Chaque modèle dispose d’une fenêtre de contexte : le nombre maximal de tokens qu’il peut traiter. Lorsqu’une conversation approche de cette limite, OpenClaw compacte les anciens messages dans un résumé afin que le chat puisse continuer.Documentation Index
Fetch the complete documentation index at: https://docs.openclaw.ai/llms.txt
Use this file to discover all available pages before exploring further.
Fonctionnement
- Les anciens tours de conversation sont résumés dans une entrée compacte.
- Le résumé est enregistré dans la transcription de session.
- Les messages récents sont conservés intacts.
toolResult correspondantes. Si un point de découpe tombe à l’intérieur d’un bloc d’outil, OpenClaw déplace la limite afin que la paire reste groupée et que la fin actuelle non résumée soit préservée.
L’historique complet de la conversation reste sur disque. La Compaction ne modifie que ce que le modèle voit au tour suivant.
Auto-compaction
L’auto-compaction est activée par défaut. Elle s’exécute lorsque la session approche de la limite de contexte, ou lorsque le modèle renvoie une erreur de dépassement de contexte (auquel cas OpenClaw compacte puis réessaie). Vous verrez :embedded run auto-compaction start/completedans les journaux Gateway normaux.🧹 Auto-compaction completeen mode détaillé./statusaffichant🧹 Compactions: <count>.
Avant de compacter, OpenClaw rappelle automatiquement à l’agent d’enregistrer les notes importantes dans des fichiers de mémoire. Cela évite la perte de contexte.
Signatures de dépassement reconnues
Signatures de dépassement reconnues
OpenClaw détecte le dépassement de contexte à partir de ces modèles d’erreur de fournisseur :
request_too_largecontext length exceededinput exceeds the maximum number of tokensinput token count exceeds the maximum number of input tokensinput is too long for the modelollama error: context length exceeded
Compaction manuelle
Tapez/compact dans n’importe quel chat pour forcer une Compaction. Ajoutez des instructions pour guider le résumé :
agents.defaults.compaction.keepRecentTokens est défini, la Compaction manuelle respecte ce point de découpe Pi et conserve la fin récente dans le contexte reconstruit. Sans budget de conservation explicite, la Compaction manuelle se comporte comme un point de contrôle strict et continue uniquement à partir du nouveau résumé.
Configuration
Configurez la Compaction sousagents.defaults.compaction dans votre openclaw.json. Les réglages les plus courants sont listés ci-dessous ; pour la référence complète, consultez Présentation approfondie de la gestion de session.
Utiliser un autre modèle
Par défaut, la Compaction utilise le modèle principal de l’agent. Définissezagents.defaults.compaction.model pour déléguer le résumé à un modèle plus performant ou spécialisé. La surcharge accepte toute chaîne provider/model-id :
agents.defaults.compaction.model reste exacte et n’hérite pas de la chaîne de repli de session.
Préservation des identifiants
Le résumé de Compaction préserve par défaut les identifiants opaques (identifierPolicy: "strict"). Utilisez identifierPolicy: "off" pour désactiver ce comportement, ou identifierPolicy: "custom" avec identifierInstructions pour des consignes personnalisées.
Garde de taille en octets de la transcription active
Lorsqueagents.defaults.compaction.maxActiveTranscriptBytes est défini, OpenClaw déclenche une Compaction locale normale avant une exécution si le JSONL actif atteint cette taille. C’est utile pour les sessions longues où la gestion du contexte côté fournisseur peut maintenir le contexte du modèle en bon état tandis que la transcription locale continue de grossir. Cela ne découpe pas les octets JSONL bruts ; cela demande au pipeline de Compaction normal de créer un résumé sémantique.
Transcriptions successeures
Lorsqueagents.defaults.compaction.truncateAfterCompaction est activé, OpenClaw ne réécrit pas la transcription existante sur place. Il crée une nouvelle transcription successeure active à partir du résumé de Compaction, de l’état préservé et de la fin non résumée, puis conserve le JSONL précédent comme source de point de contrôle archivée.
Les transcriptions successeures suppriment aussi les longs tours utilisateur exactement dupliqués qui arrivent
dans une courte fenêtre de nouvelle tentative, afin que les rafales de relances de canal ne soient pas conservées dans la
prochaine transcription active après la Compaction.
Les points de contrôle pré-Compaction ne sont conservés que tant qu’ils restent sous le plafond de taille de point de contrôle d’OpenClaw ;
les transcriptions actives surdimensionnées sont tout de même compactées, mais OpenClaw
ignore le grand instantané de débogage au lieu de doubler l’utilisation du disque.
Notifications de Compaction
Par défaut, la Compaction s’exécute silencieusement. DéfinisseznotifyUser pour afficher de brefs messages d’état lorsque la Compaction démarre et se termine :
Vidage de mémoire
Avant la Compaction, OpenClaw peut exécuter un tour de vidage de mémoire silencieux pour stocker des notes durables sur disque. Définissezagents.defaults.compaction.memoryFlush.model lorsque ce tour de maintenance doit utiliser un modèle local au lieu du modèle de conversation actif :
Fournisseurs de Compaction enfichables
Les Plugins peuvent enregistrer un fournisseur de Compaction personnalisé viaregisterCompactionProvider() sur l’API du Plugin. Lorsqu’un fournisseur est enregistré et configuré, OpenClaw lui délègue le résumé au lieu d’utiliser le pipeline LLM intégré.
Pour utiliser un fournisseur enregistré, définissez son id dans votre configuration :
provider force automatiquement mode: "safeguard". Les fournisseurs reçoivent les mêmes instructions de Compaction et la même politique de préservation des identifiants que le chemin intégré, et OpenClaw préserve toujours le contexte de suffixe des tours récents et des tours divisés après la sortie du fournisseur.
Si le fournisseur échoue ou renvoie un résultat vide, OpenClaw revient au résumé LLM intégré.
Compaction ou élagage
| Compaction | Élagage | |
|---|---|---|
| Ce que cela fait | Résume les anciennes conversations | Tronque les anciens résultats d’outils |
| Enregistré ? | Oui (dans la transcription de session) | Non (uniquement en mémoire, par requête) |
| Portée | Conversation entière | Résultats d’outils uniquement |
Dépannage
Compaction trop fréquente ? La fenêtre de contexte du modèle peut être petite, ou les sorties d’outils peuvent être volumineuses. Essayez d’activer l’élagage de session. Le contexte semble périmé après la Compaction ? Utilisez/compact Focus on <topic> pour guider le résumé, ou activez le vidage de mémoire afin que les notes soient conservées.
Besoin de repartir de zéro ? /new démarre une nouvelle session sans Compaction.
Pour la configuration avancée (tokens réservés, préservation des identifiants, moteurs de contexte personnalisés, Compaction côté serveur OpenAI), consultez la présentation approfondie de la gestion de session.
Connexe
- Session : gestion et cycle de vie des sessions.
- Élagage de session : tronquer les résultats d’outils.
- Contexte : comment le contexte est construit pour les tours d’agent.
- Hooks : hooks de cycle de vie de la Compaction (
before_compaction,after_compaction).