Compaction

Chaque modèle dispose d’une fenêtre de contexte : le nombre maximal de tokens qu’il peut traiter. Lorsqu’une conversation approche de cette limite, OpenClaw compacte les anciens messages dans un résumé afin que le chat puisse continuer.

Fonctionnement

Les anciens tours de conversation sont résumés dans une entrée compacte.
Le résumé est enregistré dans la transcription de session.
Les messages récents sont conservés intacts.

Quand OpenClaw divise l’historique en blocs de Compaction, il garde les appels d’outils de l’assistant associés à leurs entrées toolResult correspondantes. Si un point de découpe tombe à l’intérieur d’un bloc d’outil, OpenClaw déplace la limite afin que la paire reste groupée et que la fin actuelle non résumée soit préservée. L’historique complet de la conversation reste sur disque. La Compaction ne modifie que ce que le modèle voit au tour suivant.

Auto-compaction

L’auto-compaction est activée par défaut. Elle s’exécute lorsque la session approche de la limite de contexte, ou lorsque le modèle renvoie une erreur de dépassement de contexte (auquel cas OpenClaw compacte puis réessaie). Vous verrez :

embedded run auto-compaction start / complete dans les journaux Gateway normaux.
🧹 Auto-compaction complete en mode détaillé.
/status affichant 🧹 Compactions: <count>.

Avant de compacter, OpenClaw rappelle automatiquement à l’agent d’enregistrer les notes importantes dans des fichiers de mémoire. Cela évite la perte de contexte.

Signatures de dépassement reconnues

OpenClaw détecte le dépassement de contexte à partir de ces modèles d’erreur de fournisseur :

request_too_large
context length exceeded
input exceeds the maximum number of tokens
input token count exceeds the maximum number of input tokens
input is too long for the model
ollama error: context length exceeded

Compaction manuelle

Tapez /compact dans n’importe quel chat pour forcer une Compaction. Ajoutez des instructions pour guider le résumé :

/compact Focus on the API design decisions

Lorsque agents.defaults.compaction.keepRecentTokens est défini, la Compaction manuelle respecte ce point de découpe Pi et conserve la fin récente dans le contexte reconstruit. Sans budget de conservation explicite, la Compaction manuelle se comporte comme un point de contrôle strict et continue uniquement à partir du nouveau résumé.

Configuration

Configurez la Compaction sous agents.defaults.compaction dans votre openclaw.json. Les réglages les plus courants sont listés ci-dessous ; pour la référence complète, consultez Présentation approfondie de la gestion de session.

Utiliser un autre modèle

Par défaut, la Compaction utilise le modèle principal de l’agent. Définissez agents.defaults.compaction.model pour déléguer le résumé à un modèle plus performant ou spécialisé. La surcharge accepte toute chaîne provider/model-id :

{
  "agents": {
    "defaults": {
      "compaction": {
        "model": "openrouter/anthropic/claude-sonnet-4-6"
      }
    }
  }
}

Cela fonctionne aussi avec les modèles locaux, par exemple un second modèle Ollama dédié au résumé :

{
  "agents": {
    "defaults": {
      "compaction": {
        "model": "ollama/llama3.1:8b"
      }
    }
  }
}

Lorsqu’elle n’est pas définie, la Compaction démarre avec le modèle de session actif. Si le résumé échoue avec une erreur de fournisseur admissible au repli de modèle, OpenClaw réessaie cette tentative de Compaction via la chaîne de repli de modèle existante de la session. Le choix de repli est temporaire et n’est pas réécrit dans l’état de session. Une surcharge explicite agents.defaults.compaction.model reste exacte et n’hérite pas de la chaîne de repli de session.

Préservation des identifiants

Le résumé de Compaction préserve par défaut les identifiants opaques (identifierPolicy: "strict"). Utilisez identifierPolicy: "off" pour désactiver ce comportement, ou identifierPolicy: "custom" avec identifierInstructions pour des consignes personnalisées.

Garde de taille en octets de la transcription active

Lorsque agents.defaults.compaction.maxActiveTranscriptBytes est défini, OpenClaw déclenche une Compaction locale normale avant une exécution si le JSONL actif atteint cette taille. C’est utile pour les sessions longues où la gestion du contexte côté fournisseur peut maintenir le contexte du modèle en bon état tandis que la transcription locale continue de grossir. Cela ne découpe pas les octets JSONL bruts ; cela demande au pipeline de Compaction normal de créer un résumé sémantique.

La garde de taille en octets nécessite truncateAfterCompaction: true. Sans rotation de transcription, le fichier actif ne rétrécirait pas et la garde resterait inactive.

Transcriptions successeures

Lorsque agents.defaults.compaction.truncateAfterCompaction est activé, OpenClaw ne réécrit pas la transcription existante sur place. Il crée une nouvelle transcription successeure active à partir du résumé de Compaction, de l’état préservé et de la fin non résumée, puis conserve le JSONL précédent comme source de point de contrôle archivée. Les transcriptions successeures suppriment aussi les longs tours utilisateur exactement dupliqués qui arrivent dans une courte fenêtre de nouvelle tentative, afin que les rafales de relances de canal ne soient pas conservées dans la prochaine transcription active après la Compaction. Les points de contrôle pré-Compaction ne sont conservés que tant qu’ils restent sous le plafond de taille de point de contrôle d’OpenClaw ; les transcriptions actives surdimensionnées sont tout de même compactées, mais OpenClaw ignore le grand instantané de débogage au lieu de doubler l’utilisation du disque.

Notifications de Compaction

Par défaut, la Compaction s’exécute silencieusement. Définissez notifyUser pour afficher de brefs messages d’état lorsque la Compaction démarre et se termine :

{
  agents: {
    defaults: {
      compaction: {
        notifyUser: true,
      },
    },
  },
}

Vidage de mémoire

Avant la Compaction, OpenClaw peut exécuter un tour de vidage de mémoire silencieux pour stocker des notes durables sur disque. Définissez agents.defaults.compaction.memoryFlush.model lorsque ce tour de maintenance doit utiliser un modèle local au lieu du modèle de conversation actif :

{
  "agents": {
    "defaults": {
      "compaction": {
        "memoryFlush": {
          "model": "ollama/qwen3:8b"
        }
      }
    }
  }
}

La surcharge du modèle de vidage de mémoire est exacte et n’hérite pas de la chaîne de repli de session active. Consultez Mémoire pour les détails et la configuration.

Fournisseurs de Compaction enfichables

Les Plugins peuvent enregistrer un fournisseur de Compaction personnalisé via registerCompactionProvider() sur l’API du Plugin. Lorsqu’un fournisseur est enregistré et configuré, OpenClaw lui délègue le résumé au lieu d’utiliser le pipeline LLM intégré. Pour utiliser un fournisseur enregistré, définissez son id dans votre configuration :

{
  "agents": {
    "defaults": {
      "compaction": {
        "provider": "my-provider"
      }
    }
  }
}

Définir un provider force automatiquement mode: "safeguard". Les fournisseurs reçoivent les mêmes instructions de Compaction et la même politique de préservation des identifiants que le chemin intégré, et OpenClaw préserve toujours le contexte de suffixe des tours récents et des tours divisés après la sortie du fournisseur.

Si le fournisseur échoue ou renvoie un résultat vide, OpenClaw revient au résumé LLM intégré.

Compaction ou élagage

	Compaction	Élagage
Ce que cela fait	Résume les anciennes conversations	Tronque les anciens résultats d’outils
Enregistré ?	Oui (dans la transcription de session)	Non (uniquement en mémoire, par requête)
Portée	Conversation entière	Résultats d’outils uniquement

L’élagage de session est un complément plus léger qui tronque la sortie des outils sans la résumer.

Dépannage

Compaction trop fréquente ? La fenêtre de contexte du modèle peut être petite, ou les sorties d’outils peuvent être volumineuses. Essayez d’activer l’élagage de session. Le contexte semble périmé après la Compaction ? Utilisez /compact Focus on <topic> pour guider le résumé, ou activez le vidage de mémoire afin que les notes soient conservées. Besoin de repartir de zéro ? /new démarre une nouvelle session sans Compaction. Pour la configuration avancée (tokens réservés, préservation des identifiants, moteurs de contexte personnalisés, Compaction côté serveur OpenAI), consultez la présentation approfondie de la gestion de session.

Connexe

Session : gestion et cycle de vie des sessions.
Élagage de session : tronquer les résultats d’outils.
Contexte : comment le contexte est construit pour les tours d’agent.
Hooks : hooks de cycle de vie de la Compaction (before_compaction, after_compaction).

Fundamentals

Sessions and memory

Multi-agent

Messages and delivery

Fonctionnement

Auto-compaction

Compaction manuelle

Configuration

Utiliser un autre modèle

Préservation des identifiants

Garde de taille en octets de la transcription active

Transcriptions successeures

Notifications de Compaction

Vidage de mémoire

Fournisseurs de Compaction enfichables

Compaction ou élagage

Dépannage

Connexe

Fundamentals

Sessions and memory

Multi-agent

Messages and delivery

Documentation Index

​Fonctionnement

​Auto-compaction

​Compaction manuelle

​Configuration

​Utiliser un autre modèle

​Préservation des identifiants

​Garde de taille en octets de la transcription active

​Transcriptions successeures

​Notifications de Compaction

​Vidage de mémoire

​Fournisseurs de Compaction enfichables

​Compaction ou élagage

​Dépannage

​Connexe

Fonctionnement

Auto-compaction

Compaction manuelle

Configuration

Utiliser un autre modèle

Préservation des identifiants

Garde de taille en octets de la transcription active

Transcriptions successeures

Notifications de Compaction

Vidage de mémoire

Fournisseurs de Compaction enfichables

Compaction ou élagage

Dépannage

Connexe