Gestion des sessions et compaction (analyse approfondie)
Ce document explique comment OpenClaw gère les sessions de bout en bout :- Routage des sessions (comment les messages entrants sont mappés vers une
sessionKey) - Stockage des sessions (
sessions.json) et ce qu’il suit - Persistance des transcriptions (
*.jsonl) et leur structure - Hygiène des transcriptions (correctifs spécifiques aux fournisseurs avant les exécutions)
- Limites de contexte (fenêtre de contexte vs jetons suivis)
- Compaction (compaction manuelle + automatique) et où brancher le travail avant compaction
- Maintenance silencieuse (par ex. des écritures mémoire qui ne doivent pas produire de sortie visible par l’utilisateur)
- /concepts/session
- /concepts/compaction
- /concepts/memory
- /concepts/memory-search
- /concepts/session-pruning
- /reference/transcript-hygiene
Source de vérité : la Gateway
OpenClaw est conçu autour d’un seul processus Gateway qui possède l’état des sessions.- Les UI (application macOS, web Control UI, TUI) doivent interroger la Gateway pour les listes de sessions et les comptes de jetons.
- En mode distant, les fichiers de session se trouvent sur l’hôte distant ; « vérifier vos fichiers locaux sur votre Mac » ne reflétera pas ce que la Gateway utilise.
Deux couches de persistance
OpenClaw conserve les sessions dans deux couches :-
Stockage des sessions (
sessions.json)- Mappage clé/valeur :
sessionKey -> SessionEntry - Petit, mutable, sûr à modifier (ou à supprimer des entrées)
- Suit les métadonnées de session (id de session actuel, dernière activité, bascules, compteurs de jetons, etc.)
- Mappage clé/valeur :
-
Transcription (
<sessionId>.jsonl)- Transcription en ajout seul avec structure en arbre (les entrées ont
id+parentId) - Stocke la conversation réelle + les appels d’outils + les résumés de compaction
- Utilisée pour reconstruire le contexte du modèle lors des prochains tours
- Transcription en ajout seul avec structure en arbre (les entrées ont
Emplacements sur disque
Par agent, sur l’hôte Gateway :- Stockage :
~/.openclaw/agents/<agentId>/sessions/sessions.json - Transcriptions :
~/.openclaw/agents/<agentId>/sessions/<sessionId>.jsonl- Sessions de sujet Telegram :
.../<sessionId>-topic-<threadId>.jsonl
- Sessions de sujet Telegram :
src/config/sessions.ts.
Maintenance du stockage et contrôles disque
La persistance des sessions dispose de contrôles de maintenance automatiques (session.maintenance) pour sessions.json et les artefacts de transcription :
mode:warn(par défaut) ouenforcepruneAfter: seuil d’âge des entrées obsolètes (par défaut30d)maxEntries: plafond des entrées danssessions.json(par défaut500)rotateBytes: rotation desessions.jsonlorsqu’il devient trop volumineux (par défaut10mb)resetArchiveRetention: rétention des archives de transcription*.reset.<timestamp>(par défaut : identique àpruneAfter;falsedésactive le nettoyage)maxDiskBytes: budget facultatif pour le répertoire des sessionshighWaterBytes: cible facultative après nettoyage (par défaut80%demaxDiskBytes)
mode: "enforce") :
- Supprimer d’abord les plus anciens artefacts de transcription archivés ou orphelins.
- Si l’utilisation reste au-dessus de la cible, évincer les plus anciennes entrées de session et leurs fichiers de transcription.
- Continuer jusqu’à ce que l’utilisation soit inférieure ou égale à
highWaterBytes.
mode: "warn", OpenClaw signale les évictions potentielles mais ne modifie pas le stockage/les fichiers.
Exécuter la maintenance à la demande :
Sessions cron et journaux d’exécution
Les exécutions cron isolées créent aussi des entrées de session/transcriptions, et elles ont des contrôles de rétention dédiés :cron.sessionRetention(par défaut24h) supprime les anciennes sessions d’exécution cron isolées du stockage des sessions (falsedésactive).cron.runLog.maxBytes+cron.runLog.keepLinesréduisent les fichiers~/.openclaw/cron/runs/<jobId>.jsonl(par défaut :2_000_000octets et2000lignes).
Clés de session (sessionKey)
Une sessionKey identifie dans quel compartiment de conversation vous vous trouvez (routage + isolation).
Modèles courants :
- Chat principal/direct (par agent) :
agent:<agentId>:<mainKey>(par défautmain) - Groupe :
agent:<agentId>:<channel>:group:<id> - Salon/canal (Discord/Slack) :
agent:<agentId>:<channel>:channel:<id>ou...:room:<id> - Cron :
cron:<job.id> - Webhook :
hook:<uuid>(sauf si remplacé)
Ids de session (sessionId)
Chaque sessionKey pointe vers un sessionId actuel (le fichier de transcription qui prolonge la conversation).
Règles empiriques :
- Réinitialisation (
/new,/reset) crée un nouveausessionIdpour cettesessionKey. - Réinitialisation quotidienne (par défaut à 4:00 du matin, heure locale sur l’hôte gateway) crée un nouveau
sessionIdau prochain message après la limite de réinitialisation. - Expiration par inactivité (
session.reset.idleMinutesou l’anciensession.idleMinutes) crée un nouveausessionIdlorsqu’un message arrive après la fenêtre d’inactivité. Lorsque la réinitialisation quotidienne et l’inactivité sont toutes deux configurées, celle qui expire en premier l’emporte. - Garde-fou de bifurcation du parent de thread (
session.parentForkMaxTokens, par défaut100000) ignore la bifurcation de la transcription parent lorsque la session parente est déjà trop volumineuse ; le nouveau thread démarre à neuf. Définissez0pour désactiver.
initSessionState() dans src/auto-reply/reply/session.ts.
Schéma du stockage des sessions (sessions.json)
Le type de valeur du stockage est SessionEntry dans src/config/sessions.ts.
Champs clés (liste non exhaustive) :
sessionId: id de transcription actuel (le nom du fichier en est dérivé sauf sisessionFileest défini)updatedAt: horodatage de la dernière activitésessionFile: remplacement facultatif explicite du chemin de transcriptionchatType:direct | group | room(utile pour les UI et la politique d’envoi)provider,subject,room,space,displayName: métadonnées pour l’étiquetage des groupes/canaux- Basculements :
thinkingLevel,verboseLevel,reasoningLevel,elevatedLevelsendPolicy(remplacement par session)
- Sélection du modèle :
providerOverride,modelOverride,authProfileOverride
- Compteurs de jetons (au mieux / dépendants du fournisseur) :
inputTokens,outputTokens,totalTokens,contextTokens
compactionCount: nombre de fois où la compaction automatique s’est terminée pour cette clé de sessionmemoryFlushAt: horodatage du dernier vidage mémoire avant compactionmemoryFlushCompactionCount: nombre de compactions lors de la dernière exécution du vidage
Structure des transcriptions (*.jsonl)
Les transcriptions sont gérées par le SessionManager de @mariozechner/pi-coding-agent.
Le fichier est en JSONL :
- Première ligne : en-tête de session (
type: "session", inclutid,cwd,timestamp,parentSessionfacultatif) - Puis : entrées de session avec
id+parentId(arbre)
message: messages utilisateur/assistant/toolResultcustom_message: messages injectés par extension qui entrent bien dans le contexte du modèle (peuvent être masqués dans l’UI)custom: état d’extension qui n’entre pas dans le contexte du modèlecompaction: résumé de compaction persistant avecfirstKeptEntryIdettokensBeforebranch_summary: résumé persistant lors de la navigation dans une branche de l’arbre
SessionManager pour les lire/écrire.
Fenêtres de contexte vs jetons suivis
Deux concepts différents comptent :- Fenêtre de contexte du modèle : plafond strict par modèle (jetons visibles par le modèle)
- Compteurs du stockage de session : statistiques glissantes écrites dans
sessions.json(utilisées pour /status et les tableaux de bord)
- La fenêtre de contexte provient du catalogue de modèles (et peut être remplacée via la configuration).
contextTokensdans le stockage est une valeur d’estimation/de reporting à l’exécution ; ne la traitez pas comme une garantie stricte.
Compaction : ce que c’est
La compaction résume les parties plus anciennes de la conversation en une entréecompaction persistante dans la transcription et conserve les messages récents intacts.
Après compaction, les futurs tours voient :
- Le résumé de compaction
- Les messages après
firstKeptEntryId
Limites de morceaux de compaction et appariement des outils
Lorsque OpenClaw découpe une longue transcription en morceaux de compaction, il conserve les appels d’outil de l’assistant appariés avec leurs entréestoolResult correspondantes.
- Si le découpage basé sur la part de jetons tombe entre un appel d’outil et son résultat, OpenClaw déplace la limite vers le message d’appel d’outil de l’assistant au lieu de séparer la paire.
- Si un bloc final de résultat d’outil pousserait autrement le morceau au-delà de la cible, OpenClaw conserve ce bloc d’outil en attente et garde intacte la queue non résumée.
- Les blocs d’appel d’outil abandonnés/en erreur ne maintiennent pas une coupure en attente ouverte.
Quand la compaction automatique se produit (runtime Pi)
Dans l’agent Pi embarqué, la compaction automatique se déclenche dans deux cas :- Récupération après dépassement : le modèle renvoie une erreur de dépassement de contexte
(
request_too_large,context length exceeded,input exceeds the maximum number of tokens,input token count exceeds the maximum number of input tokens,input is too long for the model,ollama error: context length exceeded, et variantes similaires propres aux fournisseurs) → compacter → réessayer. - Maintenance par seuil : après un tour réussi, lorsque :
contextTokens > contextWindow - reserveTokens
Où :
contextWindowest la fenêtre de contexte du modèlereserveTokensest la marge réservée pour les prompts + la sortie du prochain modèle
Paramètres de compaction (reserveTokens, keepRecentTokens)
Les paramètres de compaction de Pi vivent dans les paramètres Pi :
- Si
compaction.reserveTokens < reserveTokensFloor, OpenClaw l’augmente. - Le seuil minimal par défaut est de
20000jetons. - Définissez
agents.defaults.compaction.reserveTokensFloor: 0pour désactiver ce seuil. - S’il est déjà plus élevé, OpenClaw ne le modifie pas.
ensurePiCompactionReserveTokens() dans src/agents/pi-settings.ts
(appelé depuis src/agents/pi-embedded-runner.ts).
Fournisseurs de compaction enfichables
Les plugins peuvent enregistrer un fournisseur de compaction viaregisterCompactionProvider() sur l’API du plugin. Lorsque agents.defaults.compaction.provider est défini sur un id de fournisseur enregistré, l’extension safeguard délègue la synthèse à ce fournisseur au lieu du pipeline intégré summarizeInStages.
provider: id d’un plugin fournisseur de compaction enregistré. Laissez vide pour la synthèse LLM par défaut.- Définir un
providerforcemode: "safeguard". - Les fournisseurs reçoivent les mêmes instructions de compaction et la même politique de préservation des identifiants que le chemin intégré.
- Le safeguard préserve toujours le contexte de suffixe des tours récents et des tours fractionnés après la sortie du fournisseur.
- Si le fournisseur échoue ou renvoie un résultat vide, OpenClaw revient automatiquement à la synthèse LLM intégrée.
- Les signaux d’abandon/timeout sont relancés (et non absorbés) pour respecter l’annulation par l’appelant.
src/plugins/compaction-provider.ts, src/agents/pi-hooks/compaction-safeguard.ts.
Surfaces visibles par l’utilisateur
Vous pouvez observer la compaction et l’état de session via :/status(dans n’importe quelle session de chat)openclaw status(CLI)openclaw sessions/sessions --json- Mode verbeux :
🧹 Auto-compaction complete+ nombre de compactions
Maintenance silencieuse (NO_REPLY)
OpenClaw prend en charge des tours « silencieux » pour les tâches d’arrière-plan où l’utilisateur ne doit pas voir de sortie intermédiaire.
Convention :
- L’assistant commence sa sortie avec le jeton silencieux exact
NO_REPLY/no_replypour indiquer « ne pas livrer de réponse à l’utilisateur ». - OpenClaw le supprime/le masque dans la couche de livraison.
- La suppression exacte du jeton silencieux ne tient pas compte de la casse, donc
NO_REPLYetno_replycomptent tous deux lorsque la charge utile complète n’est que le jeton silencieux. - C’est réservé aux véritables tours d’arrière-plan/sans livraison ; ce n’est pas un raccourci pour des demandes utilisateur ordinaires et exploitables.
2026.1.10, OpenClaw supprime aussi le streaming brouillon/saisie lorsqu’un
morceau partiel commence par NO_REPLY, afin que les opérations silencieuses ne divulguent pas de sortie partielle en milieu de tour.
« Vidage mémoire » avant compaction (implémenté)
Objectif : avant qu’une compaction automatique ne se produise, exécuter un tour agentique silencieux qui écrit un état durable sur disque (par ex.memory/YYYY-MM-DD.md dans l’espace de travail de l’agent) afin que la compaction ne puisse pas
effacer de contexte critique.
OpenClaw utilise l’approche de vidage avant seuil :
- Surveiller l’utilisation du contexte de session.
- Lorsqu’elle franchit un « seuil souple » (inférieur au seuil de compaction de Pi), exécuter une directive silencieuse « écrire la mémoire maintenant » vers l’agent.
- Utiliser le jeton silencieux exact
NO_REPLY/no_replypour que l’utilisateur ne voie rien.
agents.defaults.compaction.memoryFlush) :
enabled(par défaut :true)softThresholdTokens(par défaut :4000)prompt(message utilisateur pour le tour de vidage)systemPrompt(prompt système supplémentaire ajouté au tour de vidage)
- Le prompt système/prompt par défaut inclut un indice
NO_REPLYpour supprimer la livraison. - Le vidage s’exécute une fois par cycle de compaction (suivi dans
sessions.json). - Le vidage ne s’exécute que pour les sessions Pi embarquées (les backends CLI l’ignorent).
- Le vidage est ignoré lorsque l’espace de travail de la session est en lecture seule (
workspaceAccess: "ro"ou"none"). - Voir Mémoire pour la disposition des fichiers d’espace de travail et les modèles d’écriture.
session_before_compact dans l’API d’extension, mais la logique de
vidage d’OpenClaw vit aujourd’hui côté Gateway.
Liste de vérification de dépannage
- Mauvaise clé de session ? Commencez par /concepts/session et confirmez la
sessionKeydans/status. - Incohérence entre stockage et transcription ? Confirmez l’hôte Gateway et le chemin du stockage depuis
openclaw status. - Trop de compactions ? Vérifiez :
- la fenêtre de contexte du modèle (trop petite)
- les paramètres de compaction (
reserveTokenstrop élevé pour la fenêtre du modèle peut provoquer une compaction plus tôt) - le gonflement des résultats d’outil : activez/ajustez l’élagage de session
- Fuite de tours silencieux ? Confirmez que la réponse commence par
NO_REPLY(jeton exact insensible à la casse) et que vous utilisez une build qui inclut le correctif de suppression du streaming.