Gestión de sesiones y compactación (análisis detallado)
Este documento explica cómo OpenClaw gestiona las sesiones de extremo a extremo:- Enrutamiento de sesiones (cómo los mensajes entrantes se asignan a una
sessionKey) - Almacén de sesiones (
sessions.json) y qué rastrea - Persistencia de transcripciones (
*.jsonl) y su estructura - Higiene de transcripciones (ajustes específicos del proveedor antes de las ejecuciones)
- Límites de contexto (ventana de contexto frente a tokens rastreados)
- Compactación (compactación manual + autocompactación) y dónde enganchar trabajo previo a la compactación
- Mantenimiento silencioso (por ejemplo, escrituras de memoria que no deberían producir salida visible para el usuario)
- /concepts/session
- /concepts/compaction
- /concepts/memory
- /concepts/memory-search
- /concepts/session-pruning
- /reference/transcript-hygiene
Fuente de verdad: el Gateway
OpenClaw está diseñado en torno a un único proceso Gateway que posee el estado de la sesión.- Las IU (app de macOS, web Control UI, TUI) deben consultar al Gateway para obtener listas de sesiones y recuentos de tokens.
- En modo remoto, los archivos de sesión están en el host remoto; “comprobar tus archivos locales del Mac” no reflejará lo que está usando el Gateway.
Dos capas de persistencia
OpenClaw persiste las sesiones en dos capas:-
Almacén de sesiones (
sessions.json)- Mapa clave/valor:
sessionKey -> SessionEntry - Pequeño, mutable, seguro de editar (o de eliminar entradas)
- Rastrea metadatos de sesión (id de sesión actual, última actividad, toggles, contadores de tokens, etc.)
- Mapa clave/valor:
-
Transcripción (
<sessionId>.jsonl)- Transcripción append-only con estructura de árbol (las entradas tienen
id+parentId) - Almacena la conversación real + llamadas a herramientas + resúmenes de compactación
- Se usa para reconstruir el contexto del modelo en turnos futuros
- Transcripción append-only con estructura de árbol (las entradas tienen
Ubicaciones en disco
Por agente, en el host del Gateway:- Almacén:
~/.openclaw/agents/<agentId>/sessions/sessions.json - Transcripciones:
~/.openclaw/agents/<agentId>/sessions/<sessionId>.jsonl- Sesiones de temas de Telegram:
.../<sessionId>-topic-<threadId>.jsonl
- Sesiones de temas de Telegram:
src/config/sessions.ts.
Mantenimiento del almacén y controles de disco
La persistencia de sesiones tiene controles automáticos de mantenimiento (session.maintenance) para sessions.json y los artefactos de transcripción:
mode:warn(predeterminado) oenforcepruneAfter: umbral de antigüedad para entradas obsoletas (predeterminado30d)maxEntries: límite de entradas ensessions.json(predeterminado500)rotateBytes: rotasessions.jsoncuando es demasiado grande (predeterminado10mb)resetArchiveRetention: retención para archivos de transcripción*.reset.<timestamp>(predeterminado: igual quepruneAfter;falsedeshabilita la limpieza)maxDiskBytes: presupuesto opcional para el directorio de sesioneshighWaterBytes: objetivo opcional tras la limpieza (predeterminado80%demaxDiskBytes)
mode: "enforce"):
- Elimina primero los artefactos de transcripción archivados u huérfanos más antiguos.
- Si todavía está por encima del objetivo, expulsa las entradas de sesión más antiguas y sus archivos de transcripción.
- Sigue hasta que el uso quede en o por debajo de
highWaterBytes.
mode: "warn", OpenClaw informa de expulsiones potenciales, pero no modifica el almacén ni los archivos.
Ejecuta el mantenimiento bajo demanda:
Sesiones cron y registros de ejecución
Las ejecuciones cron aisladas también crean entradas/transcripciones de sesión, y tienen controles de retención dedicados:cron.sessionRetention(predeterminado24h) elimina sesiones antiguas de ejecuciones cron aisladas del almacén de sesiones (falselo deshabilita).cron.runLog.maxBytes+cron.runLog.keepLinespodan archivos~/.openclaw/cron/runs/<jobId>.jsonl(predeterminados:2_000_000bytes y2000líneas).
Claves de sesión (sessionKey)
Una sessionKey identifica en qué cubo de conversación estás (enrutamiento + aislamiento).
Patrones comunes:
- Chat principal/directo (por agente):
agent:<agentId>:<mainKey>(predeterminadomain) - Grupo:
agent:<agentId>:<channel>:group:<id> - Sala/canal (Discord/Slack):
agent:<agentId>:<channel>:channel:<id>o...:room:<id> - Cron:
cron:<job.id> - Webhook:
hook:<uuid>(a menos que se reemplace)
IDs de sesión (sessionId)
Cada sessionKey apunta a un sessionId actual (el archivo de transcripción que continúa la conversación).
Reglas prácticas:
- Reset (
/new,/reset) crea un nuevosessionIdpara esasessionKey. - Reset diario (predeterminado a las 4:00 AM hora local en el host del gateway) crea un nuevo
sessionIden el siguiente mensaje después del límite de reinicio. - Expiración por inactividad (
session.reset.idleMinuteso el heredadosession.idleMinutes) crea un nuevosessionIdcuando llega un mensaje después de la ventana de inactividad. Cuando se configuran diario + inactividad, prevalece el que expire primero. - Protección de bifurcación de padre de hilo (
session.parentForkMaxTokens, predeterminado100000) omite la bifurcación de la transcripción del padre cuando la sesión padre ya es demasiado grande; el nuevo hilo empieza desde cero. Establece0para deshabilitarlo.
initSessionState() en src/auto-reply/reply/session.ts.
Esquema del almacén de sesiones (sessions.json)
El tipo de valor del almacén es SessionEntry en src/config/sessions.ts.
Campos clave (no exhaustivo):
sessionId: id actual de la transcripción (el nombre de archivo se deriva de esto, a menos que se establezcasessionFile)updatedAt: marca de tiempo de la última actividadsessionFile: anulación opcional explícita de la ruta de transcripciónchatType:direct | group | room(ayuda a las IU y a la política de envío)provider,subject,room,space,displayName: metadatos para etiquetado de grupo/canal- Toggles:
thinkingLevel,verboseLevel,reasoningLevel,elevatedLevelsendPolicy(anulación por sesión)
- Selección de modelo:
providerOverride,modelOverride,authProfileOverride
- Contadores de tokens (mejor esfuerzo / dependientes del proveedor):
inputTokens,outputTokens,totalTokens,contextTokens
compactionCount: cuántas veces se completó la autocompactación para esta clave de sesiónmemoryFlushAt: marca de tiempo del último vaciado de memoria previo a la compactaciónmemoryFlushCompactionCount: recuento de compactación cuando se ejecutó el último vaciado
Estructura de la transcripción (*.jsonl)
Las transcripciones las gestiona el SessionManager de @mariozechner/pi-coding-agent.
El archivo es JSONL:
- Primera línea: cabecera de sesión (
type: "session", incluyeid,cwd,timestamp,parentSessionopcional) - Luego: entradas de sesión con
id+parentId(árbol)
message: mensajes de usuario/asistente/toolResultcustom_message: mensajes inyectados por extensiones que sí entran en el contexto del modelo (pueden ocultarse de la IU)custom: estado de extensión que no entra en el contexto del modelocompaction: resumen de compactación persistido confirstKeptEntryIdytokensBeforebranch_summary: resumen persistido al navegar por una rama del árbol
SessionManager para leerlas/escribirlas.
Ventanas de contexto frente a tokens rastreados
Importan dos conceptos diferentes:- Ventana de contexto del modelo: límite duro por modelo (tokens visibles para el modelo)
- Contadores del almacén de sesiones: estadísticas acumuladas escritas en
sessions.json(usadas para /status y paneles)
- La ventana de contexto proviene del catálogo de modelos (y puede reemplazarse mediante configuración).
contextTokensen el almacén es un valor de estimación/informe en tiempo de ejecución; no lo trates como una garantía estricta.
Compactación: qué es
La compactación resume la conversación más antigua en una entradacompaction persistida en la transcripción y mantiene intactos los mensajes recientes.
Después de la compactación, los turnos futuros ven:
- El resumen de compactación
- Los mensajes posteriores a
firstKeptEntryId
Límites de fragmentos de compactación y emparejamiento de herramientas
Cuando OpenClaw divide una transcripción larga en fragmentos de compactación, mantiene las llamadas a herramientas del asistente emparejadas con sus entradastoolResult correspondientes.
- Si la división por proporción de tokens cae entre una llamada a herramienta y su resultado, OpenClaw mueve el límite al mensaje de llamada a herramienta del asistente en lugar de separar la pareja.
- Si un bloque final de resultado de herramienta haría que el fragmento supere el objetivo, OpenClaw preserva ese bloque de herramienta pendiente y mantiene intacta la cola no resumida.
- Los bloques de llamada a herramienta abortados/con error no mantienen abierta una división pendiente.
Cuándo ocurre la autocompactación (entorno de ejecución Pi)
En el agente Pi integrado, la autocompactación se activa en dos casos:- Recuperación por desbordamiento: el modelo devuelve un error de desbordamiento de contexto
(
request_too_large,context length exceeded,input exceeds the maximum number of tokens,input token count exceeds the maximum number of input tokens,input is too long for the model,ollama error: context length exceeded, y variantes similares con forma de proveedor) → compactar → reintentar. - Mantenimiento por umbral: después de un turno correcto, cuando:
contextTokens > contextWindow - reserveTokens
Donde:
contextWindowes la ventana de contexto del modeloreserveTokenses el margen reservado para prompts + la siguiente salida del modelo
Configuración de compactación (reserveTokens, keepRecentTokens)
La configuración de compactación de Pi vive en la configuración de Pi:
- Si
compaction.reserveTokens < reserveTokensFloor, OpenClaw lo incrementa. - El suelo predeterminado es
20000tokens. - Establece
agents.defaults.compaction.reserveTokensFloor: 0para deshabilitar el suelo. - Si ya es mayor, OpenClaw lo deja como está.
ensurePiCompactionReserveTokens() en src/agents/pi-settings.ts
(llamado desde src/agents/pi-embedded-runner.ts).
Proveedores de compactación conectables
Los plugins pueden registrar un proveedor de compactación medianteregisterCompactionProvider() en la API del plugin. Cuando agents.defaults.compaction.provider se establece en un id de proveedor registrado, la extensión de protección delega el resumen a ese proveedor en lugar de la canalización integrada summarizeInStages.
provider: id de un plugin de proveedor de compactación registrado. Déjalo sin configurar para el resumen predeterminado por LLM.- Establecer un
providerfuerzamode: "safeguard". - Los proveedores reciben las mismas instrucciones de compactación y la misma política de preservación de identificadores que la ruta integrada.
- La protección sigue conservando el contexto reciente del sufijo de turno y turno dividido después de la salida del proveedor.
- Si el proveedor falla o devuelve un resultado vacío, OpenClaw vuelve automáticamente al resumen integrado por LLM.
- Las señales de aborto/timeout se vuelven a lanzar (no se tragan) para respetar la cancelación del llamador.
src/plugins/compaction-provider.ts, src/agents/pi-hooks/compaction-safeguard.ts.
Superficies visibles para el usuario
Puedes observar la compactación y el estado de la sesión mediante:/status(en cualquier sesión de chat)openclaw status(CLI)openclaw sessions/sessions --json- Modo detallado:
🧹 Auto-compaction complete+ recuento de compactación
Mantenimiento silencioso (NO_REPLY)
OpenClaw admite turnos “silenciosos” para tareas en segundo plano en las que el usuario no debería ver salida intermedia.
Convención:
- El asistente inicia su salida con el token silencioso exacto
NO_REPLY/no_replypara indicar “no entregar una respuesta al usuario”. - OpenClaw elimina/suprime esto en la capa de entrega.
- La supresión del token silencioso exacto no distingue mayúsculas de minúsculas, por lo que
NO_REPLYyno_replycuentan cuando toda la carga es solo el token silencioso. - Esto es solo para turnos verdaderamente en segundo plano/sin entrega; no es un atajo para solicitudes normales accionables del usuario.
2026.1.10, OpenClaw también suprime el streaming de borrador/escritura cuando un
fragmento parcial comienza con NO_REPLY, para que las operaciones silenciosas no filtren salida parcial a mitad de turno.
“Vaciado de memoria” previo a la compactación (implementado)
Objetivo: antes de que ocurra la autocompactación, ejecutar un turno agéntico silencioso que escriba estado duradero en disco (por ejemplo,memory/YYYY-MM-DD.md en el espacio de trabajo del agente) para que la compactación no pueda
borrar contexto crítico.
OpenClaw usa el enfoque de vaciado previo al umbral:
- Monitorizar el uso de contexto de la sesión.
- Cuando cruza un “umbral suave” (por debajo del umbral de compactación de Pi), ejecutar una directiva silenciosa de “escribir memoria ahora” para el agente.
- Usar el token silencioso exacto
NO_REPLY/no_replypara que el usuario no vea nada.
agents.defaults.compaction.memoryFlush):
enabled(predeterminado:true)softThresholdTokens(predeterminado:4000)prompt(mensaje de usuario para el turno de vaciado)systemPrompt(system prompt extra añadido para el turno de vaciado)
- El prompt/system prompt predeterminados incluyen una indicación
NO_REPLYpara suprimir la entrega. - El vaciado se ejecuta una vez por ciclo de compactación (se rastrea en
sessions.json). - El vaciado se ejecuta solo para sesiones Pi integradas (los backends CLI lo omiten).
- El vaciado se omite cuando el espacio de trabajo de la sesión es de solo lectura (
workspaceAccess: "ro"o"none"). - Consulta Memoria para el diseño de archivos del espacio de trabajo y los patrones de escritura.
session_before_compact en la API de extensiones, pero la lógica de
vaciado de OpenClaw vive hoy del lado del Gateway.
Lista de comprobación de solución de problemas
- ¿La clave de sesión es incorrecta? Empieza con /concepts/session y confirma la
sessionKeyen/status. - ¿No coinciden el almacén y la transcripción? Confirma el host del Gateway y la ruta del almacén desde
openclaw status. - ¿Compactación excesiva? Comprueba:
- ventana de contexto del modelo (demasiado pequeña)
- configuración de compactación (
reserveTokensdemasiado alto para la ventana del modelo puede causar compactación más temprana) - crecimiento excesivo de tool-result: habilita/ajusta el poda de sesiones
- ¿Se filtran turnos silenciosos? Confirma que la respuesta empieza con
NO_REPLY(token exacto sin distinguir mayúsculas/minúsculas) y que estás en una compilación que incluye la corrección de supresión de streaming.