Ogni modello ha una finestra di contesto: il numero massimo di token che può elaborare. Quando una conversazione si avvicina a quel limite, OpenClaw compatta i messaggi più vecchi in un riepilogo, così la chat può continuare.Documentation Index
Fetch the complete documentation index at: https://docs.openclaw.ai/llms.txt
Use this file to discover all available pages before exploring further.
Come funziona
- I turni più vecchi della conversazione vengono riassunti in una voce compatta.
- Il riepilogo viene salvato nella trascrizione della sessione.
- I messaggi recenti vengono mantenuti intatti.
toolResult. Se un punto di divisione cade all’interno di un blocco strumento, OpenClaw sposta il limite in modo che la coppia resti unita e che la coda corrente non riassunta venga preservata.
La cronologia completa della conversazione resta su disco. La compattazione cambia solo ciò che il modello vede al turno successivo.
Auto-compattazione
L’auto-compattazione è attiva per impostazione predefinita. Viene eseguita quando la sessione si avvicina al limite di contesto, oppure quando il modello restituisce un errore di superamento del contesto (nel qual caso OpenClaw compatta e riprova). Vedrai:embedded run auto-compaction start/completenei normali log del Gateway.🧹 Auto-compaction completein modalità dettagliata./statusche mostra🧹 Compactions: <count>.
Prima di compattare, OpenClaw ricorda automaticamente all’agente di salvare le note importanti nei file di memoria. Questo impedisce la perdita di contesto.
Firme di overflow riconosciute
Firme di overflow riconosciute
OpenClaw rileva il superamento del contesto da questi pattern di errore dei provider:
request_too_largecontext length exceededinput exceeds the maximum number of tokensinput token count exceeds the maximum number of input tokensinput is too long for the modelollama error: context length exceeded
Compattazione manuale
Digita/compact in qualsiasi chat per forzare una compattazione. Aggiungi istruzioni per guidare il riepilogo:
agents.defaults.compaction.keepRecentTokens è impostato, la compattazione manuale rispetta quel punto di taglio Pi e mantiene la coda recente nel contesto ricostruito. Senza un budget esplicito da mantenere, la compattazione manuale si comporta come un checkpoint rigido e continua solo dal nuovo riepilogo.
Configurazione
Configura la compattazione sottoagents.defaults.compaction nel tuo openclaw.json. Le opzioni più comuni sono elencate di seguito; per il riferimento completo, consulta Approfondimento sulla gestione della sessione.
Usare un modello diverso
Per impostazione predefinita, la compattazione usa il modello principale dell’agente. Impostaagents.defaults.compaction.model per delegare il riepilogo a un modello più capace o specializzato. L’override accetta qualsiasi stringa provider/model-id:
agents.defaults.compaction.model resta esatto e non eredita la catena di fallback della sessione.
Preservazione degli identificatori
Il riepilogo della compattazione preserva per impostazione predefinita gli identificatori opachi (identifierPolicy: "strict"). Esegui l’override con identifierPolicy: "off" per disabilitarlo, oppure con identifierPolicy: "custom" più identifierInstructions per istruzioni personalizzate.
Protezione byte della trascrizione attiva
Quandoagents.defaults.compaction.maxActiveTranscriptBytes è impostato, OpenClaw attiva la normale compattazione locale prima di un’esecuzione se il JSONL attivo raggiunge quella dimensione. È utile per sessioni di lunga durata in cui la gestione del contesto lato provider può mantenere sano il contesto del modello mentre la trascrizione locale continua a crescere. Non divide i byte JSONL grezzi; chiede alla normale pipeline di compattazione di creare un riepilogo semantico.
Trascrizioni successive
Quandoagents.defaults.compaction.truncateAfterCompaction è abilitato, OpenClaw non riscrive la trascrizione esistente sul posto. Crea una nuova trascrizione successiva attiva dal riepilogo della compattazione, dallo stato preservato e dalla coda non riassunta, quindi mantiene il JSONL precedente come origine del checkpoint archiviato.
Le trascrizioni successive eliminano anche i turni utente lunghi esattamente duplicati che arrivano
all’interno di una breve finestra di ripetizione, così le tempeste di retry del canale non vengono portate nella
trascrizione attiva successiva dopo la compattazione.
I checkpoint pre-compattazione vengono conservati solo finché restano sotto il limite di dimensione
dei checkpoint di OpenClaw; le trascrizioni attive sovradimensionate vengono comunque compattate, ma OpenClaw
salta il grande snapshot di debug invece di raddoppiare l’uso del disco.
Avvisi di compattazione
Per impostazione predefinita, la compattazione viene eseguita in silenzio. ImpostanotifyUser per mostrare brevi messaggi di stato quando la compattazione inizia e termina:
Flush della memoria
Prima della compattazione, OpenClaw può eseguire un turno di flush silenzioso della memoria per archiviare note durevoli su disco. Impostaagents.defaults.compaction.memoryFlush.model quando questo turno di manutenzione deve usare un modello locale invece del modello della conversazione attiva:
Provider di compattazione collegabili
I Plugin possono registrare un provider di compattazione personalizzato tramiteregisterCompactionProvider() sull’API del Plugin. Quando un provider è registrato e configurato, OpenClaw delega il riepilogo a esso invece che alla pipeline LLM integrata.
Per usare un provider registrato, imposta il suo id nella tua configurazione:
provider forza automaticamente mode: "safeguard". I provider ricevono le stesse istruzioni di compattazione e la stessa policy di preservazione degli identificatori del percorso integrato, e OpenClaw preserva comunque il contesto del suffisso dei turni recenti e dei turni divisi dopo l’output del provider.
Se il provider fallisce o restituisce un risultato vuoto, OpenClaw ripiega sul riepilogo LLM integrato.
Compattazione e pruning
| Compattazione | Pruning | |
|---|---|---|
| Cosa fa | Riassume la conversazione più vecchia | Taglia i vecchi risultati degli strumenti |
| Salvato? | Sì (nella trascrizione della sessione) | No (solo in memoria, per richiesta) |
| Ambito | Intera conversazione | Solo risultati degli strumenti |
Risoluzione dei problemi
Compattazione troppo frequente? La finestra di contesto del modello potrebbe essere piccola, oppure gli output degli strumenti potrebbero essere grandi. Prova ad abilitare il pruning della sessione. Il contesto sembra obsoleto dopo la compattazione? Usa/compact Focus on <topic> per guidare il riepilogo, oppure abilita il flush della memoria affinché le note sopravvivano.
Serve una tabula rasa? /new avvia una nuova sessione senza compattare.
Per la configurazione avanzata (token di riserva, preservazione degli identificatori, motori di contesto personalizzati, compattazione lato server di OpenAI), consulta l’Approfondimento sulla gestione della sessione.
Correlati
- Sessione: gestione e ciclo di vita della sessione.
- Pruning della sessione: taglio dei risultati degli strumenti.
- Contesto: come viene costruito il contesto per i turni dell’agente.
- Hook: hook del ciclo di vita della compattazione (
before_compaction,after_compaction).