Gateway
Backend CLI
OpenClaw può eseguire CLI AI locali come fallback solo testo quando i provider API non sono disponibili, sono soggetti a limiti di frequenza o hanno malfunzionamenti temporanei. Questo è intenzionalmente conservativo:
- Gli strumenti OpenClaw non vengono iniettati direttamente, ma i backend con
bundleMcp: truepossono ricevere strumenti del Gateway tramite un bridge MCP loopback. - Streaming JSONL per le CLI che lo supportano.
- Le sessioni sono supportate (quindi i turni successivi restano coerenti).
- Le immagini possono essere inoltrate se la CLI accetta percorsi di immagini.
Questo è progettato come rete di sicurezza più che come percorso primario. Usalo quando vuoi risposte testuali che "funzionano sempre" senza dipendere da API esterne.
Se vuoi un runtime harness completo con controlli di sessione ACP, attività in background, associazione thread/conversazione e sessioni di coding esterne persistenti, usa invece Agenti ACP. I backend CLI non sono ACP.
Avvio rapido per principianti
Puoi usare Claude Code CLI senza alcuna configurazione (il Plugin Anthropic incluso registra un backend predefinito):
openclaw agent --agent main --message "hi" --model claude-cli/claude-sonnet-4-6main è l'id agente predefinito quando non è configurato un elenco esplicito di agenti. Se
usi più agenti, sostituiscilo con l'id dell'agente che vuoi eseguire.
Se il tuo Gateway viene eseguito sotto launchd/systemd e PATH è minimo, aggiungi solo il percorso del comando:
{ agents: { defaults: { cliBackends: { "claude-cli": { command: "/opt/homebrew/bin/claude", }, }, }, },}Tutto qui. Nessuna chiave, nessuna configurazione auth aggiuntiva necessaria oltre alla CLI stessa.
Se usi un backend CLI incluso come provider di messaggi primario su un
host Gateway, OpenClaw ora carica automaticamente il Plugin incluso proprietario quando la tua configurazione
fa esplicitamente riferimento a quel backend in un model ref o sotto
agents.defaults.cliBackends.
Usarlo come fallback
Aggiungi un backend CLI al tuo elenco di fallback in modo che venga eseguito solo quando i modelli primari falliscono:
{ agents: { defaults: { model: { primary: "anthropic/claude-opus-4-6", fallbacks: ["claude-cli/claude-sonnet-4-6"], }, models: { "anthropic/claude-opus-4-6": { alias: "Opus" }, "claude-cli/claude-sonnet-4-6": {}, }, }, },}Note:
- Se usi
agents.defaults.models(allowlist), devi includere anche lì i modelli del tuo backend CLI. - Se il provider primario fallisce (auth, limiti di frequenza, timeout), OpenClaw proverà poi il backend CLI.
Panoramica della configurazione
Tutti i backend CLI si trovano sotto:
agents.defaults.cliBackendsOgni voce è indicizzata da un id provider (ad esempio claude-cli, my-cli).
L'id provider diventa il lato sinistro del tuo model ref:
<provider>/<model>Configurazione di esempio
{ agents: { defaults: { cliBackends: { "my-cli": { command: "my-cli", args: ["--json"], output: "json", input: "arg", modelArg: "--model", modelAliases: { "claude-opus-4-6": "opus", "claude-sonnet-4-6": "sonnet", }, sessionArg: "--session", sessionMode: "existing", sessionIdFields: ["session_id", "conversation_id"], systemPromptArg: "--system", // For CLIs with a dedicated prompt-file flag: // systemPromptFileArg: "--system-file", // Codex-style CLIs can point at a prompt file instead: // systemPromptFileConfigArg: "-c", // systemPromptFileConfigKey: "model_instructions_file", systemPromptWhen: "first", imageArg: "--image", imageMode: "repeat", // Opt in only if this backend may reseed safe invalidated sessions // from bounded raw OpenClaw transcript history before compaction. reseedFromRawTranscriptWhenUncompacted: true, serialize: true, }, }, }, },}Come funziona
- Seleziona un backend in base al prefisso del provider (
claude-cli/...). - Costruisce un prompt di sistema usando lo stesso prompt OpenClaw + contesto del workspace.
- Esegue la CLI con un id sessione (se supportato) così la cronologia resta coerente.
Il backend
claude-cliincluso mantiene attivo un processo Claude stdio per ogni sessione OpenClaw e invia i turni successivi su stdin stream-json. - Analizza l'output (JSON o testo semplice) e restituisce il testo finale.
- Persiste gli id sessione per backend, così i follow-up riutilizzano la stessa sessione CLI.
Il backend Anthropic claude-cli incluso preferisce il resolver nativo delle skill di Claude Code
per le skill OpenClaw. Quando lo snapshot delle skill corrente include almeno
una skill selezionata con un percorso materializzato, OpenClaw passa un Plugin Claude
Code temporaneo con --plugin-dir e omette il catalogo duplicato delle skill OpenClaw
dal prompt di sistema aggiunto. Se lo snapshot non ha alcuna skill Plugin materializzata,
OpenClaw mantiene il catalogo del prompt come fallback. Gli override env/chiave API delle skill
vengono comunque applicati da OpenClaw all'ambiente del processo figlio per
l'esecuzione.
Claude CLI ha anche una propria modalità di permesso non interattiva. OpenClaw la mappa
alla policy exec esistente invece di aggiungere una configurazione di policy specifica per Claude.
Per le sessioni Claude live gestite da OpenClaw, la policy exec OpenClaw effettiva è
autoritativa: YOLO (tools.exec.security: "full" e
tools.exec.ask: "off") avvia Claude con
--permission-mode bypassPermissions, mentre una policy exec effettiva restrittiva
avvia Claude con --permission-mode default. Le impostazioni per agente
agents.list[].tools.exec sovrascrivono tools.exec globale per quell'
agente. Gli argomenti grezzi del backend Claude possono ancora includere --permission-mode, ma gli avvii live
di Claude normalizzano quel flag per corrispondere alla policy exec OpenClaw effettiva.
Il backend Anthropic claude-cli incluso mappa anche i livelli /think di OpenClaw
al flag nativo --effort di Claude Code per i livelli diversi da off. minimal e
low mappano a low, adaptive e medium mappano a medium, e high,
xhigh e max mappano direttamente. Gli altri backend CLI hanno bisogno che il loro Plugin proprietario
dichiari un mapper argv equivalente prima che /think possa influenzare la CLI generata.
Prima che OpenClaw possa usare il backend claude-cli incluso, Claude Code stesso
deve già aver effettuato l'accesso sullo stesso host:
claude auth loginclaude auth status --textopenclaw models auth login --provider anthropic --method cli --set-defaultLe installazioni Docker richiedono che Claude Code sia installato e con accesso effettuato nella home persistente del container, non solo sull'host. Vedi Backend Claude CLI in Docker.
Usa agents.defaults.cliBackends.claude-cli.command solo quando il binario claude
non è già in PATH.
Sessioni
- Se la CLI supporta le sessioni, imposta
sessionArg(ad esempio--session-id) osessionArgs(placeholder{sessionId}) quando l'ID deve essere inserito in più flag. - Se la CLI usa un sottocomando resume con flag diversi, imposta
resumeArgs(sostituisceargsdurante il resume) e facoltativamenteresumeOutput(per resume non JSON). sessionMode:always: invia sempre un id sessione (nuovo UUID se non ne è memorizzato nessuno).existing: invia un id sessione solo se uno era stato memorizzato prima.none: non inviare mai un id sessione.
claude-cliusa come impostazioni predefiniteliveSession: "claude-stdio",output: "jsonl", einput: "stdin"così i turni successivi riutilizzano il processo Claude live mentre è attivo. Lo stdio caldo ora è il valore predefinito, anche per configurazioni personalizzate che omettono i campi di trasporto. Se il Gateway si riavvia o il processo inattivo termina, OpenClaw riprende dall'id sessione Claude memorizzato. Gli id sessione memorizzati vengono verificati rispetto a una trascrizione di progetto esistente e leggibile prima del resume, così le associazioni fantasma vengono eliminate conreason=transcript-missinginvece di avviare silenziosamente una nuova sessione Claude CLI sotto--resume.- Le sessioni Claude live mantengono guardrail limitati per l'output JSONL. I valori predefiniti consentono fino a
8 MiB e 20.000 righe JSONL grezze per turno. I turni Claude con molti strumenti possono aumentarli
per backend con
agents.defaults.cliBackends.claude-cli.reliability.outputLimits.maxTurnRawCharsemaxTurnLines; OpenClaw limita queste impostazioni a 64 MiB e 100.000 righe. - Le sessioni CLI memorizzate sono continuità di proprietà del provider. Il reset giornaliero implicito della sessione
non le interrompe;
/resete le policy esplicitesession.resetlo fanno comunque. - Le nuove sessioni CLI normalmente reinizializzano solo dal riepilogo Compaction di OpenClaw
più la coda post-Compaction. Per recuperare sessioni brevi invalidate
prima della Compaction, un backend può aderire con
reseedFromRawTranscriptWhenUncompacted: true. OpenClaw mantiene comunque la reinizializzazione della trascrizione grezza limitata e la limita a invalidazioni sicure come trascrizioni CLI mancanti, modifiche prompt di sistema/MCP o tentativo dopo sessione scaduta; le modifiche del profilo auth o dell'epoca delle credenziali non reinizializzano mai la cronologia della trascrizione grezza.
Note sulla serializzazione:
serialize: truemantiene ordinati i run della stessa corsia.- La maggior parte delle CLI serializza su una corsia provider.
- OpenClaw elimina il riutilizzo della sessione CLI memorizzata quando cambia l'identità auth selezionata, incluso un id profilo auth modificato, una chiave API statica, un token statico o l'identità account OAuth quando la CLI ne espone una. La rotazione dei token di accesso e refresh OAuth non interrompe la sessione CLI memorizzata. Se una CLI non espone un id account OAuth stabile, OpenClaw lascia che quella CLI applichi i permessi di resume.
Preludio di fallback dalle sessioni claude-cli
Quando un tentativo claude-cli passa per fallback a un candidato non CLI in
agents.defaults.model.fallbacks, OpenClaw inizializza
il tentativo successivo con un preludio di contesto raccolto dalla trascrizione JSONL locale
di Claude Code in ~/.claude/projects/. Senza questo seed, il provider di fallback
partirebbe da zero perché la trascrizione di sessione propria di OpenClaw è vuota
per i run claude-cli.
- Il preludio preferisce l'ultimo riepilogo
/compacto marcatorecompact_boundary, poi aggiunge i turni post-boundary più recenti fino a un budget di caratteri. I turni pre-boundary vengono scartati perché il riepilogo li rappresenta già. - I blocchi strumento vengono aggregati in suggerimenti compatti
(tool call: name)e(tool result: …)per mantenere onesto il budget del prompt. Il riepilogo è etichettato(truncated)se supera il limite. - I fallback dallo stesso provider
claude-cliaclaude-clisi affidano al--resumedi Claude e saltano il preludio. - Il seed riutilizza la validazione esistente del percorso del file di sessione Claude, quindi non è possibile leggere percorsi arbitrari.
Immagini (pass-through)
Se la tua CLI accetta percorsi di immagini, imposta imageArg:
imageArg: "--image",imageMode: "repeat"OpenClaw scriverà immagini base64 in file temporanei. Se imageArg è impostato, quei
percorsi vengono passati come argomenti CLI. Se imageArg manca, OpenClaw aggiunge i
percorsi dei file al prompt (iniezione del percorso), il che è sufficiente per le CLI che caricano automaticamente
file locali da percorsi semplici.
Input / output
output: "json"(predefinito) prova ad analizzare JSON ed estrarre testo + id sessione.- Per l'output JSON di Gemini CLI, OpenClaw legge il testo della risposta da
responsee l'utilizzo dastatsquandousagemanca o è vuoto. Il valore predefinito Gemini CLI incluso usastream-json, ma i vecchi override--output-format jsonusano ancora il parser JSON. output: "jsonl"analizza stream JSONL ed estrae il messaggio agente finale più gli identificatori di sessione quando presenti.output: "text"tratta stdout come risposta finale.
Modalità di input:
input: "arg"(predefinito) passa il prompt come ultimo argomento della CLI.input: "stdin"invia il prompt tramite stdin.- Se il prompt è molto lungo e
maxPromptArgCharsè impostato, viene usato stdin.
Predefiniti (di proprietà del Plugin)
I valori predefiniti dei backend CLI inclusi risiedono nel Plugin proprietario. Per esempio,
Anthropic possiede claude-cli e Google possiede google-gemini-cli. Le esecuzioni dell'agente OpenAI Codex usano l'harness app-server Codex tramite openai/*; OpenClaw non
registra più un backend codex-cli incluso.
Il Plugin Anthropic incluso registra un valore predefinito per claude-cli:
command: "claude"args: ["-p","--output-format","stream-json","--include-partial-messages","--verbose", ...]output: "jsonl"input: "stdin"modelArg: "--model"sessionMode: "always"
Anche il Plugin Google incluso registra un valore predefinito per google-gemini-cli:
command: "gemini"args: ["--skip-trust", "--approval-mode", "auto_edit", "--output-format", "stream-json", "--prompt", "{prompt}"]resumeArgs: ["--skip-trust", "--approval-mode", "auto_edit", "--resume", "{sessionId}", "--output-format", "stream-json", "--prompt", "{prompt}"]output: "jsonl"resumeOutput: "jsonl"jsonlDialect: "gemini-stream-json"imageArg: "@"imagePathScope: "workspace"modelArg: "--model"sessionMode: "existing"sessionIdFields: ["session_id", "sessionId"]
Prerequisito: la CLI Gemini locale deve essere installata e disponibile come
gemini in PATH (brew install gemini-cli o
npm install -g @google/gemini-cli).
Note sull'output della CLI Gemini:
- Il parser
stream-jsonpredefinito legge gli eventimessagedell'assistente, gli eventi degli strumenti, l'utilizzo finaleresulte gli eventi di errore irreversibile di Gemini. - Se sovrascrivi gli argomenti Gemini con
--output-format json, OpenClaw normalizza quel backend di nuovo aoutput: "json"e legge il testo della risposta dal campo JSONresponse. - L'utilizzo ricorre a
statsquandousageè assente o vuoto. stats.cachedviene normalizzato in OpenClawcacheRead.- Se
stats.inputmanca, OpenClaw deriva i token di input dastats.input_tokens - stats.cached.
Sovrascrivi solo se necessario (caso comune: percorso assoluto di command).
Valori predefiniti di proprietà del Plugin
I valori predefiniti dei backend CLI ora fanno parte della superficie del Plugin:
- I Plugin li registrano con
api.registerCliBackend(...). - L'
iddel backend diventa il prefisso del provider nei riferimenti ai modelli. - La configurazione utente in
agents.defaults.cliBackends.<id>sovrascrive ancora il valore predefinito del Plugin. - La pulizia della configurazione specifica del backend resta di proprietà del Plugin tramite l'hook opzionale
normalizeConfig.
I Plugin che necessitano di piccoli shim di compatibilità per prompt/messaggi possono dichiarare trasformazioni testuali bidirezionali senza sostituire un provider o un backend CLI:
api.registerTextTransforms({ input: [ { from: /red basket/g, to: "blue basket" }, { from: /paper ticket/g, to: "digital ticket" }, { from: /left shelf/g, to: "right shelf" }, ], output: [ { from: /blue basket/g, to: "red basket" }, { from: /digital ticket/g, to: "paper ticket" }, { from: /right shelf/g, to: "left shelf" }, ],});input riscrive il prompt di sistema e il prompt utente passati alla CLI. output
riscrive il testo dell'assistente in streaming e il testo finale analizzato prima che OpenClaw gestisca
i propri marcatori di controllo e la consegna al canale. Per le chiamate ai modelli supportate da provider,
output ripristina anche i valori stringa dentro gli argomenti strutturati delle chiamate agli strumenti dopo
la riparazione dello stream e prima dell'esecuzione dello strumento. I frammenti JSON grezzi del provider restano
invariati; i consumer dovrebbero usare il payload strutturato parziale, finale o di risultato.
Per le CLI che emettono eventi JSONL specifici del provider, imposta jsonlDialect nella configurazione di quel
backend. I dialetti supportati sono claude-stream-json per stream compatibili con Claude
Code e gemini-stream-json per eventi stream-json della CLI Gemini.
Proprietà della Compaction nativa
Alcuni backend CLI eseguono un agente che compatta il proprio transcript, quindi OpenClaw non deve eseguire il proprio riepilogatore di salvaguardia su di essi: farlo contrasta la Compaction interna del backend e può far fallire in modo definitivo il turno.
claude-cli non ha endpoint harness: Claude Code compatta internamente, quindi dichiara
ownsNativeCompaction: true e OpenClaw restituisce un no-op dal percorso di Compaction.
Le sessioni con harness nativo come Codex continuano invece a essere instradate al loro endpoint di Compaction dell'harness.
Poiché il backend possiede la Compaction, il vecchio ripiego di impostare
contextTokens: 1_000_000 solo per impedire l'attivazione della salvaguardia di OpenClaw su una
sessione claude-cli non è più necessario: l'opt-out lo sostituisce.
api.registerCliBackend({ id: "my-cli", ownsNativeCompaction: true /* ... */ });Dichiara ownsNativeCompaction solo per un backend che possiede davvero la propria Compaction: deve
limitare in modo affidabile il proprio transcript quando si avvicina alla finestra di contesto e persistere una
sessione riprendibile (ad es. --resume / --session-id); altrimenti una sessione differita può
restare oltre il budget. Le sessioni agentHarnessId corrispondenti continuano a essere instradate all'endpoint dell'harness.
Overlay MCP del bundle
I backend CLI non ricevono direttamente chiamate agli strumenti OpenClaw, ma un backend può
aderire a un overlay di configurazione MCP generato con bundleMcp: true.
Comportamento incluso attuale:
claude-cli: file di configurazione MCP rigoroso generatogoogle-gemini-cli: file di impostazioni di sistema Gemini generato
Quando MCP del bundle è abilitato, OpenClaw:
- avvia un server MCP HTTP local loopback che espone gli strumenti Gateway al processo CLI
- autentica il bridge con un token per sessione (
OPENCLAW_MCP_TOKEN) - circoscrive l'accesso agli strumenti al contesto della sessione, dell'account e del canale correnti
- carica i server bundle-MCP abilitati per il workspace corrente
- li unisce con qualunque forma di configurazione/impostazioni MCP backend esistente
- riscrive la configurazione di avvio usando la modalità di integrazione di proprietà del backend dall'estensione proprietaria
Se nessun server MCP è abilitato, OpenClaw inietta comunque una configurazione rigorosa quando un backend aderisce a MCP del bundle, così le esecuzioni in background restano isolate.
I runtime MCP inclusi con ambito di sessione vengono memorizzati nella cache per il riuso all'interno di una sessione, poi
eliminati dopo mcp.sessionIdleTtlMs millisecondi di inattività (predefinito 10
minuti; imposta 0 per disabilitare). Le esecuzioni incorporate one-shot come sonde di autenticazione,
generazione di slug e richiamo di active-memory richiedono la pulizia alla fine dell'esecuzione, così i figli stdio
e gli stream Streamable HTTP/SSE non sopravvivono all'esecuzione.
Limite della cronologia di reseed
Quando una nuova sessione CLI viene inizializzata da un precedente transcript OpenClaw (per
esempio dopo un nuovo tentativo session_expired), il blocco renderizzato
<conversation_history> viene limitato per impedire che i prompt di reseed
esplodano. Il valore predefinito è 12288 caratteri (circa 3000 token).
I backend Claude CLI usano automaticamente un limite più ampio derivato dal livello di contesto Claude risolto. Le esecuzioni Claude standard da 200K token mantengono una porzione di transcript più ampia, e le esecuzioni Claude da 1M token ne mantengono una ancora più ampia, mentre gli altri backend CLI mantengono il valore predefinito conservativo.
- Il limite governa solo il blocco di cronologia precedente del prompt di reseed. I limiti di
output della sessione live sono regolati separatamente in
reliability.outputLimits(vedi Sessioni).
Limitazioni
- Nessuna chiamata diretta agli strumenti OpenClaw. OpenClaw non inietta chiamate agli strumenti nel
protocollo del backend CLI. I backend vedono gli strumenti Gateway solo quando aderiscono a
bundleMcp: true. - Lo streaming è specifico del backend. Alcuni backend eseguono lo streaming JSONL; altri bufferizzano fino all'uscita.
- Gli output strutturati dipendono dal formato JSON della CLI.
Risoluzione dei problemi
- CLI non trovata: imposta
commandsu un percorso completo. - Nome modello errato: usa
modelAliasesper mappareprovider/model→ modello CLI. - Nessuna continuità di sessione: assicurati che
sessionArgsia impostato e chesessionModenon sianone. - Immagini ignorate: imposta
imageArg(e verifica che la CLI supporti i percorsi dei file).