Gateway
Backends da CLI
OpenClaw pode executar CLIs de IA locais como um fallback somente de texto quando provedores de API estão fora do ar, com limite de taxa, ou temporariamente com comportamento instável. Isso é intencionalmente conservador:
- As ferramentas do OpenClaw não são injetadas diretamente, mas backends com
bundleMcp: truepodem receber ferramentas do Gateway por meio de uma ponte MCP de local loopback. - Streaming JSONL para CLIs que oferecem suporte.
- Sessões são compatíveis (para que turnos de acompanhamento permaneçam coerentes).
- Imagens podem ser repassadas se a CLI aceitar caminhos de imagem.
Isso foi projetado como uma rede de segurança, em vez de um caminho principal. Use quando você quiser respostas de texto que "sempre funcionam" sem depender de APIs externas.
Se você quer um runtime de harness completo com controles de sessão ACP, tarefas em segundo plano, vinculação de thread/conversa e sessões externas persistentes de codificação, use Agentes ACP. Backends de CLI não são ACP.
Início rápido para iniciantes
Você pode usar a CLI do Claude Code sem nenhuma configuração (o Plugin Anthropic integrado registra um backend padrão):
openclaw agent --agent main --message "hi" --model claude-cli/claude-sonnet-4-6main é o ID de agente padrão quando nenhuma lista explícita de agentes está configurada. Se
você usa vários agentes, substitua-o pelo ID de agente que deseja executar.
Se seu Gateway roda sob launchd/systemd e o PATH é mínimo, adicione apenas o caminho do comando:
{ agents: { defaults: { cliBackends: { "claude-cli": { command: "/opt/homebrew/bin/claude", }, }, }, },}É só isso. Nenhuma chave, nenhuma configuração extra de autenticação necessária além da própria CLI.
Se você usa um backend de CLI integrado como o provedor principal de mensagens em um
host de Gateway, o OpenClaw agora carrega automaticamente o Plugin integrado proprietário quando sua configuração
referencia explicitamente esse backend em uma referência de modelo ou em
agents.defaults.cliBackends.
Usando como fallback
Adicione um backend de CLI à sua lista de fallbacks para que ele só execute quando modelos principais falharem:
{ agents: { defaults: { model: { primary: "anthropic/claude-opus-4-6", fallbacks: ["claude-cli/claude-sonnet-4-6"], }, models: { "anthropic/claude-opus-4-6": { alias: "Opus" }, "claude-cli/claude-sonnet-4-6": {}, }, }, },}Notas:
- Se você usa
agents.defaults.models(lista de permissões), também precisa incluir ali seus modelos de backend de CLI. - Se o provedor principal falhar (autenticação, limites de taxa, timeouts), o OpenClaw tentará o backend de CLI em seguida.
Visão geral da configuração
Todos os backends de CLI ficam em:
agents.defaults.cliBackendsCada entrada é indexada por um ID de provedor (por exemplo, claude-cli, my-cli).
O ID do provedor se torna o lado esquerdo da sua referência de modelo:
<provider>/<model>Exemplo de configuração
{ agents: { defaults: { cliBackends: { "my-cli": { command: "my-cli", args: ["--json"], output: "json", input: "arg", modelArg: "--model", modelAliases: { "claude-opus-4-6": "opus", "claude-sonnet-4-6": "sonnet", }, sessionArg: "--session", sessionMode: "existing", sessionIdFields: ["session_id", "conversation_id"], systemPromptArg: "--system", // For CLIs with a dedicated prompt-file flag: // systemPromptFileArg: "--system-file", // Codex-style CLIs can point at a prompt file instead: // systemPromptFileConfigArg: "-c", // systemPromptFileConfigKey: "model_instructions_file", systemPromptWhen: "first", imageArg: "--image", imageMode: "repeat", // Opt in only if this backend may reseed safe invalidated sessions // from bounded raw OpenClaw transcript history before compaction. reseedFromRawTranscriptWhenUncompacted: true, serialize: true, }, }, }, },}Como funciona
- Seleciona um backend com base no prefixo do provedor (
claude-cli/...). - Cria um prompt de sistema usando o mesmo prompt do OpenClaw + contexto do workspace.
- Executa a CLI com um ID de sessão (se compatível) para que o histórico permaneça consistente.
O backend integrado
claude-climantém um processo stdio do Claude ativo por sessão do OpenClaw e envia turnos de acompanhamento por stdin stream-json. - Analisa a saída (JSON ou texto simples) e retorna o texto final.
- Persiste IDs de sessão por backend, para que acompanhamentos reutilizem a mesma sessão de CLI.
O backend Anthropic integrado claude-cli prefere o resolvedor de skill nativo do Claude Code
para Skills do OpenClaw. Quando o snapshot atual de Skills inclui pelo menos
uma skill selecionada com um caminho materializado, o OpenClaw passa um Plugin temporário do Claude
Code com --plugin-dir e omite o catálogo duplicado de Skills do OpenClaw
do prompt de sistema anexado. Se o snapshot não tiver nenhuma skill de Plugin
materializada, o OpenClaw mantém o catálogo do prompt como fallback. Sobrescritas de env/chave de API
de Skills ainda são aplicadas pelo OpenClaw ao ambiente do processo filho para a
execução.
A CLI do Claude também tem seu próprio modo de permissão não interativo. O OpenClaw mapeia isso
para a política de execução existente em vez de adicionar configuração de política específica do Claude.
Para sessões Claude ao vivo gerenciadas pelo OpenClaw, a política efetiva de execução do OpenClaw é
autoritativa: YOLO (tools.exec.security: "full" e
tools.exec.ask: "off") inicia o Claude com
--permission-mode bypassPermissions, enquanto a política efetiva de execução restritiva
inicia o Claude com --permission-mode default. Configurações por agente em
agents.list[].tools.exec substituem tools.exec global para esse
agente. Argumentos brutos do backend Claude ainda podem incluir --permission-mode, mas inicializações
ao vivo do Claude normalizam essa flag para corresponder à política efetiva de execução do OpenClaw.
O backend Anthropic integrado claude-cli também mapeia níveis de /think do OpenClaw
para a flag nativa --effort do Claude Code para níveis que não sejam off. minimal e
low mapeiam para low, adaptive e medium mapeiam para medium, e high,
xhigh e max mapeiam diretamente. Outros backends de CLI precisam que seu Plugin proprietário
declare um mapeador argv equivalente antes que /think possa afetar a CLI gerada.
Antes que o OpenClaw possa usar o backend integrado claude-cli, o próprio Claude Code
já deve estar autenticado no mesmo host:
claude auth loginclaude auth status --textopenclaw models auth login --provider anthropic --method cli --set-defaultInstalações em Docker precisam que o Claude Code esteja instalado e autenticado dentro da home persistida do contêiner, não apenas no host. Consulte Backend de CLI do Claude no Docker.
Use agents.defaults.cliBackends.claude-cli.command apenas quando o binário claude
ainda não estiver no PATH.
Sessões
- Se a CLI oferece suporte a sessões, defina
sessionArg(por exemplo,--session-id) ousessionArgs(placeholder{sessionId}) quando o ID precisar ser inserido em várias flags. - Se a CLI usa um subcomando de retomada com flags diferentes, defina
resumeArgs(substituiargsao retomar) e opcionalmenteresumeOutput(para retomadas não JSON). sessionMode:always: sempre envia um ID de sessão (novo UUID se nenhum estiver armazenado).existing: só envia um ID de sessão se um já tiver sido armazenado antes.none: nunca envia um ID de sessão.
claude-cliusa por padrãoliveSession: "claude-stdio",output: "jsonl", einput: "stdin"para que turnos de acompanhamento reutilizem o processo Claude ao vivo enquanto ele estiver ativo. stdio aquecido agora é o padrão, inclusive para configurações personalizadas que omitem campos de transporte. Se o Gateway reiniciar ou o processo ocioso sair, o OpenClaw retoma a partir do ID de sessão armazenado do Claude. IDs de sessão armazenados são verificados contra uma transcrição de projeto existente e legível antes da retomada, então vínculos fantasma são limpos comreason=transcript-missingem vez de iniciar silenciosamente uma nova sessão da CLI do Claude sob--resume.- Sessões Claude ao vivo mantêm guardas limitados de saída JSONL. Os padrões permitem até
8 MiB e 20.000 linhas JSONL brutas por turno. Turnos do Claude com muitas ferramentas podem aumentá-los
por backend com
agents.defaults.cliBackends.claude-cli.reliability.outputLimits.maxTurnRawCharsemaxTurnLines; o OpenClaw limita essas configurações a 64 MiB e 100.000 linhas. - Sessões de CLI armazenadas são continuidade de propriedade do provedor. A redefinição diária implícita de sessão
não as corta;
/resete políticas explícitassession.resetainda cortam. - Sessões de CLI novas normalmente replantam apenas a partir do resumo de Compaction do OpenClaw
mais a cauda pós-Compaction. Para recuperar sessões curtas que são invalidadas
antes da Compaction, um backend pode optar por isso com
reseedFromRawTranscriptWhenUncompacted: true. O OpenClaw ainda mantém o replantio de transcrição bruta limitado e o restringe a invalidações seguras, como transcrições de CLI ausentes, mudanças de prompt de sistema/MCP, ou nova tentativa por sessão expirada; mudanças de perfil de autenticação ou época de credencial nunca replantam histórico de transcrição bruta.
Notas de serialização:
serialize: truemantém execuções da mesma faixa ordenadas.- A maioria das CLIs serializa em uma faixa de provedor.
- O OpenClaw descarta a reutilização de sessão de CLI armazenada quando a identidade de autenticação selecionada muda, incluindo mudança de ID de perfil de autenticação, chave de API estática, token estático, ou identidade de conta OAuth quando a CLI expõe uma. A rotação de tokens OAuth de acesso e atualização não corta a sessão de CLI armazenada. Se uma CLI não expuser um ID de conta OAuth estável, o OpenClaw deixa essa CLI impor permissões de retomada.
Prelúdio de fallback de sessões claude-cli
Quando uma tentativa claude-cli falha para um candidato não CLI em
agents.defaults.model.fallbacks, o OpenClaw semeia
a próxima tentativa com um prelúdio de contexto colhido da transcrição JSONL local
do Claude Code em ~/.claude/projects/. Sem essa semente, o provedor de fallback
começaria frio porque a própria transcrição de sessão do OpenClaw fica vazia
para execuções claude-cli.
- O prelúdio prefere o resumo
/compactmais recente ou o marcadorcompact_boundary, depois anexa os turnos pós-limite mais recentes até um orçamento de caracteres. Turnos pré-limite são descartados porque o resumo já os representa. - Blocos de ferramenta são consolidados em dicas compactas
(tool call: name)e(tool result: …)para manter o orçamento de prompt honesto. O resumo é rotulado como(truncated)se exceder o limite. - Fallbacks
claude-cliparaclaude-clido mesmo provedor dependem do próprio--resumedo Claude e pulam o prelúdio. - A semente reutiliza a validação existente de caminho de arquivo de sessão do Claude, para que caminhos arbitrários não possam ser lidos.
Imagens (repasse)
Se sua CLI aceita caminhos de imagem, defina imageArg:
imageArg: "--image",imageMode: "repeat"O OpenClaw gravará imagens base64 em arquivos temporários. Se imageArg estiver definido, esses
caminhos são passados como argumentos da CLI. Se imageArg estiver ausente, o OpenClaw anexa os
caminhos de arquivo ao prompt (injeção de caminho), o que é suficiente para CLIs que carregam automaticamente
arquivos locais a partir de caminhos simples.
Entradas / saídas
output: "json"(padrão) tenta analisar JSON e extrair texto + ID de sessão.- Para saída JSON da CLI Gemini, o OpenClaw lê o texto de resposta de
responsee o uso destatsquandousageestá ausente ou vazio. O padrão integrado da CLI Gemini usastream-json, mas sobrescritas antigas--output-format jsonainda usam o analisador JSON. output: "jsonl"analisa streams JSONL e extrai a mensagem final do agente mais identificadores de sessão quando presentes.output: "text"trata stdout como a resposta final.
Modos de entrada:
input: "arg"(padrão) passa o prompt como o último argumento da CLI.input: "stdin"envia o prompt via stdin.- Se o prompt for muito longo e
maxPromptArgCharsestiver definido, stdin será usado.
Padrões (pertencentes ao Plugin)
Os padrões de backend CLI incluídos ficam com o Plugin proprietário. Por exemplo,
Anthropic é proprietário de claude-cli e Google é proprietário de google-gemini-cli. Execuções de
agente do OpenAI Codex usam o harness de app-server do Codex por meio de openai/*; o OpenClaw não
registra mais um backend codex-cli incluído.
O Plugin Anthropic incluído registra um padrão para claude-cli:
command: "claude"args: ["-p","--output-format","stream-json","--include-partial-messages","--verbose", ...]output: "jsonl"input: "stdin"modelArg: "--model"sessionMode: "always"
O Plugin Google incluído também registra um padrão para google-gemini-cli:
command: "gemini"args: ["--skip-trust", "--approval-mode", "auto_edit", "--output-format", "stream-json", "--prompt", "{prompt}"]resumeArgs: ["--skip-trust", "--approval-mode", "auto_edit", "--resume", "{sessionId}", "--output-format", "stream-json", "--prompt", "{prompt}"]output: "jsonl"resumeOutput: "jsonl"jsonlDialect: "gemini-stream-json"imageArg: "@"imagePathScope: "workspace"modelArg: "--model"sessionMode: "existing"sessionIdFields: ["session_id", "sessionId"]
Pré-requisito: a CLI local do Gemini deve estar instalada e disponível como
gemini no PATH (brew install gemini-cli ou
npm install -g @google/gemini-cli).
Observações sobre a saída da CLI do Gemini:
- O parser padrão de
stream-jsonlê eventosmessagedo assistente, eventos de ferramenta, uso final deresulte eventos fatais de erro do Gemini. - Se você substituir os argumentos do Gemini para
--output-format json, o OpenClaw normaliza esse backend de volta paraoutput: "json"e lê o texto da resposta no camporesponsedo JSON. - O uso recorre a
statsquandousageestá ausente ou vazio. stats.cachedé normalizado paracacheReaddo OpenClaw.- Se
stats.inputestiver ausente, o OpenClaw deriva os tokens de entrada destats.input_tokens - stats.cached.
Substitua somente se necessário (comum: caminho absoluto de command).
Padrões pertencentes ao Plugin
Os padrões de backend CLI agora fazem parte da superfície do Plugin:
- Plugins os registram com
api.registerCliBackend(...). - O
iddo backend se torna o prefixo do provedor nas refs de modelo. - A configuração do usuário em
agents.defaults.cliBackends.<id>ainda substitui o padrão do Plugin. - A limpeza de configuração específica do backend permanece pertencente ao Plugin por meio do hook opcional
normalizeConfig.
Plugins que precisam de pequenos shims de compatibilidade de prompt/mensagem podem declarar transformações de texto bidirecionais sem substituir um provedor ou backend CLI:
api.registerTextTransforms({ input: [ { from: /red basket/g, to: "blue basket" }, { from: /paper ticket/g, to: "digital ticket" }, { from: /left shelf/g, to: "right shelf" }, ], output: [ { from: /blue basket/g, to: "red basket" }, { from: /digital ticket/g, to: "paper ticket" }, { from: /right shelf/g, to: "left shelf" }, ],});input reescreve o prompt do sistema e o prompt do usuário passados para a CLI. output
reescreve o texto transmitido do assistente e o texto final analisado antes que o OpenClaw processe
seus próprios marcadores de controle e a entrega no canal. Para chamadas de modelo apoiadas por provedor,
output também restaura valores de string dentro de argumentos estruturados de chamada de ferramenta após
o reparo do stream e antes da execução da ferramenta. Fragmentos JSON brutos do provedor permanecem
inalterados; consumidores devem usar o payload parcial, final ou de resultado estruturado.
Para CLIs que emitem eventos JSONL específicos do provedor, defina jsonlDialect na configuração desse
backend. Os dialetos compatíveis são claude-stream-json para streams compatíveis com Claude
Code e gemini-stream-json para eventos stream-json da CLI do Gemini.
Propriedade da Compaction nativa
Alguns backends CLI executam um agente que compacta sua própria transcrição, então o OpenClaw não deve executar seu sumarizador de salvaguarda sobre eles - fazer isso entra em conflito com a própria Compaction do backend e pode fazer o turno falhar de forma definitiva.
claude-cli não tem endpoint de harness - o Claude Code compacta internamente - então ele declara
ownsNativeCompaction: true, e o OpenClaw retorna uma operação sem efeito do caminho de Compaction.
Sessões de harness nativo, como Codex, continuam roteando para seu endpoint de Compaction do harness.
Como o backend é proprietário da Compaction, a antiga solução provisória de definir
contextTokens: 1_000_000 apenas para impedir que a salvaguarda do OpenClaw fosse acionada em uma
sessão claude-cli não é mais necessária - a opção de exclusão a substitui.
api.registerCliBackend({ id: "my-cli", ownsNativeCompaction: true /* ... */ });Declare ownsNativeCompaction apenas para um backend que realmente é proprietário da sua Compaction: ele
deve limitar de forma confiável sua própria transcrição à medida que se aproxima da janela de contexto e persistir uma
sessão retomável (por exemplo, --resume / --session-id); caso contrário, uma sessão adiada pode
permanecer acima do orçamento. Sessões correspondentes a agentHarnessId ainda são roteadas para o endpoint do harness.
Sobreposições MCP incluídas
Backends CLI não recebem chamadas de ferramenta do OpenClaw diretamente, mas um backend pode
optar por uma sobreposição de configuração MCP gerada com bundleMcp: true.
Comportamento incluído atual:
claude-cli: arquivo de configuração MCP estrito geradogoogle-gemini-cli: arquivo de configurações do sistema Gemini gerado
Quando o MCP incluído está habilitado, o OpenClaw:
- inicia um servidor MCP HTTP de local loopback que expõe ferramentas do Gateway ao processo da CLI
- autentica a ponte com um token por sessão (
OPENCLAW_MCP_TOKEN) - restringe o acesso às ferramentas ao contexto da sessão, conta e canal atuais
- carrega servidores MCP incluídos habilitados para o workspace atual
- mescla-os com qualquer formato de configuração/definições MCP existente do backend
- reescreve a configuração de inicialização usando o modo de integração pertencente ao backend da extensão proprietária
Se nenhum servidor MCP estiver habilitado, o OpenClaw ainda injeta uma configuração estrita quando um backend opta pelo MCP incluído, para que execuções em segundo plano permaneçam isoladas.
Runtimes MCP incluídos com escopo de sessão são armazenados em cache para reutilização dentro de uma sessão e depois
removidos após mcp.sessionIdleTtlMs milissegundos de tempo ocioso (padrão de 10
minutos; defina 0 para desabilitar). Execuções incorporadas de uso único, como sondagens de autenticação,
geração de slug e solicitações de recuperação da Active Memory fazem limpeza no fim da execução para que filhos stdio
e streams Streamable HTTP/SSE não sobrevivam à execução.
Limite do histórico de reseed
Quando uma nova sessão CLI é semeada a partir de uma transcrição anterior do OpenClaw (por
exemplo, após uma nova tentativa de session_expired), o bloco
<conversation_history> renderizado é limitado para impedir que prompts de reseed
explodam. O padrão é 12288 caracteres (cerca de 3000 tokens).
Backends da CLI do Claude usam automaticamente um limite maior derivado do tier de contexto resolvido do Claude. Execuções padrão de 200 mil tokens do Claude mantêm uma fatia maior da transcrição, e execuções de 1 milhão de tokens do Claude mantêm uma fatia ainda maior, enquanto outros backends CLI mantêm o padrão conservador.
- O limite governa apenas o bloco de histórico anterior do prompt de reseed. Limites de saída
de sessão ativa são ajustados separadamente em
reliability.outputLimits(veja Sessões).
Limitações
- Sem chamadas diretas de ferramenta do OpenClaw. O OpenClaw não injeta chamadas de ferramenta no
protocolo do backend CLI. Backends só veem ferramentas do Gateway quando optam por
bundleMcp: true. - O streaming é específico do backend. Alguns backends transmitem JSONL; outros mantêm em buffer até a saída.
- Saídas estruturadas dependem do formato JSON da CLI.
Solução de problemas
- CLI não encontrada: defina
commandcomo um caminho completo. - Nome de modelo incorreto: use
modelAliasespara mapearprovider/model→ modelo da CLI. - Sem continuidade de sessão: garanta que
sessionArgesteja definido e quesessionModenão sejanone. - Imagens ignoradas: defina
imageArg(e verifique se a CLI aceita caminhos de arquivo).