Gateway

Backends da CLI

OpenClaw pode executar CLIs de IA locais como um fallback somente de texto quando provedores de API estão fora do ar, com limite de taxa, ou temporariamente com comportamento instável. Isso é intencionalmente conservador:

  • As ferramentas do OpenClaw não são injetadas diretamente, mas backends com bundleMcp: true podem receber ferramentas do Gateway por meio de uma ponte MCP de local loopback.
  • Streaming JSONL para CLIs que oferecem suporte.
  • Sessões são compatíveis (para que turnos de acompanhamento permaneçam coerentes).
  • Imagens podem ser repassadas se a CLI aceitar caminhos de imagem.

Isso foi projetado como uma rede de segurança, em vez de um caminho principal. Use quando você quiser respostas de texto que "sempre funcionam" sem depender de APIs externas.

Se você quer um runtime de harness completo com controles de sessão ACP, tarefas em segundo plano, vinculação de thread/conversa e sessões externas persistentes de codificação, use Agentes ACP. Backends de CLI não são ACP.

Início rápido para iniciantes

Você pode usar a CLI do Claude Code sem nenhuma configuração (o Plugin Anthropic integrado registra um backend padrão):

bash
openclaw agent --agent main --message "hi" --model claude-cli/claude-sonnet-4-6

main é o ID de agente padrão quando nenhuma lista explícita de agentes está configurada. Se você usa vários agentes, substitua-o pelo ID de agente que deseja executar.

Se seu Gateway roda sob launchd/systemd e o PATH é mínimo, adicione apenas o caminho do comando:

json5
{  agents: {    defaults: {      cliBackends: {        "claude-cli": {          command: "/opt/homebrew/bin/claude",        },      },    },  },}

É só isso. Nenhuma chave, nenhuma configuração extra de autenticação necessária além da própria CLI.

Se você usa um backend de CLI integrado como o provedor principal de mensagens em um host de Gateway, o OpenClaw agora carrega automaticamente o Plugin integrado proprietário quando sua configuração referencia explicitamente esse backend em uma referência de modelo ou em agents.defaults.cliBackends.

Usando como fallback

Adicione um backend de CLI à sua lista de fallbacks para que ele só execute quando modelos principais falharem:

json5
{  agents: {    defaults: {      model: {        primary: "anthropic/claude-opus-4-6",        fallbacks: ["claude-cli/claude-sonnet-4-6"],      },      models: {        "anthropic/claude-opus-4-6": { alias: "Opus" },        "claude-cli/claude-sonnet-4-6": {},      },    },  },}

Notas:

  • Se você usa agents.defaults.models (lista de permissões), também precisa incluir ali seus modelos de backend de CLI.
  • Se o provedor principal falhar (autenticação, limites de taxa, timeouts), o OpenClaw tentará o backend de CLI em seguida.

Visão geral da configuração

Todos os backends de CLI ficam em:

Code
agents.defaults.cliBackends

Cada entrada é indexada por um ID de provedor (por exemplo, claude-cli, my-cli). O ID do provedor se torna o lado esquerdo da sua referência de modelo:

Code
<provider>/<model>

Exemplo de configuração

json5
{  agents: {    defaults: {      cliBackends: {        "my-cli": {          command: "my-cli",          args: ["--json"],          output: "json",          input: "arg",          modelArg: "--model",          modelAliases: {            "claude-opus-4-6": "opus",            "claude-sonnet-4-6": "sonnet",          },          sessionArg: "--session",          sessionMode: "existing",          sessionIdFields: ["session_id", "conversation_id"],          systemPromptArg: "--system",          // For CLIs with a dedicated prompt-file flag:          // systemPromptFileArg: "--system-file",          // Codex-style CLIs can point at a prompt file instead:          // systemPromptFileConfigArg: "-c",          // systemPromptFileConfigKey: "model_instructions_file",          systemPromptWhen: "first",          imageArg: "--image",          imageMode: "repeat",          // Opt in only if this backend may reseed safe invalidated sessions          // from bounded raw OpenClaw transcript history before compaction.          reseedFromRawTranscriptWhenUncompacted: true,          serialize: true,        },      },    },  },}

Como funciona

  1. Seleciona um backend com base no prefixo do provedor (claude-cli/...).
  2. Cria um prompt de sistema usando o mesmo prompt do OpenClaw + contexto do workspace.
  3. Executa a CLI com um ID de sessão (se compatível) para que o histórico permaneça consistente. O backend integrado claude-cli mantém um processo stdio do Claude ativo por sessão do OpenClaw e envia turnos de acompanhamento por stdin stream-json.
  4. Analisa a saída (JSON ou texto simples) e retorna o texto final.
  5. Persiste IDs de sessão por backend, para que acompanhamentos reutilizem a mesma sessão de CLI.

O backend Anthropic integrado claude-cli prefere o resolvedor de skill nativo do Claude Code para Skills do OpenClaw. Quando o snapshot atual de Skills inclui pelo menos uma skill selecionada com um caminho materializado, o OpenClaw passa um Plugin temporário do Claude Code com --plugin-dir e omite o catálogo duplicado de Skills do OpenClaw do prompt de sistema anexado. Se o snapshot não tiver nenhuma skill de Plugin materializada, o OpenClaw mantém o catálogo do prompt como fallback. Sobrescritas de env/chave de API de Skills ainda são aplicadas pelo OpenClaw ao ambiente do processo filho para a execução.

A CLI do Claude também tem seu próprio modo de permissão não interativo. O OpenClaw mapeia isso para a política de execução existente em vez de adicionar configuração de política específica do Claude. Para sessões Claude ao vivo gerenciadas pelo OpenClaw, a política efetiva de execução do OpenClaw é autoritativa: YOLO (tools.exec.security: "full" e tools.exec.ask: "off") inicia o Claude com --permission-mode bypassPermissions, enquanto a política efetiva de execução restritiva inicia o Claude com --permission-mode default. Configurações por agente em agents.list[].tools.exec substituem tools.exec global para esse agente. Argumentos brutos do backend Claude ainda podem incluir --permission-mode, mas inicializações ao vivo do Claude normalizam essa flag para corresponder à política efetiva de execução do OpenClaw.

O backend Anthropic integrado claude-cli também mapeia níveis de /think do OpenClaw para a flag nativa --effort do Claude Code para níveis que não sejam off. minimal e low mapeiam para low, adaptive e medium mapeiam para medium, e high, xhigh e max mapeiam diretamente. Outros backends de CLI precisam que seu Plugin proprietário declare um mapeador argv equivalente antes que /think possa afetar a CLI gerada.

Antes que o OpenClaw possa usar o backend integrado claude-cli, o próprio Claude Code já deve estar autenticado no mesmo host:

bash
claude auth loginclaude auth status --textopenclaw models auth login --provider anthropic --method cli --set-default

Instalações em Docker precisam que o Claude Code esteja instalado e autenticado dentro da home persistida do contêiner, não apenas no host. Consulte Backend de CLI do Claude no Docker.

Use agents.defaults.cliBackends.claude-cli.command apenas quando o binário claude ainda não estiver no PATH.

Sessões

  • Se a CLI oferece suporte a sessões, defina sessionArg (por exemplo, --session-id) ou sessionArgs (placeholder {sessionId}) quando o ID precisar ser inserido em várias flags.
  • Se a CLI usa um subcomando de retomada com flags diferentes, defina resumeArgs (substitui args ao retomar) e opcionalmente resumeOutput (para retomadas não JSON).
  • sessionMode:
    • always: sempre envia um ID de sessão (novo UUID se nenhum estiver armazenado).
    • existing: só envia um ID de sessão se um já tiver sido armazenado antes.
    • none: nunca envia um ID de sessão.
  • claude-cli usa por padrão liveSession: "claude-stdio", output: "jsonl", e input: "stdin" para que turnos de acompanhamento reutilizem o processo Claude ao vivo enquanto ele estiver ativo. stdio aquecido agora é o padrão, inclusive para configurações personalizadas que omitem campos de transporte. Se o Gateway reiniciar ou o processo ocioso sair, o OpenClaw retoma a partir do ID de sessão armazenado do Claude. IDs de sessão armazenados são verificados contra uma transcrição de projeto existente e legível antes da retomada, então vínculos fantasma são limpos com reason=transcript-missing em vez de iniciar silenciosamente uma nova sessão da CLI do Claude sob --resume.
  • Sessões Claude ao vivo mantêm guardas limitados de saída JSONL. Os padrões permitem até 8 MiB e 20.000 linhas JSONL brutas por turno. Turnos do Claude com muitas ferramentas podem aumentá-los por backend com agents.defaults.cliBackends.claude-cli.reliability.outputLimits.maxTurnRawChars e maxTurnLines; o OpenClaw limita essas configurações a 64 MiB e 100.000 linhas.
  • Sessões de CLI armazenadas são continuidade de propriedade do provedor. A redefinição diária implícita de sessão não as corta; /reset e políticas explícitas session.reset ainda cortam.
  • Sessões de CLI novas normalmente replantam apenas a partir do resumo de Compaction do OpenClaw mais a cauda pós-Compaction. Para recuperar sessões curtas que são invalidadas antes da Compaction, um backend pode optar por isso com reseedFromRawTranscriptWhenUncompacted: true. O OpenClaw ainda mantém o replantio de transcrição bruta limitado e o restringe a invalidações seguras, como transcrições de CLI ausentes, mudanças de prompt de sistema/MCP, ou nova tentativa por sessão expirada; mudanças de perfil de autenticação ou época de credencial nunca replantam histórico de transcrição bruta.

Notas de serialização:

  • serialize: true mantém execuções da mesma faixa ordenadas.
  • A maioria das CLIs serializa em uma faixa de provedor.
  • O OpenClaw descarta a reutilização de sessão de CLI armazenada quando a identidade de autenticação selecionada muda, incluindo mudança de ID de perfil de autenticação, chave de API estática, token estático, ou identidade de conta OAuth quando a CLI expõe uma. A rotação de tokens OAuth de acesso e atualização não corta a sessão de CLI armazenada. Se uma CLI não expuser um ID de conta OAuth estável, o OpenClaw deixa essa CLI impor permissões de retomada.

Prelúdio de fallback de sessões claude-cli

Quando uma tentativa claude-cli falha para um candidato não CLI em agents.defaults.model.fallbacks, o OpenClaw semeia a próxima tentativa com um prelúdio de contexto colhido da transcrição JSONL local do Claude Code em ~/.claude/projects/. Sem essa semente, o provedor de fallback começaria frio porque a própria transcrição de sessão do OpenClaw fica vazia para execuções claude-cli.

  • O prelúdio prefere o resumo /compact mais recente ou o marcador compact_boundary, depois anexa os turnos pós-limite mais recentes até um orçamento de caracteres. Turnos pré-limite são descartados porque o resumo já os representa.
  • Blocos de ferramenta são consolidados em dicas compactas (tool call: name) e (tool result: …) para manter o orçamento de prompt honesto. O resumo é rotulado como (truncated) se exceder o limite.
  • Fallbacks claude-cli para claude-cli do mesmo provedor dependem do próprio --resume do Claude e pulam o prelúdio.
  • A semente reutiliza a validação existente de caminho de arquivo de sessão do Claude, para que caminhos arbitrários não possam ser lidos.

Imagens (repasse)

Se sua CLI aceita caminhos de imagem, defina imageArg:

json5
imageArg: "--image",imageMode: "repeat"

O OpenClaw gravará imagens base64 em arquivos temporários. Se imageArg estiver definido, esses caminhos são passados como argumentos da CLI. Se imageArg estiver ausente, o OpenClaw anexa os caminhos de arquivo ao prompt (injeção de caminho), o que é suficiente para CLIs que carregam automaticamente arquivos locais a partir de caminhos simples.

Entradas / saídas

  • output: "json" (padrão) tenta analisar JSON e extrair texto + ID de sessão.
  • Para saída JSON da CLI Gemini, o OpenClaw lê o texto de resposta de response e o uso de stats quando usage está ausente ou vazio. O padrão integrado da CLI Gemini usa stream-json, mas sobrescritas antigas --output-format json ainda usam o analisador JSON.
  • output: "jsonl" analisa streams JSONL e extrai a mensagem final do agente mais identificadores de sessão quando presentes.
  • output: "text" trata stdout como a resposta final.

Modos de entrada:

  • input: "arg" (padrão) passa o prompt como o último argumento da CLI.
  • input: "stdin" envia o prompt via stdin.
  • Se o prompt for muito longo e maxPromptArgChars estiver definido, stdin será usado.

Padrões (pertencentes ao Plugin)

Os padrões de backend CLI incluídos ficam com o Plugin proprietário. Por exemplo, Anthropic é proprietário de claude-cli e Google é proprietário de google-gemini-cli. Execuções de agente do OpenAI Codex usam o harness de app-server do Codex por meio de openai/*; o OpenClaw não registra mais um backend codex-cli incluído.

O Plugin Anthropic incluído registra um padrão para claude-cli:

  • command: "claude"
  • args: ["-p","--output-format","stream-json","--include-partial-messages","--verbose", ...]
  • output: "jsonl"
  • input: "stdin"
  • modelArg: "--model"
  • sessionMode: "always"

O Plugin Google incluído também registra um padrão para google-gemini-cli:

  • command: "gemini"
  • args: ["--skip-trust", "--approval-mode", "auto_edit", "--output-format", "stream-json", "--prompt", "{prompt}"]
  • resumeArgs: ["--skip-trust", "--approval-mode", "auto_edit", "--resume", "{sessionId}", "--output-format", "stream-json", "--prompt", "{prompt}"]
  • output: "jsonl"
  • resumeOutput: "jsonl"
  • jsonlDialect: "gemini-stream-json"
  • imageArg: "@"
  • imagePathScope: "workspace"
  • modelArg: "--model"
  • sessionMode: "existing"
  • sessionIdFields: ["session_id", "sessionId"]

Pré-requisito: a CLI local do Gemini deve estar instalada e disponível como gemini no PATH (brew install gemini-cli ou npm install -g @google/gemini-cli).

Observações sobre a saída da CLI do Gemini:

  • O parser padrão de stream-json lê eventos message do assistente, eventos de ferramenta, uso final de result e eventos fatais de erro do Gemini.
  • Se você substituir os argumentos do Gemini para --output-format json, o OpenClaw normaliza esse backend de volta para output: "json" e lê o texto da resposta no campo response do JSON.
  • O uso recorre a stats quando usage está ausente ou vazio.
  • stats.cached é normalizado para cacheRead do OpenClaw.
  • Se stats.input estiver ausente, o OpenClaw deriva os tokens de entrada de stats.input_tokens - stats.cached.

Substitua somente se necessário (comum: caminho absoluto de command).

Padrões pertencentes ao Plugin

Os padrões de backend CLI agora fazem parte da superfície do Plugin:

  • Plugins os registram com api.registerCliBackend(...).
  • O id do backend se torna o prefixo do provedor nas refs de modelo.
  • A configuração do usuário em agents.defaults.cliBackends.<id> ainda substitui o padrão do Plugin.
  • A limpeza de configuração específica do backend permanece pertencente ao Plugin por meio do hook opcional normalizeConfig.

Plugins que precisam de pequenos shims de compatibilidade de prompt/mensagem podem declarar transformações de texto bidirecionais sem substituir um provedor ou backend CLI:

typescript
api.registerTextTransforms({  input: [    { from: /red basket/g, to: "blue basket" },    { from: /paper ticket/g, to: "digital ticket" },    { from: /left shelf/g, to: "right shelf" },  ],  output: [    { from: /blue basket/g, to: "red basket" },    { from: /digital ticket/g, to: "paper ticket" },    { from: /right shelf/g, to: "left shelf" },  ],});

input reescreve o prompt do sistema e o prompt do usuário passados para a CLI. output reescreve o texto transmitido do assistente e o texto final analisado antes que o OpenClaw processe seus próprios marcadores de controle e a entrega no canal. Para chamadas de modelo apoiadas por provedor, output também restaura valores de string dentro de argumentos estruturados de chamada de ferramenta após o reparo do stream e antes da execução da ferramenta. Fragmentos JSON brutos do provedor permanecem inalterados; consumidores devem usar o payload parcial, final ou de resultado estruturado.

Para CLIs que emitem eventos JSONL específicos do provedor, defina jsonlDialect na configuração desse backend. Os dialetos compatíveis são claude-stream-json para streams compatíveis com Claude Code e gemini-stream-json para eventos stream-json da CLI do Gemini.

Propriedade da Compaction nativa

Alguns backends CLI executam um agente que compacta sua própria transcrição, então o OpenClaw não deve executar seu sumarizador de salvaguarda sobre eles - fazer isso entra em conflito com a própria Compaction do backend e pode fazer o turno falhar de forma definitiva.

claude-cli não tem endpoint de harness - o Claude Code compacta internamente - então ele declara ownsNativeCompaction: true, e o OpenClaw retorna uma operação sem efeito do caminho de Compaction. Sessões de harness nativo, como Codex, continuam roteando para seu endpoint de Compaction do harness.

Como o backend é proprietário da Compaction, a antiga solução provisória de definir contextTokens: 1_000_000 apenas para impedir que a salvaguarda do OpenClaw fosse acionada em uma sessão claude-cli não é mais necessária - a opção de exclusão a substitui.

typescript
api.registerCliBackend({ id: "my-cli", ownsNativeCompaction: true /* ... */ });

Declare ownsNativeCompaction apenas para um backend que realmente é proprietário da sua Compaction: ele deve limitar de forma confiável sua própria transcrição à medida que se aproxima da janela de contexto e persistir uma sessão retomável (por exemplo, --resume / --session-id); caso contrário, uma sessão adiada pode permanecer acima do orçamento. Sessões correspondentes a agentHarnessId ainda são roteadas para o endpoint do harness.

Sobreposições MCP incluídas

Backends CLI não recebem chamadas de ferramenta do OpenClaw diretamente, mas um backend pode optar por uma sobreposição de configuração MCP gerada com bundleMcp: true.

Comportamento incluído atual:

  • claude-cli: arquivo de configuração MCP estrito gerado
  • google-gemini-cli: arquivo de configurações do sistema Gemini gerado

Quando o MCP incluído está habilitado, o OpenClaw:

  • inicia um servidor MCP HTTP de local loopback que expõe ferramentas do Gateway ao processo da CLI
  • autentica a ponte com um token por sessão (OPENCLAW_MCP_TOKEN)
  • restringe o acesso às ferramentas ao contexto da sessão, conta e canal atuais
  • carrega servidores MCP incluídos habilitados para o workspace atual
  • mescla-os com qualquer formato de configuração/definições MCP existente do backend
  • reescreve a configuração de inicialização usando o modo de integração pertencente ao backend da extensão proprietária

Se nenhum servidor MCP estiver habilitado, o OpenClaw ainda injeta uma configuração estrita quando um backend opta pelo MCP incluído, para que execuções em segundo plano permaneçam isoladas.

Runtimes MCP incluídos com escopo de sessão são armazenados em cache para reutilização dentro de uma sessão e depois removidos após mcp.sessionIdleTtlMs milissegundos de tempo ocioso (padrão de 10 minutos; defina 0 para desabilitar). Execuções incorporadas de uso único, como sondagens de autenticação, geração de slug e solicitações de recuperação da Active Memory fazem limpeza no fim da execução para que filhos stdio e streams Streamable HTTP/SSE não sobrevivam à execução.

Limite do histórico de reseed

Quando uma nova sessão CLI é semeada a partir de uma transcrição anterior do OpenClaw (por exemplo, após uma nova tentativa de session_expired), o bloco <conversation_history> renderizado é limitado para impedir que prompts de reseed explodam. O padrão é 12288 caracteres (cerca de 3000 tokens).

Backends da CLI do Claude usam automaticamente um limite maior derivado do tier de contexto resolvido do Claude. Execuções padrão de 200 mil tokens do Claude mantêm uma fatia maior da transcrição, e execuções de 1 milhão de tokens do Claude mantêm uma fatia ainda maior, enquanto outros backends CLI mantêm o padrão conservador.

  • O limite governa apenas o bloco de histórico anterior do prompt de reseed. Limites de saída de sessão ativa são ajustados separadamente em reliability.outputLimits (veja Sessões).

Limitações

  • Sem chamadas diretas de ferramenta do OpenClaw. O OpenClaw não injeta chamadas de ferramenta no protocolo do backend CLI. Backends só veem ferramentas do Gateway quando optam por bundleMcp: true.
  • O streaming é específico do backend. Alguns backends transmitem JSONL; outros mantêm em buffer até a saída.
  • Saídas estruturadas dependem do formato JSON da CLI.

Solução de problemas

  • CLI não encontrada: defina command como um caminho completo.
  • Nome de modelo incorreto: use modelAliases para mapear provider/model → modelo da CLI.
  • Sem continuidade de sessão: garanta que sessionArg esteja definido e que sessionMode não seja none.
  • Imagens ignoradas: defina imageArg (e verifique se a CLI aceita caminhos de arquivo).

Relacionado

Was this useful?
On this page

On this page