Modelos: padrões, seleção, aliases, troca
O que é o "modelo padrão"?
O que é o "modelo padrão"?
provider/model (exemplo: openai/gpt-5.4 ou openai-codex/gpt-5.5). Se você omitir o provider, o OpenClaw primeiro tenta um alias, depois uma correspondência única de provider configurado para esse ID de modelo exato e só então recorre ao provider padrão configurado como um caminho de compatibilidade obsoleto. Se esse provider não expuser mais o modelo padrão configurado, o OpenClaw recorre ao primeiro provider/modelo configurado em vez de exibir um padrão obsoleto de provider removido. Ainda assim, você deve definir explicitamente provider/model.Qual modelo você recomenda?
Qual modelo você recomenda?
Como troco de modelo sem apagar minha configuração?
Como troco de modelo sem apagar minha configuração?
/modelno chat (rápido, por sessão)openclaw models set ...(atualiza apenas a configuração de modelo)openclaw configure --section model(interativo)- edite
agents.defaults.modelem~/.openclaw/openclaw.json
config.apply com um objeto parcial, a menos que sua intenção seja substituir toda a configuração.
Para edições por RPC, inspecione primeiro com config.schema.lookup e prefira config.patch. A carga útil de lookup fornece o caminho normalizado, documentação/restrições rasas do schema e resumos imediatos dos filhos.
para atualizações parciais.
Se você sobrescreveu a configuração, restaure do backup ou execute openclaw doctor novamente para reparar.Documentação: Modelos, Configure, Config, Doctor.Posso usar modelos autohospedados (llama.cpp, vLLM, Ollama)?
Posso usar modelos autohospedados (llama.cpp, vLLM, Ollama)?
- Instale Ollama em
https://ollama.com/download - Baixe um modelo local, como
ollama pull gemma4 - Se você também quiser modelos na nuvem, execute
ollama signin - Execute
openclaw onboarde escolhaOllama - Escolha
LocalouCloud + Local
Cloud + Localoferece modelos na nuvem junto com seus modelos locais do Ollama- modelos de nuvem como
kimi-k2.5:cloudnão precisam de download local - para troca manual, use
openclaw models listeopenclaw models set ollama/<model>
Quais modelos OpenClaw, Flawd e Krill usam?
Quais modelos OpenClaw, Flawd e Krill usam?
- Essas implantações podem variar e podem mudar com o tempo; não há recomendação fixa de provider.
- Verifique a configuração atual em runtime em cada gateway com
openclaw models status. - Para agentes sensíveis à segurança/com ferramentas habilitadas, use o modelo mais forte da geração mais recente disponível.
Como troco de modelo em tempo real (sem reiniciar)?
Como troco de modelo em tempo real (sem reiniciar)?
/model como uma mensagem isolada:agents.defaults.models.Você pode listar os modelos disponíveis com /model, /model list ou /model status./model (e /model list) mostra um seletor compacto e numerado. Selecione pelo número:/model status mostra qual agente está ativo, qual arquivo auth-profiles.json está sendo usado e qual perfil de autenticação será tentado em seguida.
Também mostra o endpoint configurado do provider (baseUrl) e o modo da API (api) quando disponíveis.Como removo a fixação de um perfil que defini com @profile?Execute /model novamente sem o sufixo @profile:/model (ou envie /model <default provider/model>).
Use /model status para confirmar qual perfil de autenticação está ativo.Posso usar GPT 5.5 para tarefas diárias e Codex 5.5 para coding?
Posso usar GPT 5.5 para tarefas diárias e Codex 5.5 para coding?
- Troca rápida (por sessão):
/model openai/gpt-5.4para tarefas atuais com chave de API direta da OpenAI ou/model openai-codex/gpt-5.5para tarefas OAuth GPT-5.5 Codex. - Padrão: defina
agents.defaults.model.primarycomoopenai/gpt-5.4para uso com chave de API ouopenai-codex/gpt-5.5para uso OAuth GPT-5.5 Codex. - Subagentes: roteie tarefas de coding para subagentes com um modelo padrão diferente.
openai/gpt-5.5 será compatível quando a OpenAI habilitar
GPT-5.5 na API pública. Até lá, GPT-5.5 é apenas por assinatura/OAuth.Consulte Modelos e Comandos de barra.Como configuro fast mode para GPT 5.5?
Como configuro fast mode para GPT 5.5?
- Por sessão: envie
/fast onenquanto a sessão estiver usandoopenai/gpt-5.4ouopenai-codex/gpt-5.5. - Padrão por modelo: defina
agents.defaults.models["openai/gpt-5.4"].params.fastModeouagents.defaults.models["openai-codex/gpt-5.5"].params.fastModecomotrue.
service_tier = "priority" em solicitações nativas Responses compatíveis. Substituições de sessão com /fast prevalecem sobre os padrões da configuração.Consulte Thinking e fast mode e OpenAI fast mode.Por que vejo "Model ... is not allowed" e depois nenhuma resposta?
Por que vejo "Model ... is not allowed" e depois nenhuma resposta?
agents.defaults.models estiver definido, ele se torna a lista de permissão para /model e quaisquer
substituições de sessão. Escolher um modelo que não esteja nessa lista retorna:agents.defaults.models, remova a lista de permissão ou escolha um modelo em /model list.Por que vejo "Unknown model: minimax/MiniMax-M2.7"?
Por que vejo "Unknown model: minimax/MiniMax-M2.7"?
-
Atualize para uma versão atual do OpenClaw (ou execute a partir da
maindo código-fonte) e depois reinicie o gateway. -
Verifique se o MiniMax está configurado (assistente ou JSON), ou se a autenticação do MiniMax
existe em env/perfis de autenticação para que o provider correspondente possa ser injetado
(
MINIMAX_API_KEYparaminimax,MINIMAX_OAUTH_TOKENou MiniMax OAuth armazenado paraminimax-portal). -
Use o ID de modelo exato (sensível a maiúsculas e minúsculas) para seu caminho de autenticação:
minimax/MiniMax-M2.7ouminimax/MiniMax-M2.7-highspeedpara configuração com chave de API, ouminimax-portal/MiniMax-M2.7/minimax-portal/MiniMax-M2.7-highspeedpara configuração OAuth. -
Execute:
e escolha um da lista (ou
/model listno chat).
Posso usar MiniMax como padrão e OpenAI para tarefas complexas?
Posso usar MiniMax como padrão e OpenAI para tarefas complexas?
/model ou um agente separado.Opção A: trocar por sessão- Agente A padrão: MiniMax
- Agente B padrão: OpenAI
- Roteie por agente ou use
/agentpara trocar
opus / sonnet / gpt são atalhos integrados?
opus / sonnet / gpt são atalhos integrados?
agents.defaults.models):opus→anthropic/claude-opus-4-6sonnet→anthropic/claude-sonnet-4-6gpt→openai/gpt-5.4para configurações com chave de API, ouopenai-codex/gpt-5.5quando configurado para OAuth Codexgpt-mini→openai/gpt-5.4-minigpt-nano→openai/gpt-5.4-nanogemini→google/gemini-3.1-pro-previewgemini-flash→google/gemini-3-flash-previewgemini-flash-lite→google/gemini-3.1-flash-lite-preview
Como defino/substituo atalhos de modelo (aliases)?
Como defino/substituo atalhos de modelo (aliases)?
agents.defaults.models.<modelId>.alias. Exemplo:/model sonnet (ou /<alias> quando compatível) é resolvido para esse ID de modelo.Como adiciono modelos de outros providers como OpenRouter ou Z.AI?
Como adiciono modelos de outros providers como OpenRouter ou Z.AI?
No API key found for provider "zai").Nenhuma chave de API encontrada para o provider após adicionar um novo agenteIsso geralmente significa que o novo agente tem um armazenamento de autenticação vazio. A autenticação é por agente e
fica armazenada em:- Execute
openclaw agents add <id>e configure a autenticação durante o assistente. - Ou copie
auth-profiles.jsondoagentDirdo agente principal para oagentDirdo novo agente.
agentDir entre agentes; isso causa colisões de autenticação/sessão.Failover de modelo e “All models failed”
Como o failover funciona?
Como o failover funciona?
- Rotação de perfil de autenticação dentro do mesmo provider.
- Fallback de modelo para o próximo modelo em
agents.defaults.model.fallbacks.
429. O OpenClaw
também trata mensagens como Too many concurrent requests,
ThrottlingException, concurrency limit reached,
workers_ai ... quota limit exceeded, resource exhausted e limites
periódicos de janela de uso (weekly/monthly limit reached) como limites
de taxa dignos de failover.Algumas respostas com aparência de cobrança não são 402, e algumas respostas HTTP 402
também permanecem nesse bucket transitório. Se um provider retornar
texto explícito de cobrança em 401 ou 403, o OpenClaw ainda pode manter isso
na trilha de cobrança, mas correspondências de texto específicas de provider permanecem restritas ao
provider que as possui (por exemplo, OpenRouter Key limit exceeded). Se uma mensagem 402
em vez disso parecer um limite de janela de uso repetível ou
limite de gasto de organização/workspace (daily limit reached, resets tomorrow,
organization spending limit exceeded), o OpenClaw a trata como
rate_limit, não como uma desativação longa por cobrança.Erros de overflow de contexto são diferentes: assinaturas como
request_too_large, input exceeds the maximum number of tokens,
input token count exceeds the maximum number of input tokens,
input is too long for the model ou ollama error: context length exceeded permanecem no caminho de Compaction/retry em vez de avançar para
o fallback de modelo.O texto genérico de erro de servidor é intencionalmente mais restrito do que “qualquer coisa com
unknown/error”. O OpenClaw trata formas transitórias com escopo de provider
como Anthropic simples An unknown error occurred, OpenRouter simples
Provider returned error, erros de stop-reason como Unhandled stop reason: error, payloads JSON api_error com texto transitório de servidor
(internal server error, unknown error, 520, upstream error, backend error) e erros de provider ocupado como ModelNotReadyException como
sinais de timeout/sobrecarga dignos de failover quando o contexto do provider
corresponde.
Texto genérico de fallback interno como LLM request failed with an unknown error. permanece conservador e não aciona fallback de modelo por si só.O que significa "No credentials found for profile anthropic:default"?
O que significa "No credentials found for profile anthropic:default"?
anthropic:default, mas não conseguiu encontrar credenciais para ele no armazenamento de autenticação esperado.Checklist de correção:- Confirme onde ficam os perfis de autenticação (caminhos novos vs legados)
- Atual:
~/.openclaw/agents/<agentId>/agent/auth-profiles.json - Legado:
~/.openclaw/agent/*(migrado poropenclaw doctor)
- Atual:
- Confirme que sua variável de ambiente foi carregada pelo Gateway
- Se você definiu
ANTHROPIC_API_KEYno seu shell, mas executa o Gateway via systemd/launchd, ele pode não herdá-la. Coloque-a em~/.openclaw/.envou habiliteenv.shellEnv.
- Se você definiu
- Certifique-se de que está editando o agente correto
- Configurações multiagente significam que pode haver vários arquivos
auth-profiles.json.
- Configurações multiagente significam que pode haver vários arquivos
- Faça uma verificação rápida do status de modelo/autenticação
- Use
openclaw models statuspara ver modelos configurados e se os providers estão autenticados.
- Use
-
Use Claude CLI
- Execute
openclaw models auth login --provider anthropic --method cli --set-defaultno host do gateway.
- Execute
-
Se quiser usar uma chave de API
-
Coloque
ANTHROPIC_API_KEYem~/.openclaw/.envno host do gateway. -
Limpe qualquer ordem fixada que force um perfil ausente:
-
Coloque
-
Confirme que está executando comandos no host do gateway
- No modo remoto, perfis de autenticação ficam na máquina do gateway, não no seu laptop.
Por que ele também tentou Google Gemini e falhou?
Por que ele também tentou Google Gemini e falhou?
No API key found for provider "google".Correção: forneça autenticação do Google ou remova/evite modelos Google em agents.defaults.model.fallbacks / aliases para que o fallback não seja roteado para lá.LLM request rejected: thinking signature required (Google Antigravity)Causa: o histórico da sessão contém blocos de thinking sem assinaturas (muitas vezes de
um stream abortado/parcial). O Google Antigravity exige assinaturas para blocos de thinking.Correção: o OpenClaw agora remove blocos de thinking sem assinatura para Claude do Google Antigravity. Se ainda aparecer, inicie uma nova sessão ou defina /thinking off para esse agente.Perfis de autenticação: o que são e como gerenciá-los
Relacionado: /concepts/oauth (fluxos OAuth, armazenamento de token, padrões de múltiplas contas)O que é um perfil de autenticação?
O que é um perfil de autenticação?
Quais são IDs típicos de perfil?
Quais são IDs típicos de perfil?
anthropic:default(comum quando não existe identidade por e-mail)anthropic:<email>para identidades OAuth- IDs personalizados que você escolher (por exemplo
anthropic:work)
Posso controlar qual perfil de autenticação é tentado primeiro?
Posso controlar qual perfil de autenticação é tentado primeiro?
auth.order.<provider>). Isso não armazena segredos; mapeia IDs para provider/modo e define a ordem de rotação.O OpenClaw pode ignorar temporariamente um perfil se ele estiver em um cooldown curto (limites de taxa/timeouts/falhas de autenticação) ou em um estado desabilitado mais longo (cobrança/créditos insuficientes). Para inspecionar isso, execute openclaw models status --json e verifique auth.unusableProfiles. Ajuste: auth.cooldowns.billingBackoffHours*.Cooldowns de limite de taxa podem ter escopo por modelo. Um perfil que está em cooldown
para um modelo ainda pode ser utilizável para um modelo irmão no mesmo provider,
enquanto janelas de cobrança/desativação continuam bloqueando o perfil inteiro.Você também pode definir uma substituição de ordem por agente (armazenada em auth-state.json desse agente) via CLI:excluded_by_auth_order para esse perfil em vez de tentar usá-lo silenciosamente.OAuth vs chave de API - qual é a diferença?
OAuth vs chave de API - qual é a diferença?
- OAuth geralmente aproveita acesso por assinatura (quando aplicável).
- Chaves de API usam cobrança por token.