Uso e custos da API
Este documento lista recursos que podem invocar chaves de API e onde seus custos aparecem. Ele se concentra em recursos do OpenClaw que podem gerar uso de provedores ou chamadas pagas de API.Onde os custos aparecem (chat + CLI)
Instantâneo de custo por sessão/statusmostra o modelo atual da sessão, o uso de contexto e os tokens da última resposta.- Se o modelo usa autenticação por chave de API,
/statustambém mostra o custo estimado da última resposta. - Se os metadados da sessão em tempo real forem escassos,
/statuspode recuperar contadores de tokens/cache e o rótulo do modelo de runtime ativo a partir da entrada de uso mais recente da transcrição. Valores em tempo real não nulos existentes ainda têm prioridade, e totais da transcrição no tamanho do prompt podem prevalecer quando os totais armazenados estiverem ausentes ou forem menores.
/usage fullacrescenta um rodapé de uso a cada resposta, incluindo custo estimado (somente chave de API)./usage tokensmostra apenas tokens; fluxos de OAuth/token no estilo assinatura e da CLI ocultam o custo em dólares.- Observação sobre o Gemini CLI: quando a CLI retorna saída JSON, o OpenClaw lê o uso de
stats, normalizastats.cachedemcacheReade deriva os tokens de entrada destats.input_tokens - stats.cachedquando necessário.
claude -p como
autorizados para esta integração, a menos que a Anthropic publique uma nova política.
A Anthropic ainda não expõe uma estimativa em dólares por mensagem que o OpenClaw possa
mostrar em /usage full.
Janelas de uso da CLI (cotas do provedor)
openclaw status --usageeopenclaw channels listmostram janelas de uso do provedor (instantâneos de cota, não custos por mensagem).- A saída legível por humanos é normalizada para
X% leftentre os provedores. - Provedores atuais de janela de uso: Anthropic, GitHub Copilot, Gemini CLI, OpenAI Codex, MiniMax, Xiaomi e z.ai.
- Observação sobre MiniMax: seus campos brutos
usage_percent/usagePercentsignificam cota restante, então o OpenClaw os inverte antes da exibição. Campos baseados em contagem ainda têm prioridade quando presentes. Se o provedor retornarmodel_remains, o OpenClaw prefere a entrada do modelo de chat, deriva o rótulo da janela a partir de timestamps quando necessário e inclui o nome do modelo no rótulo do plano. - A autenticação de uso para essas janelas de cota vem de hooks específicos do provedor quando disponíveis; caso contrário, o OpenClaw recorre à correspondência de credenciais OAuth/chave de API a partir de perfis de autenticação, ambiente ou configuração.
Como as chaves são descobertas
O OpenClaw pode obter credenciais de:- Perfis de autenticação (por agente, armazenados em
auth-profiles.json). - Variáveis de ambiente (por exemplo,
OPENAI_API_KEY,BRAVE_API_KEY,FIRECRAWL_API_KEY). - Configuração (
models.providers.*.apiKey,plugins.entries.*.config.webSearch.apiKey,plugins.entries.firecrawl.config.webFetch.apiKey,memorySearch.*,talk.providers.*.apiKey). - Skills (
skills.entries.<name>.apiKey), que podem exportar chaves para o ambiente do processo da skill.
Recursos que podem consumir chaves
1) Respostas do modelo principal (chat + ferramentas)
Cada resposta ou chamada de ferramenta usa o provedor de modelo atual (OpenAI, Anthropic etc.). Esta é a principal fonte de uso e custo. Isso também inclui provedores hospedados no estilo assinatura que ainda cobram fora da UI local do OpenClaw, como OpenAI Codex, Alibaba Cloud Model Studio Coding Plan, MiniMax Coding Plan, Z.AI / GLM Coding Plan e o caminho Claude-login do OpenClaw da Anthropic com Extra Usage habilitado. Consulte Modelos para configuração de preços e Uso e custos de tokens para exibição.2) Entendimento de mídia (áudio/imagem/vídeo)
Mídia recebida pode ser resumida/transcrita antes de a resposta ser executada. Isso usa APIs de modelo/provedor.- Áudio: OpenAI / Groq / Deepgram / Google / Mistral.
- Imagem: OpenAI / OpenRouter / Anthropic / Google / MiniMax / Moonshot / Qwen / Z.AI.
- Vídeo: Google / Qwen / Moonshot.
3) Geração de imagem e vídeo
Recursos compartilhados de geração também podem consumir chaves de provedores:- Geração de imagem: OpenAI / Google / fal / MiniMax
- Geração de vídeo: Qwen
agents.defaults.imageGenerationModel não estiver definido. A geração de vídeo atualmente
exige um agents.defaults.videoGenerationModel explícito, como
qwen/wan2.6-t2v.
Consulte Geração de imagem, Qwen Cloud
e Modelos.
4) Embeddings de memória + busca semântica
A busca semântica na memória usa APIs de embeddings quando configurada para provedores remotos:memorySearch.provider = "openai"→ embeddings da OpenAImemorySearch.provider = "gemini"→ embeddings do GeminimemorySearch.provider = "voyage"→ embeddings da VoyagememorySearch.provider = "mistral"→ embeddings da MistralmemorySearch.provider = "lmstudio"→ embeddings do LM Studio (local/autohospedado)memorySearch.provider = "ollama"→ embeddings do Ollama (local/autohospedado; normalmente sem cobrança de API hospedada)- Fallback opcional para um provedor remoto se os embeddings locais falharem
memorySearch.provider = "local" (sem uso de API).
Consulte Memória.
5) Ferramenta de busca na web
web_search pode gerar cobranças de uso dependendo do seu provedor:
- Brave Search API:
BRAVE_API_KEYouplugins.entries.brave.config.webSearch.apiKey - Exa:
EXA_API_KEYouplugins.entries.exa.config.webSearch.apiKey - Firecrawl:
FIRECRAWL_API_KEYouplugins.entries.firecrawl.config.webSearch.apiKey - Gemini (Google Search):
GEMINI_API_KEYouplugins.entries.google.config.webSearch.apiKey - Grok (xAI):
XAI_API_KEYouplugins.entries.xai.config.webSearch.apiKey - Kimi (Moonshot):
KIMI_API_KEY,MOONSHOT_API_KEYouplugins.entries.moonshot.config.webSearch.apiKey - MiniMax Search:
MINIMAX_CODE_PLAN_KEY,MINIMAX_CODING_API_KEY,MINIMAX_API_KEYouplugins.entries.minimax.config.webSearch.apiKey - Ollama Web Search: sem chave por padrão, mas requer um host Ollama acessível e
ollama signin; também pode reutilizar a autenticação bearer normal do provedor Ollama quando o host exigir isso - Perplexity Search API:
PERPLEXITY_API_KEY,OPENROUTER_API_KEYouplugins.entries.perplexity.config.webSearch.apiKey - Tavily:
TAVILY_API_KEYouplugins.entries.tavily.config.webSearch.apiKey - DuckDuckGo: fallback sem chave (sem cobrança de API, mas não oficial e baseado em HTML)
- SearXNG:
SEARXNG_BASE_URLouplugins.entries.searxng.config.webSearch.baseUrl(sem chave/autohospedado; sem cobrança de API hospedada)
tools.web.search.* ainda são carregados por meio do shim temporário de compatibilidade, mas já não são mais a superfície de configuração recomendada.
Crédito gratuito do Brave Search: cada plano do Brave inclui $5/mês em crédito gratuito renovável.
O plano Search custa $5 por 1.000 solicitações, então o crédito cobre
1.000 solicitações/mês sem custo. Defina seu limite de uso no painel do Brave
para evitar cobranças inesperadas.
Consulte Ferramentas web.
5) Ferramenta de busca de página web (Firecrawl)
web_fetch pode chamar o Firecrawl quando uma chave de API está presente:
FIRECRAWL_API_KEYouplugins.entries.firecrawl.config.webFetch.apiKey
6) Instantâneos de uso do provedor (status/saúde)
Alguns comandos de status chamam endpoints de uso do provedor para exibir janelas de cota ou saúde de autenticação. Essas chamadas normalmente têm baixo volume, mas ainda assim atingem APIs de provedores:openclaw status --usageopenclaw models status --json
7) Sumarização de proteção de Compaction
A proteção de Compaction pode resumir o histórico da sessão usando o modelo atual, o que invoca APIs do provedor quando é executado. Consulte Gerenciamento de sessão + compaction.8) Varredura / sondagem de modelo
openclaw models scan pode sondar modelos do OpenRouter e usa OPENROUTER_API_KEY quando
a sondagem está habilitada.
Consulte CLI de modelos.
9) Talk (fala)
O modo Talk pode invocar ElevenLabs quando configurado:ELEVENLABS_API_KEYoutalk.providers.elevenlabs.apiKey
10) Skills (APIs de terceiros)
As Skills podem armazenarapiKey em skills.entries.<name>.apiKey. Se uma skill usar essa chave para APIs
externas, ela poderá gerar custos de acordo com o provedor da skill.
Consulte Skills.