Uso e custos de API
Este documento lista os recursos que podem invocar chaves de API e onde seus custos aparecem. Ele se concentra em recursos do OpenClaw que podem gerar uso de provedor ou chamadas pagas de API.Onde os custos aparecem (chat + CLI)
Snapshot de custo por sessão/statusmostra o modelo atual da sessão, uso de contexto e tokens da última resposta.- Se o modelo usar autenticação por chave de API,
/statustambém mostra o custo estimado da última resposta. - Se os metadados da sessão ao vivo forem escassos,
/statuspode recuperar contadores de tokens/cache e o rótulo ativo do modelo em runtime a partir da entrada de uso da transcrição mais recente. Valores ao vivo não nulos existentes ainda têm precedência, e totais da transcrição no tamanho do prompt podem prevalecer quando os totais armazenados estiverem ausentes ou forem menores.
/usage fulladiciona um rodapé de uso a cada resposta, incluindo o custo estimado (somente chave de API)./usage tokensmostra apenas tokens; fluxos de OAuth/token no estilo assinatura e fluxos de CLI ocultam o custo em dólares.- Observação sobre Gemini CLI: quando a CLI retorna saída JSON, o OpenClaw lê o uso de
stats, normalizastats.cachedemcacheReade deriva tokens de entrada destats.input_tokens - stats.cachedquando necessário.
/usage full.
Janelas de uso da CLI (cotas do provedor)
openclaw status --usageeopenclaw channels listmostram janelas de uso do provedor (snapshots de cota, não custos por mensagem).- A saída legível é normalizada para
X% leftentre provedores. - Provedores atuais de janela de uso: Anthropic, GitHub Copilot, Gemini CLI, OpenAI Codex, MiniMax, Xiaomi e z.ai.
- Observação sobre MiniMax: os campos brutos
usage_percent/usagePercentsignificam cota restante, então o OpenClaw os inverte antes da exibição. Campos baseados em contagem ainda prevalecem quando presentes. Se o provedor retornarmodel_remains, o OpenClaw prefere a entrada do modelo de chat, deriva o rótulo da janela a partir dos timestamps quando necessário e inclui o nome do modelo no rótulo do plano. - A autenticação de uso para essas janelas de cota vem de hooks específicos do provedor quando disponíveis; caso contrário, o OpenClaw recorre à correspondência de credenciais OAuth/chave de API de perfis de autenticação, ambiente ou configuração.
Como as chaves são descobertas
O OpenClaw pode obter credenciais de:- Perfis de autenticação (por agente, armazenados em
auth-profiles.json). - Variáveis de ambiente (por exemplo,
OPENAI_API_KEY,BRAVE_API_KEY,FIRECRAWL_API_KEY). - Configuração (
models.providers.*.apiKey,plugins.entries.*.config.webSearch.apiKey,plugins.entries.firecrawl.config.webFetch.apiKey,memorySearch.*,talk.providers.*.apiKey). - Skills (
skills.entries.<name>.apiKey), que podem exportar chaves para o ambiente do processo da skill.
Recursos que podem consumir chaves
1) Respostas do modelo central (chat + ferramentas)
Cada resposta ou chamada de ferramenta usa o provedor de modelo atual (OpenAI, Anthropic etc.). Essa é a principal fonte de uso e custo. Isso também inclui provedores hospedados no estilo assinatura que ainda cobram fora da interface local do OpenClaw, como OpenAI Codex, Alibaba Cloud Model Studio Coding Plan, MiniMax Coding Plan, Z.AI / GLM Coding Plan e o caminho de login Claude do OpenClaw da Anthropic com Extra Usage habilitado. Consulte Models para configuração de preços e Uso e custos de tokens para exibição.2) Entendimento de mídia (áudio/imagem/vídeo)
Mídias recebidas podem ser resumidas/transcritas antes da execução da resposta. Isso usa APIs de modelo/provedor.- Áudio: OpenAI / Groq / Deepgram / Google / Mistral.
- Imagem: OpenAI / OpenRouter / Anthropic / Google / MiniMax / Moonshot / Qwen / Z.AI.
- Vídeo: Google / Qwen / Moonshot.
3) Geração de imagem e vídeo
Capacidades compartilhadas de geração também podem consumir chaves de provedor:- Geração de imagem: OpenAI / Google / fal / MiniMax
- Geração de vídeo: Qwen
agents.defaults.imageGenerationModel não estiver definido. Atualmente, a geração de vídeo
exige um agents.defaults.videoGenerationModel explícito, como
qwen/wan2.6-t2v.
Consulte Geração de imagem, Qwen Cloud
e Models.
4) Embeddings de memória + pesquisa semântica
A pesquisa semântica em memória usa APIs de embedding quando configurada para provedores remotos:memorySearch.provider = "openai"→ embeddings do OpenAImemorySearch.provider = "gemini"→ embeddings do GeminimemorySearch.provider = "voyage"→ embeddings do VoyagememorySearch.provider = "mistral"→ embeddings do MistralmemorySearch.provider = "ollama"→ embeddings do Ollama (local/self-hosted; normalmente sem cobrança de API hospedada)- Fallback opcional para um provedor remoto se os embeddings locais falharem
memorySearch.provider = "local" (sem uso de API).
Consulte Memory.
5) Ferramenta de pesquisa na web
web_search pode gerar cobranças de uso dependendo do seu provedor:
- Brave Search API:
BRAVE_API_KEYouplugins.entries.brave.config.webSearch.apiKey - Exa:
EXA_API_KEYouplugins.entries.exa.config.webSearch.apiKey - Firecrawl:
FIRECRAWL_API_KEYouplugins.entries.firecrawl.config.webSearch.apiKey - Gemini (Google Search):
GEMINI_API_KEYouplugins.entries.google.config.webSearch.apiKey - Grok (xAI):
XAI_API_KEYouplugins.entries.xai.config.webSearch.apiKey - Kimi (Moonshot):
KIMI_API_KEY,MOONSHOT_API_KEYouplugins.entries.moonshot.config.webSearch.apiKey - MiniMax Search:
MINIMAX_CODE_PLAN_KEY,MINIMAX_CODING_API_KEY,MINIMAX_API_KEYouplugins.entries.minimax.config.webSearch.apiKey - Ollama Web Search: sem chave por padrão, mas exige um host Ollama acessível mais
ollama signin; também pode reutilizar a autenticação bearer normal do provedor Ollama quando o host exigir - Perplexity Search API:
PERPLEXITY_API_KEY,OPENROUTER_API_KEYouplugins.entries.perplexity.config.webSearch.apiKey - Tavily:
TAVILY_API_KEYouplugins.entries.tavily.config.webSearch.apiKey - DuckDuckGo: fallback sem chave (sem cobrança de API, mas não oficial e baseado em HTML)
- SearXNG:
SEARXNG_BASE_URLouplugins.entries.searxng.config.webSearch.baseUrl(sem chave/self-hosted; sem cobrança de API hospedada)
tools.web.search.* ainda são carregados por meio do shim temporário de compatibilidade, mas não são mais a superfície de configuração recomendada.
Crédito gratuito do Brave Search: cada plano do Brave inclui $5/mês em
crédito gratuito renovável. O plano Search custa $5 por 1.000 solicitações, então o crédito cobre
1.000 solicitações/mês sem cobrança. Defina seu limite de uso no dashboard do Brave
para evitar cobranças inesperadas.
Consulte Ferramentas da web.
5) Ferramenta de busca na web (Firecrawl)
web_fetch pode chamar o Firecrawl quando uma chave de API estiver presente:
FIRECRAWL_API_KEYouplugins.entries.firecrawl.config.webFetch.apiKey
6) Snapshots de uso do provedor (status/saúde)
Alguns comandos de status chamam endpoints de uso do provedor para exibir janelas de cota ou saúde da autenticação. Normalmente são chamadas de baixo volume, mas ainda atingem APIs do provedor:openclaw status --usageopenclaw models status --json
7) Resumo de proteção de compactação
A proteção de compactação pode resumir o histórico da sessão usando o modelo atual, o que invoca APIs do provedor quando é executada. Consulte Gerenciamento de sessão + compactação.8) Varredura / sonda de modelo
openclaw models scan pode sondar modelos do OpenRouter e usa OPENROUTER_API_KEY quando
a sondagem está habilitada.
Consulte Models CLI.
9) Talk (fala)
O modo Talk pode invocar o ElevenLabs quando configurado:ELEVENLABS_API_KEYoutalk.providers.elevenlabs.apiKey
10) Skills (APIs de terceiros)
As Skills podem armazenarapiKey em skills.entries.<name>.apiKey. Se uma skill usar essa chave para
APIs externas, ela poderá gerar custos de acordo com o provedor da skill.
Consulte Skills.