Uso e custos da API

Este documento lista recursos que podem invocar chaves de API e onde seus custos aparecem. Ele se concentra em recursos do OpenClaw que podem gerar uso de provedores ou chamadas de API pagas.

Onde os custos aparecem (chat + CLI)

Instantâneo de custo por sessão

/status mostra o modelo da sessão atual, o uso de contexto e os tokens da última resposta.
Se o modelo usar autenticação por chave de API, /status também mostra o custo estimado da última resposta.
Se os metadados da sessão ao vivo estiverem escassos, /status pode recuperar contadores de tokens/cache e o rótulo do modelo de runtime ativo a partir da entrada de uso mais recente do transcript. Valores ao vivo não zero existentes ainda têm precedência, e totais de transcript do tamanho do prompt podem prevalecer quando os totais armazenados estão ausentes ou são menores.

Rodapé de custo por mensagem

/usage full acrescenta um rodapé de uso a cada resposta, incluindo custo estimado (somente chave de API).
/usage tokens mostra apenas tokens; fluxos de OAuth/token em estilo assinatura e CLI ocultam o custo em dólares.
Observação sobre o Gemini CLI: quando a CLI retorna saída JSON, o OpenClaw lê o uso de stats, normaliza stats.cached para cacheRead e deriva os tokens de entrada de stats.input_tokens - stats.cached quando necessário.

Observação sobre Anthropic: a equipe da Anthropic nos informou que o uso do Claude CLI no estilo OpenClaw voltou a ser permitido, então o OpenClaw trata a reutilização do Claude CLI e o uso de claude -p como sancionados para esta integração, a menos que a Anthropic publique uma nova política. A Anthropic ainda não expõe uma estimativa em dólares por mensagem que o OpenClaw possa mostrar em /usage full. Janelas de uso da CLI (cotas de provedores)

openclaw status --usage e openclaw channels list mostram janelas de uso dos provedores (instantâneos de cota, não custos por mensagem).
A saída legível para humanos é normalizada para X% left entre provedores.
Provedores atuais de janelas de uso: Anthropic, GitHub Copilot, Gemini CLI, OpenAI Codex, MiniMax, Xiaomi e z.ai.
Observação sobre MiniMax: seus campos brutos usage_percent / usagePercent significam cota restante, então o OpenClaw os inverte antes de exibir. Campos baseados em contagem ainda prevalecem quando presentes. Se o provedor retornar model_remains, o OpenClaw prefere a entrada do modelo de chat, deriva o rótulo da janela a partir dos carimbos de data/hora quando necessário e inclui o nome do modelo no rótulo do plano.
A autenticação de uso dessas janelas de cota vem de hooks específicos do provedor quando disponíveis; caso contrário, o OpenClaw recorre a credenciais OAuth/chave de API correspondentes de perfis de autenticação, env ou configuração.

Consulte Uso de tokens e custos para detalhes e exemplos.

Como as chaves são descobertas

O OpenClaw pode obter credenciais de:

Perfis de autenticação (por agente, armazenados em auth-profiles.json).
Variáveis de ambiente (por exemplo, OPENAI_API_KEY, BRAVE_API_KEY, FIRECRAWL_API_KEY).
Configuração (models.providers.*.apiKey, plugins.entries.*.config.webSearch.apiKey, plugins.entries.firecrawl.config.webFetch.apiKey, memorySearch.*, talk.providers.*.apiKey).
Skills (skills.entries.<name>.apiKey), que podem exportar chaves para o ambiente do processo da skill.

Recursos que podem gastar chaves

1) Respostas do modelo principal (chat + ferramentas)

Cada resposta ou chamada de ferramenta usa o provedor do modelo atual (OpenAI, Anthropic etc.). Esta é a principal fonte de uso e custo. Isso também inclui provedores hospedados em estilo assinatura que ainda cobram fora da UI local do OpenClaw, como OpenAI Codex, Alibaba Cloud Model Studio Coding Plan, MiniMax Coding Plan, Z.AI / GLM Coding Plan e o caminho de login Claude da Anthropic no OpenClaw com Extra Usage habilitado. Consulte Modelos para configuração de preços e Uso de tokens e custos para exibição.

2) Compreensão de mídia (áudio/imagem/vídeo)

Mídias de entrada podem ser resumidas/transcritas antes de a resposta ser executada. Isso usa APIs de modelo/provedor.

Áudio: OpenAI / Groq / Deepgram / DeepInfra / Google / Mistral.
Imagem: OpenAI / OpenRouter / Anthropic / DeepInfra / Google / MiniMax / Moonshot / Qwen / Z.AI.
Vídeo: Google / Qwen / Moonshot.

Consulte Compreensão de mídia.

3) Geração de imagens e vídeos

Capacidades compartilhadas de geração também podem gastar chaves de provedores:

Geração de imagens: OpenAI / Google / DeepInfra / fal / MiniMax
Geração de vídeos: DeepInfra / Qwen

A geração de imagens pode inferir um padrão de provedor com autenticação quando agents.defaults.imageGenerationModel não está definido. A geração de vídeos atualmente exige um agents.defaults.videoGenerationModel explícito, como qwen/wan2.6-t2v. Consulte Geração de imagens, Qwen Cloud e Modelos.

4) Embeddings de memória + busca semântica

A busca semântica de memória usa APIs de embeddings quando configurada para provedores remotos:

memorySearch.provider = "openai" → embeddings da OpenAI
memorySearch.provider = "gemini" → embeddings do Gemini
memorySearch.provider = "voyage" → embeddings da Voyage
memorySearch.provider = "mistral" → embeddings da Mistral
memorySearch.provider = "deepinfra" → embeddings da DeepInfra
memorySearch.provider = "lmstudio" → embeddings do LM Studio (local/auto-hospedado)
memorySearch.provider = "ollama" → embeddings do Ollama (local/auto-hospedado; normalmente sem cobrança de API hospedada)
Fallback opcional para um provedor remoto se os embeddings locais falharem

Você pode mantê-la local com memorySearch.provider = "local" (sem uso de API). Consulte Memória.

5) Ferramenta de busca na web

web_search pode incorrer em cobranças de uso dependendo do seu provedor:

Brave Search API: BRAVE_API_KEY ou plugins.entries.brave.config.webSearch.apiKey
Exa: EXA_API_KEY ou plugins.entries.exa.config.webSearch.apiKey
Firecrawl: FIRECRAWL_API_KEY ou plugins.entries.firecrawl.config.webSearch.apiKey
Gemini (Google Search): GEMINI_API_KEY ou plugins.entries.google.config.webSearch.apiKey
Grok (xAI): XAI_API_KEY ou plugins.entries.xai.config.webSearch.apiKey
Kimi (Moonshot): KIMI_API_KEY, MOONSHOT_API_KEY ou plugins.entries.moonshot.config.webSearch.apiKey
MiniMax Search: MINIMAX_CODE_PLAN_KEY, MINIMAX_CODING_API_KEY, MINIMAX_API_KEY ou plugins.entries.minimax.config.webSearch.apiKey
Ollama Web Search: sem chave para um host local do Ollama acessível e com sessão iniciada; a busca direta em https://ollama.com usa OLLAMA_API_KEY, e hosts protegidos por autenticação podem reutilizar a autenticação bearer normal do provedor Ollama
Perplexity Search API: PERPLEXITY_API_KEY, OPENROUTER_API_KEY ou plugins.entries.perplexity.config.webSearch.apiKey
Tavily: TAVILY_API_KEY ou plugins.entries.tavily.config.webSearch.apiKey
DuckDuckGo: fallback sem chave (sem cobrança de API, mas não oficial e baseado em HTML)
SearXNG: SEARXNG_BASE_URL ou plugins.entries.searxng.config.webSearch.baseUrl (sem chave/auto-hospedado; sem cobrança de API hospedada)

Caminhos legados de provedor tools.web.search.* ainda são carregados por meio do shim temporário de compatibilidade, mas não são mais a superfície de configuração recomendada. Crédito grátis do Brave Search: Cada plano do Brave inclui US

5/mês em crédito grátis renovável. O plano Search custa US

5 por 1.000 solicitações, então o crédito cobre 1.000 solicitações/mês sem cobrança. Defina seu limite de uso no painel do Brave para evitar cobranças inesperadas. Consulte Ferramentas web.

5) Ferramenta de busca de conteúdo web (Firecrawl)

web_fetch pode chamar Firecrawl quando uma chave de API está presente:

FIRECRAWL_API_KEY ou plugins.entries.firecrawl.config.webFetch.apiKey

Se o Firecrawl não estiver configurado, a ferramenta recorre a busca direta mais o plugin web-readability incluído (sem API paga). Desabilite plugins.entries.web-readability.enabled para pular a extração local com Readability. Consulte Ferramentas web.

6) Instantâneos de uso do provedor (status/saúde)

Alguns comandos de status chamam endpoints de uso do provedor para exibir janelas de cota ou a saúde da autenticação. Normalmente são chamadas de baixo volume, mas ainda acessam APIs dos provedores:

openclaw status --usage
openclaw models status --json

Consulte CLI de modelos.

7) Sumarização de salvaguarda de Compaction

A salvaguarda de Compaction pode resumir o histórico da sessão usando o modelo atual, o que invoca APIs de provedores quando é executada. Consulte Gerenciamento de sessão + Compaction.

8) Varredura / sonda de modelos

openclaw models scan pode sondar modelos do OpenRouter e usa OPENROUTER_API_KEY quando a sondagem está habilitada. Consulte CLI de modelos.

9) Talk (fala)

O modo Talk pode invocar ElevenLabs quando configurado:

ELEVENLABS_API_KEY ou talk.providers.elevenlabs.apiKey

Consulte Modo Talk.

10) Skills (APIs de terceiros)

Skills podem armazenar apiKey em skills.entries.<name>.apiKey. Se uma skill usar essa chave para APIs externas, ela poderá incorrer em custos de acordo com o provedor da skill. Consulte Skills.

CLI commands

RPC and API

Codex harness

Plugin reference

Plugin SDK reference

Plugin maintainer reference

Templates

Technical reference

Concept internals

Project

Release and CI

Uso e custos da API

Onde os custos aparecem (chat + CLI)

Como as chaves são descobertas

Recursos que podem gastar chaves

1) Respostas do modelo principal (chat + ferramentas)

2) Compreensão de mídia (áudio/imagem/vídeo)

3) Geração de imagens e vídeos

4) Embeddings de memória + busca semântica

5) Ferramenta de busca na web

5) Ferramenta de busca de conteúdo web (Firecrawl)

6) Instantâneos de uso do provedor (status/saúde)

7) Sumarização de salvaguarda de Compaction

8) Varredura / sonda de modelos

9) Talk (fala)

10) Skills (APIs de terceiros)

Relacionados

CLI commands

RPC and API

Codex harness

Plugin reference

Plugin SDK reference

Plugin maintainer reference

Templates

Technical reference

Concept internals

Project

Release and CI

Documentation Index

​Onde os custos aparecem (chat + CLI)

​Como as chaves são descobertas

​Recursos que podem gastar chaves

​1) Respostas do modelo principal (chat + ferramentas)

​2) Compreensão de mídia (áudio/imagem/vídeo)

​3) Geração de imagens e vídeos

​4) Embeddings de memória + busca semântica

​5) Ferramenta de busca na web

​5) Ferramenta de busca de conteúdo web (Firecrawl)

​6) Instantâneos de uso do provedor (status/saúde)

​7) Sumarização de salvaguarda de Compaction

​8) Varredura / sonda de modelos

​9) Talk (fala)

​10) Skills (APIs de terceiros)

​Relacionados

Onde os custos aparecem (chat + CLI)

Como as chaves são descobertas

Recursos que podem gastar chaves

1) Respostas do modelo principal (chat + ferramentas)

2) Compreensão de mídia (áudio/imagem/vídeo)

3) Geração de imagens e vídeos

4) Embeddings de memória + busca semântica

5) Ferramenta de busca na web

5) Ferramenta de busca de conteúdo web (Firecrawl)

6) Instantâneos de uso do provedor (status/saúde)

7) Sumarização de salvaguarda de Compaction

8) Varredura / sonda de modelos

9) Talk (fala)

10) Skills (APIs de terceiros)

Relacionados