Pular para o conteúdo principal

Uso e custos da API

Este documento lista recursos que podem invocar chaves de API e onde seus custos aparecem. Ele se concentra em recursos do OpenClaw que podem gerar uso de provedores ou chamadas pagas de API.

Onde os custos aparecem (chat + CLI)

Instantâneo de custo por sessão
  • /status mostra o modelo atual da sessão, o uso de contexto e os tokens da última resposta.
  • Se o modelo usa autenticação por chave de API, /status também mostra o custo estimado da última resposta.
  • Se os metadados da sessão em tempo real forem escassos, /status pode recuperar contadores de tokens/cache e o rótulo do modelo de runtime ativo a partir da entrada de uso mais recente da transcrição. Valores em tempo real não nulos existentes ainda têm prioridade, e totais da transcrição no tamanho do prompt podem prevalecer quando os totais armazenados estiverem ausentes ou forem menores.
Rodapé de custo por mensagem
  • /usage full acrescenta um rodapé de uso a cada resposta, incluindo custo estimado (somente chave de API).
  • /usage tokens mostra apenas tokens; fluxos de OAuth/token no estilo assinatura e da CLI ocultam o custo em dólares.
  • Observação sobre o Gemini CLI: quando a CLI retorna saída JSON, o OpenClaw lê o uso de stats, normaliza stats.cached em cacheRead e deriva os tokens de entrada de stats.input_tokens - stats.cached quando necessário.
Observação sobre Anthropic: a equipe da Anthropic nos informou que o uso do Claude CLI no estilo OpenClaw está novamente permitido, então o OpenClaw trata a reutilização do Claude CLI e o uso de claude -p como autorizados para esta integração, a menos que a Anthropic publique uma nova política. A Anthropic ainda não expõe uma estimativa em dólares por mensagem que o OpenClaw possa mostrar em /usage full. Janelas de uso da CLI (cotas do provedor)
  • openclaw status --usage e openclaw channels list mostram janelas de uso do provedor (instantâneos de cota, não custos por mensagem).
  • A saída legível por humanos é normalizada para X% left entre os provedores.
  • Provedores atuais de janela de uso: Anthropic, GitHub Copilot, Gemini CLI, OpenAI Codex, MiniMax, Xiaomi e z.ai.
  • Observação sobre MiniMax: seus campos brutos usage_percent / usagePercent significam cota restante, então o OpenClaw os inverte antes da exibição. Campos baseados em contagem ainda têm prioridade quando presentes. Se o provedor retornar model_remains, o OpenClaw prefere a entrada do modelo de chat, deriva o rótulo da janela a partir de timestamps quando necessário e inclui o nome do modelo no rótulo do plano.
  • A autenticação de uso para essas janelas de cota vem de hooks específicos do provedor quando disponíveis; caso contrário, o OpenClaw recorre à correspondência de credenciais OAuth/chave de API a partir de perfis de autenticação, ambiente ou configuração.
Consulte Uso e custos de tokens para detalhes e exemplos.

Como as chaves são descobertas

O OpenClaw pode obter credenciais de:
  • Perfis de autenticação (por agente, armazenados em auth-profiles.json).
  • Variáveis de ambiente (por exemplo, OPENAI_API_KEY, BRAVE_API_KEY, FIRECRAWL_API_KEY).
  • Configuração (models.providers.*.apiKey, plugins.entries.*.config.webSearch.apiKey, plugins.entries.firecrawl.config.webFetch.apiKey, memorySearch.*, talk.providers.*.apiKey).
  • Skills (skills.entries.<name>.apiKey), que podem exportar chaves para o ambiente do processo da skill.

Recursos que podem consumir chaves

1) Respostas do modelo principal (chat + ferramentas)

Cada resposta ou chamada de ferramenta usa o provedor de modelo atual (OpenAI, Anthropic etc.). Esta é a principal fonte de uso e custo. Isso também inclui provedores hospedados no estilo assinatura que ainda cobram fora da UI local do OpenClaw, como OpenAI Codex, Alibaba Cloud Model Studio Coding Plan, MiniMax Coding Plan, Z.AI / GLM Coding Plan e o caminho Claude-login do OpenClaw da Anthropic com Extra Usage habilitado. Consulte Modelos para configuração de preços e Uso e custos de tokens para exibição.

2) Entendimento de mídia (áudio/imagem/vídeo)

Mídia recebida pode ser resumida/transcrita antes de a resposta ser executada. Isso usa APIs de modelo/provedor.
  • Áudio: OpenAI / Groq / Deepgram / Google / Mistral.
  • Imagem: OpenAI / OpenRouter / Anthropic / Google / MiniMax / Moonshot / Qwen / Z.AI.
  • Vídeo: Google / Qwen / Moonshot.
Consulte Entendimento de mídia.

3) Geração de imagem e vídeo

Recursos compartilhados de geração também podem consumir chaves de provedores:
  • Geração de imagem: OpenAI / Google / fal / MiniMax
  • Geração de vídeo: Qwen
A geração de imagem pode inferir um provedor padrão com autenticação quando agents.defaults.imageGenerationModel não estiver definido. A geração de vídeo atualmente exige um agents.defaults.videoGenerationModel explícito, como qwen/wan2.6-t2v. Consulte Geração de imagem, Qwen Cloud e Modelos.

4) Embeddings de memória + busca semântica

A busca semântica na memória usa APIs de embeddings quando configurada para provedores remotos:
  • memorySearch.provider = "openai" → embeddings da OpenAI
  • memorySearch.provider = "gemini" → embeddings do Gemini
  • memorySearch.provider = "voyage" → embeddings da Voyage
  • memorySearch.provider = "mistral" → embeddings da Mistral
  • memorySearch.provider = "lmstudio" → embeddings do LM Studio (local/autohospedado)
  • memorySearch.provider = "ollama" → embeddings do Ollama (local/autohospedado; normalmente sem cobrança de API hospedada)
  • Fallback opcional para um provedor remoto se os embeddings locais falharem
Você pode manter isso local com memorySearch.provider = "local" (sem uso de API). Consulte Memória.

5) Ferramenta de busca na web

web_search pode gerar cobranças de uso dependendo do seu provedor:
  • Brave Search API: BRAVE_API_KEY ou plugins.entries.brave.config.webSearch.apiKey
  • Exa: EXA_API_KEY ou plugins.entries.exa.config.webSearch.apiKey
  • Firecrawl: FIRECRAWL_API_KEY ou plugins.entries.firecrawl.config.webSearch.apiKey
  • Gemini (Google Search): GEMINI_API_KEY ou plugins.entries.google.config.webSearch.apiKey
  • Grok (xAI): XAI_API_KEY ou plugins.entries.xai.config.webSearch.apiKey
  • Kimi (Moonshot): KIMI_API_KEY, MOONSHOT_API_KEY ou plugins.entries.moonshot.config.webSearch.apiKey
  • MiniMax Search: MINIMAX_CODE_PLAN_KEY, MINIMAX_CODING_API_KEY, MINIMAX_API_KEY ou plugins.entries.minimax.config.webSearch.apiKey
  • Ollama Web Search: sem chave por padrão, mas requer um host Ollama acessível e ollama signin; também pode reutilizar a autenticação bearer normal do provedor Ollama quando o host exigir isso
  • Perplexity Search API: PERPLEXITY_API_KEY, OPENROUTER_API_KEY ou plugins.entries.perplexity.config.webSearch.apiKey
  • Tavily: TAVILY_API_KEY ou plugins.entries.tavily.config.webSearch.apiKey
  • DuckDuckGo: fallback sem chave (sem cobrança de API, mas não oficial e baseado em HTML)
  • SearXNG: SEARXNG_BASE_URL ou plugins.entries.searxng.config.webSearch.baseUrl (sem chave/autohospedado; sem cobrança de API hospedada)
Caminhos legados de provedor tools.web.search.* ainda são carregados por meio do shim temporário de compatibilidade, mas já não são mais a superfície de configuração recomendada. Crédito gratuito do Brave Search: cada plano do Brave inclui $5/mês em crédito gratuito renovável. O plano Search custa $5 por 1.000 solicitações, então o crédito cobre 1.000 solicitações/mês sem custo. Defina seu limite de uso no painel do Brave para evitar cobranças inesperadas. Consulte Ferramentas web.

5) Ferramenta de busca de página web (Firecrawl)

web_fetch pode chamar o Firecrawl quando uma chave de API está presente:
  • FIRECRAWL_API_KEY ou plugins.entries.firecrawl.config.webFetch.apiKey
Se o Firecrawl não estiver configurado, a ferramenta recorre a fetch direto + readability (sem API paga). Consulte Ferramentas web.

6) Instantâneos de uso do provedor (status/saúde)

Alguns comandos de status chamam endpoints de uso do provedor para exibir janelas de cota ou saúde de autenticação. Essas chamadas normalmente têm baixo volume, mas ainda assim atingem APIs de provedores:
  • openclaw status --usage
  • openclaw models status --json
Consulte CLI de modelos.

7) Sumarização de proteção de Compaction

A proteção de Compaction pode resumir o histórico da sessão usando o modelo atual, o que invoca APIs do provedor quando é executado. Consulte Gerenciamento de sessão + compaction.

8) Varredura / sondagem de modelo

openclaw models scan pode sondar modelos do OpenRouter e usa OPENROUTER_API_KEY quando a sondagem está habilitada. Consulte CLI de modelos.

9) Talk (fala)

O modo Talk pode invocar ElevenLabs quando configurado:
  • ELEVENLABS_API_KEY ou talk.providers.elevenlabs.apiKey
Consulte Modo Talk.

10) Skills (APIs de terceiros)

As Skills podem armazenar apiKey em skills.entries.<name>.apiKey. Se uma skill usar essa chave para APIs externas, ela poderá gerar custos de acordo com o provedor da skill. Consulte Skills.