Pular para o conteúdo principal

Uso e custos de API

Este documento lista os recursos que podem invocar chaves de API e onde seus custos aparecem. Ele se concentra em recursos do OpenClaw que podem gerar uso de provedor ou chamadas pagas de API.

Onde os custos aparecem (chat + CLI)

Snapshot de custo por sessão
  • /status mostra o modelo atual da sessão, uso de contexto e tokens da última resposta.
  • Se o modelo usar autenticação por chave de API, /status também mostra o custo estimado da última resposta.
  • Se os metadados da sessão ao vivo forem escassos, /status pode recuperar contadores de tokens/cache e o rótulo ativo do modelo em runtime a partir da entrada de uso da transcrição mais recente. Valores ao vivo não nulos existentes ainda têm precedência, e totais da transcrição no tamanho do prompt podem prevalecer quando os totais armazenados estiverem ausentes ou forem menores.
Rodapé de custo por mensagem
  • /usage full adiciona um rodapé de uso a cada resposta, incluindo o custo estimado (somente chave de API).
  • /usage tokens mostra apenas tokens; fluxos de OAuth/token no estilo assinatura e fluxos de CLI ocultam o custo em dólares.
  • Observação sobre Gemini CLI: quando a CLI retorna saída JSON, o OpenClaw lê o uso de stats, normaliza stats.cached em cacheRead e deriva tokens de entrada de stats.input_tokens - stats.cached quando necessário.
Observação sobre Anthropic: a documentação pública do Claude Code da Anthropic ainda inclui o uso direto do Claude Code no terminal nos limites do plano Claude. Separadamente, a Anthropic informou aos usuários do OpenClaw que, a partir de 4 de abril de 2026 às 12:00 PM PT / 8:00 PM BST, o caminho de login Claude do OpenClaw conta como uso por um harness de terceiros e exige Extra Usage, cobrado separadamente da assinatura. A Anthropic não expõe uma estimativa em dólares por mensagem que o OpenClaw possa mostrar em /usage full. Janelas de uso da CLI (cotas do provedor)
  • openclaw status --usage e openclaw channels list mostram janelas de uso do provedor (snapshots de cota, não custos por mensagem).
  • A saída legível é normalizada para X% left entre provedores.
  • Provedores atuais de janela de uso: Anthropic, GitHub Copilot, Gemini CLI, OpenAI Codex, MiniMax, Xiaomi e z.ai.
  • Observação sobre MiniMax: os campos brutos usage_percent / usagePercent significam cota restante, então o OpenClaw os inverte antes da exibição. Campos baseados em contagem ainda prevalecem quando presentes. Se o provedor retornar model_remains, o OpenClaw prefere a entrada do modelo de chat, deriva o rótulo da janela a partir dos timestamps quando necessário e inclui o nome do modelo no rótulo do plano.
  • A autenticação de uso para essas janelas de cota vem de hooks específicos do provedor quando disponíveis; caso contrário, o OpenClaw recorre à correspondência de credenciais OAuth/chave de API de perfis de autenticação, ambiente ou configuração.
Consulte Uso e custos de tokens para detalhes e exemplos.

Como as chaves são descobertas

O OpenClaw pode obter credenciais de:
  • Perfis de autenticação (por agente, armazenados em auth-profiles.json).
  • Variáveis de ambiente (por exemplo, OPENAI_API_KEY, BRAVE_API_KEY, FIRECRAWL_API_KEY).
  • Configuração (models.providers.*.apiKey, plugins.entries.*.config.webSearch.apiKey, plugins.entries.firecrawl.config.webFetch.apiKey, memorySearch.*, talk.providers.*.apiKey).
  • Skills (skills.entries.<name>.apiKey), que podem exportar chaves para o ambiente do processo da skill.

Recursos que podem consumir chaves

1) Respostas do modelo central (chat + ferramentas)

Cada resposta ou chamada de ferramenta usa o provedor de modelo atual (OpenAI, Anthropic etc.). Essa é a principal fonte de uso e custo. Isso também inclui provedores hospedados no estilo assinatura que ainda cobram fora da interface local do OpenClaw, como OpenAI Codex, Alibaba Cloud Model Studio Coding Plan, MiniMax Coding Plan, Z.AI / GLM Coding Plan e o caminho de login Claude do OpenClaw da Anthropic com Extra Usage habilitado. Consulte Models para configuração de preços e Uso e custos de tokens para exibição.

2) Entendimento de mídia (áudio/imagem/vídeo)

Mídias recebidas podem ser resumidas/transcritas antes da execução da resposta. Isso usa APIs de modelo/provedor.
  • Áudio: OpenAI / Groq / Deepgram / Google / Mistral.
  • Imagem: OpenAI / OpenRouter / Anthropic / Google / MiniMax / Moonshot / Qwen / Z.AI.
  • Vídeo: Google / Qwen / Moonshot.
Consulte Entendimento de mídia.

3) Geração de imagem e vídeo

Capacidades compartilhadas de geração também podem consumir chaves de provedor:
  • Geração de imagem: OpenAI / Google / fal / MiniMax
  • Geração de vídeo: Qwen
A geração de imagem pode inferir um provedor padrão com autenticação de suporte quando agents.defaults.imageGenerationModel não estiver definido. Atualmente, a geração de vídeo exige um agents.defaults.videoGenerationModel explícito, como qwen/wan2.6-t2v. Consulte Geração de imagem, Qwen Cloud e Models.

4) Embeddings de memória + pesquisa semântica

A pesquisa semântica em memória usa APIs de embedding quando configurada para provedores remotos:
  • memorySearch.provider = "openai" → embeddings do OpenAI
  • memorySearch.provider = "gemini" → embeddings do Gemini
  • memorySearch.provider = "voyage" → embeddings do Voyage
  • memorySearch.provider = "mistral" → embeddings do Mistral
  • memorySearch.provider = "ollama" → embeddings do Ollama (local/self-hosted; normalmente sem cobrança de API hospedada)
  • Fallback opcional para um provedor remoto se os embeddings locais falharem
Você pode mantê-la local com memorySearch.provider = "local" (sem uso de API). Consulte Memory.

5) Ferramenta de pesquisa na web

web_search pode gerar cobranças de uso dependendo do seu provedor:
  • Brave Search API: BRAVE_API_KEY ou plugins.entries.brave.config.webSearch.apiKey
  • Exa: EXA_API_KEY ou plugins.entries.exa.config.webSearch.apiKey
  • Firecrawl: FIRECRAWL_API_KEY ou plugins.entries.firecrawl.config.webSearch.apiKey
  • Gemini (Google Search): GEMINI_API_KEY ou plugins.entries.google.config.webSearch.apiKey
  • Grok (xAI): XAI_API_KEY ou plugins.entries.xai.config.webSearch.apiKey
  • Kimi (Moonshot): KIMI_API_KEY, MOONSHOT_API_KEY ou plugins.entries.moonshot.config.webSearch.apiKey
  • MiniMax Search: MINIMAX_CODE_PLAN_KEY, MINIMAX_CODING_API_KEY, MINIMAX_API_KEY ou plugins.entries.minimax.config.webSearch.apiKey
  • Ollama Web Search: sem chave por padrão, mas exige um host Ollama acessível mais ollama signin; também pode reutilizar a autenticação bearer normal do provedor Ollama quando o host exigir
  • Perplexity Search API: PERPLEXITY_API_KEY, OPENROUTER_API_KEY ou plugins.entries.perplexity.config.webSearch.apiKey
  • Tavily: TAVILY_API_KEY ou plugins.entries.tavily.config.webSearch.apiKey
  • DuckDuckGo: fallback sem chave (sem cobrança de API, mas não oficial e baseado em HTML)
  • SearXNG: SEARXNG_BASE_URL ou plugins.entries.searxng.config.webSearch.baseUrl (sem chave/self-hosted; sem cobrança de API hospedada)
Os caminhos legados de provedor tools.web.search.* ainda são carregados por meio do shim temporário de compatibilidade, mas não são mais a superfície de configuração recomendada. Crédito gratuito do Brave Search: cada plano do Brave inclui $5/mês em crédito gratuito renovável. O plano Search custa $5 por 1.000 solicitações, então o crédito cobre 1.000 solicitações/mês sem cobrança. Defina seu limite de uso no dashboard do Brave para evitar cobranças inesperadas. Consulte Ferramentas da web.

5) Ferramenta de busca na web (Firecrawl)

web_fetch pode chamar o Firecrawl quando uma chave de API estiver presente:
  • FIRECRAWL_API_KEY ou plugins.entries.firecrawl.config.webFetch.apiKey
Se o Firecrawl não estiver configurado, a ferramenta recorre a fetch direto + readability (sem API paga). Consulte Ferramentas da web.

6) Snapshots de uso do provedor (status/saúde)

Alguns comandos de status chamam endpoints de uso do provedor para exibir janelas de cota ou saúde da autenticação. Normalmente são chamadas de baixo volume, mas ainda atingem APIs do provedor:
  • openclaw status --usage
  • openclaw models status --json
Consulte Models CLI.

7) Resumo de proteção de compactação

A proteção de compactação pode resumir o histórico da sessão usando o modelo atual, o que invoca APIs do provedor quando é executada. Consulte Gerenciamento de sessão + compactação.

8) Varredura / sonda de modelo

openclaw models scan pode sondar modelos do OpenRouter e usa OPENROUTER_API_KEY quando a sondagem está habilitada. Consulte Models CLI.

9) Talk (fala)

O modo Talk pode invocar o ElevenLabs quando configurado:
  • ELEVENLABS_API_KEY ou talk.providers.elevenlabs.apiKey
Consulte Modo Talk.

10) Skills (APIs de terceiros)

As Skills podem armazenar apiKey em skills.entries.<name>.apiKey. Se uma skill usar essa chave para APIs externas, ela poderá gerar custos de acordo com o provedor da skill. Consulte Skills.