Pular para o conteúdo principal

Documentation Index

Fetch the complete documentation index at: https://docs.openclaw.ai/llms.txt

Use this file to discover all available pages before exploring further.

Venice AI oferece inferência de IA com foco em privacidade com suporte a modelos sem censura e acesso a grandes modelos proprietários por meio de seu proxy anonimizado. Toda inferência é privada por padrão — sem treinamento com seus dados, sem registro.

Por que usar Venice no OpenClaw

  • Inferência privada para modelos de código aberto (sem registro).
  • Modelos sem censura quando você precisar deles.
  • Acesso anonimizado a modelos proprietários (Opus/GPT/Gemini) quando a qualidade importa.
  • Endpoints /v1 compatíveis com OpenAI.

Modos de privacidade

A Venice oferece dois níveis de privacidade — entender isso é essencial para escolher seu modelo:
ModoDescriçãoModelos
PrivadoTotalmente privado. Prompts/respostas nunca são armazenados ou registrados. Efêmero.Llama, Qwen, DeepSeek, Kimi, MiniMax, Venice Uncensored, etc.
AnonimizadoEncaminhado por proxy pela Venice com metadados removidos. O provedor subjacente (OpenAI, Anthropic, Google, xAI) vê solicitações anonimizadas.Claude, GPT, Gemini, Grok
Modelos anonimizados não são totalmente privados. A Venice remove metadados antes de encaminhar, mas o provedor subjacente (OpenAI, Anthropic, Google, xAI) ainda processa a solicitação. Escolha modelos Privados quando privacidade total for necessária.

Recursos

  • Foco em privacidade: escolha entre os modos “privado” (totalmente privado) e “anonimizado” (por proxy)
  • Modelos sem censura: acesso a modelos sem restrições de conteúdo
  • Acesso a grandes modelos: use Claude, GPT, Gemini e Grok pelo proxy anonimizado da Venice
  • API compatível com OpenAI: endpoints /v1 padrão para integração fácil
  • Streaming: compatível com todos os modelos
  • Chamada de funções: compatível com modelos selecionados (verifique os recursos do modelo)
  • Visão: compatível com modelos com capacidade de visão
  • Sem limites rígidos de taxa: limitação por uso justo pode ser aplicada em uso extremo

Introdução

1

Obtenha sua chave de API

  1. Cadastre-se em venice.ai
  2. Acesse Configurações > Chaves de API > Criar nova chave
  3. Copie sua chave de API (formato: vapi_xxxxxxxxxxxx)
2

Configure o OpenClaw

Escolha seu método de configuração preferido:
openclaw onboard --auth-choice venice-api-key
Isso vai:
  1. Solicitar sua chave de API (ou usar VENICE_API_KEY existente)
  2. Mostrar todos os modelos Venice disponíveis
  3. Permitir que você escolha seu modelo padrão
  4. Configurar o provedor automaticamente
3

Verifique a configuração

openclaw agent --model venice/kimi-k2-5 --message "Hello, are you working?"

Seleção de modelo

Após a configuração, o OpenClaw mostra todos os modelos Venice disponíveis. Escolha com base nas suas necessidades:
  • Modelo padrão: venice/kimi-k2-5 para raciocínio privado forte mais visão.
  • Opção de alta capacidade: venice/claude-opus-4-6 para o caminho Venice anonimizado mais forte.
  • Privacidade: escolha modelos “privados” para inferência totalmente privada.
  • Capacidade: escolha modelos “anonimizados” para acessar Claude, GPT, Gemini pelo proxy da Venice.
Altere seu modelo padrão a qualquer momento:
openclaw models set venice/kimi-k2-5
openclaw models set venice/claude-opus-4-6
Liste todos os modelos disponíveis:
openclaw models list --all --provider venice
Você também pode executar openclaw configure, selecionar Modelo/autenticação e escolher Venice AI.
Use a tabela abaixo para escolher o modelo certo para seu caso de uso.
Caso de usoModelo recomendadoMotivo
Chat geral (padrão)kimi-k2-5Raciocínio privado forte mais visão
Melhor qualidade geralclaude-opus-4-6Opção Venice anonimizada mais forte
Privacidade + programaçãoqwen3-coder-480b-a35b-instructModelo de programação privado com contexto grande
Visão privadakimi-k2-5Suporte a visão sem sair do modo privado
Rápido + baratoqwen3-4bModelo de raciocínio leve
Tarefas privadas complexasdeepseek-v3.2Raciocínio forte, mas sem suporte a ferramentas Venice
Sem censuravenice-uncensoredSem restrições de conteúdo

Comportamento de reprodução do DeepSeek V4

Se a Venice expuser modelos DeepSeek V4, como venice/deepseek-v4-pro ou venice/deepseek-v4-flash, o OpenClaw preenche o placeholder obrigatório de reprodução reasoning_content do DeepSeek V4 em mensagens do assistente quando o proxy o omite. A Venice rejeita o controle nativo de nível superior thinking do DeepSeek, portanto o OpenClaw mantém essa correção de reprodução específica do provedor separada dos controles de pensamento do provedor DeepSeek nativo.

Catálogo integrado (41 no total)

ID do modeloNomeContextoRecursos
kimi-k2-5Kimi K2.5256kPadrão, raciocínio, visão
kimi-k2-thinkingKimi K2 Thinking256kRaciocínio
llama-3.3-70bLlama 3.3 70B128kGeral
llama-3.2-3bLlama 3.2 3B128kGeral
hermes-3-llama-3.1-405bHermes 3 Llama 3.1 405B128kGeral, ferramentas desativadas
qwen3-235b-a22b-thinking-2507Qwen3 235B Thinking128kRaciocínio
qwen3-235b-a22b-instruct-2507Qwen3 235B Instruct128kGeral
qwen3-coder-480b-a35b-instructQwen3 Coder 480B256kProgramação
qwen3-coder-480b-a35b-instruct-turboQwen3 Coder 480B Turbo256kProgramação
qwen3-5-35b-a3bQwen3.5 35B A3B256kRaciocínio, visão
qwen3-next-80bQwen3 Next 80B256kGeral
qwen3-vl-235b-a22bQwen3 VL 235B (Visão)256kVisão
qwen3-4bVenice Small (Qwen3 4B)32kRápido, raciocínio
deepseek-v3.2DeepSeek V3.2160kRaciocínio, ferramentas desativadas
venice-uncensoredVenice Uncensored (Dolphin-Mistral)32kSem censura, ferramentas desativadas
mistral-31-24bVenice Medium (Mistral)128kVisão
google-gemma-3-27b-itGoogle Gemma 3 27B Instruct198kVisão
openai-gpt-oss-120bOpenAI GPT OSS 120B128kGeral
nvidia-nemotron-3-nano-30b-a3bNVIDIA Nemotron 3 Nano 30B128kGeral
olafangensan-glm-4.7-flash-hereticGLM 4.7 Flash Heretic128kRaciocínio
zai-org-glm-4.6GLM 4.6198kGeral
zai-org-glm-4.7GLM 4.7198kRaciocínio
zai-org-glm-4.7-flashGLM 4.7 Flash128kRaciocínio
zai-org-glm-5GLM 5198kRaciocínio
minimax-m21MiniMax M2.1198kRaciocínio
minimax-m25MiniMax M2.5198kRaciocínio
ID do modeloNomeContextoRecursos
claude-opus-4-6Claude Opus 4.6 (via Venice)1MRaciocínio, visão
claude-opus-4-5Claude Opus 4.5 (via Venice)198kRaciocínio, visão
claude-sonnet-4-6Claude Sonnet 4.6 (via Venice)1MRaciocínio, visão
claude-sonnet-4-5Claude Sonnet 4.5 (via Venice)198kRaciocínio, visão
openai-gpt-54GPT-5.4 (via Venice)1MRaciocínio, visão
openai-gpt-53-codexGPT-5.3 Codex (via Venice)400kRaciocínio, visão, programação
openai-gpt-52GPT-5.2 (via Venice)256kRaciocínio
openai-gpt-52-codexGPT-5.2 Codex (via Venice)256kRaciocínio, visão, programação
openai-gpt-4o-2024-11-20GPT-4o (via Venice)128kVisão
openai-gpt-4o-mini-2024-07-18GPT-4o Mini (via Venice)128kVisão
gemini-3-1-pro-previewGemini 3.1 Pro (via Venice)1MRaciocínio, visão
gemini-3-pro-previewGemini 3 Pro (via Venice)198kRaciocínio, visão
gemini-3-flash-previewGemini 3 Flash (via Venice)256kRaciocínio, visão
grok-41-fastGrok 4.1 Fast (via Venice)1MRaciocínio, visão
grok-code-fast-1Grok Code Fast 1 (via Venice)256kRaciocínio, programação

Descoberta de modelos

O OpenClaw inclui um catálogo inicial Venice respaldado por manifesto para listagem de modelos somente leitura. A atualização em tempo de execução ainda pode descobrir modelos pela API da Venice e recorre ao catálogo do manifesto se a API estiver inacessível. O endpoint /models é público (nenhuma autenticação necessária para listar), mas a inferência requer uma chave de API válida.

Streaming e suporte a ferramentas

RecursoSuporte
StreamingTodos os modelos
Chamada de funçãoA maioria dos modelos (verifique supportsFunctionCalling na API)
Visão/ImagensModelos marcados com o recurso “Visão”
Modo JSONCompatível via response_format

Preços

A Venice usa um sistema baseado em créditos. Consulte venice.ai/pricing para ver as tarifas atuais:
  • Modelos privados: Geralmente têm custo menor
  • Modelos anonimizados: Semelhante ao preço da API direta + pequena taxa da Venice

Venice (anonimizada) vs API direta

AspectoVenice (Anonimizada)API direta
PrivacidadeMetadados removidos, anonimizadoSua conta vinculada
Latência+10-50ms (proxy)Direta
RecursosA maioria dos recursos é compatívelRecursos completos
CobrançaCréditos da VeniceCobrança do provedor

Exemplos de uso

# Use the default private model
openclaw agent --model venice/kimi-k2-5 --message "Quick health check"

# Use Claude Opus via Venice (anonymized)
openclaw agent --model venice/claude-opus-4-6 --message "Summarize this task"

# Use uncensored model
openclaw agent --model venice/venice-uncensored --message "Draft options"

# Use vision model with image
openclaw agent --model venice/qwen3-vl-235b-a22b --message "Review attached image"

# Use coding model
openclaw agent --model venice/qwen3-coder-480b-a35b-instruct --message "Refactor this function"

Solução de problemas

echo $VENICE_API_KEY
openclaw models list | grep venice
Verifique se a chave começa com vapi_.
O catálogo de modelos da Venice é atualizado dinamicamente. Execute openclaw models list para ver os modelos disponíveis no momento. Alguns modelos podem estar temporariamente offline.
A API da Venice fica em https://api.venice.ai/api/v1. Verifique se sua rede permite conexões HTTPS.

Configuração avançada

{
  env: { VENICE_API_KEY: "vapi_..." },
  agents: { defaults: { model: { primary: "venice/kimi-k2-5" } } },
  models: {
    mode: "merge",
    providers: {
      venice: {
        baseUrl: "https://api.venice.ai/api/v1",
        apiKey: "${VENICE_API_KEY}",
        api: "openai-completions",
        models: [
          {
            id: "kimi-k2-5",
            name: "Kimi K2.5",
            reasoning: true,
            input: ["text", "image"],
            cost: { input: 0, output: 0, cacheRead: 0, cacheWrite: 0 },
            contextWindow: 256000,
            maxTokens: 65536,
          },
        ],
      },
    },
  },
}

Relacionados

Model selection

Escolha de provedores, refs de modelo e comportamento de failover.

Venice AI

Página inicial da Venice AI e cadastro de conta.

API documentation

Referência da API da Venice e documentação para desenvolvedores.

Pricing

Tarifas e planos atuais de créditos da Venice.