Vai al contenuto principale

Documentation Index

Fetch the complete documentation index at: https://docs.openclaw.ai/llms.txt

Use this file to discover all available pages before exploring further.

Venice AI offre inferenza IA orientata alla privacy con supporto per modelli non censurati e accesso ai principali modelli proprietari tramite il loro proxy anonimizzato. Tutta l’inferenza è privata per impostazione predefinita: nessun addestramento sui tuoi dati, nessuna registrazione.

Perché Venice in OpenClaw

  • Inferenza privata per modelli open source (nessuna registrazione).
  • Modelli non censurati quando ne hai bisogno.
  • Accesso anonimizzato a modelli proprietari (Opus/GPT/Gemini) quando la qualità è importante.
  • Endpoint /v1 compatibili con OpenAI.

Modalità di privacy

Venice offre due livelli di privacy: comprenderli è fondamentale per scegliere il modello:
ModalitàDescrizioneModelli
PrivataCompletamente privata. Prompt/risposte non vengono mai archiviati o registrati. Effimera.Llama, Qwen, DeepSeek, Kimi, MiniMax, Venice Uncensored, ecc.
AnonimizzataInstradata tramite proxy attraverso Venice con i metadati rimossi. Il fornitore sottostante (OpenAI, Anthropic, Google, xAI) vede richieste anonimizzate.Claude, GPT, Gemini, Grok
I modelli anonimizzati non sono completamente privati. Venice rimuove i metadati prima dell’inoltro, ma il fornitore sottostante (OpenAI, Anthropic, Google, xAI) elabora comunque la richiesta. Scegli modelli Privati quando è richiesta la privacy completa.

Funzionalità

  • Orientato alla privacy: scegli tra modalità “privata” (completamente privata) e “anonimizzata” (tramite proxy)
  • Modelli non censurati: accesso a modelli senza restrizioni sui contenuti
  • Accesso ai principali modelli: usa Claude, GPT, Gemini e Grok tramite il proxy anonimizzato di Venice
  • API compatibile con OpenAI: endpoint /v1 standard per una facile integrazione
  • Streaming: supportato su tutti i modelli
  • Chiamata di funzioni: supportata su modelli selezionati (controlla le capacità del modello)
  • Visione: supportata sui modelli con capacità di visione
  • Nessun limite di frequenza rigido: potrebbe essere applicata una limitazione per uso corretto in caso di utilizzo estremo

Per iniziare

1

Ottieni la tua chiave API

  1. Registrati su venice.ai
  2. Vai a Impostazioni > Chiavi API > Crea nuova chiave
  3. Copia la tua chiave API (formato: vapi_xxxxxxxxxxxx)
2

Configura OpenClaw

Scegli il metodo di configurazione preferito:
openclaw onboard --auth-choice venice-api-key
Questo:
  1. Richiederà la tua chiave API (oppure userà VENICE_API_KEY esistente)
  2. Mostrerà tutti i modelli Venice disponibili
  3. Ti consentirà di scegliere il modello predefinito
  4. Configurerà automaticamente il provider
3

Verifica la configurazione

openclaw agent --model venice/kimi-k2-5 --message "Hello, are you working?"

Selezione del modello

Dopo la configurazione, OpenClaw mostra tutti i modelli Venice disponibili. Scegli in base alle tue esigenze:
  • Modello predefinito: venice/kimi-k2-5 per un solido ragionamento privato con supporto alla visione.
  • Opzione ad alta capacità: venice/claude-opus-4-6 per il percorso Venice anonimizzato più potente.
  • Privacy: scegli modelli “privati” per un’inferenza completamente privata.
  • Capacità: scegli modelli “anonimizzati” per accedere a Claude, GPT, Gemini tramite il proxy di Venice.
Cambia il modello predefinito in qualsiasi momento:
openclaw models set venice/kimi-k2-5
openclaw models set venice/claude-opus-4-6
Elenca tutti i modelli disponibili:
openclaw models list --all --provider venice
Puoi anche eseguire openclaw configure, selezionare Modello/autenticazione e scegliere Venice AI.
Usa la tabella seguente per scegliere il modello giusto per il tuo caso d’uso.
Caso d’usoModello consigliatoPerché
Conversazione generale (predefinita)kimi-k2-5Ragionamento privato solido con supporto alla visione
Migliore qualità complessivaclaude-opus-4-6L’opzione Venice anonimizzata più potente
Privacy + programmazioneqwen3-coder-480b-a35b-instructModello di programmazione privato con contesto ampio
Visione privatakimi-k2-5Supporto alla visione senza uscire dalla modalità privata
Veloce + economicoqwen3-4bModello di ragionamento leggero
Attività private complessedeepseek-v3.2Ragionamento solido, ma senza supporto agli strumenti di Venice
Non censuratovenice-uncensoredNessuna restrizione sui contenuti

Comportamento di riproduzione di DeepSeek V4

Se Venice espone modelli DeepSeek V4 come venice/deepseek-v4-pro o venice/deepseek-v4-flash, OpenClaw inserisce il segnaposto di riproduzione reasoning_content richiesto da DeepSeek V4 nei messaggi dell’assistente quando il proxy lo omette. Venice rifiuta il controllo nativo di primo livello thinking di DeepSeek, quindi OpenClaw mantiene quella correzione di riproduzione specifica del provider separata dai controlli di ragionamento del provider DeepSeek nativo.

Catalogo integrato (41 in totale)

ID modelloNomeContestoFunzionalità
kimi-k2-5Kimi K2.5256kPredefinito, ragionamento, visione
kimi-k2-thinkingKimi K2 Thinking256kRagionamento
llama-3.3-70bLlama 3.3 70B128kGenerale
llama-3.2-3bLlama 3.2 3B128kGenerale
hermes-3-llama-3.1-405bHermes 3 Llama 3.1 405B128kGenerale, strumenti disabilitati
qwen3-235b-a22b-thinking-2507Qwen3 235B Thinking128kRagionamento
qwen3-235b-a22b-instruct-2507Qwen3 235B Instruct128kGenerale
qwen3-coder-480b-a35b-instructQwen3 Coder 480B256kProgrammazione
qwen3-coder-480b-a35b-instruct-turboQwen3 Coder 480B Turbo256kProgrammazione
qwen3-5-35b-a3bQwen3.5 35B A3B256kRagionamento, visione
qwen3-next-80bQwen3 Next 80B256kGenerale
qwen3-vl-235b-a22bQwen3 VL 235B (Vision)256kVisione
qwen3-4bVenice Small (Qwen3 4B)32kVeloce, ragionamento
deepseek-v3.2DeepSeek V3.2160kRagionamento, strumenti disabilitati
venice-uncensoredVenice Uncensored (Dolphin-Mistral)32kNon censurato, strumenti disabilitati
mistral-31-24bVenice Medium (Mistral)128kVisione
google-gemma-3-27b-itGoogle Gemma 3 27B Instruct198kVisione
openai-gpt-oss-120bOpenAI GPT OSS 120B128kGenerale
nvidia-nemotron-3-nano-30b-a3bNVIDIA Nemotron 3 Nano 30B128kGenerale
olafangensan-glm-4.7-flash-hereticGLM 4.7 Flash Heretic128kRagionamento
zai-org-glm-4.6GLM 4.6198kGenerale
zai-org-glm-4.7GLM 4.7198kRagionamento
zai-org-glm-4.7-flashGLM 4.7 Flash128kRagionamento
zai-org-glm-5GLM 5198kRagionamento
minimax-m21MiniMax M2.1198kRagionamento
minimax-m25MiniMax M2.5198kRagionamento
ID modelloNomeContestoFunzionalità
claude-opus-4-6Claude Opus 4.6 (tramite Venice)1MRagionamento, visione
claude-opus-4-5Claude Opus 4.5 (tramite Venice)198kRagionamento, visione
claude-sonnet-4-6Claude Sonnet 4.6 (tramite Venice)1MRagionamento, visione
claude-sonnet-4-5Claude Sonnet 4.5 (tramite Venice)198kRagionamento, visione
openai-gpt-54GPT-5.4 (tramite Venice)1MRagionamento, visione
openai-gpt-53-codexGPT-5.3 Codex (tramite Venice)400kRagionamento, visione, programmazione
openai-gpt-52GPT-5.2 (tramite Venice)256kRagionamento
openai-gpt-52-codexGPT-5.2 Codex (tramite Venice)256kRagionamento, visione, programmazione
openai-gpt-4o-2024-11-20GPT-4o (tramite Venice)128kVisione
openai-gpt-4o-mini-2024-07-18GPT-4o Mini (tramite Venice)128kVisione
gemini-3-1-pro-previewGemini 3.1 Pro (tramite Venice)1MRagionamento, visione
gemini-3-pro-previewGemini 3 Pro (tramite Venice)198kRagionamento, visione
gemini-3-flash-previewGemini 3 Flash (tramite Venice)256kRagionamento, visione
grok-41-fastGrok 4.1 Fast (tramite Venice)1MRagionamento, visione
grok-code-fast-1Grok Code Fast 1 (tramite Venice)256kRagionamento, programmazione

Rilevamento dei modelli

OpenClaw include un catalogo iniziale Venice basato su manifest per l’elenco dei modelli in sola lettura. L’aggiornamento a runtime può comunque rilevare i modelli dall’API Venice e ripiega sul catalogo del manifest se l’API non è raggiungibile. L’endpoint /models è pubblico (non serve autenticazione per l’elenco), ma l’inferenza richiede una chiave API valida.

Streaming e supporto degli strumenti

FunzionalitàSupporto
StreamingTutti i modelli
Chiamata di funzioniLa maggior parte dei modelli (controlla supportsFunctionCalling nell’API)
Visione/ImmaginiModelli contrassegnati con la funzionalità “Visione”
Modalità JSONSupportata tramite response_format

Prezzi

Venice usa un sistema basato su crediti. Consulta venice.ai/pricing per le tariffe attuali:
  • Modelli privati: in genere hanno un costo inferiore
  • Modelli anonimizzati: simili ai prezzi dell’API diretta + una piccola commissione Venice

Venice (anonimizzata) vs API diretta

AspettoVenice (anonimizzata)API diretta
PrivacyMetadati rimossi, anonimizzatiAccount collegato
Latenza+10-50 ms (proxy)Diretta
FunzionalitàLa maggior parte delle funzionalità supportataFunzionalità complete
FatturazioneCrediti VeniceFatturazione del provider

Esempi di utilizzo

# Use the default private model
openclaw agent --model venice/kimi-k2-5 --message "Quick health check"

# Use Claude Opus via Venice (anonymized)
openclaw agent --model venice/claude-opus-4-6 --message "Summarize this task"

# Use uncensored model
openclaw agent --model venice/venice-uncensored --message "Draft options"

# Use vision model with image
openclaw agent --model venice/qwen3-vl-235b-a22b --message "Review attached image"

# Use coding model
openclaw agent --model venice/qwen3-coder-480b-a35b-instruct --message "Refactor this function"

Risoluzione dei problemi

echo $VENICE_API_KEY
openclaw models list | grep venice
Assicurati che la chiave inizi con vapi_.
Il catalogo dei modelli Venice si aggiorna dinamicamente. Esegui openclaw models list per vedere i modelli attualmente disponibili. Alcuni modelli potrebbero essere temporaneamente offline.
L’API Venice si trova su https://api.venice.ai/api/v1. Assicurati che la tua rete consenta connessioni HTTPS.

Configurazione avanzata

{
  env: { VENICE_API_KEY: "vapi_..." },
  agents: { defaults: { model: { primary: "venice/kimi-k2-5" } } },
  models: {
    mode: "merge",
    providers: {
      venice: {
        baseUrl: "https://api.venice.ai/api/v1",
        apiKey: "${VENICE_API_KEY}",
        api: "openai-completions",
        models: [
          {
            id: "kimi-k2-5",
            name: "Kimi K2.5",
            reasoning: true,
            input: ["text", "image"],
            cost: { input: 0, output: 0, cacheRead: 0, cacheWrite: 0 },
            contextWindow: 256000,
            maxTokens: 65536,
          },
        ],
      },
    },
  },
}

Correlati

Model selection

Scelta dei provider, riferimenti ai modelli e comportamento di failover.

Venice AI

Homepage Venice AI e registrazione dell’account.

API documentation

Riferimento dell’API Venice e documentazione per sviluppatori.

Pricing

Tariffe e piani attuali dei crediti Venice.