Providers
Venice AI
Venice AI fornisce inferenza AI orientata alla privacy con supporto per modelli senza censura e accesso ai principali modelli proprietari tramite il loro proxy anonimizzato. Tutta l'inferenza è privata per impostazione predefinita: nessun addestramento sui tuoi dati, nessuna registrazione.
Perché Venice in OpenClaw
- Inferenza privata per modelli open-source (nessuna registrazione).
- Modelli senza censura quando ne hai bisogno.
- Accesso anonimizzato a modelli proprietari (Opus/GPT/Gemini) quando la qualità è importante.
- Endpoint
/v1compatibili con OpenAI.
Modalità di privacy
Venice offre due livelli di privacy: capirli è fondamentale per scegliere il modello:
| Modalità | Descrizione | Modelli |
|---|---|---|
| Privata | Completamente privata. Prompt/risposte non vengono mai archiviati né registrati. Effimera. | Llama, Qwen, DeepSeek, Kimi, MiniMax, Venice Uncensored, ecc. |
| Anonimizzata | Instradata tramite Venice con metadati rimossi. Il provider sottostante (OpenAI, Anthropic, Google, xAI) vede richieste anonimizzate. | Claude, GPT, Gemini, Grok |
Funzionalità
- Orientato alla privacy: scegli tra modalità "private" (completamente privata) e "anonymized" (tramite proxy)
- Modelli senza censura: accesso a modelli senza restrizioni sui contenuti
- Accesso ai principali modelli: usa Claude, GPT, Gemini e Grok tramite il proxy anonimizzato di Venice
- API compatibile con OpenAI: endpoint standard
/v1per un'integrazione semplice - Streaming: supportato su tutti i modelli
- Chiamata di funzioni: supportata su modelli selezionati (controlla le capacità del modello)
- Visione: supportata sui modelli con capacità di visione
- Nessun limite rigido di frequenza: può essere applicata una limitazione per uso corretto in caso di utilizzo estremo
Per iniziare
Installa il plugin
openclaw plugins install @openclaw/venice-providerOttieni la tua chiave API
- Registrati su venice.ai
- Vai a Impostazioni > Chiavi API > Crea nuova chiave
- Copia la tua chiave API (formato:
vapi_xxxxxxxxxxxx)
Configura OpenClaw
Scegli il metodo di configurazione preferito:
Interattivo (consigliato)
openclaw onboard --auth-choice venice-api-keyQuesto:
- Richiederà la tua chiave API (o userà
VENICE_API_KEYesistente) - Mostrerà tutti i modelli Venice disponibili
- Ti permetterà di scegliere il modello predefinito
- Configurerà automaticamente il provider
Variabile d'ambiente
export VENICE_API_KEY="vapi_xxxxxxxxxxxx"Non interattivo
openclaw onboard --non-interactive \ --auth-choice venice-api-key \ --venice-api-key "vapi_xxxxxxxxxxxx"Verifica la configurazione
openclaw agent --model venice/kimi-k2-5 --message "Hello, are you working?"Selezione del modello
Dopo la configurazione, OpenClaw mostra tutti i modelli Venice disponibili. Scegli in base alle tue esigenze:
- Modello predefinito:
venice/kimi-k2-5per un ragionamento privato solido più visione. - Opzione ad alte capacità:
venice/claude-opus-4-6per il percorso Venice anonimizzato più potente. - Privacy: scegli modelli "private" per inferenza completamente privata.
- Capacità: scegli modelli "anonymized" per accedere a Claude, GPT, Gemini tramite il proxy di Venice.
Cambia il modello predefinito in qualsiasi momento:
openclaw models set venice/kimi-k2-5openclaw models set venice/claude-opus-4-6Elenca tutti i modelli disponibili:
openclaw models list --all --provider venicePuoi anche eseguire openclaw configure, selezionare Modello/autenticazione e scegliere Venice AI.
Comportamento di replay di DeepSeek V4
Se Venice espone modelli DeepSeek V4 come venice/deepseek-v4-pro o
venice/deepseek-v4-flash, OpenClaw riempie il segnaposto di replay
reasoning_content richiesto da DeepSeek V4 nei messaggi dell'assistente quando il proxy
lo omette. Venice rifiuta il controllo nativo di primo livello thinking di DeepSeek, quindi
OpenClaw mantiene questa correzione di replay specifica per provider separata dai controlli
di thinking del provider DeepSeek nativo.
Catalogo integrato (41 in totale)
Modelli privati (26) — completamente privati, nessuna registrazione
| ID modello | Nome | Contesto | Funzionalità |
|---|---|---|---|
kimi-k2-5 |
Kimi K2.5 | 256k | Predefinito, ragionamento, visione |
kimi-k2-thinking |
Kimi K2 Thinking | 256k | Ragionamento |
llama-3.3-70b |
Llama 3.3 70B | 128k | Generale |
llama-3.2-3b |
Llama 3.2 3B | 128k | Generale |
hermes-3-llama-3.1-405b |
Hermes 3 Llama 3.1 405B | 128k | Generale, strumenti disabilitati |
qwen3-235b-a22b-thinking-2507 |
Qwen3 235B Thinking | 128k | Ragionamento |
qwen3-235b-a22b-instruct-2507 |
Qwen3 235B Instruct | 128k | Generale |
qwen3-coder-480b-a35b-instruct |
Qwen3 Coder 480B | 256k | Coding |
qwen3-coder-480b-a35b-instruct-turbo |
Qwen3 Coder 480B Turbo | 256k | Coding |
qwen3-5-35b-a3b |
Qwen3.5 35B A3B | 256k | Ragionamento, visione |
qwen3-next-80b |
Qwen3 Next 80B | 256k | Generale |
qwen3-vl-235b-a22b |
Qwen3 VL 235B (Visione) | 256k | Visione |
qwen3-4b |
Venice Small (Qwen3 4B) | 32k | Veloce, ragionamento |
deepseek-v3.2 |
DeepSeek V3.2 | 160k | Ragionamento, strumenti disabilitati |
venice-uncensored |
Venice Uncensored (Dolphin-Mistral) | 32k | Senza censura, strumenti disabilitati |
mistral-31-24b |
Venice Medium (Mistral) | 128k | Visione |
google-gemma-3-27b-it |
Google Gemma 3 27B Instruct | 198k | Visione |
openai-gpt-oss-120b |
OpenAI GPT OSS 120B | 128k | Generale |
nvidia-nemotron-3-nano-30b-a3b |
NVIDIA Nemotron 3 Nano 30B | 128k | Generale |
olafangensan-glm-4.7-flash-heretic |
GLM 4.7 Flash Heretic | 128k | Ragionamento |
zai-org-glm-4.6 |
GLM 4.6 | 198k | Generale |
zai-org-glm-4.7 |
GLM 4.7 | 198k | Ragionamento |
zai-org-glm-4.7-flash |
GLM 4.7 Flash | 128k | Ragionamento |
zai-org-glm-5 |
GLM 5 | 198k | Ragionamento |
minimax-m21 |
MiniMax M2.1 | 198k | Ragionamento |
minimax-m25 |
MiniMax M2.5 | 198k | Ragionamento |
Modelli anonimizzati (12) — tramite proxy Venice
| ID modello | Nome | Contesto | Funzionalità |
|---|---|---|---|
claude-opus-4-6 |
Claude Opus 4.6 (tramite Venice) | 1M | Ragionamento, visione |
claude-sonnet-4-6 |
Claude Sonnet 4.6 (tramite Venice) | 1M | Ragionamento, visione |
openai-gpt-54 |
GPT-5.4 (tramite Venice) | 1M | Ragionamento, visione |
openai-gpt-53-codex |
GPT-5.3 Codex (tramite Venice) | 400k | Ragionamento, visione, coding |
openai-gpt-52 |
GPT-5.2 (tramite Venice) | 256k | Ragionamento |
openai-gpt-52-codex |
GPT-5.2 Codex (tramite Venice) | 256k | Ragionamento, visione, coding |
openai-gpt-4o-2024-11-20 |
GPT-4o (tramite Venice) | 128k | Visione |
openai-gpt-4o-mini-2024-07-18 |
GPT-4o Mini (tramite Venice) | 128k | Visione |
gemini-3-1-pro-preview |
Gemini 3.1 Pro (tramite Venice) | 1M | Ragionamento, visione |
gemini-3-pro-preview |
Gemini 3 Pro (tramite Venice) | 198k | Ragionamento, visione |
gemini-3-flash-preview |
Gemini 3 Flash (tramite Venice) | 256k | Ragionamento, visione |
grok-41-fast |
Grok 4.1 Fast (tramite Venice) | 1M | Ragionamento, visione |
Scoperta dei modelli
OpenClaw include un catalogo seed Venice basato su manifest per l'elenco dei modelli in sola lettura. L'aggiornamento a runtime può comunque scoprire modelli dall'API Venice e ricorre al catalogo del manifest se l'API non è raggiungibile.
L'endpoint /models è pubblico (nessuna autenticazione necessaria per l'elenco), ma l'inferenza richiede una chiave API valida.
Streaming e supporto agli strumenti
| Funzionalità | Supporto |
|---|---|
| Streaming | Tutti i modelli |
| Function calling | La maggior parte dei modelli (controlla supportsFunctionCalling nell'API) |
| Visione/Immagini | Modelli contrassegnati con la funzionalità "Vision" |
| Modalità JSON | Supportata tramite response_format |
Prezzi
Venice usa un sistema basato sui crediti. Controlla venice.ai/pricing per le tariffe attuali:
- Modelli privati: generalmente più economici
- Modelli anonimizzati: simili ai prezzi dell'API diretta + una piccola commissione Venice
Venice (anonimizzato) vs API diretta
| Aspetto | Venice (anonimizzato) | API diretta |
|---|---|---|
| Privacy | Metadati rimossi, anonimizzato | Il tuo account collegato |
| Latenza | +10-50 ms (proxy) | Diretta |
| Funzionalità | La maggior parte supportata | Funzionalità complete |
| Fatturazione | Crediti Venice | Fatturazione provider |
Esempi d'uso
# Use the default private modelopenclaw agent --model venice/kimi-k2-5 --message "Quick health check" # Use Claude Opus via Venice (anonymized)openclaw agent --model venice/claude-opus-4-6 --message "Summarize this task" # Use uncensored modelopenclaw agent --model venice/venice-uncensored --message "Draft options" # Use vision model with imageopenclaw agent --model venice/qwen3-vl-235b-a22b --message "Review attached image" # Use coding modelopenclaw agent --model venice/qwen3-coder-480b-a35b-instruct --message "Refactor this function"Risoluzione dei problemi
API key not recognized
echo $VENICE_API_KEYopenclaw models list | grep veniceAssicurati che la chiave inizi con vapi_.
Model not available
Il catalogo dei modelli Venice si aggiorna dinamicamente. Esegui openclaw models list per vedere i modelli attualmente disponibili. Alcuni modelli potrebbero essere temporaneamente offline.
Connection issues
L'API Venice si trova su https://api.venice.ai/api/v1. Assicurati che la tua rete consenta connessioni HTTPS.
Configurazione avanzata
Config file example
{ env: { VENICE_API_KEY: "vapi_..." }, agents: { defaults: { model: { primary: "venice/kimi-k2-5" } } }, models: { mode: "merge", providers: { venice: { baseUrl: "https://api.venice.ai/api/v1", apiKey: "${VENICE_API_KEY}", api: "openai-completions", models: [ { id: "kimi-k2-5", name: "Kimi K2.5", reasoning: true, input: ["text", "image"], cost: { input: 0, output: 0, cacheRead: 0, cacheWrite: 0 }, contextWindow: 256000, maxTokens: 65536, }, ], }, }, },}