Zum Hauptinhalt springen

Venice AI (Venice-Highlight)

Venice ist unser hervorgehobenes Venice-Setup für datenschutzorientierte Inferenz mit optionalem anonymisiertem Zugriff auf proprietäre Modelle. Venice AI bietet datenschutzorientierte KI-Inferenz mit Unterstützung für unzensierte Modelle und Zugriff auf große proprietäre Modelle über ihren anonymisierten Proxy. Jede Inferenz ist standardmäßig privat – kein Training auf Ihren Daten, keine Protokollierung.

Warum Venice in OpenClaw

  • Private Inferenz für Open-Source-Modelle (keine Protokollierung).
  • Unzensierte Modelle, wenn Sie sie benötigen.
  • Anonymisierter Zugriff auf proprietäre Modelle (Opus/GPT/Gemini), wenn Qualität entscheidend ist.
  • OpenAI-kompatible /v1-Endpunkte.

Datenschutzmodi

Venice bietet zwei Datenschutzstufen – deren Verständnis ist entscheidend für die Wahl Ihres Modells:
ModusBeschreibungModelle
PrivatVollständig privat. Prompts/Antworten werden nie gespeichert oder protokolliert. Ephemer.Llama, Qwen, DeepSeek, Kimi, MiniMax, Venice Uncensored usw.
AnonymisiertÜber Venice weitergeleitet, wobei Metadaten entfernt werden. Der zugrunde liegende Provider (OpenAI, Anthropic, Google, xAI) sieht anonymisierte Anfragen.Claude, GPT, Gemini, Grok

Funktionen

  • Datenschutzorientiert: Wählen Sie zwischen den Modi „private“ (vollständig privat) und „anonymized“ (über Proxy)
  • Unzensierte Modelle: Zugriff auf Modelle ohne Inhaltsbeschränkungen
  • Zugriff auf große Modelle: Verwenden Sie Claude, GPT, Gemini und Grok über den anonymisierten Proxy von Venice
  • OpenAI-kompatible API: Standard-/v1-Endpunkte zur einfachen Integration
  • Streaming: ✅ Auf allen Modellen unterstützt
  • Funktionsaufrufe: ✅ Auf ausgewählten Modellen unterstützt (prüfen Sie die Modellfähigkeiten)
  • Vision: ✅ Auf Modellen mit Vision-Fähigkeit unterstützt
  • Keine harten Ratenlimits: Bei extremer Nutzung kann Fair-Use-Drosselung gelten

Einrichtung

1. API-Schlüssel abrufen

  1. Registrieren Sie sich unter venice.ai
  2. Gehen Sie zu Settings → API Keys → Create new key
  3. Kopieren Sie Ihren API-Schlüssel (Format: vapi_xxxxxxxxxxxx)

2. OpenClaw konfigurieren

Option A: Umgebungsvariable
export VENICE_API_KEY="vapi_xxxxxxxxxxxx"
Option B: Interaktive Einrichtung (empfohlen)
openclaw onboard --auth-choice venice-api-key
Dadurch wird:
  1. nach Ihrem API-Schlüssel gefragt (oder ein vorhandener VENICE_API_KEY verwendet)
  2. alle verfügbaren Venice-Modelle angezeigt
  3. Ihnen ermöglicht, Ihr Standardmodell auszuwählen
  4. der Provider automatisch konfiguriert
Option C: Nicht-interaktiv
openclaw onboard --non-interactive \
  --auth-choice venice-api-key \
  --venice-api-key "vapi_xxxxxxxxxxxx"

3. Einrichtung überprüfen

openclaw agent --model venice/kimi-k2-5 --message "Hallo, funktionierst du?"

Modellauswahl

Nach der Einrichtung zeigt OpenClaw alle verfügbaren Venice-Modelle an. Wählen Sie je nach Bedarf:
  • Standardmodell: venice/kimi-k2-5 für starke private Reasoning-Fähigkeiten plus Vision.
  • Option mit hoher Leistungsfähigkeit: venice/claude-opus-4-6 für den stärksten anonymisierten Venice-Pfad.
  • Datenschutz: Wählen Sie „private“-Modelle für vollständig private Inferenz.
  • Fähigkeiten: Wählen Sie „anonymized“-Modelle, um über den Proxy von Venice auf Claude, GPT und Gemini zuzugreifen.
Ändern Sie Ihr Standardmodell jederzeit:
openclaw models set venice/kimi-k2-5
openclaw models set venice/claude-opus-4-6
Alle verfügbaren Modelle auflisten:
openclaw models list | grep venice

Über openclaw configure konfigurieren

  1. Führen Sie openclaw configure aus
  2. Wählen Sie Model/auth
  3. Wählen Sie Venice AI

Welches Modell sollte ich verwenden?

AnwendungsfallEmpfohlenes ModellWarum
Allgemeiner Chat (Standard)kimi-k2-5Starke private Reasoning-Fähigkeiten plus Vision
Beste Gesamtqualitätclaude-opus-4-6Stärkste anonymisierte Venice-Option
Datenschutz + Programmierungqwen3-coder-480b-a35b-instructPrivates Coding-Modell mit großem Kontext
Private Visionkimi-k2-5Vision-Unterstützung ohne Verlassen des privaten Modus
Schnell + günstigqwen3-4bLeichtgewichtiges Reasoning-Modell
Komplexe private Aufgabendeepseek-v3.2Starkes Reasoning, aber keine Venice-Tool-Unterstützung
Unzensiertvenice-uncensoredKeine Inhaltsbeschränkungen

Verfügbare Modelle (insgesamt 41)

Private Modelle (26) – vollständig privat, keine Protokollierung

Modell-IDNameKontextFunktionen
kimi-k2-5Kimi K2.5256kStandard, Reasoning, Vision
kimi-k2-thinkingKimi K2 Thinking256kReasoning
llama-3.3-70bLlama 3.3 70B128kAllgemein
llama-3.2-3bLlama 3.2 3B128kAllgemein
hermes-3-llama-3.1-405bHermes 3 Llama 3.1 405B128kAllgemein, Tools deaktiviert
qwen3-235b-a22b-thinking-2507Qwen3 235B Thinking128kReasoning
qwen3-235b-a22b-instruct-2507Qwen3 235B Instruct128kAllgemein
qwen3-coder-480b-a35b-instructQwen3 Coder 480B256kCoding
qwen3-coder-480b-a35b-instruct-turboQwen3 Coder 480B Turbo256kCoding
qwen3-5-35b-a3bQwen3.5 35B A3B256kReasoning, Vision
qwen3-next-80bQwen3 Next 80B256kAllgemein
qwen3-vl-235b-a22bQwen3 VL 235B (Vision)256kVision
qwen3-4bVenice Small (Qwen3 4B)32kSchnell, Reasoning
deepseek-v3.2DeepSeek V3.2160kReasoning, Tools deaktiviert
venice-uncensoredVenice Uncensored (Dolphin-Mistral)32kUnzensiert, Tools deaktiviert
mistral-31-24bVenice Medium (Mistral)128kVision
google-gemma-3-27b-itGoogle Gemma 3 27B Instruct198kVision
openai-gpt-oss-120bOpenAI GPT OSS 120B128kAllgemein
nvidia-nemotron-3-nano-30b-a3bNVIDIA Nemotron 3 Nano 30B128kAllgemein
olafangensan-glm-4.7-flash-hereticGLM 4.7 Flash Heretic128kReasoning
zai-org-glm-4.6GLM 4.6198kAllgemein
zai-org-glm-4.7GLM 4.7198kReasoning
zai-org-glm-4.7-flashGLM 4.7 Flash128kReasoning
zai-org-glm-5GLM 5198kReasoning
minimax-m21MiniMax M2.1198kReasoning
minimax-m25MiniMax M2.5198kReasoning

Anonymisierte Modelle (15) – über Venice-Proxy

Modell-IDNameKontextFunktionen
claude-opus-4-6Claude Opus 4.6 (über Venice)1MReasoning, Vision
claude-opus-4-5Claude Opus 4.5 (über Venice)198kReasoning, Vision
claude-sonnet-4-6Claude Sonnet 4.6 (über Venice)1MReasoning, Vision
claude-sonnet-4-5Claude Sonnet 4.5 (über Venice)198kReasoning, Vision
openai-gpt-54GPT-5.4 (über Venice)1MReasoning, Vision
openai-gpt-53-codexGPT-5.3 Codex (über Venice)400kReasoning, Vision, Coding
openai-gpt-52GPT-5.2 (über Venice)256kReasoning
openai-gpt-52-codexGPT-5.2 Codex (über Venice)256kReasoning, Vision, Coding
openai-gpt-4o-2024-11-20GPT-4o (über Venice)128kVision
openai-gpt-4o-mini-2024-07-18GPT-4o Mini (über Venice)128kVision
gemini-3-1-pro-previewGemini 3.1 Pro (über Venice)1MReasoning, Vision
gemini-3-pro-previewGemini 3 Pro (über Venice)198kReasoning, Vision
gemini-3-flash-previewGemini 3 Flash (über Venice)256kReasoning, Vision
grok-41-fastGrok 4.1 Fast (über Venice)1MReasoning, Vision
grok-code-fast-1Grok Code Fast 1 (über Venice)256kReasoning, Coding

Modellerkennung

OpenClaw erkennt Modelle automatisch über die Venice-API, wenn VENICE_API_KEY gesetzt ist. Wenn die API nicht erreichbar ist, wird auf einen statischen Katalog zurückgegriffen. Der Endpunkt /models ist öffentlich zugänglich (keine Authentifizierung zum Auflisten erforderlich), aber für Inferenz ist ein gültiger API-Schlüssel erforderlich.

Streaming- und Tool-Unterstützung

FunktionUnterstützung
Streaming✅ Alle Modelle
Funktionsaufrufe✅ Die meisten Modelle (prüfen Sie supportsFunctionCalling in der API)
Vision/Bilder✅ Modelle mit dem Merkmal „Vision“
JSON-Modus✅ Über response_format unterstützt

Preise

Venice verwendet ein kreditbasiertes System. Prüfen Sie venice.ai/pricing für aktuelle Tarife:
  • Private Modelle: Im Allgemeinen geringere Kosten
  • Anonymisierte Modelle: Ähnlich wie direkte API-Preise + kleine Venice-Gebühr

Vergleich: Venice vs. direkte API

AspektVenice (anonymisiert)Direkte API
DatenschutzMetadaten entfernt, anonymisiertIhr Konto ist verknüpft
Latenz+10-50ms (Proxy)Direkt
FunktionenDie meisten Funktionen unterstütztVollständige Funktionen
AbrechnungVenice-CreditsProvider-Abrechnung

Verwendungsbeispiele

# Das private Standardmodell verwenden
openclaw agent --model venice/kimi-k2-5 --message "Schneller Gesundheitscheck"

# Claude Opus über Venice verwenden (anonymisiert)
openclaw agent --model venice/claude-opus-4-6 --message "Fasse diese Aufgabe zusammen"

# Unzensiertes Modell verwenden
openclaw agent --model venice/venice-uncensored --message "Optionen entwerfen"

# Vision-Modell mit Bild verwenden
openclaw agent --model venice/qwen3-vl-235b-a22b --message "Angehängtes Bild prüfen"

# Coding-Modell verwenden
openclaw agent --model venice/qwen3-coder-480b-a35b-instruct --message "Diese Funktion refaktorieren"

Fehlerbehebung

API-Schlüssel wird nicht erkannt

echo $VENICE_API_KEY
openclaw models list | grep venice
Stellen Sie sicher, dass der Schlüssel mit vapi_ beginnt.

Modell nicht verfügbar

Der Venice-Modellkatalog wird dynamisch aktualisiert. Führen Sie openclaw models list aus, um die derzeit verfügbaren Modelle anzuzeigen. Einige Modelle können vorübergehend offline sein.

Verbindungsprobleme

Die Venice-API befindet sich unter https://api.venice.ai/api/v1. Stellen Sie sicher, dass Ihr Netzwerk HTTPS-Verbindungen zulässt.

Beispiel für eine Konfigurationsdatei

{
  env: { VENICE_API_KEY: "vapi_..." },
  agents: { defaults: { model: { primary: "venice/kimi-k2-5" } } },
  models: {
    mode: "merge",
    providers: {
      venice: {
        baseUrl: "https://api.venice.ai/api/v1",
        apiKey: "${VENICE_API_KEY}",
        api: "openai-completions",
        models: [
          {
            id: "kimi-k2-5",
            name: "Kimi K2.5",
            reasoning: true,
            input: ["text", "image"],
            cost: { input: 0, output: 0, cacheRead: 0, cacheWrite: 0 },
            contextWindow: 256000,
            maxTokens: 65536,
          },
        ],
      },
    },
  },
}