Providers

NVIDIA

NVIDIA stellt unter https://integrate.api.nvidia.com/v1 eine OpenAI-kompatible API für offene Modelle kostenlos bereit. Authentifizieren Sie sich mit einem API-Schlüssel von build.nvidia.com. OpenClaw setzt den NVIDIA-Provider standardmäßig auf Nemotron 3 Ultra, NVIDIAs Reasoning-Modell mit insgesamt 550B / 55B aktiven Parametern für agentische Arbeit mit langem Kontext.

Erste Schritte

  • API-Schlüssel abrufen

    Erstellen Sie einen API-Schlüssel unter build.nvidia.com.

  • Schlüssel exportieren und Onboarding ausführen

    bash
    export NVIDIA_API_KEY="nvapi-..."openclaw onboard --auth-choice nvidia-api-key
  • Ein NVIDIA-Modell festlegen

    bash
    openclaw models set nvidia/nvidia/nemotron-3-ultra-550b-a55b
  • Für eine nicht interaktive Einrichtung können Sie den Schlüssel auch direkt übergeben:

    bash
    openclaw onboard --auth-choice nvidia-api-key --nvidia-api-key "nvapi-..."

    Konfigurationsbeispiel

    json5
    {  env: { NVIDIA_API_KEY: "nvapi-..." },  models: {    providers: {      nvidia: {        baseUrl: "https://integrate.api.nvidia.com/v1",        api: "openai-completions",      },    },  },  agents: {    defaults: {      model: { primary: "nvidia/nvidia/nemotron-3-ultra-550b-a55b" },    },  },}

    Hervorgehobener Katalog

    Wenn ein NVIDIA-API-Schlüssel konfiguriert ist, versuchen die OpenClaw-Einrichtungs- und Modellauswahlpfade, NVIDIAs öffentlichen Katalog hervorgehobener Modelle von https://assets.ngc.nvidia.com/products/api-catalog/featured-models.json zu verwenden, und speichern das bewertete Ergebnis für 24 Stunden im Cache. Neue hervorgehobene Modelle von build.nvidia.com erscheinen dadurch in Einrichtungs- und Modellauswahloberflächen, ohne auf ein OpenClaw-Release warten zu müssen. Wenn der Live-Feed verfügbar ist, ist das erste zurückgegebene Modell die Standardoption, die während der NVIDIA-Einrichtung angezeigt wird.

    Der Abruf verwendet eine feste HTTPS-Host-Richtlinie für assets.ngc.nvidia.com. Wenn kein NVIDIA-API-Schlüssel konfiguriert ist oder wenn dieser öffentliche Katalog nicht verfügbar oder fehlerhaft ist, fällt OpenClaw auf den gebündelten Katalog und den unten aufgeführten gebündelten Standard zurück.

    Nemotron 3 Ultra

    Nemotron 3 Ultra ist das Standardmodell von NVIDIA in OpenClaw. NVIDIAs Build-Seite für nvidia/nemotron-3-ultra-550b-a55b führt es als verfügbaren kostenlosen Endpunkt mit einer 1M-Token-Kontextspezifikation auf. Der gebündelte Katalog verzeichnet eine maximale Ausgabe von 16.384 Tokens, um NVIDIAs aktueller OpenAI-kompatibler Beispielanforderung für den gehosteten Endpunkt zu entsprechen.

    Verwenden Sie Ultra als NVIDIA-Standard mit den höchsten Fähigkeiten. Behalten Sie Super ausgewählt, wenn Sie die kleinere Nemotron-3-Option wünschen, oder wählen Sie eines der Drittanbietermodelle, die in NVIDIAs Katalog gehostet werden, wenn deren Kontext, Latenz oder Verhalten besser passt. Die gebündelte Ultra-Zeile sendet standardmäßig chat_template_kwargs.enable_thinking: false und force_nonempty_content: true, damit normale Chat-Ausgaben in der sichtbaren Antwort bleiben, anstatt Reasoning-Text offenzulegen.

    Gebündelter Fallback-Katalog

    Modell-Ref Name Kontext Maximale Ausgabe Hinweise
    nvidia/nvidia/nemotron-3-ultra-550b-a55b NVIDIA Nemotron 3 Ultra 550B 1,000,000 16,384 Standard
    nvidia/nvidia/nemotron-3-super-120b-a12b NVIDIA Nemotron 3 Super 120B 1,048,576 8,192 Hervorgehobener Fallback
    nvidia/moonshotai/kimi-k2.5 Kimi K2.5 262,144 8,192 Hervorgehobener Fallback
    nvidia/minimaxai/minimax-m2.7 Minimax M2.7 196,608 8,192 Hervorgehobener Fallback
    nvidia/z-ai/glm-5.1 GLM 5.1 202,752 8,192 Hervorgehobener Fallback
    nvidia/minimaxai/minimax-m2.5 MiniMax M2.5 196,608 8,192 Veraltet, Upgrade-Kompatibilität
    nvidia/z-ai/glm5 GLM-5 202,752 8,192 Veraltet, Upgrade-Kompatibilität

    Erweiterte Konfiguration

    Verhalten zur automatischen Aktivierung

    Der Provider wird automatisch aktiviert, wenn die Umgebungsvariable NVIDIA_API_KEY gesetzt ist. Über den Schlüssel hinaus ist keine explizite Provider-Konfiguration erforderlich.

    Katalog und Preise

    OpenClaw bevorzugt NVIDIAs öffentlichen Katalog hervorgehobener Modelle, wenn NVIDIA-Authentifizierung konfiguriert ist, und speichert ihn für 24 Stunden im Cache. Der gebündelte Fallback-Katalog ist statisch und behält veraltete ausgelieferte Refs für Upgrade-Kompatibilität bei. Kosten sind im Quellcode standardmäßig auf 0 gesetzt, da NVIDIA derzeit kostenlosen API-Zugriff für die aufgeführten Modelle anbietet.

    OpenAI-kompatibler Endpunkt

    NVIDIA verwendet den standardmäßigen /v1-Completions-Endpunkt. Alle OpenAI-kompatiblen Tools sollten mit der NVIDIA-Basis-URL sofort funktionieren.

    Nemotron 3 Ultra Reasoning-Parameter

    NVIDIAs Ultra-Beispielanforderung verwendet chat_template_kwargs.enable_thinking und reasoning_budget für Reasoning-Ausgaben. OpenClaws gebündelte Ultra-Zeile deaktiviert Template-Thinking standardmäßig für normale Chat-Nutzung. Wenn Sie NVIDIA-Reasoning-Ausgaben aktivieren oder andere NVIDIA-spezifische Anforderungsfelder erzwingen müssen, setzen Sie modellspezifische Parameter und beschränken Sie Provider-spezifische Overrides auf das NVIDIA-Modell:

    json5
    {  agents: {    defaults: {      models: {        "nvidia/nvidia/nemotron-3-ultra-550b-a55b": {          params: {            chat_template_kwargs: { enable_thinking: true },            extra_body: { reasoning_budget: 16384 },          },        },      },    },  },}

    params.extra_body ist der finale OpenAI-kompatible Request-Body-Override, verwenden Sie ihn daher nur für Felder, die NVIDIA für den ausgewählten Endpunkt dokumentiert.

    Langsame Antworten benutzerdefinierter Provider

    Einige von NVIDIA gehostete benutzerdefinierte Modelle können länger brauchen als der standardmäßige Leerlauf-Watchdog des Modells, bevor sie den ersten Antwort-Chunk ausgeben. Erhöhen Sie für benutzerdefinierte NVIDIA-Provider-Einträge das Provider-Timeout, anstatt das Timeout der gesamten Agent-Laufzeit zu erhöhen:

    json5
    {  models: {    providers: {      "custom-integrate-api-nvidia-com": {        baseUrl: "https://integrate.api.nvidia.com/v1",        api: "openai-completions",        apiKey: "NVIDIA_API_KEY",        timeoutSeconds: 300,      },    },  },  agents: {    defaults: {      models: {        "custom-integrate-api-nvidia-com/meta/llama-3.1-70b-instruct": {          params: { thinking: "off" },        },      },    },  },}

    Verwandt

    Was this useful?
    On this page

    On this page