Providers
NVIDIA
NVIDIA stellt unter https://integrate.api.nvidia.com/v1 eine OpenAI-kompatible API für
offene Modelle kostenlos bereit. Authentifizieren Sie sich mit einem API-Schlüssel von
build.nvidia.com. OpenClaw
setzt den NVIDIA-Provider standardmäßig auf Nemotron 3 Ultra, NVIDIAs Reasoning-Modell mit insgesamt 550B / 55B
aktiven Parametern für agentische Arbeit mit langem Kontext.
Erste Schritte
API-Schlüssel abrufen
Erstellen Sie einen API-Schlüssel unter build.nvidia.com.
Schlüssel exportieren und Onboarding ausführen
export NVIDIA_API_KEY="nvapi-..."openclaw onboard --auth-choice nvidia-api-keyEin NVIDIA-Modell festlegen
openclaw models set nvidia/nvidia/nemotron-3-ultra-550b-a55bFür eine nicht interaktive Einrichtung können Sie den Schlüssel auch direkt übergeben:
openclaw onboard --auth-choice nvidia-api-key --nvidia-api-key "nvapi-..."Konfigurationsbeispiel
{ env: { NVIDIA_API_KEY: "nvapi-..." }, models: { providers: { nvidia: { baseUrl: "https://integrate.api.nvidia.com/v1", api: "openai-completions", }, }, }, agents: { defaults: { model: { primary: "nvidia/nvidia/nemotron-3-ultra-550b-a55b" }, }, },}Hervorgehobener Katalog
Wenn ein NVIDIA-API-Schlüssel konfiguriert ist, versuchen die OpenClaw-Einrichtungs- und Modellauswahlpfade,
NVIDIAs öffentlichen Katalog hervorgehobener Modelle von
https://assets.ngc.nvidia.com/products/api-catalog/featured-models.json zu verwenden, und
speichern das bewertete Ergebnis für 24 Stunden im Cache. Neue hervorgehobene Modelle von build.nvidia.com
erscheinen dadurch in Einrichtungs- und Modellauswahloberflächen, ohne auf ein
OpenClaw-Release warten zu müssen. Wenn der Live-Feed verfügbar ist, ist das erste zurückgegebene Modell
die Standardoption, die während der NVIDIA-Einrichtung angezeigt wird.
Der Abruf verwendet eine feste HTTPS-Host-Richtlinie für assets.ngc.nvidia.com. Wenn kein
NVIDIA-API-Schlüssel konfiguriert ist oder wenn dieser öffentliche Katalog nicht verfügbar oder
fehlerhaft ist, fällt OpenClaw auf den gebündelten Katalog und den unten aufgeführten gebündelten Standard zurück.
Nemotron 3 Ultra
Nemotron 3 Ultra ist das Standardmodell von NVIDIA in OpenClaw. NVIDIAs Build-Seite für
nvidia/nemotron-3-ultra-550b-a55b
führt es als verfügbaren kostenlosen Endpunkt mit einer 1M-Token-Kontextspezifikation auf.
Der gebündelte Katalog verzeichnet eine maximale Ausgabe von 16.384 Tokens, um NVIDIAs aktueller
OpenAI-kompatibler Beispielanforderung für den gehosteten Endpunkt zu entsprechen.
Verwenden Sie Ultra als NVIDIA-Standard mit den höchsten Fähigkeiten. Behalten Sie Super ausgewählt, wenn
Sie die kleinere Nemotron-3-Option wünschen, oder wählen Sie eines der Drittanbietermodelle,
die in NVIDIAs Katalog gehostet werden, wenn deren Kontext, Latenz oder Verhalten besser passt.
Die gebündelte Ultra-Zeile sendet standardmäßig chat_template_kwargs.enable_thinking: false und
force_nonempty_content: true, damit normale Chat-Ausgaben in der sichtbaren Antwort bleiben,
anstatt Reasoning-Text offenzulegen.
Gebündelter Fallback-Katalog
| Modell-Ref | Name | Kontext | Maximale Ausgabe | Hinweise |
|---|---|---|---|---|
nvidia/nvidia/nemotron-3-ultra-550b-a55b |
NVIDIA Nemotron 3 Ultra 550B | 1,000,000 | 16,384 | Standard |
nvidia/nvidia/nemotron-3-super-120b-a12b |
NVIDIA Nemotron 3 Super 120B | 1,048,576 | 8,192 | Hervorgehobener Fallback |
nvidia/moonshotai/kimi-k2.5 |
Kimi K2.5 | 262,144 | 8,192 | Hervorgehobener Fallback |
nvidia/minimaxai/minimax-m2.7 |
Minimax M2.7 | 196,608 | 8,192 | Hervorgehobener Fallback |
nvidia/z-ai/glm-5.1 |
GLM 5.1 | 202,752 | 8,192 | Hervorgehobener Fallback |
nvidia/minimaxai/minimax-m2.5 |
MiniMax M2.5 | 196,608 | 8,192 | Veraltet, Upgrade-Kompatibilität |
nvidia/z-ai/glm5 |
GLM-5 | 202,752 | 8,192 | Veraltet, Upgrade-Kompatibilität |
Erweiterte Konfiguration
Verhalten zur automatischen Aktivierung
Der Provider wird automatisch aktiviert, wenn die Umgebungsvariable NVIDIA_API_KEY gesetzt ist.
Über den Schlüssel hinaus ist keine explizite Provider-Konfiguration erforderlich.
Katalog und Preise
OpenClaw bevorzugt NVIDIAs öffentlichen Katalog hervorgehobener Modelle, wenn NVIDIA-Authentifizierung
konfiguriert ist, und speichert ihn für 24 Stunden im Cache. Der gebündelte Fallback-Katalog ist statisch
und behält veraltete ausgelieferte Refs für Upgrade-Kompatibilität bei. Kosten sind im Quellcode standardmäßig
auf 0 gesetzt, da NVIDIA derzeit kostenlosen API-Zugriff für die
aufgeführten Modelle anbietet.
OpenAI-kompatibler Endpunkt
NVIDIA verwendet den standardmäßigen /v1-Completions-Endpunkt. Alle OpenAI-kompatiblen
Tools sollten mit der NVIDIA-Basis-URL sofort funktionieren.
Nemotron 3 Ultra Reasoning-Parameter
NVIDIAs Ultra-Beispielanforderung verwendet chat_template_kwargs.enable_thinking
und reasoning_budget für Reasoning-Ausgaben. OpenClaws gebündelte Ultra-Zeile
deaktiviert Template-Thinking standardmäßig für normale Chat-Nutzung. Wenn Sie
NVIDIA-Reasoning-Ausgaben aktivieren oder andere NVIDIA-spezifische Anforderungsfelder
erzwingen müssen, setzen Sie modellspezifische Parameter und beschränken Sie Provider-spezifische Overrides auf
das NVIDIA-Modell:
{ agents: { defaults: { models: { "nvidia/nvidia/nemotron-3-ultra-550b-a55b": { params: { chat_template_kwargs: { enable_thinking: true }, extra_body: { reasoning_budget: 16384 }, }, }, }, }, },}params.extra_body ist der finale OpenAI-kompatible Request-Body-Override, verwenden Sie ihn daher
nur für Felder, die NVIDIA für den ausgewählten Endpunkt dokumentiert.
Langsame Antworten benutzerdefinierter Provider
Einige von NVIDIA gehostete benutzerdefinierte Modelle können länger brauchen als der standardmäßige Leerlauf-Watchdog des Modells, bevor sie den ersten Antwort-Chunk ausgeben. Erhöhen Sie für benutzerdefinierte NVIDIA-Provider-Einträge das Provider-Timeout, anstatt das Timeout der gesamten Agent-Laufzeit zu erhöhen:
{ models: { providers: { "custom-integrate-api-nvidia-com": { baseUrl: "https://integrate.api.nvidia.com/v1", api: "openai-completions", apiKey: "NVIDIA_API_KEY", timeoutSeconds: 300, }, }, }, agents: { defaults: { models: { "custom-integrate-api-nvidia-com/meta/llama-3.1-70b-instruct": { params: { thinking: "off" }, }, }, }, },}