Providers

NVIDIA

NVIDIA fornisce un'API compatibile con OpenAI all'indirizzo https://integrate.api.nvidia.com/v1 per modelli aperti gratuitamente. Esegui l'autenticazione con una chiave API da build.nvidia.com. OpenClaw imposta per impostazione predefinita il provider NVIDIA su Nemotron 3 Ultra, il modello di reasoning attivo di NVIDIA da 550B totali / 55B per lavoro agentico con contesto lungo.

Per iniziare

Ottieni la tua chiave API

Crea una chiave API su build.nvidia.com.

Esporta la chiave ed esegui l'onboarding

bash

export NVIDIA_API_KEY="nvapi-..."openclaw onboard --auth-choice nvidia-api-key

Imposta un modello NVIDIA

bash

openclaw models set nvidia/nvidia/nemotron-3-ultra-550b-a55b

Per una configurazione non interattiva, puoi anche passare direttamente la chiave:

bash

openclaw onboard --auth-choice nvidia-api-key --nvidia-api-key "nvapi-..."

Esempio di configurazione

json5

{  env: { NVIDIA_API_KEY: "nvapi-..." },  models: {    providers: {      nvidia: {        baseUrl: "https://integrate.api.nvidia.com/v1",        api: "openai-completions",      },    },  },  agents: {    defaults: {      model: { primary: "nvidia/nvidia/nemotron-3-ultra-550b-a55b" },    },  },}

Catalogo in evidenza

Quando è configurata una chiave API NVIDIA, i percorsi di configurazione e selezione del modello di OpenClaw provano il catalogo pubblico dei modelli in evidenza di NVIDIA da https://assets.ngc.nvidia.com/products/api-catalog/featured-models.json e memorizzano nella cache il risultato classificato per 24 ore. I nuovi modelli in evidenza da build.nvidia.com appaiono quindi nelle superfici di configurazione e selezione del modello senza attendere una release di OpenClaw. Quando il feed live è disponibile, il primo modello restituito è l'opzione predefinita mostrata durante la configurazione di NVIDIA.

Il recupero usa una policy host HTTPS fissa per assets.ngc.nvidia.com. Se non è configurata alcuna chiave API NVIDIA, oppure se quel catalogo pubblico non è disponibile o è malformato, OpenClaw ripiega sul catalogo incluso e sul valore predefinito incluso qui sotto.

Nemotron 3 Ultra

Nemotron 3 Ultra è il modello NVIDIA predefinito in OpenClaw. La pagina build di NVIDIA per nvidia/nemotron-3-ultra-550b-a55b lo elenca come endpoint gratuito disponibile con una specifica di contesto da 1M di token. Il catalogo incluso registra un output massimo di 16.384 token per corrispondere all'attuale richiesta di esempio compatibile con OpenAI di NVIDIA per l'endpoint ospitato.

Usa Ultra per il valore predefinito NVIDIA con le capacità più elevate. Mantieni selezionato Super quando vuoi l'opzione Nemotron 3 più piccola, oppure scegli uno dei modelli di terze parti ospitati nel catalogo di NVIDIA quando il loro contesto, latenza o comportamento si adattano meglio. La riga Ultra inclusa invia chat_template_kwargs.enable_thinking: false e force_nonempty_content: true per impostazione predefinita, così l'output normale della chat resta nella risposta visibile invece di esporre testo di reasoning.

Catalogo di fallback incluso

Model ref	Nome	Contesto	Output massimo	Note
`nvidia/nvidia/nemotron-3-ultra-550b-a55b`	NVIDIA Nemotron 3 Ultra 550B	1,000,000	16,384	Predefinito
`nvidia/nvidia/nemotron-3-super-120b-a12b`	NVIDIA Nemotron 3 Super 120B	1,048,576	8,192	Fallback in evidenza
`nvidia/moonshotai/kimi-k2.5`	Kimi K2.5	262,144	8,192	Fallback in evidenza
`nvidia/minimaxai/minimax-m2.7`	Minimax M2.7	196,608	8,192	Fallback in evidenza
`nvidia/z-ai/glm-5.1`	GLM 5.1	202,752	8,192	Fallback in evidenza
`nvidia/minimaxai/minimax-m2.5`	MiniMax M2.5	196,608	8,192	Obsoleto, compatibilità di upgrade
`nvidia/z-ai/glm5`	GLM-5	202,752	8,192	Obsoleto, compatibilità di upgrade

Configurazione avanzata

Comportamento di abilitazione automatica

Il provider si abilita automaticamente quando la variabile d'ambiente NVIDIA_API_KEY è impostata. Non è richiesta alcuna configurazione esplicita del provider oltre alla chiave.

Catalogo e prezzi

OpenClaw preferisce il catalogo pubblico dei modelli in evidenza di NVIDIA quando l'autenticazione NVIDIA è configurata e lo memorizza nella cache per 24 ore. Il catalogo di fallback incluso è statico e mantiene i ref distribuiti obsoleti per la compatibilità di upgrade. I costi hanno valore predefinito 0 nel sorgente poiché NVIDIA attualmente offre accesso API gratuito per i modelli elencati.

Endpoint compatibile con OpenAI

NVIDIA usa l'endpoint standard /v1 completions. Qualsiasi tooling compatibile con OpenAI dovrebbe funzionare subito con l'URL di base NVIDIA.

Parametri di reasoning di Nemotron 3 Ultra

La richiesta di esempio Ultra di NVIDIA usa chat_template_kwargs.enable_thinking e reasoning_budget per l'output di reasoning. La riga Ultra inclusa in OpenClaw disabilita per impostazione predefinita il thinking del template per l'uso normale della chat. Se devi abilitare l'output di reasoning NVIDIA o forzare altri campi di richiesta specifici di NVIDIA, imposta parametri per modello e mantieni gli override specifici del provider limitati al modello NVIDIA:

json5

{  agents: {    defaults: {      models: {        "nvidia/nvidia/nemotron-3-ultra-550b-a55b": {          params: {            chat_template_kwargs: { enable_thinking: true },            extra_body: { reasoning_budget: 16384 },          },        },      },    },  },}

params.extra_body è l'override finale del corpo della richiesta compatibile con OpenAI, quindi usalo solo per campi che NVIDIA documenta per l'endpoint selezionato.

Risposte lente del provider personalizzato

Alcuni modelli personalizzati ospitati da NVIDIA possono richiedere più tempo del watchdog di inattività predefinito del modello prima di emettere il primo chunk di risposta. Per voci di provider NVIDIA personalizzate, aumenta il timeout del provider invece di aumentare il timeout dell'intero runtime dell'agente:

json5

{  models: {    providers: {      "custom-integrate-api-nvidia-com": {        baseUrl: "https://integrate.api.nvidia.com/v1",        api: "openai-completions",        apiKey: "NVIDIA_API_KEY",        timeoutSeconds: 300,      },    },  },  agents: {    defaults: {      models: {        "custom-integrate-api-nvidia-com/meta/llama-3.1-70b-instruct": {          params: { thinking: "off" },        },      },    },  },}

Correlati

Selezione del modello

Scegliere provider, ref dei modelli e comportamento di failover.

Riferimento di configurazione

Riferimento completo di configurazione per agenti, modelli e provider.

Was this useful?

NVIDIA

Per iniziare

Ottieni la tua chiave API

Esporta la chiave ed esegui l'onboarding

Imposta un modello NVIDIA

Esempio di configurazione

Catalogo in evidenza

Nemotron 3 Ultra

Catalogo di fallback incluso

Configurazione avanzata

Correlati

On this page

Molty