Providers

NVIDIA

NVIDIA fournit une API compatible avec OpenAI à l’adresse https://integrate.api.nvidia.com/v1 pour les modèles ouverts gratuitement. Authentifiez-vous avec une clé d’API depuis build.nvidia.com. OpenClaw définit par défaut le fournisseur NVIDIA sur Nemotron 3 Ultra, le modèle de raisonnement actif de NVIDIA totalisant 550B / 55B, conçu pour le travail agentique à contexte long.

Premiers pas

Obtenir votre clé d’API

Créez une clé d’API sur build.nvidia.com.

Exporter la clé et exécuter l’intégration

bash

export NVIDIA_API_KEY="nvapi-..."openclaw onboard --auth-choice nvidia-api-key

Définir un modèle NVIDIA

bash

openclaw models set nvidia/nvidia/nemotron-3-ultra-550b-a55b

Pour une configuration non interactive, vous pouvez également passer la clé directement :

bash

openclaw onboard --auth-choice nvidia-api-key --nvidia-api-key "nvapi-..."

Exemple de configuration

json5

{  env: { NVIDIA_API_KEY: "nvapi-..." },  models: {    providers: {      nvidia: {        baseUrl: "https://integrate.api.nvidia.com/v1",        api: "openai-completions",      },    },  },  agents: {    defaults: {      model: { primary: "nvidia/nvidia/nemotron-3-ultra-550b-a55b" },    },  },}

Catalogue mis en avant

Lorsqu’une clé d’API NVIDIA est configurée, la configuration d’OpenClaw et les parcours de sélection de modèles essaient le catalogue public de modèles mis en avant par NVIDIA depuis https://assets.ngc.nvidia.com/products/api-catalog/featured-models.json et mettent en cache le résultat classé pendant 24 heures. Les nouveaux modèles mis en avant depuis build.nvidia.com apparaissent donc dans les surfaces de configuration et de sélection de modèles sans attendre une version d’OpenClaw. Lorsque le flux en direct est disponible, le premier modèle renvoyé est l’option par défaut affichée lors de la configuration NVIDIA.

La récupération utilise une politique d’hôte HTTPS fixe pour assets.ngc.nvidia.com. Si aucune clé d’API NVIDIA n’est configurée, ou si ce catalogue public est indisponible ou mal formé, OpenClaw se rabat sur le catalogue groupé et la valeur par défaut groupée ci-dessous.

Nemotron 3 Ultra

Nemotron 3 Ultra est le modèle NVIDIA par défaut dans OpenClaw. La page de build de NVIDIA pour nvidia/nemotron-3-ultra-550b-a55b le liste comme endpoint gratuit disponible avec une spécification de contexte de 1M de jetons. Le catalogue groupé enregistre une sortie maximale de 16 384 jetons pour correspondre à la requête d’exemple compatible OpenAI actuelle de NVIDIA pour l’endpoint hébergé.

Utilisez Ultra pour le modèle NVIDIA par défaut aux capacités les plus élevées. Gardez Super sélectionné lorsque vous voulez l’option Nemotron 3 plus petite, ou choisissez l’un des modèles tiers hébergés dans le catalogue NVIDIA lorsque leur contexte, leur latence ou leur comportement convient mieux. La ligne Ultra groupée envoie chat_template_kwargs.enable_thinking: false et force_nonempty_content: true par défaut afin que la sortie de chat normale reste dans la réponse visible au lieu d’exposer le texte de raisonnement.

Catalogue de secours groupé

Référence de modèle	Nom	Contexte	Sortie max.	Notes
`nvidia/nvidia/nemotron-3-ultra-550b-a55b`	NVIDIA Nemotron 3 Ultra 550B	1,000,000	16,384	Par défaut
`nvidia/nvidia/nemotron-3-super-120b-a12b`	NVIDIA Nemotron 3 Super 120B	1,048,576	8,192	Secours mis en avant
`nvidia/moonshotai/kimi-k2.5`	Kimi K2.5	262,144	8,192	Secours mis en avant
`nvidia/minimaxai/minimax-m2.7`	Minimax M2.7	196,608	8,192	Secours mis en avant
`nvidia/z-ai/glm-5.1`	GLM 5.1	202,752	8,192	Secours mis en avant
`nvidia/minimaxai/minimax-m2.5`	MiniMax M2.5	196,608	8,192	Obsolète, compatibilité de mise à niveau
`nvidia/z-ai/glm5`	GLM-5	202,752	8,192	Obsolète, compatibilité de mise à niveau

Configuration avancée

Comportement d’activation automatique

Le fournisseur s’active automatiquement lorsque la variable d’environnement NVIDIA_API_KEY est définie. Aucune configuration explicite du fournisseur n’est requise au-delà de la clé.

Catalogue et tarification

OpenClaw privilégie le catalogue public de modèles mis en avant par NVIDIA lorsque l’authentification NVIDIA est configurée et le met en cache pendant 24 heures. Le catalogue de secours groupé est statique et conserve les références livrées obsolètes pour la compatibilité de mise à niveau. Les coûts valent par défaut 0 dans la source, car NVIDIA propose actuellement un accès gratuit à l’API pour les modèles listés.

Endpoint compatible OpenAI

NVIDIA utilise l’endpoint standard de complétions /v1. Tout outil compatible OpenAI devrait fonctionner immédiatement avec l’URL de base NVIDIA.

Paramètres de raisonnement de Nemotron 3 Ultra

La requête d’exemple Ultra de NVIDIA utilise chat_template_kwargs.enable_thinking et reasoning_budget pour la sortie de raisonnement. La ligne Ultra groupée d’OpenClaw désactive la pensée de modèle par défaut pour l’utilisation normale du chat. Si vous devez activer la sortie de raisonnement NVIDIA ou forcer d’autres champs de requête spécifiques à NVIDIA, définissez des paramètres par modèle et gardez les surcharges propres au fournisseur limitées au modèle NVIDIA :

json5

{  agents: {    defaults: {      models: {        "nvidia/nvidia/nemotron-3-ultra-550b-a55b": {          params: {            chat_template_kwargs: { enable_thinking: true },            extra_body: { reasoning_budget: 16384 },          },        },      },    },  },}

params.extra_body est la surcharge finale du corps de requête compatible OpenAI ; utilisez-la donc uniquement pour les champs que NVIDIA documente pour l’endpoint sélectionné.

Réponses lentes de fournisseur personnalisé

Certains modèles personnalisés hébergés par NVIDIA peuvent prendre plus de temps que le chien de garde d’inactivité du modèle par défaut avant d’émettre un premier fragment de réponse. Pour les entrées de fournisseur NVIDIA personnalisées, augmentez le délai d’expiration du fournisseur plutôt que celui de toute la durée d’exécution de l’agent :

json5

{  models: {    providers: {      "custom-integrate-api-nvidia-com": {        baseUrl: "https://integrate.api.nvidia.com/v1",        api: "openai-completions",        apiKey: "NVIDIA_API_KEY",        timeoutSeconds: 300,      },    },  },  agents: {    defaults: {      models: {        "custom-integrate-api-nvidia-com/meta/llama-3.1-70b-instruct": {          params: { thinking: "off" },        },      },    },  },}

Associé

Sélection de modèle

Choisir les fournisseurs, les références de modèles et le comportement de basculement.

Référence de configuration

Référence complète de configuration pour les agents, les modèles et les fournisseurs.

Was this useful?

NVIDIA

Premiers pas

Obtenir votre clé d’API

Exporter la clé et exécuter l’intégration

Définir un modèle NVIDIA

Exemple de configuration

Catalogue mis en avant

Nemotron 3 Ultra

Catalogue de secours groupé

Configuration avancée

Associé

On this page

Molty