Providers
NVIDIA
NVIDIA fournit une API compatible avec OpenAI à l’adresse https://integrate.api.nvidia.com/v1 pour
les modèles ouverts gratuitement. Authentifiez-vous avec une clé d’API depuis
build.nvidia.com. OpenClaw
définit par défaut le fournisseur NVIDIA sur Nemotron 3 Ultra, le modèle de
raisonnement actif de NVIDIA totalisant 550B / 55B, conçu pour le travail
agentique à contexte long.
Premiers pas
Obtenir votre clé d’API
Créez une clé d’API sur build.nvidia.com.
Exporter la clé et exécuter l’intégration
export NVIDIA_API_KEY="nvapi-..."openclaw onboard --auth-choice nvidia-api-keyDéfinir un modèle NVIDIA
openclaw models set nvidia/nvidia/nemotron-3-ultra-550b-a55bPour une configuration non interactive, vous pouvez également passer la clé directement :
openclaw onboard --auth-choice nvidia-api-key --nvidia-api-key "nvapi-..."Exemple de configuration
{ env: { NVIDIA_API_KEY: "nvapi-..." }, models: { providers: { nvidia: { baseUrl: "https://integrate.api.nvidia.com/v1", api: "openai-completions", }, }, }, agents: { defaults: { model: { primary: "nvidia/nvidia/nemotron-3-ultra-550b-a55b" }, }, },}Catalogue mis en avant
Lorsqu’une clé d’API NVIDIA est configurée, la configuration d’OpenClaw et les parcours de sélection de modèles
essaient le catalogue public de modèles mis en avant par NVIDIA depuis
https://assets.ngc.nvidia.com/products/api-catalog/featured-models.json et
mettent en cache le résultat classé pendant 24 heures. Les nouveaux modèles mis en avant depuis build.nvidia.com
apparaissent donc dans les surfaces de configuration et de sélection de modèles sans attendre une
version d’OpenClaw. Lorsque le flux en direct est disponible, le premier modèle renvoyé est
l’option par défaut affichée lors de la configuration NVIDIA.
La récupération utilise une politique d’hôte HTTPS fixe pour assets.ngc.nvidia.com. Si aucune
clé d’API NVIDIA n’est configurée, ou si ce catalogue public est indisponible ou
mal formé, OpenClaw se rabat sur le catalogue groupé et la valeur par défaut groupée ci-dessous.
Nemotron 3 Ultra
Nemotron 3 Ultra est le modèle NVIDIA par défaut dans OpenClaw. La page de build de NVIDIA pour
nvidia/nemotron-3-ultra-550b-a55b
le liste comme endpoint gratuit disponible avec une spécification de contexte de 1M de jetons.
Le catalogue groupé enregistre une sortie maximale de 16 384 jetons pour correspondre à la requête d’exemple
compatible OpenAI actuelle de NVIDIA pour l’endpoint hébergé.
Utilisez Ultra pour le modèle NVIDIA par défaut aux capacités les plus élevées. Gardez Super sélectionné lorsque
vous voulez l’option Nemotron 3 plus petite, ou choisissez l’un des modèles tiers
hébergés dans le catalogue NVIDIA lorsque leur contexte, leur latence ou leur comportement convient mieux.
La ligne Ultra groupée envoie chat_template_kwargs.enable_thinking: false et
force_nonempty_content: true par défaut afin que la sortie de chat normale reste dans la
réponse visible au lieu d’exposer le texte de raisonnement.
Catalogue de secours groupé
| Référence de modèle | Nom | Contexte | Sortie max. | Notes |
|---|---|---|---|---|
nvidia/nvidia/nemotron-3-ultra-550b-a55b |
NVIDIA Nemotron 3 Ultra 550B | 1,000,000 | 16,384 | Par défaut |
nvidia/nvidia/nemotron-3-super-120b-a12b |
NVIDIA Nemotron 3 Super 120B | 1,048,576 | 8,192 | Secours mis en avant |
nvidia/moonshotai/kimi-k2.5 |
Kimi K2.5 | 262,144 | 8,192 | Secours mis en avant |
nvidia/minimaxai/minimax-m2.7 |
Minimax M2.7 | 196,608 | 8,192 | Secours mis en avant |
nvidia/z-ai/glm-5.1 |
GLM 5.1 | 202,752 | 8,192 | Secours mis en avant |
nvidia/minimaxai/minimax-m2.5 |
MiniMax M2.5 | 196,608 | 8,192 | Obsolète, compatibilité de mise à niveau |
nvidia/z-ai/glm5 |
GLM-5 | 202,752 | 8,192 | Obsolète, compatibilité de mise à niveau |
Configuration avancée
Comportement d’activation automatique
Le fournisseur s’active automatiquement lorsque la variable d’environnement NVIDIA_API_KEY est définie.
Aucune configuration explicite du fournisseur n’est requise au-delà de la clé.
Catalogue et tarification
OpenClaw privilégie le catalogue public de modèles mis en avant par NVIDIA lorsque l’authentification NVIDIA est
configurée et le met en cache pendant 24 heures. Le catalogue de secours groupé est statique
et conserve les références livrées obsolètes pour la compatibilité de mise à niveau. Les coûts valent par défaut
0 dans la source, car NVIDIA propose actuellement un accès gratuit à l’API pour les
modèles listés.
Endpoint compatible OpenAI
NVIDIA utilise l’endpoint standard de complétions /v1. Tout outil compatible OpenAI
devrait fonctionner immédiatement avec l’URL de base NVIDIA.
Paramètres de raisonnement de Nemotron 3 Ultra
La requête d’exemple Ultra de NVIDIA utilise chat_template_kwargs.enable_thinking
et reasoning_budget pour la sortie de raisonnement. La ligne Ultra groupée d’OpenClaw
désactive la pensée de modèle par défaut pour l’utilisation normale du chat. Si vous devez
activer la sortie de raisonnement NVIDIA ou forcer d’autres champs de requête spécifiques à NVIDIA,
définissez des paramètres par modèle et gardez les surcharges propres au fournisseur limitées au
modèle NVIDIA :
{ agents: { defaults: { models: { "nvidia/nvidia/nemotron-3-ultra-550b-a55b": { params: { chat_template_kwargs: { enable_thinking: true }, extra_body: { reasoning_budget: 16384 }, }, }, }, }, },}params.extra_body est la surcharge finale du corps de requête compatible OpenAI ; utilisez-la donc
uniquement pour les champs que NVIDIA documente pour l’endpoint sélectionné.
Réponses lentes de fournisseur personnalisé
Certains modèles personnalisés hébergés par NVIDIA peuvent prendre plus de temps que le chien de garde d’inactivité du modèle par défaut avant d’émettre un premier fragment de réponse. Pour les entrées de fournisseur NVIDIA personnalisées, augmentez le délai d’expiration du fournisseur plutôt que celui de toute la durée d’exécution de l’agent :
{ models: { providers: { "custom-integrate-api-nvidia-com": { baseUrl: "https://integrate.api.nvidia.com/v1", api: "openai-completions", apiKey: "NVIDIA_API_KEY", timeoutSeconds: 300, }, }, }, agents: { defaults: { models: { "custom-integrate-api-nvidia-com/meta/llama-3.1-70b-instruct": { params: { thinking: "off" }, }, }, }, },}