Providers

NVIDIA

NVIDIA fournit une API compatible avec OpenAI à l’adresse https://integrate.api.nvidia.com/v1 pour les modèles ouverts gratuitement. Authentifiez-vous avec une clé d’API depuis build.nvidia.com. OpenClaw définit par défaut le fournisseur NVIDIA sur Nemotron 3 Ultra, le modèle de raisonnement actif de NVIDIA totalisant 550B / 55B, conçu pour le travail agentique à contexte long.

Premiers pas

  • Obtenir votre clé d’API

    Créez une clé d’API sur build.nvidia.com.

  • Exporter la clé et exécuter l’intégration

    bash
    export NVIDIA_API_KEY="nvapi-..."openclaw onboard --auth-choice nvidia-api-key
  • Définir un modèle NVIDIA

    bash
    openclaw models set nvidia/nvidia/nemotron-3-ultra-550b-a55b
  • Pour une configuration non interactive, vous pouvez également passer la clé directement :

    bash
    openclaw onboard --auth-choice nvidia-api-key --nvidia-api-key "nvapi-..."

    Exemple de configuration

    json5
    {  env: { NVIDIA_API_KEY: "nvapi-..." },  models: {    providers: {      nvidia: {        baseUrl: "https://integrate.api.nvidia.com/v1",        api: "openai-completions",      },    },  },  agents: {    defaults: {      model: { primary: "nvidia/nvidia/nemotron-3-ultra-550b-a55b" },    },  },}

    Catalogue mis en avant

    Lorsqu’une clé d’API NVIDIA est configurée, la configuration d’OpenClaw et les parcours de sélection de modèles essaient le catalogue public de modèles mis en avant par NVIDIA depuis https://assets.ngc.nvidia.com/products/api-catalog/featured-models.json et mettent en cache le résultat classé pendant 24 heures. Les nouveaux modèles mis en avant depuis build.nvidia.com apparaissent donc dans les surfaces de configuration et de sélection de modèles sans attendre une version d’OpenClaw. Lorsque le flux en direct est disponible, le premier modèle renvoyé est l’option par défaut affichée lors de la configuration NVIDIA.

    La récupération utilise une politique d’hôte HTTPS fixe pour assets.ngc.nvidia.com. Si aucune clé d’API NVIDIA n’est configurée, ou si ce catalogue public est indisponible ou mal formé, OpenClaw se rabat sur le catalogue groupé et la valeur par défaut groupée ci-dessous.

    Nemotron 3 Ultra

    Nemotron 3 Ultra est le modèle NVIDIA par défaut dans OpenClaw. La page de build de NVIDIA pour nvidia/nemotron-3-ultra-550b-a55b le liste comme endpoint gratuit disponible avec une spécification de contexte de 1M de jetons. Le catalogue groupé enregistre une sortie maximale de 16 384 jetons pour correspondre à la requête d’exemple compatible OpenAI actuelle de NVIDIA pour l’endpoint hébergé.

    Utilisez Ultra pour le modèle NVIDIA par défaut aux capacités les plus élevées. Gardez Super sélectionné lorsque vous voulez l’option Nemotron 3 plus petite, ou choisissez l’un des modèles tiers hébergés dans le catalogue NVIDIA lorsque leur contexte, leur latence ou leur comportement convient mieux. La ligne Ultra groupée envoie chat_template_kwargs.enable_thinking: false et force_nonempty_content: true par défaut afin que la sortie de chat normale reste dans la réponse visible au lieu d’exposer le texte de raisonnement.

    Catalogue de secours groupé

    Référence de modèle Nom Contexte Sortie max. Notes
    nvidia/nvidia/nemotron-3-ultra-550b-a55b NVIDIA Nemotron 3 Ultra 550B 1,000,000 16,384 Par défaut
    nvidia/nvidia/nemotron-3-super-120b-a12b NVIDIA Nemotron 3 Super 120B 1,048,576 8,192 Secours mis en avant
    nvidia/moonshotai/kimi-k2.5 Kimi K2.5 262,144 8,192 Secours mis en avant
    nvidia/minimaxai/minimax-m2.7 Minimax M2.7 196,608 8,192 Secours mis en avant
    nvidia/z-ai/glm-5.1 GLM 5.1 202,752 8,192 Secours mis en avant
    nvidia/minimaxai/minimax-m2.5 MiniMax M2.5 196,608 8,192 Obsolète, compatibilité de mise à niveau
    nvidia/z-ai/glm5 GLM-5 202,752 8,192 Obsolète, compatibilité de mise à niveau

    Configuration avancée

    Comportement d’activation automatique

    Le fournisseur s’active automatiquement lorsque la variable d’environnement NVIDIA_API_KEY est définie. Aucune configuration explicite du fournisseur n’est requise au-delà de la clé.

    Catalogue et tarification

    OpenClaw privilégie le catalogue public de modèles mis en avant par NVIDIA lorsque l’authentification NVIDIA est configurée et le met en cache pendant 24 heures. Le catalogue de secours groupé est statique et conserve les références livrées obsolètes pour la compatibilité de mise à niveau. Les coûts valent par défaut 0 dans la source, car NVIDIA propose actuellement un accès gratuit à l’API pour les modèles listés.

    Endpoint compatible OpenAI

    NVIDIA utilise l’endpoint standard de complétions /v1. Tout outil compatible OpenAI devrait fonctionner immédiatement avec l’URL de base NVIDIA.

    Paramètres de raisonnement de Nemotron 3 Ultra

    La requête d’exemple Ultra de NVIDIA utilise chat_template_kwargs.enable_thinking et reasoning_budget pour la sortie de raisonnement. La ligne Ultra groupée d’OpenClaw désactive la pensée de modèle par défaut pour l’utilisation normale du chat. Si vous devez activer la sortie de raisonnement NVIDIA ou forcer d’autres champs de requête spécifiques à NVIDIA, définissez des paramètres par modèle et gardez les surcharges propres au fournisseur limitées au modèle NVIDIA :

    json5
    {  agents: {    defaults: {      models: {        "nvidia/nvidia/nemotron-3-ultra-550b-a55b": {          params: {            chat_template_kwargs: { enable_thinking: true },            extra_body: { reasoning_budget: 16384 },          },        },      },    },  },}

    params.extra_body est la surcharge finale du corps de requête compatible OpenAI ; utilisez-la donc uniquement pour les champs que NVIDIA documente pour l’endpoint sélectionné.

    Réponses lentes de fournisseur personnalisé

    Certains modèles personnalisés hébergés par NVIDIA peuvent prendre plus de temps que le chien de garde d’inactivité du modèle par défaut avant d’émettre un premier fragment de réponse. Pour les entrées de fournisseur NVIDIA personnalisées, augmentez le délai d’expiration du fournisseur plutôt que celui de toute la durée d’exécution de l’agent :

    json5
    {  models: {    providers: {      "custom-integrate-api-nvidia-com": {        baseUrl: "https://integrate.api.nvidia.com/v1",        api: "openai-completions",        apiKey: "NVIDIA_API_KEY",        timeoutSeconds: 300,      },    },  },  agents: {    defaults: {      models: {        "custom-integrate-api-nvidia-com/meta/llama-3.1-70b-instruct": {          params: { thinking: "off" },        },      },    },  },}

    Associé

    Was this useful?
    On this page

    On this page