Providers

NVIDIA

NVIDIA proporciona una API compatible con OpenAI en https://integrate.api.nvidia.com/v1 para modelos abiertos de forma gratuita. Autentícate con una clave de API de build.nvidia.com. OpenClaw configura de forma predeterminada el proveedor NVIDIA en Nemotron 3 Ultra, el modelo de razonamiento activo de NVIDIA con 550B totales / 55B activos para trabajo agéntico de contexto largo.

Primeros pasos

Obtén tu clave de API

Crea una clave de API en build.nvidia.com.

Exporta la clave y ejecuta la incorporación

bash

export NVIDIA_API_KEY="nvapi-..."openclaw onboard --auth-choice nvidia-api-key

Define un modelo NVIDIA

bash

openclaw models set nvidia/nvidia/nemotron-3-ultra-550b-a55b

Para una configuración no interactiva, también puedes pasar la clave directamente:

bash

openclaw onboard --auth-choice nvidia-api-key --nvidia-api-key "nvapi-..."

Ejemplo de configuración

json5

{  env: { NVIDIA_API_KEY: "nvapi-..." },  models: {    providers: {      nvidia: {        baseUrl: "https://integrate.api.nvidia.com/v1",        api: "openai-completions",      },    },  },  agents: {    defaults: {      model: { primary: "nvidia/nvidia/nemotron-3-ultra-550b-a55b" },    },  },}

Catálogo destacado

Cuando se configura una clave de API de NVIDIA, las rutas de configuración y selección de modelos de OpenClaw intentan usar el catálogo público de modelos destacados de NVIDIA desde https://assets.ngc.nvidia.com/products/api-catalog/featured-models.json y almacenan en caché el resultado clasificado durante 24 horas. Por lo tanto, los nuevos modelos destacados de build.nvidia.com aparecen en las superficies de configuración y selección de modelos sin esperar a una versión de OpenClaw. Cuando el feed en vivo está disponible, el primer modelo devuelto es la opción predeterminada que se muestra durante la configuración de NVIDIA.

La obtención usa una política fija de host HTTPS para assets.ngc.nvidia.com. Si no hay una clave de API de NVIDIA configurada, o si ese catálogo público no está disponible o tiene formato incorrecto, OpenClaw recurre al catálogo incluido y al valor predeterminado incluido a continuación.

Nemotron 3 Ultra

Nemotron 3 Ultra es el modelo NVIDIA predeterminado en OpenClaw. La página de build de NVIDIA para nvidia/nemotron-3-ultra-550b-a55b lo enumera como un endpoint gratuito disponible con una especificación de contexto de 1M de tokens. El catálogo incluido registra una salida máxima de 16,384 tokens para coincidir con la solicitud de ejemplo compatible con OpenAI actual de NVIDIA para el endpoint alojado.

Usa Ultra para obtener el valor predeterminado de NVIDIA con mayor capacidad. Mantén Super seleccionado cuando quieras la opción Nemotron 3 más pequeña, o elige uno de los modelos de terceros alojados en el catálogo de NVIDIA cuando su contexto, latencia o comportamiento encaje mejor. La fila Ultra incluida envía chat_template_kwargs.enable_thinking: false y force_nonempty_content: true de forma predeterminada para que la salida normal del chat permanezca en la respuesta visible en lugar de exponer texto de razonamiento.

Catálogo de respaldo incluido

Referencia del modelo	Nombre	Contexto	Salida máxima	Notas
`nvidia/nvidia/nemotron-3-ultra-550b-a55b`	NVIDIA Nemotron 3 Ultra 550B	1,000,000	16,384	Predeterminado
`nvidia/nvidia/nemotron-3-super-120b-a12b`	NVIDIA Nemotron 3 Super 120B	1,048,576	8,192	Respaldo destacado
`nvidia/moonshotai/kimi-k2.5`	Kimi K2.5	262,144	8,192	Respaldo destacado
`nvidia/minimaxai/minimax-m2.7`	Minimax M2.7	196,608	8,192	Respaldo destacado
`nvidia/z-ai/glm-5.1`	GLM 5.1	202,752	8,192	Respaldo destacado
`nvidia/minimaxai/minimax-m2.5`	MiniMax M2.5	196,608	8,192	Obsoleto, compatibilidad de actualización
`nvidia/z-ai/glm5`	GLM-5	202,752	8,192	Obsoleto, compatibilidad de actualización

Configuración avanzada

Comportamiento de activación automática

El proveedor se activa automáticamente cuando se establece la variable de entorno NVIDIA_API_KEY. No se requiere configuración explícita del proveedor más allá de la clave.

Catálogo y precios

OpenClaw prefiere el catálogo público de modelos destacados de NVIDIA cuando la autenticación de NVIDIA está configurada y lo almacena en caché durante 24 horas. El catálogo de respaldo incluido es estático y conserva referencias enviadas obsoletas para compatibilidad de actualización. Los costos tienen el valor predeterminado 0 en el código fuente, ya que NVIDIA actualmente ofrece acceso gratuito a la API para los modelos enumerados.

Endpoint compatible con OpenAI

NVIDIA usa el endpoint estándar de finalizaciones /v1. Cualquier herramienta compatible con OpenAI debería funcionar de inmediato con la URL base de NVIDIA.

Parámetros de razonamiento de Nemotron 3 Ultra

La solicitud de ejemplo de Ultra de NVIDIA usa chat_template_kwargs.enable_thinking y reasoning_budget para la salida de razonamiento. La fila Ultra incluida de OpenClaw deshabilita el pensamiento de plantilla de forma predeterminada para el uso normal de chat. Si necesitas optar por la salida de razonamiento de NVIDIA o forzar otros campos de solicitud específicos de NVIDIA, establece parámetros por modelo y mantén las sobrescrituras específicas del proveedor limitadas al modelo NVIDIA:

json5

{  agents: {    defaults: {      models: {        "nvidia/nvidia/nemotron-3-ultra-550b-a55b": {          params: {            chat_template_kwargs: { enable_thinking: true },            extra_body: { reasoning_budget: 16384 },          },        },      },    },  },}

params.extra_body es la sobrescritura final del cuerpo de solicitud compatible con OpenAI, así que úsala solo para campos que NVIDIA documente para el endpoint seleccionado.

Respuestas lentas de proveedores personalizados

Algunos modelos personalizados alojados en NVIDIA pueden tardar más que el watchdog de inactividad predeterminado del modelo antes de emitir el primer fragmento de respuesta. Para entradas de proveedores NVIDIA personalizados, aumenta el tiempo de espera del proveedor en lugar de aumentar el tiempo de espera de todo el tiempo de ejecución del agente:

json5

{  models: {    providers: {      "custom-integrate-api-nvidia-com": {        baseUrl: "https://integrate.api.nvidia.com/v1",        api: "openai-completions",        apiKey: "NVIDIA_API_KEY",        timeoutSeconds: 300,      },    },  },  agents: {    defaults: {      models: {        "custom-integrate-api-nvidia-com/meta/llama-3.1-70b-instruct": {          params: { thinking: "off" },        },      },    },  },}

Relacionado

Selección de modelo

Elección de proveedores, referencias de modelos y comportamiento de conmutación por error.

Referencia de configuración

Referencia de configuración completa para agentes, modelos y proveedores.

Was this useful?

NVIDIA

Primeros pasos

Obtén tu clave de API

Exporta la clave y ejecuta la incorporación

Define un modelo NVIDIA

Ejemplo de configuración

Catálogo destacado

Nemotron 3 Ultra

Catálogo de respaldo incluido

Configuración avanzada

Relacionado

On this page

Molty