Providers
NVIDIA
NVIDIA proporciona una API compatible con OpenAI en https://integrate.api.nvidia.com/v1 para
modelos abiertos de forma gratuita. Autentícate con una clave de API de
build.nvidia.com. OpenClaw
configura de forma predeterminada el proveedor NVIDIA en Nemotron 3 Ultra, el modelo de razonamiento
activo de NVIDIA con 550B totales / 55B activos para trabajo agéntico de contexto largo.
Primeros pasos
Obtén tu clave de API
Crea una clave de API en build.nvidia.com.
Exporta la clave y ejecuta la incorporación
export NVIDIA_API_KEY="nvapi-..."openclaw onboard --auth-choice nvidia-api-keyDefine un modelo NVIDIA
openclaw models set nvidia/nvidia/nemotron-3-ultra-550b-a55bPara una configuración no interactiva, también puedes pasar la clave directamente:
openclaw onboard --auth-choice nvidia-api-key --nvidia-api-key "nvapi-..."Ejemplo de configuración
{ env: { NVIDIA_API_KEY: "nvapi-..." }, models: { providers: { nvidia: { baseUrl: "https://integrate.api.nvidia.com/v1", api: "openai-completions", }, }, }, agents: { defaults: { model: { primary: "nvidia/nvidia/nemotron-3-ultra-550b-a55b" }, }, },}Catálogo destacado
Cuando se configura una clave de API de NVIDIA, las rutas de configuración y selección de modelos
de OpenClaw intentan usar el catálogo público de modelos destacados de NVIDIA desde
https://assets.ngc.nvidia.com/products/api-catalog/featured-models.json y
almacenan en caché el resultado clasificado durante 24 horas. Por lo tanto, los nuevos modelos destacados de build.nvidia.com
aparecen en las superficies de configuración y selección de modelos sin esperar a una
versión de OpenClaw. Cuando el feed en vivo está disponible, el primer modelo devuelto es
la opción predeterminada que se muestra durante la configuración de NVIDIA.
La obtención usa una política fija de host HTTPS para assets.ngc.nvidia.com. Si no
hay una clave de API de NVIDIA configurada, o si ese catálogo público no está disponible o
tiene formato incorrecto, OpenClaw recurre al catálogo incluido y al valor predeterminado incluido a continuación.
Nemotron 3 Ultra
Nemotron 3 Ultra es el modelo NVIDIA predeterminado en OpenClaw. La página de build de NVIDIA para
nvidia/nemotron-3-ultra-550b-a55b
lo enumera como un endpoint gratuito disponible con una especificación de contexto de 1M de tokens.
El catálogo incluido registra una salida máxima de 16,384 tokens para coincidir con la solicitud de ejemplo
compatible con OpenAI actual de NVIDIA para el endpoint alojado.
Usa Ultra para obtener el valor predeterminado de NVIDIA con mayor capacidad. Mantén Super seleccionado cuando
quieras la opción Nemotron 3 más pequeña, o elige uno de los modelos de terceros
alojados en el catálogo de NVIDIA cuando su contexto, latencia o comportamiento encaje mejor.
La fila Ultra incluida envía chat_template_kwargs.enable_thinking: false y
force_nonempty_content: true de forma predeterminada para que la salida normal del chat permanezca en la
respuesta visible en lugar de exponer texto de razonamiento.
Catálogo de respaldo incluido
| Referencia del modelo | Nombre | Contexto | Salida máxima | Notas |
|---|---|---|---|---|
nvidia/nvidia/nemotron-3-ultra-550b-a55b |
NVIDIA Nemotron 3 Ultra 550B | 1,000,000 | 16,384 | Predeterminado |
nvidia/nvidia/nemotron-3-super-120b-a12b |
NVIDIA Nemotron 3 Super 120B | 1,048,576 | 8,192 | Respaldo destacado |
nvidia/moonshotai/kimi-k2.5 |
Kimi K2.5 | 262,144 | 8,192 | Respaldo destacado |
nvidia/minimaxai/minimax-m2.7 |
Minimax M2.7 | 196,608 | 8,192 | Respaldo destacado |
nvidia/z-ai/glm-5.1 |
GLM 5.1 | 202,752 | 8,192 | Respaldo destacado |
nvidia/minimaxai/minimax-m2.5 |
MiniMax M2.5 | 196,608 | 8,192 | Obsoleto, compatibilidad de actualización |
nvidia/z-ai/glm5 |
GLM-5 | 202,752 | 8,192 | Obsoleto, compatibilidad de actualización |
Configuración avanzada
Comportamiento de activación automática
El proveedor se activa automáticamente cuando se establece la variable de entorno NVIDIA_API_KEY.
No se requiere configuración explícita del proveedor más allá de la clave.
Catálogo y precios
OpenClaw prefiere el catálogo público de modelos destacados de NVIDIA cuando la autenticación de NVIDIA está
configurada y lo almacena en caché durante 24 horas. El catálogo de respaldo incluido es estático
y conserva referencias enviadas obsoletas para compatibilidad de actualización. Los costos tienen el valor predeterminado
0 en el código fuente, ya que NVIDIA actualmente ofrece acceso gratuito a la API para los
modelos enumerados.
Endpoint compatible con OpenAI
NVIDIA usa el endpoint estándar de finalizaciones /v1. Cualquier herramienta compatible con OpenAI
debería funcionar de inmediato con la URL base de NVIDIA.
Parámetros de razonamiento de Nemotron 3 Ultra
La solicitud de ejemplo de Ultra de NVIDIA usa chat_template_kwargs.enable_thinking
y reasoning_budget para la salida de razonamiento. La fila Ultra incluida de OpenClaw
deshabilita el pensamiento de plantilla de forma predeterminada para el uso normal de chat. Si necesitas
optar por la salida de razonamiento de NVIDIA o forzar otros campos de solicitud específicos de NVIDIA,
establece parámetros por modelo y mantén las sobrescrituras específicas del proveedor limitadas al
modelo NVIDIA:
{ agents: { defaults: { models: { "nvidia/nvidia/nemotron-3-ultra-550b-a55b": { params: { chat_template_kwargs: { enable_thinking: true }, extra_body: { reasoning_budget: 16384 }, }, }, }, }, },}params.extra_body es la sobrescritura final del cuerpo de solicitud compatible con OpenAI, así que
úsala solo para campos que NVIDIA documente para el endpoint seleccionado.
Respuestas lentas de proveedores personalizados
Algunos modelos personalizados alojados en NVIDIA pueden tardar más que el watchdog de inactividad predeterminado del modelo antes de emitir el primer fragmento de respuesta. Para entradas de proveedores NVIDIA personalizados, aumenta el tiempo de espera del proveedor en lugar de aumentar el tiempo de espera de todo el tiempo de ejecución del agente:
{ models: { providers: { "custom-integrate-api-nvidia-com": { baseUrl: "https://integrate.api.nvidia.com/v1", api: "openai-completions", apiKey: "NVIDIA_API_KEY", timeoutSeconds: 300, }, }, }, agents: { defaults: { models: { "custom-integrate-api-nvidia-com/meta/llama-3.1-70b-instruct": { params: { thinking: "off" }, }, }, }, },}