Providers

NVIDIA

A NVIDIA fornece uma API compatível com OpenAI em https://integrate.api.nvidia.com/v1 para modelos abertos gratuitamente. Autentique-se com uma chave de API de build.nvidia.com. O OpenClaw define por padrão o provedor NVIDIA como Nemotron 3 Ultra, o modelo de raciocínio ativo da NVIDIA com 550B no total / 55B ativos para trabalho agêntico de contexto longo.

Primeiros passos

Get your API key

Crie uma chave de API em build.nvidia.com.

Export the key and run onboarding

bash

export NVIDIA_API_KEY="nvapi-..."openclaw onboard --auth-choice nvidia-api-key

Set an NVIDIA model

bash

openclaw models set nvidia/nvidia/nemotron-3-ultra-550b-a55b

Para configuração não interativa, você também pode passar a chave diretamente:

bash

openclaw onboard --auth-choice nvidia-api-key --nvidia-api-key "nvapi-..."

Exemplo de configuração

json5

{  env: { NVIDIA_API_KEY: "nvapi-..." },  models: {    providers: {      nvidia: {        baseUrl: "https://integrate.api.nvidia.com/v1",        api: "openai-completions",      },    },  },  agents: {    defaults: {      model: { primary: "nvidia/nvidia/nemotron-3-ultra-550b-a55b" },    },  },}

Catálogo em destaque

Quando uma chave de API da NVIDIA é configurada, os caminhos de configuração e seleção de modelo do OpenClaw tentam usar o catálogo público de modelos em destaque da NVIDIA em https://assets.ngc.nvidia.com/products/api-catalog/featured-models.json e armazenam em cache o resultado classificado por 24 horas. Assim, novos modelos em destaque do build.nvidia.com aparecem nas superfícies de configuração e seleção de modelo sem esperar por uma versão do OpenClaw. Quando o feed ativo está disponível, o primeiro modelo retornado é a opção padrão mostrada durante a configuração da NVIDIA.

A busca usa uma política fixa de host HTTPS para assets.ngc.nvidia.com. Se nenhuma chave de API da NVIDIA estiver configurada, ou se esse catálogo público estiver indisponível ou malformado, o OpenClaw recorre ao catálogo incluído e ao padrão incluído abaixo.

Nemotron 3 Ultra

Nemotron 3 Ultra é o modelo NVIDIA padrão no OpenClaw. A página de build da NVIDIA para nvidia/nemotron-3-ultra-550b-a55b o lista como um endpoint gratuito disponível com uma especificação de contexto de 1M tokens. O catálogo incluído registra uma saída máxima de 16.384 tokens para corresponder à solicitação de exemplo compatível com OpenAI atual da NVIDIA para o endpoint hospedado.

Use o Ultra para o padrão NVIDIA de maior capacidade. Mantenha o Super selecionado quando quiser a opção menor do Nemotron 3, ou escolha um dos modelos de terceiros hospedados no catálogo da NVIDIA quando o contexto, a latência ou o comportamento deles se ajustar melhor. A linha Ultra incluída envia chat_template_kwargs.enable_thinking: false e force_nonempty_content: true por padrão para que a saída normal do chat permaneça na resposta visível em vez de expor texto de raciocínio.

Catálogo fallback incluído

Ref. do modelo	Nome	Contexto	Saída máxima	Observações
`nvidia/nvidia/nemotron-3-ultra-550b-a55b`	NVIDIA Nemotron 3 Ultra 550B	1,000,000	16,384	Padrão
`nvidia/nvidia/nemotron-3-super-120b-a12b`	NVIDIA Nemotron 3 Super 120B	1,048,576	8,192	Fallback em destaque
`nvidia/moonshotai/kimi-k2.5`	Kimi K2.5	262,144	8,192	Fallback em destaque
`nvidia/minimaxai/minimax-m2.7`	Minimax M2.7	196,608	8,192	Fallback em destaque
`nvidia/z-ai/glm-5.1`	GLM 5.1	202,752	8,192	Fallback em destaque
`nvidia/minimaxai/minimax-m2.5`	MiniMax M2.5	196,608	8,192	Obsoleto, compatibilidade de upgrade
`nvidia/z-ai/glm5`	GLM-5	202,752	8,192	Obsoleto, compatibilidade de upgrade

Configuração avançada

Auto-enable behavior

O provedor é habilitado automaticamente quando a variável de ambiente NVIDIA_API_KEY está definida. Nenhuma configuração explícita de provedor é necessária além da chave.

Catalog and pricing

O OpenClaw prefere o catálogo público de modelos em destaque da NVIDIA quando a autenticação NVIDIA está configurada e o armazena em cache por 24 horas. O catálogo fallback incluído é estático e mantém refs enviadas obsoletas para compatibilidade de upgrade. Os custos assumem o padrão 0 no código-fonte, pois a NVIDIA atualmente oferece acesso gratuito à API para os modelos listados.

OpenAI-compatible endpoint

A NVIDIA usa o endpoint padrão de completions /v1. Qualquer ferramenta compatível com OpenAI deve funcionar imediatamente com a URL base da NVIDIA.

Nemotron 3 Ultra reasoning params

A solicitação de exemplo do Ultra da NVIDIA usa chat_template_kwargs.enable_thinking e reasoning_budget para saída de raciocínio. A linha Ultra incluída do OpenClaw desabilita o pensamento por template por padrão para uso normal de chat. Se você precisar optar pela saída de raciocínio da NVIDIA ou forçar outros campos de solicitação específicos da NVIDIA, defina parâmetros por modelo e mantenha substituições específicas do provedor restritas ao modelo NVIDIA:

json5

{  agents: {    defaults: {      models: {        "nvidia/nvidia/nemotron-3-ultra-550b-a55b": {          params: {            chat_template_kwargs: { enable_thinking: true },            extra_body: { reasoning_budget: 16384 },          },        },      },    },  },}

params.extra_body é a substituição final do corpo da solicitação compatível com OpenAI, então use-a apenas para campos que a NVIDIA documenta para o endpoint selecionado.

Slow custom provider responses

Alguns modelos personalizados hospedados pela NVIDIA podem levar mais tempo que o watchdog ocioso padrão do modelo antes de emitirem o primeiro fragmento de resposta. Para entradas personalizadas de provedor NVIDIA, aumente o timeout do provedor em vez de aumentar o timeout de runtime do agente inteiro:

json5

{  models: {    providers: {      "custom-integrate-api-nvidia-com": {        baseUrl: "https://integrate.api.nvidia.com/v1",        api: "openai-completions",        apiKey: "NVIDIA_API_KEY",        timeoutSeconds: 300,      },    },  },  agents: {    defaults: {      models: {        "custom-integrate-api-nvidia-com/meta/llama-3.1-70b-instruct": {          params: { thinking: "off" },        },      },    },  },}

Relacionados

Model selection

Escolha de provedores, refs de modelo e comportamento de failover.

Configuration reference

Referência completa de configuração para agentes, modelos e provedores.

Was this useful?

NVIDIA

Primeiros passos

Get your API key

Export the key and run onboarding

Set an NVIDIA model

Exemplo de configuração

Catálogo em destaque

Nemotron 3 Ultra

Catálogo fallback incluído

Configuração avançada

Relacionados

On this page

Molty