Providers
NVIDIA
A NVIDIA fornece uma API compatível com OpenAI em https://integrate.api.nvidia.com/v1 para
modelos abertos gratuitamente. Autentique-se com uma chave de API de
build.nvidia.com. O OpenClaw
define por padrão o provedor NVIDIA como Nemotron 3 Ultra, o modelo de raciocínio
ativo da NVIDIA com 550B no total / 55B ativos para trabalho agêntico de contexto longo.
Primeiros passos
Get your API key
Crie uma chave de API em build.nvidia.com.
Export the key and run onboarding
export NVIDIA_API_KEY="nvapi-..."openclaw onboard --auth-choice nvidia-api-keySet an NVIDIA model
openclaw models set nvidia/nvidia/nemotron-3-ultra-550b-a55bPara configuração não interativa, você também pode passar a chave diretamente:
openclaw onboard --auth-choice nvidia-api-key --nvidia-api-key "nvapi-..."Exemplo de configuração
{ env: { NVIDIA_API_KEY: "nvapi-..." }, models: { providers: { nvidia: { baseUrl: "https://integrate.api.nvidia.com/v1", api: "openai-completions", }, }, }, agents: { defaults: { model: { primary: "nvidia/nvidia/nemotron-3-ultra-550b-a55b" }, }, },}Catálogo em destaque
Quando uma chave de API da NVIDIA é configurada, os caminhos de configuração e seleção de modelo
do OpenClaw tentam usar o catálogo público de modelos em destaque da NVIDIA em
https://assets.ngc.nvidia.com/products/api-catalog/featured-models.json e
armazenam em cache o resultado classificado por 24 horas. Assim, novos modelos em destaque do build.nvidia.com
aparecem nas superfícies de configuração e seleção de modelo sem esperar por uma
versão do OpenClaw. Quando o feed ativo está disponível, o primeiro modelo retornado é
a opção padrão mostrada durante a configuração da NVIDIA.
A busca usa uma política fixa de host HTTPS para assets.ngc.nvidia.com. Se nenhuma
chave de API da NVIDIA estiver configurada, ou se esse catálogo público estiver indisponível ou
malformado, o OpenClaw recorre ao catálogo incluído e ao padrão incluído abaixo.
Nemotron 3 Ultra
Nemotron 3 Ultra é o modelo NVIDIA padrão no OpenClaw. A página de build da NVIDIA para
nvidia/nemotron-3-ultra-550b-a55b
o lista como um endpoint gratuito disponível com uma especificação de contexto de 1M tokens.
O catálogo incluído registra uma saída máxima de 16.384 tokens para corresponder à solicitação de exemplo
compatível com OpenAI atual da NVIDIA para o endpoint hospedado.
Use o Ultra para o padrão NVIDIA de maior capacidade. Mantenha o Super selecionado quando
quiser a opção menor do Nemotron 3, ou escolha um dos modelos de terceiros
hospedados no catálogo da NVIDIA quando o contexto, a latência ou o comportamento deles se ajustar melhor.
A linha Ultra incluída envia chat_template_kwargs.enable_thinking: false e
force_nonempty_content: true por padrão para que a saída normal do chat permaneça na
resposta visível em vez de expor texto de raciocínio.
Catálogo fallback incluído
| Ref. do modelo | Nome | Contexto | Saída máxima | Observações |
|---|---|---|---|---|
nvidia/nvidia/nemotron-3-ultra-550b-a55b |
NVIDIA Nemotron 3 Ultra 550B | 1,000,000 | 16,384 | Padrão |
nvidia/nvidia/nemotron-3-super-120b-a12b |
NVIDIA Nemotron 3 Super 120B | 1,048,576 | 8,192 | Fallback em destaque |
nvidia/moonshotai/kimi-k2.5 |
Kimi K2.5 | 262,144 | 8,192 | Fallback em destaque |
nvidia/minimaxai/minimax-m2.7 |
Minimax M2.7 | 196,608 | 8,192 | Fallback em destaque |
nvidia/z-ai/glm-5.1 |
GLM 5.1 | 202,752 | 8,192 | Fallback em destaque |
nvidia/minimaxai/minimax-m2.5 |
MiniMax M2.5 | 196,608 | 8,192 | Obsoleto, compatibilidade de upgrade |
nvidia/z-ai/glm5 |
GLM-5 | 202,752 | 8,192 | Obsoleto, compatibilidade de upgrade |
Configuração avançada
Auto-enable behavior
O provedor é habilitado automaticamente quando a variável de ambiente NVIDIA_API_KEY está definida.
Nenhuma configuração explícita de provedor é necessária além da chave.
Catalog and pricing
O OpenClaw prefere o catálogo público de modelos em destaque da NVIDIA quando a autenticação NVIDIA está
configurada e o armazena em cache por 24 horas. O catálogo fallback incluído é estático
e mantém refs enviadas obsoletas para compatibilidade de upgrade. Os custos assumem o padrão
0 no código-fonte, pois a NVIDIA atualmente oferece acesso gratuito à API para os
modelos listados.
OpenAI-compatible endpoint
A NVIDIA usa o endpoint padrão de completions /v1. Qualquer ferramenta compatível com OpenAI
deve funcionar imediatamente com a URL base da NVIDIA.
Nemotron 3 Ultra reasoning params
A solicitação de exemplo do Ultra da NVIDIA usa chat_template_kwargs.enable_thinking
e reasoning_budget para saída de raciocínio. A linha Ultra incluída do OpenClaw
desabilita o pensamento por template por padrão para uso normal de chat. Se você precisar
optar pela saída de raciocínio da NVIDIA ou forçar outros campos de solicitação específicos da NVIDIA,
defina parâmetros por modelo e mantenha substituições específicas do provedor restritas ao
modelo NVIDIA:
{ agents: { defaults: { models: { "nvidia/nvidia/nemotron-3-ultra-550b-a55b": { params: { chat_template_kwargs: { enable_thinking: true }, extra_body: { reasoning_budget: 16384 }, }, }, }, }, },}params.extra_body é a substituição final do corpo da solicitação compatível com OpenAI, então
use-a apenas para campos que a NVIDIA documenta para o endpoint selecionado.
Slow custom provider responses
Alguns modelos personalizados hospedados pela NVIDIA podem levar mais tempo que o watchdog ocioso padrão do modelo antes de emitirem o primeiro fragmento de resposta. Para entradas personalizadas de provedor NVIDIA, aumente o timeout do provedor em vez de aumentar o timeout de runtime do agente inteiro:
{ models: { providers: { "custom-integrate-api-nvidia-com": { baseUrl: "https://integrate.api.nvidia.com/v1", api: "openai-completions", apiKey: "NVIDIA_API_KEY", timeoutSeconds: 300, }, }, }, agents: { defaults: { models: { "custom-integrate-api-nvidia-com/meta/llama-3.1-70b-instruct": { params: { thinking: "off" }, }, }, }, },}