Providers

NVIDIA

A NVIDIA fornece uma API compatível com OpenAI em https://integrate.api.nvidia.com/v1 para modelos abertos gratuitamente. Autentique-se com uma chave de API de build.nvidia.com. O OpenClaw define por padrão o provedor NVIDIA como Nemotron 3 Ultra, o modelo de raciocínio ativo da NVIDIA com 550B no total / 55B ativos para trabalho agêntico de contexto longo.

Primeiros passos

  • Get your API key

    Crie uma chave de API em build.nvidia.com.

  • Export the key and run onboarding

    bash
    export NVIDIA_API_KEY="nvapi-..."openclaw onboard --auth-choice nvidia-api-key
  • Set an NVIDIA model

    bash
    openclaw models set nvidia/nvidia/nemotron-3-ultra-550b-a55b
  • Para configuração não interativa, você também pode passar a chave diretamente:

    bash
    openclaw onboard --auth-choice nvidia-api-key --nvidia-api-key "nvapi-..."

    Exemplo de configuração

    json5
    {  env: { NVIDIA_API_KEY: "nvapi-..." },  models: {    providers: {      nvidia: {        baseUrl: "https://integrate.api.nvidia.com/v1",        api: "openai-completions",      },    },  },  agents: {    defaults: {      model: { primary: "nvidia/nvidia/nemotron-3-ultra-550b-a55b" },    },  },}

    Catálogo em destaque

    Quando uma chave de API da NVIDIA é configurada, os caminhos de configuração e seleção de modelo do OpenClaw tentam usar o catálogo público de modelos em destaque da NVIDIA em https://assets.ngc.nvidia.com/products/api-catalog/featured-models.json e armazenam em cache o resultado classificado por 24 horas. Assim, novos modelos em destaque do build.nvidia.com aparecem nas superfícies de configuração e seleção de modelo sem esperar por uma versão do OpenClaw. Quando o feed ativo está disponível, o primeiro modelo retornado é a opção padrão mostrada durante a configuração da NVIDIA.

    A busca usa uma política fixa de host HTTPS para assets.ngc.nvidia.com. Se nenhuma chave de API da NVIDIA estiver configurada, ou se esse catálogo público estiver indisponível ou malformado, o OpenClaw recorre ao catálogo incluído e ao padrão incluído abaixo.

    Nemotron 3 Ultra

    Nemotron 3 Ultra é o modelo NVIDIA padrão no OpenClaw. A página de build da NVIDIA para nvidia/nemotron-3-ultra-550b-a55b o lista como um endpoint gratuito disponível com uma especificação de contexto de 1M tokens. O catálogo incluído registra uma saída máxima de 16.384 tokens para corresponder à solicitação de exemplo compatível com OpenAI atual da NVIDIA para o endpoint hospedado.

    Use o Ultra para o padrão NVIDIA de maior capacidade. Mantenha o Super selecionado quando quiser a opção menor do Nemotron 3, ou escolha um dos modelos de terceiros hospedados no catálogo da NVIDIA quando o contexto, a latência ou o comportamento deles se ajustar melhor. A linha Ultra incluída envia chat_template_kwargs.enable_thinking: false e force_nonempty_content: true por padrão para que a saída normal do chat permaneça na resposta visível em vez de expor texto de raciocínio.

    Catálogo fallback incluído

    Ref. do modelo Nome Contexto Saída máxima Observações
    nvidia/nvidia/nemotron-3-ultra-550b-a55b NVIDIA Nemotron 3 Ultra 550B 1,000,000 16,384 Padrão
    nvidia/nvidia/nemotron-3-super-120b-a12b NVIDIA Nemotron 3 Super 120B 1,048,576 8,192 Fallback em destaque
    nvidia/moonshotai/kimi-k2.5 Kimi K2.5 262,144 8,192 Fallback em destaque
    nvidia/minimaxai/minimax-m2.7 Minimax M2.7 196,608 8,192 Fallback em destaque
    nvidia/z-ai/glm-5.1 GLM 5.1 202,752 8,192 Fallback em destaque
    nvidia/minimaxai/minimax-m2.5 MiniMax M2.5 196,608 8,192 Obsoleto, compatibilidade de upgrade
    nvidia/z-ai/glm5 GLM-5 202,752 8,192 Obsoleto, compatibilidade de upgrade

    Configuração avançada

    Auto-enable behavior

    O provedor é habilitado automaticamente quando a variável de ambiente NVIDIA_API_KEY está definida. Nenhuma configuração explícita de provedor é necessária além da chave.

    Catalog and pricing

    O OpenClaw prefere o catálogo público de modelos em destaque da NVIDIA quando a autenticação NVIDIA está configurada e o armazena em cache por 24 horas. O catálogo fallback incluído é estático e mantém refs enviadas obsoletas para compatibilidade de upgrade. Os custos assumem o padrão 0 no código-fonte, pois a NVIDIA atualmente oferece acesso gratuito à API para os modelos listados.

    OpenAI-compatible endpoint

    A NVIDIA usa o endpoint padrão de completions /v1. Qualquer ferramenta compatível com OpenAI deve funcionar imediatamente com a URL base da NVIDIA.

    Nemotron 3 Ultra reasoning params

    A solicitação de exemplo do Ultra da NVIDIA usa chat_template_kwargs.enable_thinking e reasoning_budget para saída de raciocínio. A linha Ultra incluída do OpenClaw desabilita o pensamento por template por padrão para uso normal de chat. Se você precisar optar pela saída de raciocínio da NVIDIA ou forçar outros campos de solicitação específicos da NVIDIA, defina parâmetros por modelo e mantenha substituições específicas do provedor restritas ao modelo NVIDIA:

    json5
    {  agents: {    defaults: {      models: {        "nvidia/nvidia/nemotron-3-ultra-550b-a55b": {          params: {            chat_template_kwargs: { enable_thinking: true },            extra_body: { reasoning_budget: 16384 },          },        },      },    },  },}

    params.extra_body é a substituição final do corpo da solicitação compatível com OpenAI, então use-a apenas para campos que a NVIDIA documenta para o endpoint selecionado.

    Slow custom provider responses

    Alguns modelos personalizados hospedados pela NVIDIA podem levar mais tempo que o watchdog ocioso padrão do modelo antes de emitirem o primeiro fragmento de resposta. Para entradas personalizadas de provedor NVIDIA, aumente o timeout do provedor em vez de aumentar o timeout de runtime do agente inteiro:

    json5
    {  models: {    providers: {      "custom-integrate-api-nvidia-com": {        baseUrl: "https://integrate.api.nvidia.com/v1",        api: "openai-completions",        apiKey: "NVIDIA_API_KEY",        timeoutSeconds: 300,      },    },  },  agents: {    defaults: {      models: {        "custom-integrate-api-nvidia-com/meta/llama-3.1-70b-instruct": {          params: { thinking: "off" },        },      },    },  },}

    Relacionados

    Was this useful?
    On this page

    On this page