Providers

NVIDIA

NVIDIA надає OpenAI-сумісний API за адресою https://integrate.api.nvidia.com/v1 для відкритих моделей безкоштовно. Автентифікуйтеся за допомогою API-ключа з build.nvidia.com. OpenClaw за замовчуванням налаштовує провайдер NVIDIA на Nemotron 3 Ultra, модель NVIDIA з 550B загальних / 55B активних параметрів міркування для агентної роботи з довгим контекстом.

Початок роботи

Отримайте свій API-ключ

Створіть API-ключ на build.nvidia.com.

Експортуйте ключ і запустіть onboarding

bash

export NVIDIA_API_KEY="nvapi-..."openclaw onboard --auth-choice nvidia-api-key

Встановіть модель NVIDIA

bash

openclaw models set nvidia/nvidia/nemotron-3-ultra-550b-a55b

Для неінтерактивного налаштування також можна передати ключ напряму:

bash

openclaw onboard --auth-choice nvidia-api-key --nvidia-api-key "nvapi-..."

Приклад конфігурації

json5

{  env: { NVIDIA_API_KEY: "nvapi-..." },  models: {    providers: {      nvidia: {        baseUrl: "https://integrate.api.nvidia.com/v1",        api: "openai-completions",      },    },  },  agents: {    defaults: {      model: { primary: "nvidia/nvidia/nemotron-3-ultra-550b-a55b" },    },  },}

Nemotron 3 Ultra

Nemotron 3 Ultra є стандартною моделлю NVIDIA в OpenClaw. Сторінка NVIDIA build для nvidia/nemotron-3-ultra-550b-a55b вказує її як доступний безкоштовний endpoint зі специфікацією контексту в 1M токенів. Вбудований каталог записує максимальний вивід у 16 384 токени, щоб відповідати поточному OpenAI-сумісному прикладу запиту NVIDIA для розміщеного endpoint.

Використовуйте Ultra як стандартний варіант NVIDIA з найвищими можливостями. Залишайте вибраною Super, коли потрібен менший варіант Nemotron 3, або виберіть одну зі сторонніх моделей, розміщених у каталозі NVIDIA, коли їхній контекст, затримка чи поведінка підходять краще. Вбудований рядок Ultra надсилає chat_template_kwargs.enable_thinking: false і force_nonempty_content: true за замовчуванням, щоб звичайний вивід чату залишався у видимій відповіді замість розкриття тексту міркувань.

Вбудований резервний каталог

Посилання на модель	Назва	Контекст	Макс. вивід	Примітки
`nvidia/nvidia/nemotron-3-ultra-550b-a55b`	NVIDIA Nemotron 3 Ultra 550B	1,000,000	16,384	За замовчуванням
`nvidia/nvidia/nemotron-3-super-120b-a12b`	NVIDIA Nemotron 3 Super 120B	1,048,576	8,192	Рекомендований резервний варіант
`nvidia/moonshotai/kimi-k2.5`	Kimi K2.5	262,144	8,192	Рекомендований резервний варіант
`nvidia/minimaxai/minimax-m2.7`	Minimax M2.7	196,608	8,192	Рекомендований резервний варіант
`nvidia/z-ai/glm-5.1`	GLM 5.1	202,752	8,192	Рекомендований резервний варіант
`nvidia/minimaxai/minimax-m2.5`	MiniMax M2.5	196,608	8,192	Застаріло, сумісність оновлення
`nvidia/z-ai/glm5`	GLM-5	202,752	8,192	Застаріло, сумісність оновлення

Розширена конфігурація

Поведінка автоматичного ввімкнення

Провайдер автоматично вмикається, коли встановлено змінну середовища NVIDIA_API_KEY. Явна конфігурація провайдера, окрім ключа, не потрібна.

Каталог і ціни

OpenClaw надає перевагу публічному каталогу рекомендованих моделей NVIDIA, коли налаштовано автентифікацію NVIDIA, і кешує його на 24 години. Вбудований резервний каталог статичний і зберігає застарілі випущені посилання для сумісності оновлення. Вартість за замовчуванням дорівнює 0 у вихідному коді, оскільки NVIDIA наразі пропонує безкоштовний доступ API для перелічених моделей.

OpenAI-сумісний endpoint

NVIDIA використовує стандартний endpoint completions /v1. Будь-які OpenAI-сумісні інструменти мають працювати з базовою URL-адресою NVIDIA без додаткового налаштування.

Параметри міркування Nemotron 3 Ultra

Приклад запиту Ultra від NVIDIA використовує chat_template_kwargs.enable_thinking і reasoning_budget для виводу міркувань. Вбудований рядок Ultra в OpenClaw за замовчуванням вимикає template thinking для звичайного використання чату. Якщо потрібно увімкнути вивід міркувань NVIDIA або примусово встановити інші специфічні для NVIDIA поля запиту, задайте параметри для окремої моделі та обмежте специфічні для провайдера перевизначення моделлю NVIDIA:

json5

{  agents: {    defaults: {      models: {        "nvidia/nvidia/nemotron-3-ultra-550b-a55b": {          params: {            chat_template_kwargs: { enable_thinking: true },            extra_body: { reasoning_budget: 16384 },          },        },      },    },  },}

params.extra_body є фінальним перевизначенням тіла OpenAI-сумісного запиту, тому використовуйте його лише для полів, які NVIDIA документує для вибраного endpoint.

Повільні відповіді користувацького провайдера

Деякі користувацькі моделі, розміщені NVIDIA, можуть потребувати більше часу, ніж стандартний watchdog бездіяльності моделі, перш ніж вони видадуть перший фрагмент відповіді. Для користувацьких записів провайдера NVIDIA збільште timeout провайдера замість збільшення timeout усього runtime агента:

json5

{  models: {    providers: {      "custom-integrate-api-nvidia-com": {        baseUrl: "https://integrate.api.nvidia.com/v1",        api: "openai-completions",        apiKey: "NVIDIA_API_KEY",        timeoutSeconds: 300,      },    },  },  agents: {    defaults: {      models: {        "custom-integrate-api-nvidia-com/meta/llama-3.1-70b-instruct": {          params: { thinking: "off" },        },      },    },  },}

Пов’язане

Вибір моделі

Вибір провайдерів, посилань на моделі та поведінки failover.

Довідник конфігурації

Повний довідник конфігурації для агентів, моделей і провайдерів.

Was this useful?

NVIDIA

Початок роботи

Отримайте свій API-ключ

Експортуйте ключ і запустіть onboarding

Встановіть модель NVIDIA

Приклад конфігурації

Рекомендований каталог

Nemotron 3 Ultra

Вбудований резервний каталог

Розширена конфігурація

Пов’язане

On this page

Molty