NVIDIA надає OpenAI-сумісний API за адресоюDocumentation Index
Fetch the complete documentation index at: https://docs.openclaw.ai/llms.txt
Use this file to discover all available pages before exploring further.
https://integrate.api.nvidia.com/v1 для
відкритих моделей безкоштовно. Автентифікуйтеся за допомогою API-ключа з
build.nvidia.com.
Початок роботи
Отримайте свій API-ключ
Створіть API-ключ на build.nvidia.com.
Приклад конфігурації
Вбудований каталог
| Посилання на модель | Назва | Контекст | Макс. вивід |
|---|---|---|---|
nvidia/nvidia/nemotron-3-super-120b-a12b | NVIDIA Nemotron 3 Super 120B | 262,144 | 8,192 |
nvidia/moonshotai/kimi-k2.5 | Kimi K2.5 | 262,144 | 8,192 |
nvidia/minimaxai/minimax-m2.5 | Minimax M2.5 | 196,608 | 8,192 |
nvidia/z-ai/glm5 | GLM 5 | 202,752 | 8,192 |
Розширена конфігурація
Поведінка автоматичного ввімкнення
Поведінка автоматичного ввімкнення
Провайдер автоматично вмикається, коли задано змінну середовища
NVIDIA_API_KEY.
Окрім ключа, явна конфігурація провайдера не потрібна.Каталог і ціни
Каталог і ціни
Вбудований каталог є статичним. Витрати в джерелі за замовчуванням дорівнюють
0, оскільки NVIDIA
наразі пропонує безкоштовний доступ до API для перелічених моделей.OpenAI-сумісний endpoint
OpenAI-сумісний endpoint
NVIDIA використовує стандартний endpoint completions
/v1. Будь-які OpenAI-сумісні
інструменти мають працювати одразу з базовим URL NVIDIA.Повільні відповіді власного провайдера
Повільні відповіді власного провайдера
Деякі власні моделі, розміщені NVIDIA, можуть потребувати більше часу, ніж стандартний idle
watchdog моделі, перш ніж вони видадуть перший фрагмент відповіді. Для власних записів провайдера NVIDIA
збільшуйте timeout провайдера, а не timeout усього runtime агента:
Пов’язане
Вибір моделі
Вибір провайдерів, посилань на моделі та поведінки failover.
Довідник із конфігурації
Повний довідник із конфігурації для агентів, моделей і провайдерів.