NVIDIA
NVIDIA надає OpenAI-сумісний API за адресоюhttps://integrate.api.nvidia.com/v1 для моделей Nemotron і NeMo. Автентифікація виконується за допомогою API-ключа з NVIDIA NGC.
Налаштування CLI
Експортуйте ключ один раз, потім запустіть онбординг і встановіть модель NVIDIA:--token, пам’ятайте, що він потрапляє в історію оболонки й вивід ps; за можливості віддавайте перевагу env-змінній.
Фрагмент конфігурації
ID моделей
| Посилання на модель | Назва | Контекст | Макс. вивід |
|---|---|---|---|
nvidia/nvidia/llama-3.1-nemotron-70b-instruct | NVIDIA Llama 3.1 Nemotron 70B Instruct | 131,072 | 4,096 |
nvidia/meta/llama-3.3-70b-instruct | Meta Llama 3.3 70B Instruct | 131,072 | 4,096 |
nvidia/nvidia/mistral-nemo-minitron-8b-8k-instruct | NVIDIA Mistral NeMo Minitron 8B Instruct | 8,192 | 2,048 |
Примітки
- OpenAI-сумісний endpoint
/v1; використовуйте API-ключ із NVIDIA NGC. - Провайдер автоматично вмикається, коли задано
NVIDIA_API_KEY. - Вбудований каталог є статичним; у вихідному коді вартість типово встановлена в
0.