NVIDIA
NVIDIA menyediakan API yang kompatibel dengan OpenAI dihttps://integrate.api.nvidia.com/v1 untuk model Nemotron dan NeMo. Lakukan autentikasi dengan API key dari NVIDIA NGC.
Penyiapan CLI
Ekspor key sekali, lalu jalankan onboarding dan tetapkan model NVIDIA:--token, ingat bahwa itu akan masuk ke riwayat shell dan output ps; sebisa mungkin gunakan variabel environment.
Cuplikan konfigurasi
ID model
| Model ref | Name | Context | Max output |
|---|---|---|---|
nvidia/nvidia/llama-3.1-nemotron-70b-instruct | NVIDIA Llama 3.1 Nemotron 70B Instruct | 131,072 | 4,096 |
nvidia/meta/llama-3.3-70b-instruct | Meta Llama 3.3 70B Instruct | 131,072 | 4,096 |
nvidia/nvidia/mistral-nemo-minitron-8b-8k-instruct | NVIDIA Mistral NeMo Minitron 8B Instruct | 8,192 | 2,048 |
Catatan
- Endpoint
/v1yang kompatibel dengan OpenAI; gunakan API key dari NVIDIA NGC. - Provider aktif otomatis saat
NVIDIA_API_KEYditetapkan. - Katalog bawaan bersifat statis; biaya secara default bernilai
0dalam source.