NVIDIA
NVIDIA stellt unterhttps://integrate.api.nvidia.com/v1 eine OpenAI-kompatible API für Nemotron- und NeMo-Modelle bereit. Authentifizieren Sie sich mit einem API-Schlüssel von NVIDIA NGC.
CLI-Einrichtung
Exportieren Sie den Schlüssel einmal, führen Sie dann das Onboarding aus und legen Sie ein NVIDIA-Modell fest:--token übergeben, denken Sie daran, dass es im Shell-Verlauf und in der ps-Ausgabe landet; bevorzugen Sie nach Möglichkeit die env var.
Konfigurations-Snippet
Modell-IDs
| Modellreferenz | Name | Kontext | Max. Ausgabe |
|---|---|---|---|
nvidia/nvidia/llama-3.1-nemotron-70b-instruct | NVIDIA Llama 3.1 Nemotron 70B Instruct | 131,072 | 4,096 |
nvidia/meta/llama-3.3-70b-instruct | Meta Llama 3.3 70B Instruct | 131,072 | 4,096 |
nvidia/nvidia/mistral-nemo-minitron-8b-8k-instruct | NVIDIA Mistral NeMo Minitron 8B Instruct | 8,192 | 2,048 |
Hinweise
- OpenAI-kompatibler
/v1-Endpunkt; verwenden Sie einen API-Schlüssel von NVIDIA NGC. - Der Provider wird automatisch aktiviert, wenn
NVIDIA_API_KEYgesetzt ist. - Der gebündelte Katalog ist statisch; Kosten sind im Quellcode standardmäßig auf
0gesetzt.