Providers
NVIDIA
NVIDIA menyediakan API yang kompatibel dengan OpenAI di https://integrate.api.nvidia.com/v1 untuk
model terbuka secara gratis. Autentikasikan dengan kunci API dari
build.nvidia.com. OpenClaw
menyetel default penyedia NVIDIA ke Nemotron 3 Ultra, model penalaran aktif
550B total / 55B milik NVIDIA untuk pekerjaan agentik konteks panjang.
Mulai cepat
Dapatkan kunci API Anda
Buat kunci API di build.nvidia.com.
Ekspor kunci dan jalankan onboarding
export NVIDIA_API_KEY="nvapi-..."openclaw onboard --auth-choice nvidia-api-keyTetapkan model NVIDIA
openclaw models set nvidia/nvidia/nemotron-3-ultra-550b-a55bUntuk penyiapan non-interaktif, Anda juga dapat meneruskan kunci secara langsung:
openclaw onboard --auth-choice nvidia-api-key --nvidia-api-key "nvapi-..."Contoh konfigurasi
{ env: { NVIDIA_API_KEY: "nvapi-..." }, models: { providers: { nvidia: { baseUrl: "https://integrate.api.nvidia.com/v1", api: "openai-completions", }, }, }, agents: { defaults: { model: { primary: "nvidia/nvidia/nemotron-3-ultra-550b-a55b" }, }, },}Katalog unggulan
Ketika kunci API NVIDIA dikonfigurasi, jalur penyiapan dan pemilihan model OpenClaw
mencoba katalog model unggulan publik NVIDIA dari
https://assets.ngc.nvidia.com/products/api-catalog/featured-models.json dan
menyimpan hasil berperingkat dalam cache selama 24 jam. Karena itu, model unggulan baru dari build.nvidia.com
muncul di permukaan penyiapan dan pemilihan model tanpa menunggu
rilis OpenClaw. Ketika feed langsung tersedia, model pertama yang dikembalikan adalah
opsi default yang ditampilkan selama penyiapan NVIDIA.
Pengambilan menggunakan kebijakan host HTTPS tetap untuk assets.ngc.nvidia.com. Jika tidak ada
kunci API NVIDIA yang dikonfigurasi, atau jika katalog publik tersebut tidak tersedia atau
cacat, OpenClaw kembali ke katalog bawaan dan default bawaan di bawah.
Nemotron 3 Ultra
Nemotron 3 Ultra adalah model NVIDIA default di OpenClaw. Halaman build NVIDIA untuk
nvidia/nemotron-3-ultra-550b-a55b
mencantumkannya sebagai endpoint gratis yang tersedia dengan spesifikasi konteks 1 juta token.
Katalog bawaan mencatat output maksimum 16.384 token agar sesuai dengan permintaan sampel
yang kompatibel dengan OpenAI saat ini dari NVIDIA untuk endpoint yang di-host.
Gunakan Ultra untuk default NVIDIA berkapabilitas tertinggi. Tetap pilih Super ketika
Anda menginginkan opsi Nemotron 3 yang lebih kecil, atau pilih salah satu model pihak ketiga
yang di-host di katalog NVIDIA ketika konteks, latensi, atau perilakunya lebih cocok.
Baris Ultra bawaan mengirim chat_template_kwargs.enable_thinking: false dan
force_nonempty_content: true secara default agar output chat normal tetap berada di
jawaban yang terlihat alih-alih mengekspos teks penalaran.
Katalog fallback bawaan
| Ref model | Nama | Konteks | Output maks. | Catatan |
|---|---|---|---|---|
nvidia/nvidia/nemotron-3-ultra-550b-a55b |
NVIDIA Nemotron 3 Ultra 550B | 1,000,000 | 16,384 | Default |
nvidia/nvidia/nemotron-3-super-120b-a12b |
NVIDIA Nemotron 3 Super 120B | 1,048,576 | 8,192 | Fallback unggulan |
nvidia/moonshotai/kimi-k2.5 |
Kimi K2.5 | 262,144 | 8,192 | Fallback unggulan |
nvidia/minimaxai/minimax-m2.7 |
Minimax M2.7 | 196,608 | 8,192 | Fallback unggulan |
nvidia/z-ai/glm-5.1 |
GLM 5.1 | 202,752 | 8,192 | Fallback unggulan |
nvidia/minimaxai/minimax-m2.5 |
MiniMax M2.5 | 196,608 | 8,192 | Tidak digunakan lagi, kompatibilitas upgrade |
nvidia/z-ai/glm5 |
GLM-5 | 202,752 | 8,192 | Tidak digunakan lagi, kompatibilitas upgrade |
Konfigurasi lanjutan
Perilaku aktif otomatis
Penyedia aktif otomatis ketika variabel lingkungan NVIDIA_API_KEY ditetapkan.
Tidak diperlukan konfigurasi penyedia eksplisit selain kunci tersebut.
Katalog dan harga
OpenClaw lebih memilih katalog model unggulan publik NVIDIA ketika autentikasi NVIDIA
dikonfigurasi dan menyimpannya dalam cache selama 24 jam. Katalog fallback bawaan bersifat statis
dan mempertahankan ref terkirim yang tidak digunakan lagi untuk kompatibilitas upgrade. Biaya default
ke 0 di sumber karena NVIDIA saat ini menawarkan akses API gratis untuk
model yang tercantum.
Endpoint yang kompatibel dengan OpenAI
NVIDIA menggunakan endpoint completions standar /v1. Tooling apa pun yang kompatibel dengan OpenAI
seharusnya langsung berfungsi dengan URL dasar NVIDIA.
Parameter penalaran Nemotron 3 Ultra
Permintaan sampel Ultra NVIDIA menggunakan chat_template_kwargs.enable_thinking
dan reasoning_budget untuk output penalaran. Baris Ultra bawaan OpenClaw
menonaktifkan template thinking secara default untuk penggunaan chat normal. Jika Anda perlu
ikut menggunakan output penalaran NVIDIA atau memaksa bidang permintaan khusus NVIDIA lainnya,
tetapkan parameter per model dan jaga override khusus penyedia tetap terbatas pada
model NVIDIA:
{ agents: { defaults: { models: { "nvidia/nvidia/nemotron-3-ultra-550b-a55b": { params: { chat_template_kwargs: { enable_thinking: true }, extra_body: { reasoning_budget: 16384 }, }, }, }, }, },}params.extra_body adalah override akhir body permintaan yang kompatibel dengan OpenAI, jadi
gunakan hanya untuk bidang yang didokumentasikan NVIDIA untuk endpoint yang dipilih.
Respons penyedia kustom yang lambat
Beberapa model kustom yang di-host NVIDIA dapat memakan waktu lebih lama daripada watchdog idle model default sebelum memancarkan chunk respons pertama. Untuk entri penyedia NVIDIA kustom, naikkan timeout penyedia alih-alih menaikkan seluruh timeout runtime agen:
{ models: { providers: { "custom-integrate-api-nvidia-com": { baseUrl: "https://integrate.api.nvidia.com/v1", api: "openai-completions", apiKey: "NVIDIA_API_KEY", timeoutSeconds: 300, }, }, }, agents: { defaults: { models: { "custom-integrate-api-nvidia-com/meta/llama-3.1-70b-instruct": { params: { thinking: "off" }, }, }, }, },}