Providers

NVIDIA

NVIDIA menyediakan API yang kompatibel dengan OpenAI di https://integrate.api.nvidia.com/v1 untuk model terbuka secara gratis. Autentikasikan dengan kunci API dari build.nvidia.com. OpenClaw menyetel default penyedia NVIDIA ke Nemotron 3 Ultra, model penalaran aktif 550B total / 55B milik NVIDIA untuk pekerjaan agentik konteks panjang.

Mulai cepat

  • Dapatkan kunci API Anda

    Buat kunci API di build.nvidia.com.

  • Ekspor kunci dan jalankan onboarding

    bash
    export NVIDIA_API_KEY="nvapi-..."openclaw onboard --auth-choice nvidia-api-key
  • Tetapkan model NVIDIA

    bash
    openclaw models set nvidia/nvidia/nemotron-3-ultra-550b-a55b
  • Untuk penyiapan non-interaktif, Anda juga dapat meneruskan kunci secara langsung:

    bash
    openclaw onboard --auth-choice nvidia-api-key --nvidia-api-key "nvapi-..."

    Contoh konfigurasi

    json5
    {  env: { NVIDIA_API_KEY: "nvapi-..." },  models: {    providers: {      nvidia: {        baseUrl: "https://integrate.api.nvidia.com/v1",        api: "openai-completions",      },    },  },  agents: {    defaults: {      model: { primary: "nvidia/nvidia/nemotron-3-ultra-550b-a55b" },    },  },}

    Katalog unggulan

    Ketika kunci API NVIDIA dikonfigurasi, jalur penyiapan dan pemilihan model OpenClaw mencoba katalog model unggulan publik NVIDIA dari https://assets.ngc.nvidia.com/products/api-catalog/featured-models.json dan menyimpan hasil berperingkat dalam cache selama 24 jam. Karena itu, model unggulan baru dari build.nvidia.com muncul di permukaan penyiapan dan pemilihan model tanpa menunggu rilis OpenClaw. Ketika feed langsung tersedia, model pertama yang dikembalikan adalah opsi default yang ditampilkan selama penyiapan NVIDIA.

    Pengambilan menggunakan kebijakan host HTTPS tetap untuk assets.ngc.nvidia.com. Jika tidak ada kunci API NVIDIA yang dikonfigurasi, atau jika katalog publik tersebut tidak tersedia atau cacat, OpenClaw kembali ke katalog bawaan dan default bawaan di bawah.

    Nemotron 3 Ultra

    Nemotron 3 Ultra adalah model NVIDIA default di OpenClaw. Halaman build NVIDIA untuk nvidia/nemotron-3-ultra-550b-a55b mencantumkannya sebagai endpoint gratis yang tersedia dengan spesifikasi konteks 1 juta token. Katalog bawaan mencatat output maksimum 16.384 token agar sesuai dengan permintaan sampel yang kompatibel dengan OpenAI saat ini dari NVIDIA untuk endpoint yang di-host.

    Gunakan Ultra untuk default NVIDIA berkapabilitas tertinggi. Tetap pilih Super ketika Anda menginginkan opsi Nemotron 3 yang lebih kecil, atau pilih salah satu model pihak ketiga yang di-host di katalog NVIDIA ketika konteks, latensi, atau perilakunya lebih cocok. Baris Ultra bawaan mengirim chat_template_kwargs.enable_thinking: false dan force_nonempty_content: true secara default agar output chat normal tetap berada di jawaban yang terlihat alih-alih mengekspos teks penalaran.

    Katalog fallback bawaan

    Ref model Nama Konteks Output maks. Catatan
    nvidia/nvidia/nemotron-3-ultra-550b-a55b NVIDIA Nemotron 3 Ultra 550B 1,000,000 16,384 Default
    nvidia/nvidia/nemotron-3-super-120b-a12b NVIDIA Nemotron 3 Super 120B 1,048,576 8,192 Fallback unggulan
    nvidia/moonshotai/kimi-k2.5 Kimi K2.5 262,144 8,192 Fallback unggulan
    nvidia/minimaxai/minimax-m2.7 Minimax M2.7 196,608 8,192 Fallback unggulan
    nvidia/z-ai/glm-5.1 GLM 5.1 202,752 8,192 Fallback unggulan
    nvidia/minimaxai/minimax-m2.5 MiniMax M2.5 196,608 8,192 Tidak digunakan lagi, kompatibilitas upgrade
    nvidia/z-ai/glm5 GLM-5 202,752 8,192 Tidak digunakan lagi, kompatibilitas upgrade

    Konfigurasi lanjutan

    Perilaku aktif otomatis

    Penyedia aktif otomatis ketika variabel lingkungan NVIDIA_API_KEY ditetapkan. Tidak diperlukan konfigurasi penyedia eksplisit selain kunci tersebut.

    Katalog dan harga

    OpenClaw lebih memilih katalog model unggulan publik NVIDIA ketika autentikasi NVIDIA dikonfigurasi dan menyimpannya dalam cache selama 24 jam. Katalog fallback bawaan bersifat statis dan mempertahankan ref terkirim yang tidak digunakan lagi untuk kompatibilitas upgrade. Biaya default ke 0 di sumber karena NVIDIA saat ini menawarkan akses API gratis untuk model yang tercantum.

    Endpoint yang kompatibel dengan OpenAI

    NVIDIA menggunakan endpoint completions standar /v1. Tooling apa pun yang kompatibel dengan OpenAI seharusnya langsung berfungsi dengan URL dasar NVIDIA.

    Parameter penalaran Nemotron 3 Ultra

    Permintaan sampel Ultra NVIDIA menggunakan chat_template_kwargs.enable_thinking dan reasoning_budget untuk output penalaran. Baris Ultra bawaan OpenClaw menonaktifkan template thinking secara default untuk penggunaan chat normal. Jika Anda perlu ikut menggunakan output penalaran NVIDIA atau memaksa bidang permintaan khusus NVIDIA lainnya, tetapkan parameter per model dan jaga override khusus penyedia tetap terbatas pada model NVIDIA:

    json5
    {  agents: {    defaults: {      models: {        "nvidia/nvidia/nemotron-3-ultra-550b-a55b": {          params: {            chat_template_kwargs: { enable_thinking: true },            extra_body: { reasoning_budget: 16384 },          },        },      },    },  },}

    params.extra_body adalah override akhir body permintaan yang kompatibel dengan OpenAI, jadi gunakan hanya untuk bidang yang didokumentasikan NVIDIA untuk endpoint yang dipilih.

    Respons penyedia kustom yang lambat

    Beberapa model kustom yang di-host NVIDIA dapat memakan waktu lebih lama daripada watchdog idle model default sebelum memancarkan chunk respons pertama. Untuk entri penyedia NVIDIA kustom, naikkan timeout penyedia alih-alih menaikkan seluruh timeout runtime agen:

    json5
    {  models: {    providers: {      "custom-integrate-api-nvidia-com": {        baseUrl: "https://integrate.api.nvidia.com/v1",        api: "openai-completions",        apiKey: "NVIDIA_API_KEY",        timeoutSeconds: 300,      },    },  },  agents: {    defaults: {      models: {        "custom-integrate-api-nvidia-com/meta/llama-3.1-70b-instruct": {          params: { thinking: "off" },        },      },    },  },}

    Terkait

    Was this useful?
    On this page

    On this page