Providers

NVIDIA

NVIDIA มี API ที่เข้ากันได้กับ OpenAI ที่ https://integrate.api.nvidia.com/v1 สำหรับ โมเดลเปิดให้ใช้ฟรี ยืนยันตัวตนด้วยคีย์ API จาก build.nvidia.com OpenClaw ตั้งค่าเริ่มต้นของผู้ให้บริการ NVIDIA เป็น Nemotron 3 Ultra ซึ่งเป็นโมเดลเหตุผลแบบ active 55B / รวม 550B ของ NVIDIA สำหรับงานเอเจนต์บริบทยาว

เริ่มต้นใช้งาน

  • Get your API key

    สร้างคีย์ API ที่ build.nvidia.com

  • Export the key and run onboarding

    bash
    export NVIDIA_API_KEY="nvapi-..."openclaw onboard --auth-choice nvidia-api-key
  • Set an NVIDIA model

    bash
    openclaw models set nvidia/nvidia/nemotron-3-ultra-550b-a55b
  • สำหรับการตั้งค่าแบบไม่โต้ตอบ คุณยังสามารถส่งคีย์โดยตรงได้ด้วย:

    bash
    openclaw onboard --auth-choice nvidia-api-key --nvidia-api-key "nvapi-..."

    ตัวอย่างการกำหนดค่า

    json5
    {  env: { NVIDIA_API_KEY: "nvapi-..." },  models: {    providers: {      nvidia: {        baseUrl: "https://integrate.api.nvidia.com/v1",        api: "openai-completions",      },    },  },  agents: {    defaults: {      model: { primary: "nvidia/nvidia/nemotron-3-ultra-550b-a55b" },    },  },}

    แค็ตตาล็อกแนะนำ

    เมื่อกำหนดค่าคีย์ API ของ NVIDIA แล้ว เส้นทางการตั้งค่าและการเลือกโมเดลของ OpenClaw จะลองใช้แค็ตตาล็อกโมเดลแนะนำสาธารณะของ NVIDIA จาก https://assets.ngc.nvidia.com/products/api-catalog/featured-models.json และ แคชผลลัพธ์ที่จัดอันดับไว้ 24 ชั่วโมง ดังนั้นโมเดลแนะนำใหม่จาก build.nvidia.com จึงปรากฏในพื้นผิวการตั้งค่าและการเลือกโมเดลได้โดยไม่ต้องรอ รุ่นเผยแพร่ของ OpenClaw เมื่อฟีดสดพร้อมใช้งาน โมเดลแรกที่ส่งกลับมา จะเป็นตัวเลือกเริ่มต้นที่แสดงระหว่างการตั้งค่า NVIDIA

    การดึงข้อมูลใช้นโยบายโฮสต์ HTTPS แบบคงที่สำหรับ assets.ngc.nvidia.com หากไม่มีการ กำหนดค่าคีย์ API ของ NVIDIA หรือหากแค็ตตาล็อกสาธารณะนั้นไม่พร้อมใช้งานหรือ มีรูปแบบไม่ถูกต้อง OpenClaw จะถอยกลับไปใช้แค็ตตาล็อกที่บันเดิลมาและค่าเริ่มต้นที่บันเดิลมาด้านล่าง

    Nemotron 3 Ultra

    Nemotron 3 Ultra เป็นโมเดล NVIDIA เริ่มต้นใน OpenClaw หน้า build ของ NVIDIA สำหรับ nvidia/nemotron-3-ultra-550b-a55b ระบุว่าเป็น endpoint ฟรีที่พร้อมใช้งานพร้อมข้อกำหนดบริบท 1M-token แค็ตตาล็อกที่บันเดิลมาบันทึกเอาต์พุตสูงสุด 16,384 token เพื่อให้ตรงกับคำขอตัวอย่างแบบ เข้ากันได้กับ OpenAI ปัจจุบันของ NVIDIA สำหรับ endpoint ที่โฮสต์อยู่

    ใช้ Ultra สำหรับค่าเริ่มต้นของ NVIDIA ที่มีความสามารถสูงสุด เลือก Super ต่อไปเมื่อ คุณต้องการตัวเลือก Nemotron 3 ที่เล็กกว่า หรือเลือกหนึ่งในโมเดลจากบุคคลที่สาม ที่โฮสต์ในแค็ตตาล็อกของ NVIDIA เมื่อบริบท latency หรือพฤติกรรมของโมเดลเหล่านั้นเหมาะกว่า แถว Ultra ที่บันเดิลมาส่ง chat_template_kwargs.enable_thinking: false และ force_nonempty_content: true เป็นค่าเริ่มต้น เพื่อให้เอาต์พุตแชตปกติอยู่ใน คำตอบที่มองเห็นได้แทนที่จะเปิดเผยข้อความเหตุผล

    แค็ตตาล็อก fallback ที่บันเดิลมา

    Model ref ชื่อ บริบท เอาต์พุตสูงสุด หมายเหตุ
    nvidia/nvidia/nemotron-3-ultra-550b-a55b NVIDIA Nemotron 3 Ultra 550B 1,000,000 16,384 ค่าเริ่มต้น
    nvidia/nvidia/nemotron-3-super-120b-a12b NVIDIA Nemotron 3 Super 120B 262,144 8,192 fallback แนะนำ
    nvidia/moonshotai/kimi-k2.5 Kimi K2.5 262,144 8,192 fallback แนะนำ
    nvidia/minimaxai/minimax-m2.7 Minimax M2.7 196,608 8,192 fallback แนะนำ
    nvidia/z-ai/glm-5.1 GLM 5.1 202,752 8,192 fallback แนะนำ
    nvidia/minimaxai/minimax-m2.5 MiniMax M2.5 196,608 8,192 เลิกใช้แล้ว, ความเข้ากันได้สำหรับการอัปเกรด
    nvidia/z-ai/glm5 GLM-5 202,752 8,192 เลิกใช้แล้ว, ความเข้ากันได้สำหรับการอัปเกรด

    การกำหนดค่าขั้นสูง

    Auto-enable behavior

    ผู้ให้บริการจะเปิดใช้งานอัตโนมัติเมื่อตั้งค่าตัวแปรสภาพแวดล้อม NVIDIA_API_KEY ไม่จำเป็นต้องมีการกำหนดค่าผู้ให้บริการอย่างชัดเจนนอกเหนือจากคีย์

    Catalog and pricing

    OpenClaw จะเลือกใช้แค็ตตาล็อกโมเดลแนะนำสาธารณะของ NVIDIA เมื่อมีการกำหนดค่า auth ของ NVIDIA และแคชไว้ 24 ชั่วโมง แค็ตตาล็อก fallback ที่บันเดิลมาเป็นแบบคงที่ และเก็บ refs ที่เคยเผยแพร่แต่เลิกใช้แล้วไว้เพื่อความเข้ากันได้ในการอัปเกรด ค่าใช้จ่ายมีค่าเริ่มต้น เป็น 0 ในซอร์ส เนื่องจากปัจจุบัน NVIDIA ให้สิทธิ์เข้าถึง API ฟรีสำหรับ โมเดลที่ระบุไว้

    OpenAI-compatible endpoint

    NVIDIA ใช้ endpoint completions มาตรฐาน /v1 เครื่องมือใด ๆ ที่เข้ากันได้กับ OpenAI ควรใช้งานได้ทันทีด้วย base URL ของ NVIDIA

    Nemotron 3 Ultra reasoning params

    คำขอตัวอย่าง Ultra ของ NVIDIA ใช้ chat_template_kwargs.enable_thinking และ reasoning_budget สำหรับเอาต์พุตเหตุผล แถว Ultra ที่บันเดิลมากับ OpenClaw ปิดใช้ template thinking เป็นค่าเริ่มต้นสำหรับการใช้งานแชตปกติ หากคุณต้องการ เลือกใช้เอาต์พุตเหตุผลของ NVIDIA หรือบังคับฟิลด์คำขอเฉพาะของ NVIDIA อื่น ๆ ให้ตั้งค่า params รายโมเดลและจำกัด overrides เฉพาะผู้ให้บริการไว้กับ โมเดล NVIDIA:

    json5
    {  agents: {    defaults: {      models: {        "nvidia/nvidia/nemotron-3-ultra-550b-a55b": {          params: {            chat_template_kwargs: { enable_thinking: true },            extra_body: { reasoning_budget: 16384 },          },        },      },    },  },}

    params.extra_body คือ override ขั้นสุดท้ายของ request-body ที่เข้ากันได้กับ OpenAI ดังนั้น ให้ใช้เฉพาะกับฟิลด์ที่ NVIDIA จัดทำเอกสารไว้สำหรับ endpoint ที่เลือกเท่านั้น

    Slow custom provider responses

    โมเดล custom บางรุ่นที่โฮสต์โดย NVIDIA อาจใช้เวลานานกว่า watchdog idle ของโมเดลเริ่มต้น ก่อนจะส่ง chunk การตอบกลับแรก สำหรับรายการผู้ให้บริการ NVIDIA แบบ custom ให้เพิ่ม timeout ของผู้ให้บริการแทนการเพิ่ม timeout ของ runtime เอเจนต์ ทั้งหมด:

    json5
    {  models: {    providers: {      "custom-integrate-api-nvidia-com": {        baseUrl: "https://integrate.api.nvidia.com/v1",        api: "openai-completions",        apiKey: "NVIDIA_API_KEY",        timeoutSeconds: 300,      },    },  },  agents: {    defaults: {      models: {        "custom-integrate-api-nvidia-com/meta/llama-3.1-70b-instruct": {          params: { thinking: "off" },        },      },    },  },}

    ที่เกี่ยวข้อง

    Was this useful?
    On this page

    On this page