Providers
NVIDIA
NVIDIA มี API ที่เข้ากันได้กับ OpenAI ที่ https://integrate.api.nvidia.com/v1 สำหรับ
โมเดลเปิดให้ใช้ฟรี ยืนยันตัวตนด้วยคีย์ API จาก
build.nvidia.com OpenClaw
ตั้งค่าเริ่มต้นของผู้ให้บริการ NVIDIA เป็น Nemotron 3 Ultra ซึ่งเป็นโมเดลเหตุผลแบบ active 55B / รวม 550B
ของ NVIDIA สำหรับงานเอเจนต์บริบทยาว
เริ่มต้นใช้งาน
Get your API key
สร้างคีย์ API ที่ build.nvidia.com
Export the key and run onboarding
export NVIDIA_API_KEY="nvapi-..."openclaw onboard --auth-choice nvidia-api-keySet an NVIDIA model
openclaw models set nvidia/nvidia/nemotron-3-ultra-550b-a55bสำหรับการตั้งค่าแบบไม่โต้ตอบ คุณยังสามารถส่งคีย์โดยตรงได้ด้วย:
openclaw onboard --auth-choice nvidia-api-key --nvidia-api-key "nvapi-..."ตัวอย่างการกำหนดค่า
{ env: { NVIDIA_API_KEY: "nvapi-..." }, models: { providers: { nvidia: { baseUrl: "https://integrate.api.nvidia.com/v1", api: "openai-completions", }, }, }, agents: { defaults: { model: { primary: "nvidia/nvidia/nemotron-3-ultra-550b-a55b" }, }, },}แค็ตตาล็อกแนะนำ
เมื่อกำหนดค่าคีย์ API ของ NVIDIA แล้ว เส้นทางการตั้งค่าและการเลือกโมเดลของ OpenClaw
จะลองใช้แค็ตตาล็อกโมเดลแนะนำสาธารณะของ NVIDIA จาก
https://assets.ngc.nvidia.com/products/api-catalog/featured-models.json และ
แคชผลลัพธ์ที่จัดอันดับไว้ 24 ชั่วโมง ดังนั้นโมเดลแนะนำใหม่จาก build.nvidia.com
จึงปรากฏในพื้นผิวการตั้งค่าและการเลือกโมเดลได้โดยไม่ต้องรอ
รุ่นเผยแพร่ของ OpenClaw เมื่อฟีดสดพร้อมใช้งาน โมเดลแรกที่ส่งกลับมา
จะเป็นตัวเลือกเริ่มต้นที่แสดงระหว่างการตั้งค่า NVIDIA
การดึงข้อมูลใช้นโยบายโฮสต์ HTTPS แบบคงที่สำหรับ assets.ngc.nvidia.com หากไม่มีการ
กำหนดค่าคีย์ API ของ NVIDIA หรือหากแค็ตตาล็อกสาธารณะนั้นไม่พร้อมใช้งานหรือ
มีรูปแบบไม่ถูกต้อง OpenClaw จะถอยกลับไปใช้แค็ตตาล็อกที่บันเดิลมาและค่าเริ่มต้นที่บันเดิลมาด้านล่าง
Nemotron 3 Ultra
Nemotron 3 Ultra เป็นโมเดล NVIDIA เริ่มต้นใน OpenClaw หน้า build ของ NVIDIA สำหรับ
nvidia/nemotron-3-ultra-550b-a55b
ระบุว่าเป็น endpoint ฟรีที่พร้อมใช้งานพร้อมข้อกำหนดบริบท 1M-token
แค็ตตาล็อกที่บันเดิลมาบันทึกเอาต์พุตสูงสุด 16,384 token เพื่อให้ตรงกับคำขอตัวอย่างแบบ
เข้ากันได้กับ OpenAI ปัจจุบันของ NVIDIA สำหรับ endpoint ที่โฮสต์อยู่
ใช้ Ultra สำหรับค่าเริ่มต้นของ NVIDIA ที่มีความสามารถสูงสุด เลือก Super ต่อไปเมื่อ
คุณต้องการตัวเลือก Nemotron 3 ที่เล็กกว่า หรือเลือกหนึ่งในโมเดลจากบุคคลที่สาม
ที่โฮสต์ในแค็ตตาล็อกของ NVIDIA เมื่อบริบท latency หรือพฤติกรรมของโมเดลเหล่านั้นเหมาะกว่า
แถว Ultra ที่บันเดิลมาส่ง chat_template_kwargs.enable_thinking: false และ
force_nonempty_content: true เป็นค่าเริ่มต้น เพื่อให้เอาต์พุตแชตปกติอยู่ใน
คำตอบที่มองเห็นได้แทนที่จะเปิดเผยข้อความเหตุผล
แค็ตตาล็อก fallback ที่บันเดิลมา
| Model ref | ชื่อ | บริบท | เอาต์พุตสูงสุด | หมายเหตุ |
|---|---|---|---|---|
nvidia/nvidia/nemotron-3-ultra-550b-a55b |
NVIDIA Nemotron 3 Ultra 550B | 1,000,000 | 16,384 | ค่าเริ่มต้น |
nvidia/nvidia/nemotron-3-super-120b-a12b |
NVIDIA Nemotron 3 Super 120B | 262,144 | 8,192 | fallback แนะนำ |
nvidia/moonshotai/kimi-k2.5 |
Kimi K2.5 | 262,144 | 8,192 | fallback แนะนำ |
nvidia/minimaxai/minimax-m2.7 |
Minimax M2.7 | 196,608 | 8,192 | fallback แนะนำ |
nvidia/z-ai/glm-5.1 |
GLM 5.1 | 202,752 | 8,192 | fallback แนะนำ |
nvidia/minimaxai/minimax-m2.5 |
MiniMax M2.5 | 196,608 | 8,192 | เลิกใช้แล้ว, ความเข้ากันได้สำหรับการอัปเกรด |
nvidia/z-ai/glm5 |
GLM-5 | 202,752 | 8,192 | เลิกใช้แล้ว, ความเข้ากันได้สำหรับการอัปเกรด |
การกำหนดค่าขั้นสูง
Auto-enable behavior
ผู้ให้บริการจะเปิดใช้งานอัตโนมัติเมื่อตั้งค่าตัวแปรสภาพแวดล้อม NVIDIA_API_KEY
ไม่จำเป็นต้องมีการกำหนดค่าผู้ให้บริการอย่างชัดเจนนอกเหนือจากคีย์
Catalog and pricing
OpenClaw จะเลือกใช้แค็ตตาล็อกโมเดลแนะนำสาธารณะของ NVIDIA เมื่อมีการกำหนดค่า auth ของ NVIDIA
และแคชไว้ 24 ชั่วโมง แค็ตตาล็อก fallback ที่บันเดิลมาเป็นแบบคงที่
และเก็บ refs ที่เคยเผยแพร่แต่เลิกใช้แล้วไว้เพื่อความเข้ากันได้ในการอัปเกรด ค่าใช้จ่ายมีค่าเริ่มต้น
เป็น 0 ในซอร์ส เนื่องจากปัจจุบัน NVIDIA ให้สิทธิ์เข้าถึง API ฟรีสำหรับ
โมเดลที่ระบุไว้
OpenAI-compatible endpoint
NVIDIA ใช้ endpoint completions มาตรฐาน /v1 เครื่องมือใด ๆ ที่เข้ากันได้กับ OpenAI
ควรใช้งานได้ทันทีด้วย base URL ของ NVIDIA
Nemotron 3 Ultra reasoning params
คำขอตัวอย่าง Ultra ของ NVIDIA ใช้ chat_template_kwargs.enable_thinking
และ reasoning_budget สำหรับเอาต์พุตเหตุผล แถว Ultra ที่บันเดิลมากับ OpenClaw
ปิดใช้ template thinking เป็นค่าเริ่มต้นสำหรับการใช้งานแชตปกติ หากคุณต้องการ
เลือกใช้เอาต์พุตเหตุผลของ NVIDIA หรือบังคับฟิลด์คำขอเฉพาะของ NVIDIA อื่น ๆ
ให้ตั้งค่า params รายโมเดลและจำกัด overrides เฉพาะผู้ให้บริการไว้กับ
โมเดล NVIDIA:
{ agents: { defaults: { models: { "nvidia/nvidia/nemotron-3-ultra-550b-a55b": { params: { chat_template_kwargs: { enable_thinking: true }, extra_body: { reasoning_budget: 16384 }, }, }, }, }, },}params.extra_body คือ override ขั้นสุดท้ายของ request-body ที่เข้ากันได้กับ OpenAI ดังนั้น
ให้ใช้เฉพาะกับฟิลด์ที่ NVIDIA จัดทำเอกสารไว้สำหรับ endpoint ที่เลือกเท่านั้น
Slow custom provider responses
โมเดล custom บางรุ่นที่โฮสต์โดย NVIDIA อาจใช้เวลานานกว่า watchdog idle ของโมเดลเริ่มต้น ก่อนจะส่ง chunk การตอบกลับแรก สำหรับรายการผู้ให้บริการ NVIDIA แบบ custom ให้เพิ่ม timeout ของผู้ให้บริการแทนการเพิ่ม timeout ของ runtime เอเจนต์ ทั้งหมด:
{ models: { providers: { "custom-integrate-api-nvidia-com": { baseUrl: "https://integrate.api.nvidia.com/v1", api: "openai-completions", apiKey: "NVIDIA_API_KEY", timeoutSeconds: 300, }, }, }, agents: { defaults: { models: { "custom-integrate-api-nvidia-com/meta/llama-3.1-70b-instruct": { params: { thinking: "off" }, }, }, }, },}