Providers
xAI
OpenClaw มาพร้อม Plugin ผู้ให้บริการ xai แบบบันเดิลสำหรับโมเดล Grok สำหรับผู้ใช้ส่วนใหญ่
เส้นทางที่แนะนำคือ Grok OAuth พร้อมการสมัครสมาชิก SuperGrok หรือ X Premium
ที่เข้าเกณฑ์ OpenClaw ยังคงเน้นการทำงานบนเครื่องเป็นหลัก: Gateway, การกำหนดค่า, การกำหนดเส้นทาง และ
เครื่องมือจะทำงานบนเครื่องของคุณ ส่วนคำขอโมเดล Grok จะยืนยันตัวตนผ่าน xAI
และส่งไปยัง API ของ xAI
OAuth ไม่ต้องใช้คีย์ API ของ xAI และไม่ต้องใช้แอป Grok Build xAI อาจยังแสดง Grok Build บนหน้าจอขอความยินยอม เนื่องจาก OpenClaw ใช้ OAuth client แบบใช้ร่วมกันของ xAI
เลือกเส้นทางการตั้งค่าของคุณ
ใช้เส้นทางที่ตรงกับสถานะการติดตั้ง OpenClaw ของคุณ:
New OpenClaw install
เรียกใช้การเริ่มต้นใช้งานพร้อมติดตั้ง daemon เมื่อคุณกำลังตั้งค่า Gateway ภายในเครื่องใหม่ จากนั้นเลือกตัวเลือก xAI/Grok OAuth ในขั้นตอนโมเดล/การยืนยันตัวตน:
openclaw onboard --install-daemonบน VPS หรือผ่าน SSH ให้เลือก xAI OAuth โดยตรง; OpenClaw ใช้การตรวจสอบด้วย device-code และไม่ต้องใช้ localhost callback:
openclaw onboard --install-daemon --auth-choice xai-oauthOAuth ไม่ต้องใช้คีย์ API ของ xAI OpenClaw ไม่ต้องใช้แอป Grok Build xAI อาจยังติดป้ายแอปขอความยินยอมเป็น Grok Build เนื่องจาก OpenClaw ใช้ OAuth client แบบใช้ร่วมกันของ xAI
Existing OpenClaw install
หากกำหนดค่า OpenClaw ไว้แล้ว ให้ลงชื่อเข้าใช้ xAI เท่านั้น อย่าเรียกใช้การเริ่มต้นใช้งานเต็มรูปแบบซ้ำ หรือติดตั้ง daemon ใหม่เพียงเพื่อเชื่อมต่อ Grok:
openclaw models auth login --provider xai --method oauthหากต้องการทำให้ Grok เป็นโมเดลเริ่มต้นหลังลงชื่อเข้าใช้ ให้ตั้งค่าแยกต่างหาก:
openclaw models set xai/grok-4.3เรียกใช้การเริ่มต้นใช้งานเต็มรูปแบบซ้ำเฉพาะเมื่อคุณตั้งใจจะเปลี่ยน Gateway, daemon, ช่องทาง, พื้นที่ทำงาน หรือตัวเลือกการตั้งค่าอื่น ๆ
API-key path
การตั้งค่าด้วยคีย์ API ยังคงใช้งานได้สำหรับคีย์ xAI Console และสำหรับพื้นผิวสื่อที่ ต้องใช้การกำหนดค่าผู้ให้บริการที่มีคีย์รองรับ:
openclaw models auth login --provider xai --method api-keyexport XAI_API_KEY=xai-...Pick a model
{ agents: { defaults: { model: { primary: "xai/grok-4.3" } } },}การแก้ปัญหา OAuth
-
สำหรับ SSH, Docker, VPS หรือการตั้งค่าระยะไกลอื่น ๆ ให้ใช้
openclaw models auth login --provider xai --method oauth; xAI OAuth ใช้ การตรวจสอบด้วย device-code แทน localhost callback -
หากลงชื่อเข้าใช้สำเร็จแต่ Grok ไม่ใช่โมเดลเริ่มต้น ให้เรียกใช้
openclaw models set xai/grok-4.3 -
หากต้องการตรวจสอบโปรไฟล์การยืนยันตัวตน xAI ที่บันทึกไว้ ให้เรียกใช้:
bash openclaw models auth list --provider xaiopenclaw models status -
xAI เป็นผู้ตัดสินใจว่าบัญชีใดสามารถรับ OAuth API tokens ได้ หากบัญชีไม่ เข้าเกณฑ์ ให้ลองใช้เส้นทางคีย์ API หรือตรวจสอบการสมัครสมาชิกฝั่ง xAI
แค็ตตาล็อกในตัว
OpenClaw มีโมเดลแชต xAI ปัจจุบันมาให้ตั้งแต่ต้น โดยเรียงจากใหม่ที่สุด ก่อนในตัวเลือกโมเดล:
| ตระกูล | ID โมเดล |
|---|---|
| Grok Build 0.1 | grok-build-0.1 |
| Grok 4.3 | grok-4.3 |
| Grok 4.20 Beta | grok-4.20-beta-latest-reasoning, grok-4.20-beta-latest-non-reasoning |
Plugin ยังคง forward-resolve slug เก่าอย่าง Grok 3, Grok 4, Grok 4 Fast, Grok 4.1
Fast และ Grok Code สำหรับการกำหนดค่าที่มีอยู่ alias อย่างเป็นทางการของ Grok Code Fast
จะ normalize เป็น grok-build-0.1; OpenClaw จะไม่แสดง slug upstream ที่เลิกใช้แล้วอื่น ๆ
ในแค็ตตาล็อกที่เลือกได้อีกต่อไป
การครอบคลุมฟีเจอร์ของ OpenClaw
Plugin แบบบันเดิลจะแมปพื้นผิว API สาธารณะปัจจุบันของ xAI เข้ากับสัญญา ผู้ให้บริการและเครื่องมือแบบใช้ร่วมกันของ OpenClaw ความสามารถที่ไม่เข้ากับสัญญาแบบใช้ร่วมกัน (เช่น streaming TTS และเสียงแบบ realtime) จะไม่ถูกเปิดเผย - ดูตาราง ด้านล่าง
| ความสามารถของ xAI | พื้นผิว OpenClaw | สถานะ |
|---|---|---|
| Chat / Responses | ผู้ให้บริการโมเดล xai/<model> |
ใช่ |
| การค้นเว็บฝั่งเซิร์ฟเวอร์ | ผู้ให้บริการ web_search grok |
ใช่ |
| การค้น X ฝั่งเซิร์ฟเวอร์ | เครื่องมือ x_search |
ใช่ |
| การรันโค้ดฝั่งเซิร์ฟเวอร์ | เครื่องมือ code_execution |
ใช่ |
| รูปภาพ | image_generate |
ใช่ |
| วิดีโอ | video_generate |
ใช่ |
| Batch text-to-speech | messages.tts.provider: "xai" / tts |
ใช่ |
| Streaming TTS | - | ไม่เปิดเผย; สัญญา TTS ของ OpenClaw ส่งคืนบัฟเฟอร์เสียงที่สมบูรณ์ |
| Batch speech-to-text | tools.media.audio / ความเข้าใจสื่อ |
ใช่ |
| Streaming speech-to-text | Voice Call streaming.provider: "xai" |
ใช่ |
| เสียงแบบ Realtime | - | ยังไม่เปิดเผย; ใช้สัญญา session/WebSocket ที่แตกต่างกัน |
| ไฟล์ / batches | เฉพาะความเข้ากันได้กับ API โมเดลทั่วไป | ไม่ใช่เครื่องมือ OpenClaw แบบ first-class |
การแมปโหมดเร็ว
/fast on หรือ agents.defaults.models["xai/<model>"].params.fastMode: true
จะเขียนคำขอ xAI แบบ native ใหม่ดังนี้:
| โมเดลต้นทาง | เป้าหมายโหมดเร็ว |
|---|---|
grok-3 |
grok-3-fast |
grok-3-mini |
grok-3-mini-fast |
grok-4 |
grok-4-fast |
grok-4-0709 |
grok-4-fast |
alias ความเข้ากันได้แบบ legacy
alias แบบ legacy ยังคง normalize ไปยัง ID แบบบันเดิลที่เป็น canonical:
| alias แบบ legacy | ID canonical |
|---|---|
grok-code-fast-1 |
grok-build-0.1 |
grok-code-fast |
grok-build-0.1 |
grok-code-fast-1-0825 |
grok-build-0.1 |
grok-4-fast-reasoning |
grok-4-fast |
grok-4-1-fast-reasoning |
grok-4-1-fast |
grok-4.20-reasoning |
grok-4.20-beta-latest-reasoning |
grok-4.20-non-reasoning |
grok-4.20-beta-latest-non-reasoning |
ฟีเจอร์
Web search
ผู้ให้บริการ web-search grok แบบบันเดิลจะเลือกใช้ xAI OAuth ก่อน แล้วจึงถอยกลับ
ไปใช้ XAI_API_KEY หรือคีย์ web-search ของ Plugin:
openclaw models auth login --provider xai --method oauthopenclaw config set tools.web.search.provider grokVideo generation
Plugin xai แบบบันเดิลลงทะเบียนการสร้างวิดีโอผ่านเครื่องมือแบบใช้ร่วมกัน
video_generate
- โมเดลวิดีโอเริ่มต้น:
xai/grok-imagine-video - โหมด: text-to-video, image-to-video, การสร้าง reference-image, การแก้ไขวิดีโอระยะไกล และการต่อขยายวิดีโอระยะไกล
- อัตราส่วนภาพ:
1:1,16:9,9:16,4:3,3:4,3:2,2:3 - ความละเอียด:
480P,720P - ระยะเวลา: 1-15 วินาทีสำหรับการสร้าง/image-to-video, 1-10 วินาทีเมื่อ
ใช้บทบาท
reference_image, 2-10 วินาทีสำหรับการต่อขยาย - การสร้าง reference-image: ตั้งค่า
imageRolesเป็นreference_imageสำหรับ รูปภาพที่ให้มาทุกภาพ; xAI รับรูปภาพดังกล่าวได้สูงสุด 7 ภาพ - timeout การดำเนินการเริ่มต้น: 600 วินาที เว้นแต่จะตั้งค่า
video_generate.timeoutMsหรือagents.defaults.videoGenerationModel.timeoutMs
หากต้องการใช้ xAI เป็นผู้ให้บริการวิดีโอเริ่มต้น:
{ agents: { defaults: { videoGenerationModel: { primary: "xai/grok-imagine-video", }, }, },}Image generation
Plugin xai แบบบันเดิลลงทะเบียนการสร้างรูปภาพผ่านเครื่องมือแบบใช้ร่วมกัน
image_generate
- โมเดลรูปภาพเริ่มต้น:
xai/grok-imagine-image - โมเดลเพิ่มเติม:
xai/grok-imagine-image-quality - โหมด: text-to-image และการแก้ไข reference-image
- อินพุตอ้างอิง:
imageหนึ่งรายการ หรือimagesสูงสุดห้ารายการ - อัตราส่วนภาพ:
1:1,16:9,9:16,4:3,3:4,2:3,3:2 - ความละเอียด:
1K,2K - จำนวน: สูงสุด 4 รูปภาพ
- timeout การดำเนินการเริ่มต้น: 600 วินาที เว้นแต่จะตั้งค่า
image_generate.timeoutMsหรือagents.defaults.imageGenerationModel.timeoutMs
OpenClaw ขอการตอบกลับรูปภาพแบบ b64_json จาก xAI เพื่อให้สื่อที่สร้างขึ้นสามารถ
จัดเก็บและส่งผ่านเส้นทางไฟล์แนบของช่องทางปกติได้ รูปภาพอ้างอิงภายในเครื่อง
จะถูกแปลงเป็น data URL; การอ้างอิง http(s) ระยะไกลจะถูกส่งผ่านตามเดิม
หากต้องการใช้ xAI เป็นผู้ให้บริการรูปภาพเริ่มต้น:
{ agents: { defaults: { imageGenerationModel: { primary: "xai/grok-imagine-image", }, }, },}ข้อความเป็นเสียงพูด
Plugin xai ที่รวมมาให้ลงทะเบียนข้อความเป็นเสียงพูดผ่านพื้นผิวผู้ให้บริการ tts
ที่ใช้ร่วมกัน
- เสียง:
eve,ara,rex,sal,leo,una - เสียงเริ่มต้น:
eve - รูปแบบ:
mp3,wav,pcm,mulaw,alaw - ภาษา: รหัส BCP-47 หรือ
auto - ความเร็ว: การแทนที่ความเร็วแบบเนทีฟของผู้ให้บริการ
- ไม่รองรับรูปแบบข้อความเสียง Opus แบบเนทีฟ
หากต้องการใช้ xAI เป็นผู้ให้บริการ TTS เริ่มต้น:
{ messages: { tts: { provider: "xai", providers: { xai: { speakerVoiceId: "eve", }, }, }, },}เสียงพูดเป็นข้อความ
Plugin xai ที่รวมมาให้ลงทะเบียนเสียงพูดเป็นข้อความแบบแบตช์ผ่านพื้นผิวการถอดเสียง
เพื่อทำความเข้าใจสื่อของ OpenClaw
- โมเดลเริ่มต้น:
grok-stt - ปลายทาง: xAI REST
/v1/stt - เส้นทางอินพุต: การอัปโหลดไฟล์เสียงแบบ multipart
- OpenClaw รองรับทุกที่ที่การถอดเสียงขาเข้าใช้
tools.media.audioรวมถึงเซกเมนต์ช่องเสียงของ Discord และ ไฟล์แนบเสียงของช่องทาง
หากต้องการบังคับใช้ xAI สำหรับการถอดเสียงขาเข้า:
{ tools: { media: { audio: { models: [ { type: "provider", provider: "xai", model: "grok-stt", }, ], }, }, },}สามารถระบุภาษาได้ผ่านการกำหนดค่าสื่อเสียงที่ใช้ร่วมกัน หรือผ่านคำขอถอดเสียง รายครั้ง พื้นผิว OpenClaw ที่ใช้ร่วมกันยอมรับคำใบ้พรอมป์ แต่การผสานรวม xAI REST STT จะส่งต่อเฉพาะไฟล์ โมเดล และภาษา เพราะสิ่งเหล่านี้แมปกับปลายทาง xAI สาธารณะ ในปัจจุบันได้อย่างชัดเจน
เสียงพูดเป็นข้อความแบบสตรีม
Plugin xai ที่รวมมาให้ยังลงทะเบียนผู้ให้บริการถอดเสียงแบบเรียลไทม์
สำหรับเสียงการโทรสด
- ปลายทาง: xAI WebSocket
wss://api.x.ai/v1/stt - การเข้ารหัสเริ่มต้น:
mulaw - อัตราสุ่มตัวอย่างเริ่มต้น:
8000 - การกำหนดจุดสิ้นสุดเริ่มต้น:
800ms - ข้อความถอดเสียงระหว่างทาง: เปิดใช้เป็นค่าเริ่มต้น
สตรีมสื่อ Twilio ของ Voice Call ส่งเฟรมเสียง G.711 µ-law ดังนั้น ผู้ให้บริการ xAI จึงส่งต่อเฟรมเหล่านั้นได้โดยตรงโดยไม่ต้องแปลงรหัส:
{ plugins: { entries: { "voice-call": { config: { streaming: { enabled: true, provider: "xai", providers: { xai: { apiKey: "${XAI_API_KEY}", endpointingMs: 800, language: "en", }, }, }, }, }, }, },}การกำหนดค่าที่ผู้ให้บริการเป็นเจ้าของอยู่ภายใต้
plugins.entries.voice-call.config.streaming.providers.xai คีย์ที่รองรับคือ
apiKey, baseUrl, sampleRate, encoding (pcm, mulaw หรือ
alaw), interimResults, endpointingMs และ language
การกำหนดค่า x_search
Plugin xAI ที่รวมมาให้เปิดเผย x_search เป็นเครื่องมือของ OpenClaw สำหรับค้นหา
เนื้อหา X (เดิมคือ Twitter) ผ่าน Grok
เส้นทางการกำหนดค่า: plugins.entries.xai.config.xSearch
| คีย์ | ประเภท | ค่าเริ่มต้น | คำอธิบาย |
|---|---|---|---|
enabled |
boolean | - | เปิดหรือปิดใช้ x_search |
model |
string | grok-4-1-fast |
โมเดลที่ใช้สำหรับคำขอ x_search |
baseUrl |
string | - | การแทนที่ URL ฐานของ xAI Responses |
inlineCitations |
boolean | - | รวมการอ้างอิงแบบอินไลน์ในผลลัพธ์ |
maxTurns |
number | - | จำนวนรอบสนทนาสูงสุด |
timeoutSeconds |
number | - | หมดเวลาคำขอเป็นวินาที |
cacheTtlMinutes |
number | - | อายุการใช้งานแคชเป็นนาที |
{ plugins: { entries: { xai: { config: { xSearch: { enabled: true, model: "grok-4-1-fast", baseUrl: "https://api.x.ai/v1", inlineCitations: true, }, }, }, }, },}การกำหนดค่าการเรียกใช้โค้ด
Plugin xAI ที่รวมมาให้เปิดเผย code_execution เป็นเครื่องมือของ OpenClaw สำหรับ
การเรียกใช้โค้ดระยะไกลในสภาพแวดล้อมแซนด์บ็อกซ์ของ xAI
เส้นทางการกำหนดค่า: plugins.entries.xai.config.codeExecution
| คีย์ | ประเภท | ค่าเริ่มต้น | คำอธิบาย |
|---|---|---|---|
enabled |
boolean | true (หากมีคีย์พร้อมใช้) |
เปิดหรือปิดใช้การเรียกใช้โค้ด |
model |
string | grok-4-1-fast |
โมเดลที่ใช้สำหรับคำขอเรียกใช้โค้ด |
maxTurns |
number | - | จำนวนรอบสนทนาสูงสุด |
timeoutSeconds |
number | - | หมดเวลาคำขอเป็นวินาที |
{ plugins: { entries: { xai: { config: { codeExecution: { enabled: true, model: "grok-4-1-fast", }, }, }, }, },}ข้อจำกัดที่ทราบ
- การยืนยันตัวตน xAI สามารถใช้คีย์ API, ตัวแปรสภาพแวดล้อม, ค่าถอยกลับจากการกำหนดค่า Plugin หรือ OAuth กับบัญชี xAI ที่เข้าเกณฑ์ OAuth ใช้การยืนยันด้วยรหัสอุปกรณ์ โดยไม่มี callback localhost xAI เป็นผู้ตัดสินว่าบัญชีใดรับโทเค็น API ผ่าน OAuth ได้ และหน้าความยินยอมอาจแสดง Grok Build แม้ว่า OpenClaw จะไม่ต้องใช้แอป Grok Build
- ปัจจุบัน OpenClaw ยังไม่เปิดเผยตระกูลโมเดลหลายเอเจนต์ของ xAI xAI ให้บริการโมเดลเหล่านี้ผ่าน Responses API แต่โมเดลเหล่านี้ไม่รับ เครื่องมือฝั่งไคลเอนต์หรือเครื่องมือกำหนดเองที่ลูปเอเจนต์ร่วมของ OpenClaw ใช้ ดู ข้อจำกัดหลายเอเจนต์ของ xAI
- เสียง xAI Realtime ยังไม่ได้ลงทะเบียนเป็นผู้ให้บริการ OpenClaw จำเป็นต้องมีสัญญาเซสชันเสียงสองทิศทางที่ต่างจาก STT แบบแบตช์หรือ การถอดเสียงแบบสตรีม
- รูปภาพ xAI
quality, รูปภาพmaskและอัตราส่วนภาพเพิ่มเติมที่เป็นเนทีฟเท่านั้น จะไม่ถูกเปิดเผยจนกว่าเครื่องมือimage_generateที่ใช้ร่วมกันจะมี ตัวควบคุมแบบข้ามผู้ให้บริการที่สอดคล้องกัน
หมายเหตุขั้นสูง
- OpenClaw ใช้การแก้ไขความเข้ากันได้ของสคีมาเครื่องมือและการเรียกเครื่องมือเฉพาะ xAI โดยอัตโนมัติบนเส้นทางตัวรันที่ใช้ร่วมกัน
- คำขอ xAI แบบเนทีฟตั้งค่าเริ่มต้นเป็น
tool_stream: trueตั้งค่าagents.defaults.models["xai/<model>"].params.tool_streamเป็นfalseเพื่อ ปิดใช้ - ตัวห่อ xAI ที่รวมมาให้จะตัดแฟล็กสคีมาเครื่องมือแบบเข้มงวดที่ไม่รองรับ และ
คีย์เพย์โหลด effort สำหรับการให้เหตุผลออกก่อนส่งคำขอ xAI แบบเนทีฟ มีเพียง
grok-4.3/grok-4.3-*เท่านั้นที่ประกาศว่าสามารถกำหนด effort สำหรับการให้เหตุผลได้; โมเดล xAI อื่นทั้งหมดที่มีความสามารถในการให้เหตุผลยังคงขอinclude: ["reasoning.encrypted_content"]เพื่อให้สามารถเล่นซ้ำการให้เหตุผลที่เข้ารหัสก่อนหน้า ในรอบติดตามผลได้ web_search,x_searchและcode_executionถูกเปิดเผยเป็นเครื่องมือของ OpenClaw OpenClaw เปิดใช้ built-in เฉพาะของ xAI ที่ต้องการภายในคำขอเครื่องมือแต่ละรายการ แทนที่จะผูกเครื่องมือเนทีฟทั้งหมดเข้ากับทุกๆ รอบแชต- Grok
web_searchอ่านplugins.entries.xai.config.webSearch.baseUrlx_searchอ่านplugins.entries.xai.config.xSearch.baseUrlแล้ว ถอยกลับไปใช้ URL ฐานของ Grok web-search x_searchและcode_executionเป็นของ Plugin xAI ที่รวมมาให้ แทนที่จะ hardcode ลงในรันไทม์โมเดลหลักcode_executionคือการเรียกใช้แซนด์บ็อกซ์ xAI ระยะไกล ไม่ใช่execภายในเครื่อง
การทดสอบสด
เส้นทางสื่อ xAI ครอบคลุมด้วยยูนิตเทสต์และชุดทดสอบสดแบบเลือกเปิดใช้ ส่งออก
XAI_API_KEY ในสภาพแวดล้อมของกระบวนการก่อนรันโพรบสด
pnpm test extensions/xaiOPENCLAW_LIVE_TEST=1 OPENCLAW_LIVE_TEST_QUIET=1 pnpm test:live -- extensions/xai/xai.live.test.tsOPENCLAW_LIVE_TEST=1 OPENCLAW_LIVE_TEST_QUIET=1 OPENCLAW_LIVE_IMAGE_GENERATION_PROVIDERS=xai pnpm test:live -- test/image-generation.runtime.live.test.tsไฟล์สดเฉพาะผู้ให้บริการสังเคราะห์ TTS ปกติ, TTS แบบ PCM ที่เป็นมิตรกับโทรศัพท์, ถอดเสียงผ่าน xAI batch STT, สตรีม PCM เดียวกันผ่าน xAI realtime STT, สร้างผลลัพธ์ข้อความเป็นรูปภาพ และแก้ไขรูปภาพอ้างอิง ไฟล์สดรูปภาพที่ใช้ร่วมกัน ตรวจสอบผู้ให้บริการ xAI เดียวกันผ่านเส้นทางการเลือก รันไทม์ ค่าถอยกลับ การทำให้เป็นมาตรฐาน และไฟล์แนบสื่อของ OpenClaw