OpenClaw 隨附一個用於 Grok 模型的Documentation Index
Fetch the complete documentation index at: https://docs.openclaw.ai/llms.txt
Use this file to discover all available pages before exploring further.
xai 提供者 Plugin。
開始使用
OpenClaw 使用 xAI Responses API 作為隨附的 xAI 傳輸方式。同一個
XAI_API_KEY 也可以支援由 Grok 提供的 web_search、一級 x_search
以及遠端 code_execution。
如果你將 xAI 金鑰儲存在 plugins.entries.xai.config.webSearch.apiKey 下,
隨附的 xAI 模型提供者也會重用該金鑰作為備援。
code_execution 調校設定位於 plugins.entries.xai.config.codeExecution 下。內建目錄
OpenClaw 開箱即包含這些 xAI 模型系列:| 系列 | 模型 ID |
|---|---|
| Grok 3 | grok-3, grok-3-fast, grok-3-mini, grok-3-mini-fast |
| Grok 4 | grok-4, grok-4-0709 |
| Grok 4 Fast | grok-4-fast, grok-4-fast-non-reasoning |
| Grok 4.1 Fast | grok-4-1-fast, grok-4-1-fast-non-reasoning |
| Grok 4.20 Beta | grok-4.20-beta-latest-reasoning, grok-4.20-beta-latest-non-reasoning |
| Grok Code | grok-code-fast-1 |
grok-4* 和 grok-code-fast* ID 遵循相同 API 形狀時,該 Plugin
也會向前解析它們。
OpenClaw 功能涵蓋範圍
隨附的 Plugin 會將 xAI 目前的公開 API 表面對應到 OpenClaw 的共用提供者和工具合約。 不符合共用合約的能力(例如串流 TTS 和即時語音)不會公開,請見下表。| xAI 能力 | OpenClaw 表面 | 狀態 |
|---|---|---|
| 聊天 / Responses | xai/<model> 模型提供者 | 是 |
| 伺服器端網頁搜尋 | web_search 提供者 grok | 是 |
| 伺服器端 X 搜尋 | x_search 工具 | 是 |
| 伺服器端程式碼執行 | code_execution 工具 | 是 |
| 圖片 | image_generate | 是 |
| 影片 | video_generate | 是 |
| 批次文字轉語音 | messages.tts.provider: "xai" / tts | 是 |
| 串流 TTS | — | 未公開;OpenClaw 的 TTS 合約會傳回完整音訊緩衝區 |
| 批次語音轉文字 | tools.media.audio / 媒體理解 | 是 |
| 串流語音轉文字 | Voice Call streaming.provider: "xai" | 是 |
| 即時語音 | — | 尚未公開;使用不同的工作階段/WebSocket 合約 |
| 檔案 / 批次 | 僅一般模型 API 相容性 | 不是一級 OpenClaw 工具 |
OpenClaw 使用 xAI 的 REST 圖片/影片/TTS/STT API 進行媒體生成、語音和批次轉錄,
使用 xAI 的串流 STT WebSocket 進行即時語音通話轉錄,並使用 Responses API
提供模型、搜尋和程式碼執行工具。需要不同 OpenClaw 合約的功能,例如即時語音工作階段,
在此會記錄為上游能力,而不是隱藏的 Plugin 行為。
快速模式對應
/fast on 或 agents.defaults.models["xai/<model>"].params.fastMode: true
會將原生 xAI 請求改寫如下:
| 來源模型 | 快速模式目標 |
|---|---|
grok-3 | grok-3-fast |
grok-3-mini | grok-3-mini-fast |
grok-4 | grok-4-fast |
grok-4-0709 | grok-4-fast |
舊版相容別名
舊版別名仍會正規化為標準隨附 ID:| 舊版別名 | 標準 ID |
|---|---|
grok-4-fast-reasoning | grok-4-fast |
grok-4-1-fast-reasoning | grok-4-1-fast |
grok-4.20-reasoning | grok-4.20-beta-latest-reasoning |
grok-4.20-non-reasoning | grok-4.20-beta-latest-non-reasoning |
功能
網頁搜尋
網頁搜尋
隨附的
grok 網頁搜尋提供者也會使用 XAI_API_KEY:影片生成
影片生成
隨附的
xai Plugin 透過共用的 video_generate 工具註冊影片生成。- 預設影片模型:
xai/grok-imagine-video - 模式:文字轉影片、圖片轉影片、參考圖片生成、遠端影片編輯,以及遠端影片延伸
- 長寬比:
1:1,16:9,9:16,4:3,3:4,3:2,2:3 - 解析度:
480P,720P - 時長:生成/圖片轉影片為 1-15 秒,使用
reference_image角色時為 1-10 秒,延伸為 2-10 秒 - 參考圖片生成:將每個提供的圖片的
imageRoles設為reference_image;xAI 最多接受 7 張此類圖片
請參閱影片生成,了解共用工具參數、提供者選擇和容錯移轉行為。
圖片生成
圖片生成
隨附的
xai Plugin 透過共用的 image_generate 工具註冊圖片生成。- 預設圖片模型:
xai/grok-imagine-image - 額外模型:
xai/grok-imagine-image-pro - 模式:文字轉圖片和參考圖片編輯
- 參考輸入:一個
image或最多五個images - 長寬比:
1:1,16:9,9:16,4:3,3:4,2:3,3:2 - 解析度:
1K,2K - 數量:最多 4 張圖片
b64_json 圖片回應,以便生成的媒體可以透過一般頻道附件路徑儲存並傳送。
本機參考圖片會轉換為資料 URL;遠端 http(s) 參考會直接傳遞。若要將 xAI 作為預設圖片提供者:xAI 也記錄了
quality、mask、user 以及其他原生比例,
例如 1:2、2:1、9:20 和 20:9。OpenClaw 目前只轉發
共用的跨提供者圖片控制項;不支援的原生專用旋鈕會刻意不透過 image_generate 公開。文字轉語音
文字轉語音
隨附的
xai Plugin 透過共用的 tts 提供者表面註冊文字轉語音。- 語音:
eve,ara,rex,sal,leo,una - 預設語音:
eve - 格式:
mp3,wav,pcm,mulaw,alaw - 語言:BCP-47 代碼或
auto - 速度:提供者原生速度覆寫
- 不支援原生 Opus 語音訊息格式
OpenClaw 使用 xAI 的批次
/v1/tts 端點。xAI 也提供透過 WebSocket 的串流 TTS,
但 OpenClaw 語音提供者合約目前預期在傳送回覆前取得完整音訊緩衝區。語音轉文字
語音轉文字
隨附的 可以透過共用音訊媒體設定或逐次轉錄請求提供語言。共用 OpenClaw 表面接受提示提示,
但 xAI REST STT 整合只轉發檔案、模型和語言,因為這些能清楚對應到目前公開的 xAI 端點。
xai Plugin 透過 OpenClaw 的媒體理解轉錄表面註冊批次語音轉文字。- 預設模型:
grok-stt - 端點:xAI REST
/v1/stt - 輸入路徑:多部分音訊檔案上傳
- 在 OpenClaw 中凡是入站音訊轉錄使用
tools.media.audio的地方皆支援,包括 Discord 語音頻道片段和頻道音訊附件
串流語音轉文字
串流語音轉文字
隨附的 提供者擁有的設定位於
xai Plugin 也為即時語音通話音訊註冊即時轉錄提供者。- 端點:xAI WebSocket
wss://api.x.ai/v1/stt - 預設編碼:
mulaw - 預設取樣率:
8000 - 預設端點偵測:
800ms - 臨時轉錄稿:預設啟用
plugins.entries.voice-call.config.streaming.providers.xai 下。支援的
鍵為 apiKey、baseUrl、sampleRate、encoding(pcm、mulaw 或
alaw)、interimResults、endpointingMs 和 language。此串流供應商用於 Voice Call 的即時轉錄路徑。
Discord 語音目前會錄製短片段,並改用批次
tools.media.audio 轉錄路徑。x_search 設定
x_search 設定
內建的 xAI Plugin 會將
x_search 作為 OpenClaw 工具公開,用於透過 Grok 搜尋
X(前身為 Twitter)內容。設定路徑:plugins.entries.xai.config.xSearch| 鍵 | 類型 | 預設值 | 說明 |
|---|---|---|---|
enabled | boolean | — | 啟用或停用 x_search |
model | string | grok-4-1-fast | x_search 請求使用的模型 |
inlineCitations | boolean | — | 在結果中包含行內引用 |
maxTurns | number | — | 最大對話輪次 |
timeoutSeconds | number | — | 請求逾時秒數 |
cacheTtlMinutes | number | — | 快取存活時間,以分鐘為單位 |
程式碼執行設定
程式碼執行設定
內建的 xAI Plugin 會將
code_execution 作為 OpenClaw 工具公開,用於在 xAI 的沙箱環境中
遠端執行程式碼。設定路徑:plugins.entries.xai.config.codeExecution| 鍵 | 類型 | 預設值 | 說明 |
|---|---|---|---|
enabled | boolean | true(如果金鑰可用) | 啟用或停用程式碼執行 |
model | string | grok-4-1-fast | 程式碼執行請求使用的模型 |
maxTurns | number | — | 最大對話輪次 |
timeoutSeconds | number | — | 請求逾時秒數 |
這是遠端 xAI 沙箱執行,不是本機
exec。已知限制
已知限制
- 目前驗證僅支援 API 金鑰。OpenClaw 尚未提供 xAI OAuth 或裝置碼流程。
- 一般 xAI 供應商路徑不支援
grok-4.20-multi-agent-experimental-beta-0304,因為它需要與標準 OpenClaw xAI 傳輸不同的上游 API 介面。 - xAI Realtime 語音尚未註冊為 OpenClaw 供應商。它需要與批次 STT 或串流轉錄不同的雙向語音工作階段合約。
- xAI 圖片
quality、圖片mask,以及額外的僅原生支援長寬比,在共用image_generate工具具備相對應的跨供應商控制之前不會公開。
進階備註
進階備註
- OpenClaw 會在共用執行器路徑上自動套用 xAI 專屬的工具結構描述與工具呼叫相容性修正。
- 原生 xAI 請求預設為
tool_stream: true。將agents.defaults.models["xai/<model>"].params.tool_stream設為false可停用它。 - 內建的 xAI 包裝器會在傳送原生 xAI 請求前,移除不支援的嚴格工具結構描述旗標與推理酬載鍵。
web_search、x_search和code_execution會作為 OpenClaw 工具公開。OpenClaw 會在每個工具請求內啟用所需的特定 xAI 內建功能,而不是將所有原生工具附加到每個聊天輪次。x_search和code_execution由內建的 xAI Plugin 擁有,而不是硬編碼到核心模型執行階段。code_execution是遠端 xAI 沙箱執行,不是本機exec。
即時測試
xAI 媒體路徑由單元測試和選擇加入的即時套件涵蓋。即時命令會先從你的登入 shell 載入密鑰,包括~/.profile,再探測 XAI_API_KEY。
相關
模型選擇
選擇供應商、模型參照與容錯移轉行為。
影片產生
共用影片工具參數與供應商選擇。
所有供應商
更廣泛的供應商概覽。
疑難排解
常見問題與修正方式。