跳轉到主要內容

Documentation Index

Fetch the complete documentation index at: https://docs.openclaw.ai/llms.txt

Use this file to discover all available pages before exploring further.

OpenClaw 隨附一個用於 Grok 模型的 xai 提供者 Plugin。

開始使用

1

建立 API 金鑰

xAI 控制台 中建立 API 金鑰。
2

設定你的 API 金鑰

設定 XAI_API_KEY,或執行:
openclaw onboard --auth-choice xai-api-key
3

選擇模型

{
  agents: { defaults: { model: { primary: "xai/grok-4" } } },
}
OpenClaw 使用 xAI Responses API 作為隨附的 xAI 傳輸方式。同一個 XAI_API_KEY 也可以支援由 Grok 提供的 web_search、一級 x_search 以及遠端 code_execution。 如果你將 xAI 金鑰儲存在 plugins.entries.xai.config.webSearch.apiKey 下, 隨附的 xAI 模型提供者也會重用該金鑰作為備援。 code_execution 調校設定位於 plugins.entries.xai.config.codeExecution 下。

內建目錄

OpenClaw 開箱即包含這些 xAI 模型系列:
系列模型 ID
Grok 3grok-3, grok-3-fast, grok-3-mini, grok-3-mini-fast
Grok 4grok-4, grok-4-0709
Grok 4 Fastgrok-4-fast, grok-4-fast-non-reasoning
Grok 4.1 Fastgrok-4-1-fast, grok-4-1-fast-non-reasoning
Grok 4.20 Betagrok-4.20-beta-latest-reasoning, grok-4.20-beta-latest-non-reasoning
Grok Codegrok-code-fast-1
當較新的 grok-4*grok-code-fast* ID 遵循相同 API 形狀時,該 Plugin 也會向前解析它們。
grok-4-fastgrok-4-1-fastgrok-4.20-beta-* 變體是隨附目錄中 目前支援圖片的 Grok 參照。

OpenClaw 功能涵蓋範圍

隨附的 Plugin 會將 xAI 目前的公開 API 表面對應到 OpenClaw 的共用提供者和工具合約。 不符合共用合約的能力(例如串流 TTS 和即時語音)不會公開,請見下表。
xAI 能力OpenClaw 表面狀態
聊天 / Responsesxai/<model> 模型提供者
伺服器端網頁搜尋web_search 提供者 grok
伺服器端 X 搜尋x_search 工具
伺服器端程式碼執行code_execution 工具
圖片image_generate
影片video_generate
批次文字轉語音messages.tts.provider: "xai" / tts
串流 TTS未公開;OpenClaw 的 TTS 合約會傳回完整音訊緩衝區
批次語音轉文字tools.media.audio / 媒體理解
串流語音轉文字Voice Call streaming.provider: "xai"
即時語音尚未公開;使用不同的工作階段/WebSocket 合約
檔案 / 批次僅一般模型 API 相容性不是一級 OpenClaw 工具
OpenClaw 使用 xAI 的 REST 圖片/影片/TTS/STT API 進行媒體生成、語音和批次轉錄, 使用 xAI 的串流 STT WebSocket 進行即時語音通話轉錄,並使用 Responses API 提供模型、搜尋和程式碼執行工具。需要不同 OpenClaw 合約的功能,例如即時語音工作階段, 在此會記錄為上游能力,而不是隱藏的 Plugin 行為。

快速模式對應

/fast onagents.defaults.models["xai/<model>"].params.fastMode: true 會將原生 xAI 請求改寫如下:
來源模型快速模式目標
grok-3grok-3-fast
grok-3-minigrok-3-mini-fast
grok-4grok-4-fast
grok-4-0709grok-4-fast

舊版相容別名

舊版別名仍會正規化為標準隨附 ID:
舊版別名標準 ID
grok-4-fast-reasoninggrok-4-fast
grok-4-1-fast-reasoninggrok-4-1-fast
grok-4.20-reasoninggrok-4.20-beta-latest-reasoning
grok-4.20-non-reasoninggrok-4.20-beta-latest-non-reasoning

功能

隨附的 grok 網頁搜尋提供者也會使用 XAI_API_KEY
openclaw config set tools.web.search.provider grok
隨附的 xai Plugin 透過共用的 video_generate 工具註冊影片生成。
  • 預設影片模型:xai/grok-imagine-video
  • 模式:文字轉影片、圖片轉影片、參考圖片生成、遠端影片編輯,以及遠端影片延伸
  • 長寬比:1:1, 16:9, 9:16, 4:3, 3:4, 3:2, 2:3
  • 解析度:480P, 720P
  • 時長:生成/圖片轉影片為 1-15 秒,使用 reference_image 角色時為 1-10 秒,延伸為 2-10 秒
  • 參考圖片生成:將每個提供的圖片的 imageRoles 設為 reference_image;xAI 最多接受 7 張此類圖片
不接受本機影片緩衝區。影片編輯/延伸輸入請使用遠端 http(s) URL。 圖片轉影片接受本機圖片緩衝區,因為 OpenClaw 可以將其編碼為供 xAI 使用的資料 URL。
若要將 xAI 作為預設影片提供者:
{
  agents: {
    defaults: {
      videoGenerationModel: {
        primary: "xai/grok-imagine-video",
      },
    },
  },
}
請參閱影片生成,了解共用工具參數、提供者選擇和容錯移轉行為。
隨附的 xai Plugin 透過共用的 image_generate 工具註冊圖片生成。
  • 預設圖片模型:xai/grok-imagine-image
  • 額外模型:xai/grok-imagine-image-pro
  • 模式:文字轉圖片和參考圖片編輯
  • 參考輸入:一個 image 或最多五個 images
  • 長寬比:1:1, 16:9, 9:16, 4:3, 3:4, 2:3, 3:2
  • 解析度:1K, 2K
  • 數量:最多 4 張圖片
OpenClaw 會向 xAI 要求 b64_json 圖片回應,以便生成的媒體可以透過一般頻道附件路徑儲存並傳送。 本機參考圖片會轉換為資料 URL;遠端 http(s) 參考會直接傳遞。若要將 xAI 作為預設圖片提供者:
{
  agents: {
    defaults: {
      imageGenerationModel: {
        primary: "xai/grok-imagine-image",
      },
    },
  },
}
xAI 也記錄了 qualitymaskuser 以及其他原生比例, 例如 1:22:19:2020:9。OpenClaw 目前只轉發 共用的跨提供者圖片控制項;不支援的原生專用旋鈕會刻意不透過 image_generate 公開。
隨附的 xai Plugin 透過共用的 tts 提供者表面註冊文字轉語音。
  • 語音:eve, ara, rex, sal, leo, una
  • 預設語音:eve
  • 格式:mp3, wav, pcm, mulaw, alaw
  • 語言:BCP-47 代碼或 auto
  • 速度:提供者原生速度覆寫
  • 不支援原生 Opus 語音訊息格式
若要將 xAI 作為預設 TTS 提供者:
{
  messages: {
    tts: {
      provider: "xai",
      providers: {
        xai: {
          voiceId: "eve",
        },
      },
    },
  },
}
OpenClaw 使用 xAI 的批次 /v1/tts 端點。xAI 也提供透過 WebSocket 的串流 TTS, 但 OpenClaw 語音提供者合約目前預期在傳送回覆前取得完整音訊緩衝區。
隨附的 xai Plugin 透過 OpenClaw 的媒體理解轉錄表面註冊批次語音轉文字。
  • 預設模型:grok-stt
  • 端點:xAI REST /v1/stt
  • 輸入路徑:多部分音訊檔案上傳
  • 在 OpenClaw 中凡是入站音訊轉錄使用 tools.media.audio 的地方皆支援,包括 Discord 語音頻道片段和頻道音訊附件
若要強制使用 xAI 進行入站音訊轉錄:
{
  tools: {
    media: {
      audio: {
        models: [
          {
            type: "provider",
            provider: "xai",
            model: "grok-stt",
          },
        ],
      },
    },
  },
}
可以透過共用音訊媒體設定或逐次轉錄請求提供語言。共用 OpenClaw 表面接受提示提示, 但 xAI REST STT 整合只轉發檔案、模型和語言,因為這些能清楚對應到目前公開的 xAI 端點。
隨附的 xai Plugin 也為即時語音通話音訊註冊即時轉錄提供者。
  • 端點:xAI WebSocket wss://api.x.ai/v1/stt
  • 預設編碼:mulaw
  • 預設取樣率:8000
  • 預設端點偵測:800ms
  • 臨時轉錄稿:預設啟用
Voice Call 的 Twilio 媒體串流會傳送 G.711 µ-law 音訊影格,因此 xAI 提供者可以直接轉發這些影格,無需轉碼:
{
  plugins: {
    entries: {
      "voice-call": {
        config: {
          streaming: {
            enabled: true,
            provider: "xai",
            providers: {
              xai: {
                apiKey: "${XAI_API_KEY}",
                endpointingMs: 800,
                language: "en",
              },
            },
          },
        },
      },
    },
  },
}
提供者擁有的設定位於 plugins.entries.voice-call.config.streaming.providers.xai 下。支援的 鍵為 apiKeybaseUrlsampleRateencodingpcmmulawalaw)、interimResultsendpointingMslanguage
此串流供應商用於 Voice Call 的即時轉錄路徑。 Discord 語音目前會錄製短片段,並改用批次 tools.media.audio 轉錄路徑。
內建的 xAI Plugin 會將 code_execution 作為 OpenClaw 工具公開,用於在 xAI 的沙箱環境中 遠端執行程式碼。設定路徑:plugins.entries.xai.config.codeExecution
類型預設值說明
enabledbooleantrue(如果金鑰可用)啟用或停用程式碼執行
modelstringgrok-4-1-fast程式碼執行請求使用的模型
maxTurnsnumber最大對話輪次
timeoutSecondsnumber請求逾時秒數
這是遠端 xAI 沙箱執行,不是本機 exec
{
  plugins: {
    entries: {
      xai: {
        config: {
          codeExecution: {
            enabled: true,
            model: "grok-4-1-fast",
          },
        },
      },
    },
  },
}
  • 目前驗證僅支援 API 金鑰。OpenClaw 尚未提供 xAI OAuth 或裝置碼流程。
  • 一般 xAI 供應商路徑不支援 grok-4.20-multi-agent-experimental-beta-0304,因為它需要與標準 OpenClaw xAI 傳輸不同的上游 API 介面。
  • xAI Realtime 語音尚未註冊為 OpenClaw 供應商。它需要與批次 STT 或串流轉錄不同的雙向語音工作階段合約。
  • xAI 圖片 quality、圖片 mask,以及額外的僅原生支援長寬比,在共用 image_generate 工具具備相對應的跨供應商控制之前不會公開。
  • OpenClaw 會在共用執行器路徑上自動套用 xAI 專屬的工具結構描述與工具呼叫相容性修正。
  • 原生 xAI 請求預設為 tool_stream: true。將 agents.defaults.models["xai/<model>"].params.tool_stream 設為 false 可停用它。
  • 內建的 xAI 包裝器會在傳送原生 xAI 請求前,移除不支援的嚴格工具結構描述旗標與推理酬載鍵。
  • web_searchx_searchcode_execution 會作為 OpenClaw 工具公開。OpenClaw 會在每個工具請求內啟用所需的特定 xAI 內建功能,而不是將所有原生工具附加到每個聊天輪次。
  • x_searchcode_execution 由內建的 xAI Plugin 擁有,而不是硬編碼到核心模型執行階段。
  • code_execution 是遠端 xAI 沙箱執行,不是本機 exec

即時測試

xAI 媒體路徑由單元測試和選擇加入的即時套件涵蓋。即時命令會先從你的登入 shell 載入密鑰,包括 ~/.profile,再探測 XAI_API_KEY
pnpm test extensions/xai
OPENCLAW_LIVE_TEST=1 OPENCLAW_LIVE_TEST_QUIET=1 pnpm test:live -- extensions/xai/xai.live.test.ts
OPENCLAW_LIVE_TEST=1 OPENCLAW_LIVE_TEST_QUIET=1 OPENCLAW_LIVE_IMAGE_GENERATION_PROVIDERS=xai pnpm test:live -- test/image-generation.runtime.live.test.ts
供應商專屬的即時檔案會合成一般 TTS、適合電話語音的 PCM TTS、透過 xAI 批次 STT 轉錄音訊、透過 xAI 即時 STT 串流相同的 PCM、產生文字轉圖片輸出,並編輯參考圖片。共用圖片即時檔案會透過 OpenClaw 的執行階段選擇、備援、正規化與媒體附件路徑驗證相同的 xAI 供應商。

相關

模型選擇

選擇供應商、模型參照與容錯移轉行為。

影片產生

共用影片工具參數與供應商選擇。

所有供應商

更廣泛的供應商概覽。

疑難排解

常見問題與修正方式。