메인 콘텐츠로 건너뛰기

Documentation Index

Fetch the complete documentation index at: https://docs.openclaw.ai/llms.txt

Use this file to discover all available pages before exploring further.

OpenClaw는 Grok 모델을 위한 번들 xai 제공자 Plugin과 함께 제공됩니다.

시작하기

1

API 키 만들기

xAI 콘솔에서 API 키를 만드세요.
2

API 키 설정

XAI_API_KEY를 설정하거나 다음을 실행하세요.
openclaw onboard --auth-choice xai-api-key
3

모델 선택

{
  agents: { defaults: { model: { primary: "xai/grok-4.3" } } },
}
OpenClaw는 번들 xAI 전송 방식으로 xAI Responses API를 사용합니다. openclaw onboard --auth-choice xai-api-key의 동일한 API 키는 일급 x_search와 원격 code_execution에도 사용할 수 있으며, XAI_API_KEY 또는 Plugin 웹 검색 구성으로 Grok 기반 web_search도 사용할 수 있습니다. plugins.entries.xai.config.webSearch.apiKey에 xAI 키를 저장하면, 번들 xAI 모델 제공자도 해당 키를 대체 키로 재사용합니다. plugins.entries.xai.config.webSearch.baseUrl을 설정하면 Grok web_search와, 기본적으로 x_search를 운영자 xAI Responses 프록시를 통해 라우팅합니다. code_execution 조정은 plugins.entries.xai.config.codeExecution 아래에 있습니다.

내장 카탈로그

OpenClaw에는 다음 xAI 모델 제품군이 기본 포함되어 있습니다.
제품군모델 ID
Grok 3grok-3, grok-3-fast, grok-3-mini, grok-3-mini-fast
Grok 4.3grok-4.3
Grok 4grok-4, grok-4-0709
Grok 4 Fastgrok-4-fast, grok-4-fast-non-reasoning
Grok 4.1 Fastgrok-4-1-fast, grok-4-1-fast-non-reasoning
Grok 4.20 Betagrok-4.20-beta-latest-reasoning, grok-4.20-beta-latest-non-reasoning
Grok Codegrok-code-fast-1
Plugin은 더 새로운 grok-4*grok-code-fast* ID가 동일한 API 형태를 따르는 경우에도 이를 앞으로 해석합니다.
grok-4.3, grok-4-fast, grok-4-1-fastgrok-4.20-beta-* 변형은 번들 카탈로그의 현재 이미지 지원 Grok 참조입니다.

OpenClaw 기능 적용 범위

번들 Plugin은 xAI의 현재 공개 API 표면을 OpenClaw의 공유 제공자 및 도구 계약에 매핑합니다. 공유 계약에 맞지 않는 기능 (예: 스트리밍 TTS 및 실시간 음성)은 노출되지 않습니다. 아래 표를 참조하세요.
xAI 기능OpenClaw 표면상태
채팅 / Responsesxai/<model> 모델 제공자
서버 측 웹 검색web_search 제공자 grok
서버 측 X 검색x_search 도구
서버 측 코드 실행code_execution 도구
이미지image_generate
동영상video_generate
배치 텍스트 음성 변환messages.tts.provider: "xai" / tts
스트리밍 TTS-노출되지 않음; OpenClaw의 TTS 계약은 완전한 오디오 버퍼를 반환합니다
배치 음성 텍스트 변환tools.media.audio / 미디어 이해
스트리밍 음성 텍스트 변환Voice Call streaming.provider: "xai"
실시간 음성-아직 노출되지 않음; 다른 세션/WebSocket 계약
파일 / 배치일반 모델 API 호환성만일급 OpenClaw 도구가 아님
OpenClaw는 미디어 생성, 음성, 배치 전사에 xAI의 REST 이미지/동영상/TTS/STT API를 사용하고, 라이브 음성 통화 전사에는 xAI의 스트리밍 STT WebSocket을 사용하며, 모델, 검색, 코드 실행 도구에는 Responses API를 사용합니다. 실시간 음성 세션처럼 다른 OpenClaw 계약이 필요한 기능은 숨겨진 Plugin 동작이 아니라 업스트림 기능으로 여기에 문서화되어 있습니다.

빠른 모드 매핑

/fast on 또는 agents.defaults.models["xai/<model>"].params.fastMode: true는 네이티브 xAI 요청을 다음과 같이 다시 씁니다.
원본 모델빠른 모드 대상
grok-3grok-3-fast
grok-3-minigrok-3-mini-fast
grok-4grok-4-fast
grok-4-0709grok-4-fast

레거시 호환성 별칭

레거시 별칭은 여전히 정식 번들 ID로 정규화됩니다.
레거시 별칭정식 ID
grok-4-fast-reasoninggrok-4-fast
grok-4-1-fast-reasoninggrok-4-1-fast
grok-4.20-reasoninggrok-4.20-beta-latest-reasoning
grok-4.20-non-reasoninggrok-4.20-beta-latest-non-reasoning

기능

번들 grok 웹 검색 제공자는 XAI_API_KEY 또는 Plugin 웹 검색 키를 사용할 수 있습니다.
openclaw config set tools.web.search.provider grok
번들 xai Plugin은 공유 video_generate 도구를 통해 동영상 생성을 등록합니다.
  • 기본 동영상 모델: xai/grok-imagine-video
  • 모드: 텍스트-동영상, 이미지-동영상, 참조 이미지 생성, 원격 동영상 편집, 원격 동영상 확장
  • 화면 비율: 1:1, 16:9, 9:16, 4:3, 3:4, 3:2, 2:3
  • 해상도: 480P, 720P
  • 길이: 생성/이미지-동영상의 경우 1-15초, reference_image 역할을 사용할 때는 1-10초, 확장의 경우 2-10초
  • 참조 이미지 생성: 제공된 모든 이미지에 대해 imageRolesreference_image로 설정하세요. xAI는 이러한 이미지를 최대 7개까지 허용합니다.
로컬 동영상 버퍼는 허용되지 않습니다. 동영상 편집/확장 입력에는 원격 http(s) URL을 사용하세요. OpenClaw가 해당 이미지를 xAI용 데이터 URL로 인코딩할 수 있으므로 이미지-동영상은 로컬 이미지 버퍼를 허용합니다.
xAI를 기본 동영상 제공자로 사용하려면:
{
  agents: {
    defaults: {
      videoGenerationModel: {
        primary: "xai/grok-imagine-video",
      },
    },
  },
}
공유 도구 매개변수, 제공자 선택, 장애 조치 동작은 동영상 생성을 참조하세요.
번들 xai Plugin은 공유 image_generate 도구를 통해 이미지 생성을 등록합니다.
  • 기본 이미지 모델: xai/grok-imagine-image
  • 추가 모델: xai/grok-imagine-image-pro
  • 모드: 텍스트-이미지 및 참조 이미지 편집
  • 참조 입력: image 하나 또는 최대 다섯 개의 images
  • 화면 비율: 1:1, 16:9, 9:16, 4:3, 3:4, 2:3, 3:2
  • 해상도: 1K, 2K
  • 개수: 최대 4개 이미지
OpenClaw는 생성된 미디어를 일반 채널 첨부 경로를 통해 저장하고 전달할 수 있도록 xAI에 b64_json 이미지 응답을 요청합니다. 로컬 참조 이미지는 데이터 URL로 변환되며, 원격 http(s) 참조는 그대로 전달됩니다.xAI를 기본 이미지 제공자로 사용하려면:
{
  agents: {
    defaults: {
      imageGenerationModel: {
        primary: "xai/grok-imagine-image",
      },
    },
  },
}
xAI는 quality, mask, user1:2, 2:1, 9:20, 20:9 같은 추가 네이티브 비율도 문서화합니다. OpenClaw는 현재 공유 교차 제공자 이미지 제어만 전달하며, 지원되지 않는 네이티브 전용 조절값은 의도적으로 image_generate를 통해 노출하지 않습니다.
번들 xai Plugin은 공유 tts 제공자 표면을 통해 텍스트 음성 변환을 등록합니다.
  • 음성: eve, ara, rex, sal, leo, una
  • 기본 음성: eve
  • 형식: mp3, wav, pcm, mulaw, alaw
  • 언어: BCP-47 코드 또는 auto
  • 속도: 제공자 네이티브 속도 재정의
  • 네이티브 Opus 음성 메모 형식은 지원되지 않음
xAI를 기본 TTS 제공자로 사용하려면:
{
  messages: {
    tts: {
      provider: "xai",
      providers: {
        xai: {
          voiceId: "eve",
        },
      },
    },
  },
}
OpenClaw는 xAI의 배치 /v1/tts 엔드포인트를 사용합니다. xAI는 WebSocket을 통한 스트리밍 TTS도 제공하지만, OpenClaw 음성 제공자 계약은 현재 답장 전달 전에 완전한 오디오 버퍼를 요구합니다.
번들 xai Plugin은 OpenClaw의 미디어 이해 전사 표면을 통해 배치 음성 텍스트 변환을 등록합니다.
  • 기본 모델: grok-stt
  • 엔드포인트: xAI REST /v1/stt
  • 입력 경로: multipart 오디오 파일 업로드
  • Discord 음성 채널 세그먼트 및 채널 오디오 첨부를 포함하여, 인바운드 오디오 전사가 tools.media.audio를 사용하는 모든 OpenClaw 위치에서 지원됨
인바운드 오디오 전사에 xAI를 강제하려면:
{
  tools: {
    media: {
      audio: {
        models: [
          {
            type: "provider",
            provider: "xai",
            model: "grok-stt",
          },
        ],
      },
    },
  },
}
언어는 공유 오디오 미디어 구성 또는 호출별 전사 요청을 통해 제공할 수 있습니다. 프롬프트 힌트는 공유 OpenClaw 표면에서 허용되지만, xAI REST STT 통합은 파일, 모델, 언어만 전달합니다. 이들이 현재 공개 xAI 엔드포인트에 명확하게 매핑되기 때문입니다.
번들 xai Plugin은 라이브 음성 통화 오디오용 실시간 전사 제공자도 등록합니다.
  • 엔드포인트: xAI WebSocket wss://api.x.ai/v1/stt
  • 기본 인코딩: mulaw
  • 기본 샘플링 레이트: 8000
  • 기본 엔드포인팅: 800ms
  • 중간 전사: 기본적으로 활성화됨
Voice Call의 Twilio 미디어 스트림은 G.711 µ-law 오디오 프레임을 전송하므로, xAI 제공자는 트랜스코딩 없이 해당 프레임을 직접 전달할 수 있습니다.
{
  plugins: {
    entries: {
      "voice-call": {
        config: {
          streaming: {
            enabled: true,
            provider: "xai",
            providers: {
              xai: {
                apiKey: "${XAI_API_KEY}",
                endpointingMs: 800,
                language: "en",
              },
            },
          },
        },
      },
    },
  },
}
제공자 소유 구성은 plugins.entries.voice-call.config.streaming.providers.xai 아래에 있습니다. 지원되는 키는 apiKey, baseUrl, sampleRate, encoding(pcm, mulaw 또는 alaw), interimResults, endpointingMs, language입니다.
이 스트리밍 제공자는 Voice Call의 실시간 전사 경로용입니다. Discord 음성은 현재 짧은 세그먼트를 녹음하고 대신 배치 tools.media.audio 전사 경로를 사용합니다.
번들된 xAI Plugin은 xAI의 샌드박스 환경에서 원격 코드 실행을 위한 OpenClaw 도구로 code_execution을 노출합니다.구성 경로: plugins.entries.xai.config.codeExecution
유형기본값설명
enabledbooleantrue(키가 있는 경우)코드 실행 활성화 또는 비활성화
modelstringgrok-4-1-fast코드 실행 요청에 사용되는 모델
maxTurnsnumber-최대 대화 턴 수
timeoutSecondsnumber-요청 제한 시간(초)
이것은 원격 xAI 샌드박스 실행이며, 로컬 exec가 아닙니다.
{
  plugins: {
    entries: {
      xai: {
        config: {
          codeExecution: {
            enabled: true,
            model: "grok-4-1-fast",
          },
        },
      },
    },
  },
}
  • 현재 인증은 API 키만 지원합니다. API 키는 xAI 인증 프로필, 환경 변수 또는 Plugin 구성에 저장할 수 있습니다. 아직 OpenClaw에는 xAI OAuth 또는 device-code 흐름이 없습니다.
  • grok-4.20-multi-agent-experimental-beta-0304는 표준 OpenClaw xAI 전송과 다른 업스트림 API 표면이 필요하므로 일반 xAI 제공자 경로에서 지원되지 않습니다.
  • xAI Realtime 음성은 아직 OpenClaw 제공자로 등록되어 있지 않습니다. 배치 STT 또는 스트리밍 전사와는 다른 양방향 음성 세션 계약이 필요합니다.
  • xAI 이미지 quality, 이미지 mask, 추가 네이티브 전용 화면비는 공유 image_generate 도구에 대응하는 제공자 간 제어가 생길 때까지 노출되지 않습니다.
  • OpenClaw는 공유 실행기 경로에서 xAI 전용 도구 스키마 및 도구 호출 호환성 수정을 자동으로 적용합니다.
  • 네이티브 xAI 요청의 기본값은 tool_stream: true입니다. 비활성화하려면 agents.defaults.models["xai/<model>"].params.tool_streamfalse로 설정하세요.
  • 번들된 xAI 래퍼는 네이티브 xAI 요청을 보내기 전에 지원되지 않는 엄격한 도구 스키마 플래그와 reasoning 페이로드 키를 제거합니다.
  • web_search, x_search, code_execution은 OpenClaw 도구로 노출됩니다. OpenClaw는 모든 네이티브 도구를 모든 채팅 턴에 연결하는 대신 각 도구 요청 안에서 필요한 특정 xAI 내장 기능을 활성화합니다.
  • Grok web_searchplugins.entries.xai.config.webSearch.baseUrl을 읽습니다. x_searchplugins.entries.xai.config.xSearch.baseUrl을 읽은 다음 Grok 웹 검색 기본 URL로 폴백합니다.
  • x_searchcode_execution은 핵심 모델 런타임에 하드코딩되지 않고 번들된 xAI Plugin이 소유합니다.
  • code_execution은 원격 xAI 샌드박스 실행이며, 로컬 exec가 아닙니다.

라이브 테스트

xAI 미디어 경로는 단위 테스트와 선택 실행 라이브 스위트에서 다룹니다. 라이브 명령은 XAI_API_KEY를 확인하기 전에 ~/.profile을 포함해 로그인 셸에서 비밀 값을 로드합니다.
pnpm test extensions/xai
OPENCLAW_LIVE_TEST=1 OPENCLAW_LIVE_TEST_QUIET=1 pnpm test:live -- extensions/xai/xai.live.test.ts
OPENCLAW_LIVE_TEST=1 OPENCLAW_LIVE_TEST_QUIET=1 OPENCLAW_LIVE_IMAGE_GENERATION_PROVIDERS=xai pnpm test:live -- test/image-generation.runtime.live.test.ts
제공자별 라이브 파일은 일반 TTS, 전화 통화에 적합한 PCM TTS를 합성하고, xAI 배치 STT로 오디오를 전사하며, 동일한 PCM을 xAI 실시간 STT로 스트리밍하고, 텍스트-이미지 출력을 생성하며, 참조 이미지를 편집합니다. 공유 이미지 라이브 파일은 OpenClaw의 런타임 선택, 폴백, 정규화, 미디어 첨부 경로를 통해 동일한 xAI 제공자를 검증합니다.

관련 항목

모델 선택

제공자, 모델 참조, 장애 조치 동작 선택.

비디오 생성

공유 비디오 도구 매개변수와 제공자 선택.

모든 제공자

더 넓은 제공자 개요.

문제 해결

일반적인 문제와 수정 방법.