OpenClaw dostarcza dołączony Plugin dostawcyDocumentation Index
Fetch the complete documentation index at: https://docs.openclaw.ai/llms.txt
Use this file to discover all available pages before exploring further.
xai dla modeli Grok.
Pierwsze kroki
Utwórz klucz API
Utwórz klucz API w konsoli xAI.
OpenClaw używa xAI Responses API jako dołączonego transportu xAI. Ten sam
klucz API z
openclaw onboard --auth-choice xai-api-key może też zasilać
pierwszoklasowe x_search i zdalne code_execution; XAI_API_KEY lub
konfiguracja wyszukiwania w sieci Pluginu może również zasilać web_search
oparte na Grok.
Jeśli zapiszesz klucz xAI w plugins.entries.xai.config.webSearch.apiKey,
dołączony dostawca modeli xAI użyje tego klucza również jako opcji awaryjnej.
Ustaw plugins.entries.xai.config.webSearch.baseUrl, aby kierować Grok web_search
oraz, domyślnie, x_search przez operatorski proxy xAI Responses.
Dostrajanie code_execution znajduje się w plugins.entries.xai.config.codeExecution.Wbudowany katalog
OpenClaw domyślnie obejmuje następujące rodziny modeli xAI:| Rodzina | Identyfikatory modeli |
|---|---|
| Grok 3 | grok-3, grok-3-fast, grok-3-mini, grok-3-mini-fast |
| Grok 4.3 | grok-4.3 |
| Grok 4 | grok-4, grok-4-0709 |
| Grok 4 Fast | grok-4-fast, grok-4-fast-non-reasoning |
| Grok 4.1 Fast | grok-4-1-fast, grok-4-1-fast-non-reasoning |
| Grok 4.20 Beta | grok-4.20-beta-latest-reasoning, grok-4.20-beta-latest-non-reasoning |
| Grok Code | grok-code-fast-1 |
grok-4* i grok-code-fast*,
gdy mają taki sam kształt API.
Pokrycie funkcji OpenClaw
Dołączony Plugin mapuje bieżącą publiczną powierzchnię API xAI na współdzielone kontrakty dostawców i narzędzi OpenClaw. Możliwości, które nie pasują do współdzielonego kontraktu (na przykład strumieniowe TTS i głos czasu rzeczywistego), nie są udostępniane - zobacz tabelę poniżej.| Możliwość xAI | Powierzchnia OpenClaw | Status |
|---|---|---|
| Czat / Responses | dostawca modelu xai/<model> | Tak |
| Wyszukiwanie w sieci po stronie serwera | dostawca web_search grok | Tak |
| Wyszukiwanie X po stronie serwera | narzędzie x_search | Tak |
| Wykonywanie kodu po stronie serwera | narzędzie code_execution | Tak |
| Obrazy | image_generate | Tak |
| Wideo | video_generate | Tak |
| Wsadowe text-to-speech | messages.tts.provider: "xai" / tts | Tak |
| Strumieniowe TTS | - | Nieudostępnione; kontrakt TTS OpenClaw zwraca kompletne bufory audio |
| Wsadowe speech-to-text | tools.media.audio / rozumienie mediów | Tak |
| Strumieniowe speech-to-text | Voice Call streaming.provider: "xai" | Tak |
| Głos czasu rzeczywistego | - | Jeszcze nieudostępnione; inny kontrakt sesji/WebSocket |
| Pliki / zadania wsadowe | Tylko ogólna zgodność API modeli | Nie jest pierwszoklasowym narzędziem OpenClaw |
OpenClaw używa interfejsów API REST xAI dla obrazów/wideo/TTS/STT do generowania
mediów, mowy i transkrypcji wsadowej, strumieniowego WebSocket STT xAI do
transkrypcji połączeń głosowych na żywo oraz Responses API do narzędzi modeli,
wyszukiwania i wykonywania kodu. Funkcje wymagające innych kontraktów OpenClaw,
takie jak sesje głosu czasu rzeczywistego, są tu udokumentowane jako możliwości
upstreamu, a nie ukryte zachowanie Pluginu.
Mapowania trybu szybkiego
/fast on lub agents.defaults.models["xai/<model>"].params.fastMode: true
przepisuje natywne żądania xAI następująco:
| Model źródłowy | Cel trybu szybkiego |
|---|---|
grok-3 | grok-3-fast |
grok-3-mini | grok-3-mini-fast |
grok-4 | grok-4-fast |
grok-4-0709 | grok-4-fast |
Starsze aliasy zgodności
Starsze aliasy nadal normalizują się do kanonicznych dołączonych identyfikatorów:| Starszy alias | Identyfikator kanoniczny |
|---|---|
grok-4-fast-reasoning | grok-4-fast |
grok-4-1-fast-reasoning | grok-4-1-fast |
grok-4.20-reasoning | grok-4.20-beta-latest-reasoning |
grok-4.20-non-reasoning | grok-4.20-beta-latest-non-reasoning |
Funkcje
Wyszukiwanie w sieci
Wyszukiwanie w sieci
Dołączony dostawca wyszukiwania w sieci
grok może używać XAI_API_KEY
albo klucza wyszukiwania w sieci Pluginu:Generowanie wideo
Generowanie wideo
Dołączony Plugin
xai rejestruje generowanie wideo przez współdzielone
narzędzie video_generate.- Domyślny model wideo:
xai/grok-imagine-video - Tryby: tekst-na-wideo, obraz-na-wideo, generowanie z obrazem referencyjnym, zdalna edycja wideo i zdalne przedłużanie wideo
- Proporcje obrazu:
1:1,16:9,9:16,4:3,3:4,3:2,2:3 - Rozdzielczości:
480P,720P - Czas trwania: 1-15 sekund dla generowania/obrazu-na-wideo, 1-10 sekund przy
użyciu ról
reference_image, 2-10 sekund dla przedłużania - Generowanie z obrazem referencyjnym: ustaw
imageRolesnareference_imagedla każdego dostarczonego obrazu; xAI akceptuje do 7 takich obrazów
Zobacz Generowanie wideo, aby poznać
współdzielone parametry narzędzia, wybór dostawcy i zachowanie przełączania
awaryjnego.
Generowanie obrazów
Generowanie obrazów
Dołączony Plugin
xai rejestruje generowanie obrazów przez współdzielone
narzędzie image_generate.- Domyślny model obrazu:
xai/grok-imagine-image - Dodatkowy model:
xai/grok-imagine-image-pro - Tryby: tekst-na-obraz i edycja obrazu referencyjnego
- Wejścia referencyjne: jeden
imagealbo do pięciuimages - Proporcje obrazu:
1:1,16:9,9:16,4:3,3:4,2:3,3:2 - Rozdzielczości:
1K,2K - Liczba: do 4 obrazów
b64_json, aby wygenerowane media
mogły być przechowywane i dostarczane normalną ścieżką załączników kanału.
Lokalne obrazy referencyjne są konwertowane na adresy URL danych; zdalne
referencje http(s) są przekazywane bez zmian.Aby używać xAI jako domyślnego dostawcy obrazów:xAI dokumentuje też
quality, mask, user oraz dodatkowe natywne
proporcje, takie jak 1:2, 2:1, 9:20 i 20:9. OpenClaw przekazuje
obecnie tylko współdzielone między dostawcami kontrolki obrazów;
nieobsługiwane pokrętła wyłącznie natywne celowo nie są udostępniane przez
image_generate.Text-to-speech
Text-to-speech
Dołączony Plugin
xai rejestruje text-to-speech przez współdzieloną
powierzchnię dostawcy tts.- Głosy:
eve,ara,rex,sal,leo,una - Domyślny głos:
eve - Formaty:
mp3,wav,pcm,mulaw,alaw - Język: kod BCP-47 albo
auto - Szybkość: natywne dla dostawcy nadpisanie szybkości
- Natywny format notatki głosowej Opus nie jest obsługiwany
OpenClaw używa wsadowego punktu końcowego xAI
/v1/tts. xAI oferuje też
strumieniowe TTS przez WebSocket, ale kontrakt dostawcy mowy OpenClaw
obecnie oczekuje kompletnego bufora audio przed dostarczeniem odpowiedzi.Speech-to-text
Speech-to-text
Dołączony Plugin Język można podać przez współdzieloną konfigurację mediów audio albo przez
żądanie transkrypcji dla pojedynczego wywołania. Wskazówki promptu są
akceptowane przez współdzieloną powierzchnię OpenClaw, ale integracja xAI
REST STT przekazuje tylko plik, model i język, ponieważ te elementy mapują
się jasno na bieżący publiczny punkt końcowy xAI.
xai rejestruje wsadowe speech-to-text przez powierzchnię
transkrypcji rozumienia mediów OpenClaw.- Domyślny model:
grok-stt - Punkt końcowy: xAI REST
/v1/stt - Ścieżka wejściowa: przesłanie wieloczęściowego pliku audio
- Obsługiwane przez OpenClaw wszędzie tam, gdzie transkrypcja przychodzącego
audio używa
tools.media.audio, w tym w segmentach kanałów głosowych Discord i załącznikach audio kanałów
Strumieniowe speech-to-text
Strumieniowe speech-to-text
Dołączony Plugin Konfiguracja należąca do dostawcy znajduje się pod
xai rejestruje też dostawcę transkrypcji czasu
rzeczywistego dla audio połączeń głosowych na żywo.- Punkt końcowy: xAI WebSocket
wss://api.x.ai/v1/stt - Domyślne kodowanie:
mulaw - Domyślna częstotliwość próbkowania:
8000 - Domyślne wykrywanie końca wypowiedzi:
800ms - Transkrypty tymczasowe: domyślnie włączone
plugins.entries.voice-call.config.streaming.providers.xai. Obsługiwane
klucze to apiKey, baseUrl, sampleRate, encoding (pcm, mulaw lub
alaw), interimResults, endpointingMs oraz language.Ten dostawca strumieniowania jest przeznaczony dla ścieżki transkrypcji
w czasie rzeczywistym Voice Call. Discord voice obecnie nagrywa krótkie
segmenty i zamiast tego używa wsadowej ścieżki transkrypcji
tools.media.audio.Konfiguracja x_search
Konfiguracja x_search
Dołączony Plugin xAI udostępnia
x_search jako narzędzie OpenClaw do
wyszukiwania treści X (dawniej Twitter) przez Grok.Ścieżka konfiguracji: plugins.entries.xai.config.xSearch| Klucz | Typ | Domyślnie | Opis |
|---|---|---|---|
enabled | boolean | - | Włącza lub wyłącza x_search |
model | string | grok-4-1-fast | Model używany dla żądań x_search |
baseUrl | string | - | Nadpisanie bazowego URL xAI Responses |
inlineCitations | boolean | - | Dołącza cytowania inline w wynikach |
maxTurns | number | - | Maksymalna liczba tur konwersacji |
timeoutSeconds | number | - | Limit czasu żądania w sekundach |
cacheTtlMinutes | number | - | Czas życia pamięci podręcznej w minutach |
Konfiguracja wykonywania kodu
Konfiguracja wykonywania kodu
Dołączony Plugin xAI udostępnia
code_execution jako narzędzie OpenClaw do
zdalnego wykonywania kodu w środowisku sandbox xAI.Ścieżka konfiguracji: plugins.entries.xai.config.codeExecution| Klucz | Typ | Domyślnie | Opis |
|---|---|---|---|
enabled | boolean | true (jeśli klucz jest dostępny) | Włącza lub wyłącza wykonywanie kodu |
model | string | grok-4-1-fast | Model używany dla żądań wykonywania kodu |
maxTurns | number | - | Maksymalna liczba tur konwersacji |
timeoutSeconds | number | - | Limit czasu żądania w sekundach |
To jest zdalne wykonywanie w sandboxie xAI, a nie lokalne
exec.Znane ograniczenia
Znane ograniczenia
- Uwierzytelnianie odbywa się obecnie tylko przez klucz API. Klucz API może być przechowywany w profilu uwierzytelniania xAI, zmiennej środowiskowej albo konfiguracji pluginu; w OpenClaw nie ma jeszcze przepływu OAuth xAI ani przepływu z kodem urządzenia.
grok-4.20-multi-agent-experimental-beta-0304nie jest obsługiwany na normalnej ścieżce dostawcy xAI, ponieważ wymaga innej powierzchni API upstream niż standardowy transport xAI OpenClaw.- xAI Realtime voice nie jest jeszcze zarejestrowany jako dostawca OpenClaw. Wymaga innego kontraktu dwukierunkowej sesji głosowej niż wsadowe STT lub transkrypcja strumieniowa.
qualityobrazu xAI,maskobrazu oraz dodatkowe współczynniki proporcji dostępne tylko natywnie nie są udostępniane, dopóki współdzielone narzędzieimage_generatenie będzie mieć odpowiadających im kontrolek międzydostawcowych.
Uwagi zaawansowane
Uwagi zaawansowane
- OpenClaw automatycznie stosuje poprawki zgodności schematu narzędzi i wywołań narzędzi specyficzne dla xAI na współdzielonej ścieżce runnera.
- Natywne żądania xAI domyślnie ustawiają
tool_stream: true. Ustawagents.defaults.models["xai/<model>"].params.tool_streamnafalse, aby to wyłączyć. - Dołączony wrapper xAI usuwa nieobsługiwane ścisłe flagi schematu narzędzi oraz klucze ładunku reasoning przed wysłaniem natywnych żądań xAI.
web_search,x_searchicode_executionsą udostępniane jako narzędzia OpenClaw. OpenClaw włącza konkretną wbudowaną funkcję xAI, której potrzebuje, wewnątrz każdego żądania narzędzia, zamiast dołączać wszystkie natywne narzędzia do każdej tury czatu.- Grok
web_searchodczytujeplugins.entries.xai.config.webSearch.baseUrl.x_searchodczytujeplugins.entries.xai.config.xSearch.baseUrl, a następnie wraca do bazowego URL wyszukiwania webowego Grok. x_searchicode_executionnależą do dołączonego pluginu xAI, a nie są zakodowane na stałe w głównym runtime modelu.code_executionto zdalne wykonywanie w sandboxie xAI, a nie lokalneexec.
Testowanie na żywo
Ścieżki mediów xAI są objęte testami jednostkowymi oraz opcjonalnymi zestawami testów na żywo. Polecenia na żywo ładują sekrety z powłoki logowania, w tym~/.profile, zanim sprawdzą XAI_API_KEY.
Powiązane
Wybór modelu
Wybieranie dostawców, referencji modeli i zachowania przełączania awaryjnego.
Generowanie wideo
Współdzielone parametry narzędzia wideo i wybór dostawcy.
Wszyscy dostawcy
Szerszy przegląd dostawców.
Rozwiązywanie problemów
Typowe problemy i poprawki.