Providers
xAI
OpenClaw zawiera dołączony Plugin dostawcy xai dla modeli Grok. Dla większości
użytkowników zalecaną ścieżką jest Grok OAuth z kwalifikującą się subskrypcją
SuperGrok lub X Premium. OpenClaw pozostaje lokalny w pierwszej kolejności:
Gateway, konfiguracja, routing i narzędzia działają na Twoim komputerze, a
żądania modeli Grok uwierzytelniają się przez xAI i są wysyłane do API xAI.
OAuth nie wymaga klucza API xAI ani aplikacji Grok Build. xAI może nadal pokazywać Grok Build na ekranie zgody, ponieważ OpenClaw używa współdzielonego klienta OAuth xAI.
Wybierz ścieżkę konfiguracji
Użyj ścieżki odpowiadającej stanowi instalacji OpenClaw:
Nowa instalacja OpenClaw
Uruchom onboarding z instalacją demona, gdy konfigurujesz nowy lokalny Gateway, a następnie wybierz opcję xAI/Grok OAuth w kroku modelu/uwierzytelniania:
openclaw onboard --install-daemonNa VPS lub przez SSH wybierz bezpośrednio xAI OAuth; OpenClaw używa weryfikacji kodem urządzenia i nie wymaga wywołania zwrotnego localhost:
openclaw onboard --install-daemon --auth-choice xai-oauthOAuth nie wymaga klucza API xAI. OpenClaw nie wymaga aplikacji Grok Build. xAI może nadal oznaczać aplikację zgody jako Grok Build, ponieważ OpenClaw używa współdzielonego klienta OAuth xAI.
Istniejąca instalacja OpenClaw
Jeśli OpenClaw jest już skonfigurowany, zaloguj się tylko do xAI. Nie uruchamiaj ponownie pełnego onboardingu ani nie instaluj ponownie demona tylko po to, aby podłączyć Grok:
openclaw models auth login --provider xai --method oauthAby po zalogowaniu ustawić Grok jako domyślny model, zastosuj to osobno:
openclaw models set xai/grok-4.3Uruchom ponownie pełny onboarding tylko wtedy, gdy celowo chcesz zmienić Gateway, demona, kanał, przestrzeń roboczą lub inne opcje konfiguracji.
Ścieżka klucza API
Konfiguracja klucza API nadal działa dla kluczy xAI Console oraz dla powierzchni multimedialnych, które wymagają konfiguracji dostawcy opartej na kluczu:
openclaw models auth login --provider xai --method api-keyexport XAI_API_KEY=xai-...Wybierz model
{ agents: { defaults: { model: { primary: "xai/grok-4.3" } } },}Rozwiązywanie problemów z OAuth
-
Dla SSH, Docker, VPS lub innych konfiguracji zdalnych użyj
openclaw models auth login --provider xai --method oauth; xAI OAuth używa weryfikacji kodem urządzenia zamiast wywołania zwrotnego localhost. -
Jeśli logowanie się powiedzie, ale Grok nie jest modelem domyślnym, uruchom
openclaw models set xai/grok-4.3. -
Aby sprawdzić zapisane profile uwierzytelniania xAI, uruchom:
bash openclaw models auth list --provider xaiopenclaw models status -
xAI decyduje, które konta mogą otrzymywać tokeny API OAuth. Jeśli konto nie kwalifikuje się, spróbuj ścieżki klucza API lub sprawdź subskrypcję po stronie xAI.
Wbudowany katalog
OpenClaw od razu zawiera aktualne modele czatu xAI, uporządkowane w selektorach modeli od najnowszych:
| Rodzina | Identyfikatory modeli |
|---|---|
| Grok Build 0.1 | grok-build-0.1 |
| Grok 4.3 | grok-4.3 |
| Grok 4.20 Beta | grok-4.20-beta-latest-reasoning, grok-4.20-beta-latest-non-reasoning |
Plugin nadal rozwiązuje w przód starsze slugi Grok 3, Grok 4, Grok 4 Fast, Grok 4.1
Fast i Grok Code dla istniejących konfiguracji. Oficjalne aliasy Grok Code Fast
normalizują się do grok-build-0.1; OpenClaw nie pokazuje już pozostałych
wycofanych slugów upstream w wybieralnym katalogu.
Zakres funkcji OpenClaw
Dołączony Plugin mapuje aktualną publiczną powierzchnię API xAI na współdzielone kontrakty dostawców i narzędzi OpenClaw. Możliwości, które nie pasują do współdzielonego kontraktu (na przykład strumieniowe TTS i głos w czasie rzeczywistym), nie są udostępniane - zobacz tabelę poniżej.
| Możliwość xAI | Powierzchnia OpenClaw | Status |
|---|---|---|
| Czat / Responses | dostawca modelu xai/<model> |
Tak |
| Wyszukiwanie internetowe po stronie serwera | dostawca web_search grok |
Tak |
| Wyszukiwanie X po stronie serwera | narzędzie x_search |
Tak |
| Wykonywanie kodu po stronie serwera | narzędzie code_execution |
Tak |
| Obrazy | image_generate |
Tak |
| Wideo | video_generate |
Tak |
| Wsadowa synteza mowy | messages.tts.provider: "xai" / tts |
Tak |
| Strumieniowe TTS | - | Nieudostępnione; kontrakt TTS OpenClaw zwraca kompletne bufory audio |
| Wsadowe rozpoznawanie mowy | tools.media.audio / rozumienie mediów |
Tak |
| Strumieniowe rozpoznawanie mowy | Voice Call streaming.provider: "xai" |
Tak |
| Głos w czasie rzeczywistym | - | Jeszcze nieudostępnione; inny kontrakt sesji/WebSocket |
| Pliki / zadania wsadowe | Tylko ogólna kompatybilność API modeli | Nie jest pierwszoklasowym narzędziem OpenClaw |
Mapowania trybu szybkiego
/fast on lub agents.defaults.models["xai/<model>"].params.fastMode: true
przepisuje natywne żądania xAI w następujący sposób:
| Model źródłowy | Cel trybu szybkiego |
|---|---|
grok-3 |
grok-3-fast |
grok-3-mini |
grok-3-mini-fast |
grok-4 |
grok-4-fast |
grok-4-0709 |
grok-4-fast |
Starsze aliasy kompatybilności
Starsze aliasy nadal normalizują się do kanonicznych dołączonych identyfikatorów:
| Starszy alias | Kanoniczny identyfikator |
|---|---|
grok-code-fast-1 |
grok-build-0.1 |
grok-code-fast |
grok-build-0.1 |
grok-code-fast-1-0825 |
grok-build-0.1 |
grok-4-fast-reasoning |
grok-4-fast |
grok-4-1-fast-reasoning |
grok-4-1-fast |
grok-4.20-reasoning |
grok-4.20-beta-latest-reasoning |
grok-4.20-non-reasoning |
grok-4.20-beta-latest-non-reasoning |
Funkcje
Wyszukiwanie internetowe
Dołączony dostawca wyszukiwania internetowego grok preferuje xAI OAuth,
a następnie przełącza się awaryjnie na XAI_API_KEY lub klucz wyszukiwania
internetowego Plugin:
openclaw models auth login --provider xai --method oauthopenclaw config set tools.web.search.provider grokGenerowanie wideo
Dołączony Plugin xai rejestruje generowanie wideo przez współdzielone
narzędzie video_generate.
- Domyślny model wideo:
xai/grok-imagine-video - Tryby: tekst-na-wideo, obraz-na-wideo, generowanie z obrazu referencyjnego, zdalna edycja wideo i zdalne rozszerzanie wideo
- Proporcje obrazu:
1:1,16:9,9:16,4:3,3:4,3:2,2:3 - Rozdzielczości:
480P,720P - Czas trwania: 1-15 sekund dla generowania/obrazu-na-wideo, 1-10 sekund przy
użyciu ról
reference_image, 2-10 sekund dla rozszerzania - Generowanie z obrazu referencyjnego: ustaw
imageRolesnareference_imagedla każdego dostarczonego obrazu; xAI akceptuje do 7 takich obrazów - Domyślny limit czasu operacji: 600 sekund, chyba że ustawiono
video_generate.timeoutMslubagents.defaults.videoGenerationModel.timeoutMs
Aby używać xAI jako domyślnego dostawcy wideo:
{ agents: { defaults: { videoGenerationModel: { primary: "xai/grok-imagine-video", }, }, },}Generowanie obrazów
Dołączony Plugin xai rejestruje generowanie obrazów przez współdzielone
narzędzie image_generate.
- Domyślny model obrazu:
xai/grok-imagine-image - Dodatkowy model:
xai/grok-imagine-image-quality - Tryby: tekst-na-obraz i edycja z obrazem referencyjnym
- Wejścia referencyjne: jeden
imagelub do pięciuimages - Proporcje obrazu:
1:1,16:9,9:16,4:3,3:4,2:3,3:2 - Rozdzielczości:
1K,2K - Liczba: do 4 obrazów
- Domyślny limit czasu operacji: 600 sekund, chyba że ustawiono
image_generate.timeoutMslubagents.defaults.imageGenerationModel.timeoutMs
OpenClaw prosi xAI o odpowiedzi obrazów b64_json, aby wygenerowane media mogły być
przechowywane i dostarczane przez standardową ścieżkę załączników kanału. Lokalne
obrazy referencyjne są konwertowane na adresy URL danych; zdalne referencje http(s) są
przekazywane bez zmian.
Aby używać xAI jako domyślnego dostawcy obrazów:
{ agents: { defaults: { imageGenerationModel: { primary: "xai/grok-imagine-image", }, }, },}Tekst na mowę
Dołączony Plugin xai rejestruje tekst na mowę przez wspólną powierzchnię
dostawcy tts.
- Głosy:
eve,ara,rex,sal,leo,una - Domyślny głos:
eve - Formaty:
mp3,wav,pcm,mulaw,alaw - Język: kod BCP-47 lub
auto - Szybkość: natywne nadpisanie szybkości dostawcy
- Natywny format notatki głosowej Opus nie jest obsługiwany
Aby używać xAI jako domyślnego dostawcy TTS:
{ messages: { tts: { provider: "xai", providers: { xai: { speakerVoiceId: "eve", }, }, }, },}Mowa na tekst
Dołączony Plugin xai rejestruje wsadowe przetwarzanie mowy na tekst przez
powierzchnię transkrypcji rozumienia mediów w OpenClaw.
- Domyślny model:
grok-stt - Punkt końcowy: xAI REST
/v1/stt - Ścieżka wejściowa: przesyłanie pliku audio multipart
- Obsługiwane przez OpenClaw wszędzie tam, gdzie transkrypcja przychodzącego
audio używa
tools.media.audio, w tym segmenty kanałów głosowych Discord i załączniki audio kanałów
Aby wymusić xAI dla transkrypcji przychodzącego audio:
{ tools: { media: { audio: { models: [ { type: "provider", provider: "xai", model: "grok-stt", }, ], }, }, },}Język można podać przez wspólną konfigurację mediów audio albo żądanie transkrypcji dla pojedynczego wywołania. Wskazówki promptu są akceptowane przez wspólną powierzchnię OpenClaw, ale integracja xAI REST STT przekazuje tylko plik, model i język, ponieważ są one jednoznacznie mapowane na obecny publiczny punkt końcowy xAI.
Strumieniowe przetwarzanie mowy na tekst
Dołączony Plugin xai rejestruje także dostawcę transkrypcji w czasie
rzeczywistym dla audio rozmów głosowych na żywo.
- Punkt końcowy: xAI WebSocket
wss://api.x.ai/v1/stt - Domyślne kodowanie:
mulaw - Domyślna częstotliwość próbkowania:
8000 - Domyślne wykrywanie końca wypowiedzi:
800ms - Transkrypcje pośrednie: domyślnie włączone
Strumień mediów Twilio w Voice Call wysyła ramki audio G.711 µ-law, więc dostawca xAI może przekazywać te ramki bezpośrednio bez transkodowania:
{ plugins: { entries: { "voice-call": { config: { streaming: { enabled: true, provider: "xai", providers: { xai: { apiKey: "${XAI_API_KEY}", endpointingMs: 800, language: "en", }, }, }, }, }, }, },}Konfiguracja należąca do dostawcy znajduje się pod
plugins.entries.voice-call.config.streaming.providers.xai. Obsługiwane
klucze to apiKey, baseUrl, sampleRate, encoding (pcm, mulaw lub
alaw), interimResults, endpointingMs i language.
Konfiguracja x_search
Dołączony Plugin xAI udostępnia x_search jako narzędzie OpenClaw do
wyszukiwania treści X (dawniej Twitter) przez Grok.
Ścieżka konfiguracji: plugins.entries.xai.config.xSearch
| Klucz | Typ | Domyślne | Opis |
|---|---|---|---|
enabled |
boolean | - | Włącz lub wyłącz x_search |
model |
string | grok-4-1-fast |
Model używany do żądań x_search |
baseUrl |
string | - | Nadpisanie bazowego URL xAI Responses |
inlineCitations |
boolean | - | Uwzględnij cytowania w wierszu w wynikach |
maxTurns |
number | - | Maksymalna liczba tur rozmowy |
timeoutSeconds |
number | - | Limit czasu żądania w sekundach |
cacheTtlMinutes |
number | - | Czas życia pamięci podręcznej w minutach |
{ plugins: { entries: { xai: { config: { xSearch: { enabled: true, model: "grok-4-1-fast", baseUrl: "https://api.x.ai/v1", inlineCitations: true, }, }, }, }, },}Konfiguracja wykonywania kodu
Dołączony Plugin xAI udostępnia code_execution jako narzędzie OpenClaw do
zdalnego wykonywania kodu w środowisku piaskownicy xAI.
Ścieżka konfiguracji: plugins.entries.xai.config.codeExecution
| Klucz | Typ | Domyślne | Opis |
|---|---|---|---|
enabled |
boolean | true (jeśli klucz jest dostępny) |
Włącz lub wyłącz wykonywanie kodu |
model |
string | grok-4-1-fast |
Model używany do żądań wykonywania kodu |
maxTurns |
number | - | Maksymalna liczba tur rozmowy |
timeoutSeconds |
number | - | Limit czasu żądania w sekundach |
{ plugins: { entries: { xai: { config: { codeExecution: { enabled: true, model: "grok-4-1-fast", }, }, }, }, },}Znane ograniczenia
- Uwierzytelnianie xAI może używać klucza API, zmiennej środowiskowej, awaryjnej konfiguracji Pluginu albo OAuth z kwalifikującym się kontem xAI. OAuth używa weryfikacji kodem urządzenia bez wywołania zwrotnego localhost. xAI decyduje, które konta mogą otrzymywać tokeny API OAuth, a strona zgody może pokazywać Grok Build, mimo że OpenClaw nie wymaga aplikacji Grok Build.
- OpenClaw obecnie nie udostępnia rodziny modeli wieloagentowych xAI. xAI obsługuje te modele przez Responses API, ale nie akceptują one narzędzi po stronie klienta ani narzędzi niestandardowych używanych przez wspólną pętlę agenta OpenClaw. Zobacz ograniczenia wieloagentowe xAI.
- Głos xAI Realtime nie jest jeszcze zarejestrowany jako dostawca OpenClaw. Wymaga innego kontraktu dwukierunkowej sesji głosowej niż wsadowe STT lub transkrypcja strumieniowa.
qualityobrazu xAI,maskobrazu oraz dodatkowe proporcje wyłącznie natywne nie są udostępniane, dopóki wspólne narzędzieimage_generatenie będzie mieć odpowiadających im międzydostawczych ustawień.
Uwagi zaawansowane
- OpenClaw automatycznie stosuje poprawki zgodności schematów narzędzi i wywołań narzędzi specyficzne dla xAI na wspólnej ścieżce uruchamiania.
- Natywne żądania xAI domyślnie ustawiają
tool_stream: true. Ustawagents.defaults.models["xai/<model>"].params.tool_streamnafalse, aby to wyłączyć. - Dołączony wrapper xAI usuwa nieobsługiwane rygorystyczne flagi schematu
narzędzi oraz klucze payloadu wysiłku rozumowania przed wysłaniem
natywnych żądań xAI. Tylko
grok-4.3/grok-4.3-*deklarują konfigurowalny wysiłek rozumowania; wszystkie pozostałe modele xAI zdolne do rozumowania nadal żądająinclude: ["reasoning.encrypted_content"], aby wcześniejsze zaszyfrowane rozumowanie można było odtworzyć w kolejnych turach. web_search,x_searchicode_executionsą udostępniane jako narzędzia OpenClaw. OpenClaw włącza konkretną wbudowaną funkcję xAI potrzebną w każdym żądaniu narzędzia, zamiast dołączać wszystkie natywne narzędzia do każdej tury czatu.- Grok
web_searchodczytujeplugins.entries.xai.config.webSearch.baseUrl.x_searchodczytujeplugins.entries.xai.config.xSearch.baseUrl, a następnie wraca awaryjnie do bazowego URL wyszukiwania w sieci Grok. x_searchicode_executionnależą do dołączonego Pluginu xAI, a nie są zakodowane na stałe w głównym runtime modeli.code_executionto zdalne wykonywanie w piaskownicy xAI, a nie lokalneexec.
Testowanie na żywo
Ścieżki mediów xAI są objęte testami jednostkowymi i opcjonalnie włączanymi
zestawami testów na żywo. Wyeksportuj XAI_API_KEY w środowisku procesu przed
uruchomieniem prób na żywo.
pnpm test extensions/xaiOPENCLAW_LIVE_TEST=1 OPENCLAW_LIVE_TEST_QUIET=1 pnpm test:live -- extensions/xai/xai.live.test.tsOPENCLAW_LIVE_TEST=1 OPENCLAW_LIVE_TEST_QUIET=1 OPENCLAW_LIVE_IMAGE_GENERATION_PROVIDERS=xai pnpm test:live -- test/image-generation.runtime.live.test.tsPlik testów na żywo specyficzny dla dostawcy syntetyzuje zwykłe TTS, przyjazne telefonii PCM TTS, transkrybuje audio przez wsadowe STT xAI, strumieniuje ten sam PCM przez xAI realtime STT, generuje wynik tekst-na-obraz i edytuje obraz referencyjny. Wspólny plik testów na żywo obrazów weryfikuje tego samego dostawcę xAI przez ścieżkę wyboru runtime OpenClaw, fallbacku, normalizacji i załączników mediów.