Providers
xAI
OpenClaw fournit un Plugin de fournisseur xai intégré pour les modèles Grok. Pour la plupart
des utilisateurs, le parcours recommandé est l’OAuth Grok avec un abonnement SuperGrok ou X Premium
éligible. OpenClaw reste local-first : le Gateway, la configuration, le routage et
les outils s’exécutent sur votre machine, tandis que les requêtes de modèle Grok s’authentifient via xAI
et sont envoyées à l’API de xAI.
OAuth ne nécessite pas de clé API xAI et ne nécessite pas l’application Grok Build. xAI peut tout de même afficher Grok Build sur l’écran de consentement, car OpenClaw utilise le client OAuth partagé de xAI.
Choisir votre parcours de configuration
Utilisez le parcours qui correspond à l’état de votre installation OpenClaw :
New OpenClaw install
Exécutez l’onboarding avec installation du daemon lorsque vous configurez un nouveau Gateway local, puis choisissez l’option OAuth xAI/Grok à l’étape modèle/authentification :
openclaw onboard --install-daemonSur un VPS ou via SSH, sélectionnez directement OAuth xAI ; OpenClaw utilise la vérification par code d’appareil et ne nécessite pas de callback localhost :
openclaw onboard --install-daemon --auth-choice xai-oauthOAuth ne nécessite pas de clé API xAI. OpenClaw ne nécessite pas l’application Grok Build. xAI peut tout de même libeller l’application de consentement comme Grok Build, car OpenClaw utilise le client OAuth partagé de xAI.
Existing OpenClaw install
Si OpenClaw est déjà configuré, connectez-vous uniquement à xAI. Ne relancez pas l’onboarding complet et ne réinstallez pas le daemon uniquement pour connecter Grok :
openclaw models auth login --provider xai --method oauthPour faire de Grok le modèle par défaut après la connexion, appliquez-le séparément :
openclaw models set xai/grok-4.3Relancez l’onboarding complet uniquement si vous souhaitez intentionnellement modifier le Gateway, le daemon, le canal, l’espace de travail ou d’autres choix de configuration.
API-key path
La configuration par clé API fonctionne toujours pour les clés xAI Console et pour les surfaces média qui nécessitent une configuration de fournisseur adossée à une clé :
openclaw models auth login --provider xai --method api-keyexport XAI_API_KEY=xai-...Pick a model
{ agents: { defaults: { model: { primary: "xai/grok-4.3" } } },}Dépannage OAuth
-
Pour SSH, Docker, VPS ou d’autres configurations distantes, utilisez
openclaw models auth login --provider xai --method oauth; OAuth xAI utilise la vérification par code d’appareil au lieu d’un callback localhost. -
Si la connexion réussit mais que Grok n’est pas le modèle par défaut, exécutez
openclaw models set xai/grok-4.3. -
Pour inspecter les profils d’authentification xAI enregistrés, exécutez :
bash openclaw models auth list --provider xaiopenclaw models status -
xAI décide quels comptes peuvent recevoir des jetons API OAuth. Si un compte n’est pas éligible, essayez le parcours par clé API ou vérifiez l’abonnement côté xAI.
Catalogue intégré
OpenClaw inclut d’emblée les modèles de chat xAI actuels, classés du plus récent au plus ancien dans les sélecteurs de modèles :
| Famille | Identifiants de modèle |
|---|---|
| Grok Build 0.1 | grok-build-0.1 |
| Grok 4.3 | grok-4.3 |
| Grok 4.20 Beta | grok-4.20-beta-latest-reasoning, grok-4.20-beta-latest-non-reasoning |
Le Plugin résout toujours en avant les anciens slugs Grok 3, Grok 4, Grok 4 Fast, Grok 4.1
Fast et Grok Code pour les configurations existantes. Les alias officiels Grok Code Fast
se normalisent en grok-build-0.1 ; OpenClaw n’affiche plus les autres slugs upstream retirés
dans le catalogue sélectionnable.
Couverture des fonctionnalités OpenClaw
Le Plugin intégré mappe la surface d’API publique actuelle de xAI sur les contrats partagés de fournisseur et d’outils d’OpenClaw. Les capacités qui ne correspondent pas au contrat partagé (par exemple le TTS en streaming et la voix en temps réel) ne sont pas exposées - voir le tableau ci-dessous.
| Capacité xAI | Surface OpenClaw | État |
|---|---|---|
| Chat / Responses | fournisseur de modèle xai/<model> |
Oui |
| Recherche web côté serveur | fournisseur web_search grok |
Oui |
| Recherche X côté serveur | outil x_search |
Oui |
| Exécution de code côté serveur | outil code_execution |
Oui |
| Images | image_generate |
Oui |
| Vidéos | video_generate |
Oui |
| Synthèse vocale par lot | messages.tts.provider: "xai" / tts |
Oui |
| TTS en streaming | - | Non exposé ; le contrat TTS d’OpenClaw renvoie des tampons audio complets |
| Transcription vocale par lot | tools.media.audio / compréhension média |
Oui |
| Transcription vocale en streaming | Voice Call streaming.provider: "xai" |
Oui |
| Voix en temps réel | - | Pas encore exposé ; contrat de session/WebSocket différent |
| Fichiers / lots | Compatibilité API de modèle générique uniquement | Pas un outil OpenClaw natif |
Mappages du mode rapide
/fast on ou agents.defaults.models["xai/<model>"].params.fastMode: true
réécrit les requêtes xAI natives comme suit :
| Modèle source | Cible du mode rapide |
|---|---|
grok-3 |
grok-3-fast |
grok-3-mini |
grok-3-mini-fast |
grok-4 |
grok-4-fast |
grok-4-0709 |
grok-4-fast |
Alias de compatibilité hérités
Les alias hérités se normalisent toujours vers les identifiants intégrés canoniques :
| Alias hérité | Identifiant canonique |
|---|---|
grok-code-fast-1 |
grok-build-0.1 |
grok-code-fast |
grok-build-0.1 |
grok-code-fast-1-0825 |
grok-build-0.1 |
grok-4-fast-reasoning |
grok-4-fast |
grok-4-1-fast-reasoning |
grok-4-1-fast |
grok-4.20-reasoning |
grok-4.20-beta-latest-reasoning |
grok-4.20-non-reasoning |
grok-4.20-beta-latest-non-reasoning |
Fonctionnalités
Web search
Le fournisseur de recherche web grok intégré préfère OAuth xAI, puis se rabat
sur XAI_API_KEY ou une clé de recherche web du Plugin :
openclaw models auth login --provider xai --method oauthopenclaw config set tools.web.search.provider grokVideo generation
Le Plugin xai intégré enregistre la génération vidéo via l’outil partagé
video_generate.
- Modèle vidéo par défaut :
xai/grok-imagine-video - Modes : texte-vers-vidéo, image-vers-vidéo, génération par image de référence, modification vidéo distante et extension vidéo distante
- Formats d’image :
1:1,16:9,9:16,4:3,3:4,3:2,2:3 - Résolutions :
480P,720P - Durée : 1 à 15 secondes pour la génération/image-vers-vidéo, 1 à 10 secondes lors de
l’utilisation de rôles
reference_image, 2 à 10 secondes pour l’extension - Génération par image de référence : définissez
imageRolessurreference_imagepour chaque image fournie ; xAI accepte jusqu’à 7 images de ce type - Délai d’expiration par défaut de l’opération : 600 secondes, sauf si
video_generate.timeoutMsouagents.defaults.videoGenerationModel.timeoutMsest défini
Pour utiliser xAI comme fournisseur vidéo par défaut :
{ agents: { defaults: { videoGenerationModel: { primary: "xai/grok-imagine-video", }, }, },}Image generation
Le Plugin xai intégré enregistre la génération d’images via l’outil partagé
image_generate.
- Modèle d’image par défaut :
xai/grok-imagine-image - Modèle supplémentaire :
xai/grok-imagine-image-quality - Modes : texte-vers-image et modification par image de référence
- Entrées de référence : une
imageou jusqu’à cinqimages - Formats d’image :
1:1,16:9,9:16,4:3,3:4,2:3,3:2 - Résolutions :
1K,2K - Nombre : jusqu’à 4 images
- Délai d’expiration par défaut de l’opération : 600 secondes, sauf si
image_generate.timeoutMsouagents.defaults.imageGenerationModel.timeoutMsest défini
OpenClaw demande à xAI des réponses d’image b64_json afin que les médias générés puissent être
stockés et livrés via le chemin normal des pièces jointes de canal. Les images de référence
locales sont converties en URL de données ; les références http(s) distantes sont
transmises telles quelles.
Pour utiliser xAI comme fournisseur d’images par défaut :
{ agents: { defaults: { imageGenerationModel: { primary: "xai/grok-imagine-image", }, }, },}Synthèse vocale
Le Plugin xai inclus enregistre la synthèse vocale via la surface de
fournisseur tts partagée.
- Voix :
eve,ara,rex,sal,leo,una - Voix par défaut :
eve - Formats :
mp3,wav,pcm,mulaw,alaw - Langue : code BCP-47 ou
auto - Vitesse : surcharge de vitesse native du fournisseur
- Le format natif Opus de note vocale n'est pas pris en charge
Pour utiliser xAI comme fournisseur TTS par défaut :
{ messages: { tts: { provider: "xai", providers: { xai: { speakerVoiceId: "eve", }, }, }, },}Reconnaissance vocale
Le Plugin xai inclus enregistre la reconnaissance vocale par lots via la
surface de transcription de compréhension des médias d'OpenClaw.
- Modèle par défaut :
grok-stt - Point de terminaison : REST xAI
/v1/stt - Chemin d'entrée : téléversement de fichier audio multipart
- Pris en charge par OpenClaw partout où la transcription audio entrante utilise
tools.media.audio, notamment les segments de canaux vocaux Discord et les pièces jointes audio des canaux
Pour forcer xAI pour la transcription audio entrante :
{ tools: { media: { audio: { models: [ { type: "provider", provider: "xai", model: "grok-stt", }, ], }, }, },}La langue peut être fournie via la configuration de média audio partagée ou par requête de transcription. Les indications de prompt sont acceptées par la surface OpenClaw partagée, mais l'intégration STT REST de xAI ne transmet que le fichier, le modèle et la langue, car ces éléments correspondent clairement au point de terminaison public xAI actuel.
Reconnaissance vocale en streaming
Le Plugin xai inclus enregistre aussi un fournisseur de transcription en
temps réel pour l'audio des appels vocaux en direct.
- Point de terminaison : WebSocket xAI
wss://api.x.ai/v1/stt - Encodage par défaut :
mulaw - Fréquence d'échantillonnage par défaut :
8000 - Détection de fin par défaut :
800ms - Transcriptions intermédiaires : activées par défaut
Le flux média Twilio de Voice Call envoie des trames audio G.711 µ-law, donc le fournisseur xAI peut transmettre ces trames directement sans transcodage :
{ plugins: { entries: { "voice-call": { config: { streaming: { enabled: true, provider: "xai", providers: { xai: { apiKey: "${XAI_API_KEY}", endpointingMs: 800, language: "en", }, }, }, }, }, }, },}La configuration détenue par le fournisseur se trouve sous
plugins.entries.voice-call.config.streaming.providers.xai. Les clés prises
en charge sont apiKey, baseUrl, sampleRate, encoding (pcm, mulaw ou
alaw), interimResults, endpointingMs et language.
Configuration de x_search
Le Plugin xAI inclus expose x_search comme outil OpenClaw pour rechercher
du contenu X (anciennement Twitter) via Grok.
Chemin de configuration : plugins.entries.xai.config.xSearch
| Clé | Type | Valeur par défaut | Description |
|---|---|---|---|
enabled |
boolean | - | Activer ou désactiver x_search |
model |
string | grok-4-1-fast |
Modèle utilisé pour les requêtes x_search |
baseUrl |
string | - | Surcharge de l'URL de base xAI Responses |
inlineCitations |
boolean | - | Inclure des citations en ligne dans les résultats |
maxTurns |
number | - | Nombre maximal de tours de conversation |
timeoutSeconds |
number | - | Délai d'expiration de la requête en secondes |
cacheTtlMinutes |
number | - | Durée de vie du cache en minutes |
{ plugins: { entries: { xai: { config: { xSearch: { enabled: true, model: "grok-4-1-fast", baseUrl: "https://api.x.ai/v1", inlineCitations: true, }, }, }, }, },}Configuration de l'exécution de code
Le Plugin xAI inclus expose code_execution comme outil OpenClaw pour
l'exécution de code à distance dans l'environnement sandbox de xAI.
Chemin de configuration : plugins.entries.xai.config.codeExecution
| Clé | Type | Valeur par défaut | Description |
|---|---|---|---|
enabled |
boolean | true (si la clé est disponible) |
Activer ou désactiver l'exécution de code |
model |
string | grok-4-1-fast |
Modèle utilisé pour les requêtes d'exécution de code |
maxTurns |
number | - | Nombre maximal de tours de conversation |
timeoutSeconds |
number | - | Délai d'expiration de la requête en secondes |
{ plugins: { entries: { xai: { config: { codeExecution: { enabled: true, model: "grok-4-1-fast", }, }, }, }, },}Limites connues
- L'authentification xAI peut utiliser une clé d'API, une variable d'environnement, un repli de configuration du Plugin ou OAuth avec un compte xAI éligible. OAuth utilise une vérification par code d'appareil sans rappel localhost. xAI décide quels comptes peuvent recevoir des jetons d'API OAuth, et la page de consentement peut afficher Grok Build même si OpenClaw n'exige pas l'application Grok Build.
- OpenClaw n'expose pas actuellement la famille de modèles multi-agents de xAI. xAI sert ces modèles via l'API Responses, mais ils n'acceptent pas les outils côté client ni les outils personnalisés utilisés par la boucle d'agent partagée d'OpenClaw. Consultez les limites multi-agents de xAI.
- La voix Realtime de xAI n'est pas encore enregistrée comme fournisseur OpenClaw. Elle nécessite un contrat de session vocale bidirectionnelle différent de la STT par lots ou de la transcription en streaming.
- Les options d'image xAI
quality,masket les ratios d'aspect supplémentaires uniquement natifs ne sont pas exposés tant que l'outil partagéimage_generatene dispose pas de contrôles correspondants entre fournisseurs.
Notes avancées
- OpenClaw applique automatiquement les correctifs de compatibilité de schéma d'outils et d'appels d'outils propres à xAI sur le chemin du lanceur partagé.
- Les requêtes xAI natives utilisent par défaut
tool_stream: true. Définissezagents.defaults.models["xai/<model>"].params.tool_streamsurfalsepour le désactiver. - Le wrapper xAI inclus retire les indicateurs stricts de schéma d'outils non
pris en charge et les clés de charge utile de raisonnement effort avant
d'envoyer les requêtes xAI natives. Seuls
grok-4.3/grok-4.3-*annoncent un effort de raisonnement configurable ; tous les autres modèles xAI capables de raisonnement demandent toujoursinclude: ["reasoning.encrypted_content"]afin que le raisonnement chiffré précédent puisse être rejoué lors des tours suivants. web_search,x_searchetcode_executionsont exposés comme outils OpenClaw. OpenClaw active l'intégration xAI intégrée précise dont il a besoin dans chaque requête d'outil au lieu d'attacher tous les outils natifs à chaque tour de chat.- Le
web_searchde Grok litplugins.entries.xai.config.webSearch.baseUrl.x_searchlitplugins.entries.xai.config.xSearch.baseUrl, puis se replie sur l'URL de base de recherche Web Grok. x_searchetcode_executionappartiennent au Plugin xAI inclus plutôt que d'être codés en dur dans le runtime de modèle principal.code_executionest l'exécution sandbox xAI à distance, pasexeclocal.
Tests en direct
Les chemins média xAI sont couverts par des tests unitaires et des suites en
direct à activation explicite. Exportez XAI_API_KEY dans l'environnement du
processus avant d'exécuter les sondes en direct.
pnpm test extensions/xaiOPENCLAW_LIVE_TEST=1 OPENCLAW_LIVE_TEST_QUIET=1 pnpm test:live -- extensions/xai/xai.live.test.tsOPENCLAW_LIVE_TEST=1 OPENCLAW_LIVE_TEST_QUIET=1 OPENCLAW_LIVE_IMAGE_GENERATION_PROVIDERS=xai pnpm test:live -- test/image-generation.runtime.live.test.tsLe fichier en direct propre au fournisseur synthétise une TTS normale, une TTS PCM adaptée à la téléphonie, transcrit l'audio via la STT par lots de xAI, diffuse le même PCM via la STT en temps réel de xAI, génère une sortie texte vers image et modifie une image de référence. Le fichier en direct d'image partagé vérifie le même fournisseur xAI via le chemin de sélection du runtime, de repli, de normalisation et de pièce jointe média d'OpenClaw.