Vai al contenuto principale

Documentation Index

Fetch the complete documentation index at: https://docs.openclaw.ai/llms.txt

Use this file to discover all available pages before exploring further.

OpenClaw distribuisce un plugin provider xai incluso per i modelli Grok.

Primi passi

1

Crea una chiave API

Crea una chiave API nella console xAI.
2

Imposta la tua chiave API

Imposta XAI_API_KEY, oppure esegui:
openclaw onboard --auth-choice xai-api-key
3

Scegli un modello

{
  agents: { defaults: { model: { primary: "xai/grok-4.3" } } },
}
OpenClaw usa l’API Responses di xAI come trasporto xAI incluso. La stessa chiave API di openclaw onboard --auth-choice xai-api-key può anche alimentare x_search di prima classe e code_execution remoto; anche XAI_API_KEY o la configurazione di ricerca web del plugin possono alimentare web_search basato su Grok. Se archivi una chiave xAI in plugins.entries.xai.config.webSearch.apiKey, il provider del modello xAI incluso riutilizza quella chiave anche come fallback. Imposta plugins.entries.xai.config.webSearch.baseUrl per instradare web_search di Grok e, per impostazione predefinita, x_search tramite un proxy xAI Responses dell’operatore. La regolazione di code_execution si trova in plugins.entries.xai.config.codeExecution.

Catalogo integrato

OpenClaw include queste famiglie di modelli xAI pronte all’uso:
FamigliaID modello
Grok 3grok-3, grok-3-fast, grok-3-mini, grok-3-mini-fast
Grok 4.3grok-4.3
Grok 4grok-4, grok-4-0709
Grok 4 Fastgrok-4-fast, grok-4-fast-non-reasoning
Grok 4.1 Fastgrok-4-1-fast, grok-4-1-fast-non-reasoning
Grok 4.20 Betagrok-4.20-beta-latest-reasoning, grok-4.20-beta-latest-non-reasoning
Grok Codegrok-code-fast-1
Il plugin risolve in avanti anche gli ID grok-4* e grok-code-fast* più recenti quando seguono la stessa forma API.
grok-4.3, grok-4-fast, grok-4-1-fast e le varianti grok-4.20-beta-* sono gli attuali riferimenti Grok con supporto per immagini nel catalogo incluso.

Copertura delle funzionalità OpenClaw

Il plugin incluso mappa l’attuale superficie API pubblica di xAI sui contratti condivisi di provider e strumenti di OpenClaw. Le funzionalità che non rientrano nel contratto condiviso (per esempio TTS in streaming e voce in tempo reale) non sono esposte: vedi la tabella seguente.
Funzionalità xAISuperficie OpenClawStato
Chat / Responsesprovider di modelli xai/<model>
Ricerca web lato serverprovider web_search grok
Ricerca X lato serverstrumento x_search
Esecuzione codice lato serverstrumento code_execution
Immaginiimage_generate
Videovideo_generate
Text-to-speech batchmessages.tts.provider: "xai" / tts
TTS in streaming-Non esposto; il contratto TTS di OpenClaw restituisce buffer audio completi
Speech-to-text batchtools.media.audio / comprensione multimediale
Speech-to-text in streamingVoice Call streaming.provider: "xai"
Voce in tempo reale-Non ancora esposta; contratto di sessione/WebSocket diverso
File / batchSolo compatibilità API generica del modelloNon è uno strumento OpenClaw di prima classe
OpenClaw usa le API REST image/video/TTS/STT di xAI per generazione multimediale, voce e trascrizione batch, il WebSocket STT in streaming di xAI per la trascrizione di chiamate vocali in diretta e l’API Responses per strumenti di modello, ricerca ed esecuzione codice. Le funzionalità che richiedono contratti OpenClaw diversi, come le sessioni vocali in tempo reale, sono documentate qui come funzionalità upstream anziché come comportamento nascosto del plugin.

Mappature della modalità veloce

/fast on o agents.defaults.models["xai/<model>"].params.fastMode: true riscrive le richieste xAI native come segue:
Modello di origineDestinazione modalità veloce
grok-3grok-3-fast
grok-3-minigrok-3-mini-fast
grok-4grok-4-fast
grok-4-0709grok-4-fast

Alias di compatibilità legacy

Gli alias legacy vengono ancora normalizzati agli ID canonici inclusi:
Alias legacyID canonico
grok-4-fast-reasoninggrok-4-fast
grok-4-1-fast-reasoninggrok-4-1-fast
grok-4.20-reasoninggrok-4.20-beta-latest-reasoning
grok-4.20-non-reasoninggrok-4.20-beta-latest-non-reasoning

Funzionalità

Il provider di ricerca web grok incluso può usare XAI_API_KEY o una chiave di ricerca web del plugin:
openclaw config set tools.web.search.provider grok
Il plugin xai incluso registra la generazione video tramite lo strumento condiviso video_generate.
  • Modello video predefinito: xai/grok-imagine-video
  • Modalità: text-to-video, image-to-video, generazione con immagine di riferimento, modifica video remota ed estensione video remota
  • Rapporti d’aspetto: 1:1, 16:9, 9:16, 4:3, 3:4, 3:2, 2:3
  • Risoluzioni: 480P, 720P
  • Durata: 1-15 secondi per generazione/image-to-video, 1-10 secondi quando si usano ruoli reference_image, 2-10 secondi per l’estensione
  • Generazione con immagine di riferimento: imposta imageRoles su reference_image per ogni immagine fornita; xAI accetta fino a 7 immagini di questo tipo
I buffer video locali non sono accettati. Usa URL remoti http(s) per gli input di modifica/estensione video. Image-to-video accetta buffer immagine locali perché OpenClaw può codificarli come URL dati per xAI.
Per usare xAI come provider video predefinito:
{
  agents: {
    defaults: {
      videoGenerationModel: {
        primary: "xai/grok-imagine-video",
      },
    },
  },
}
Vedi Generazione video per i parametri condivisi dello strumento, la selezione del provider e il comportamento di failover.
Il plugin xai incluso registra la generazione immagini tramite lo strumento condiviso image_generate.
  • Modello immagine predefinito: xai/grok-imagine-image
  • Modello aggiuntivo: xai/grok-imagine-image-pro
  • Modalità: text-to-image e modifica con immagine di riferimento
  • Input di riferimento: una image o fino a cinque images
  • Rapporti d’aspetto: 1:1, 16:9, 9:16, 4:3, 3:4, 2:3, 3:2
  • Risoluzioni: 1K, 2K
  • Conteggio: fino a 4 immagini
OpenClaw richiede a xAI risposte immagine b64_json in modo che i media generati possano essere archiviati e consegnati tramite il normale percorso degli allegati del canale. Le immagini di riferimento locali vengono convertite in URL dati; i riferimenti remoti http(s) vengono passati così come sono.Per usare xAI come provider immagine predefinito:
{
  agents: {
    defaults: {
      imageGenerationModel: {
        primary: "xai/grok-imagine-image",
      },
    },
  },
}
xAI documenta anche quality, mask, user e ulteriori rapporti nativi come 1:2, 2:1, 9:20 e 20:9. OpenClaw inoltra oggi solo i controlli immagine condivisi tra provider; le manopole non supportate e solo native non sono esposte intenzionalmente tramite image_generate.
Il plugin xai incluso registra il text-to-speech tramite la superficie provider tts condivisa.
  • Voci: eve, ara, rex, sal, leo, una
  • Voce predefinita: eve
  • Formati: mp3, wav, pcm, mulaw, alaw
  • Lingua: codice BCP-47 o auto
  • Velocità: override della velocità nativo del provider
  • Il formato nativo Opus per note vocali non è supportato
Per usare xAI come provider TTS predefinito:
{
  messages: {
    tts: {
      provider: "xai",
      providers: {
        xai: {
          voiceId: "eve",
        },
      },
    },
  },
}
OpenClaw usa l’endpoint batch /v1/tts di xAI. xAI offre anche TTS in streaming tramite WebSocket, ma il contratto del provider vocale di OpenClaw attualmente richiede un buffer audio completo prima della consegna della risposta.
Il plugin xai incluso registra speech-to-text batch tramite la superficie di trascrizione per comprensione multimediale di OpenClaw.
  • Modello predefinito: grok-stt
  • Endpoint: xAI REST /v1/stt
  • Percorso di input: caricamento file audio multipart
  • Supportato da OpenClaw ovunque la trascrizione audio in ingresso usi tools.media.audio, inclusi i segmenti dei canali vocali Discord e gli allegati audio dei canali
Per forzare xAI per la trascrizione audio in ingresso:
{
  tools: {
    media: {
      audio: {
        models: [
          {
            type: "provider",
            provider: "xai",
            model: "grok-stt",
          },
        ],
      },
    },
  },
}
La lingua può essere fornita tramite la configurazione multimediale audio condivisa o per singola richiesta di trascrizione. Gli hint del prompt sono accettati dalla superficie condivisa di OpenClaw, ma l’integrazione REST STT di xAI inoltra solo file, modello e lingua perché questi si mappano in modo pulito sull’attuale endpoint pubblico xAI.
Il plugin xai incluso registra anche un provider di trascrizione in tempo reale per l’audio delle chiamate vocali in diretta.
  • Endpoint: xAI WebSocket wss://api.x.ai/v1/stt
  • Codifica predefinita: mulaw
  • Frequenza di campionamento predefinita: 8000
  • Rilevamento fine turno predefinito: 800ms
  • Trascrizioni provvisorie: abilitate per impostazione predefinita
Lo stream multimediale Twilio di Voice Call invia frame audio G.711 µ-law, quindi il provider xAI può inoltrare direttamente quei frame senza transcodifica:
{
  plugins: {
    entries: {
      "voice-call": {
        config: {
          streaming: {
            enabled: true,
            provider: "xai",
            providers: {
              xai: {
                apiKey: "${XAI_API_KEY}",
                endpointingMs: 800,
                language: "en",
              },
            },
          },
        },
      },
    },
  },
}
La configurazione di proprietà del provider si trova in plugins.entries.voice-call.config.streaming.providers.xai. Le chiavi supportate sono apiKey, baseUrl, sampleRate, encoding (pcm, mulaw o alaw), interimResults, endpointingMs e language.
Questo provider di streaming è per il percorso di trascrizione in tempo reale di Voice Call. La voce di Discord attualmente registra brevi segmenti e usa invece il percorso di trascrizione batch tools.media.audio.
Il plugin xAI incluso espone x_search come strumento OpenClaw per cercare contenuti di X (precedentemente Twitter) tramite Grok.Percorso di configurazione: plugins.entries.xai.config.xSearch
ChiaveTipoPredefinitoDescrizione
enabledboolean-Abilita o disabilita x_search
modelstringgrok-4-1-fastModello usato per le richieste x_search
baseUrlstring-Override dell’URL di base xAI Responses
inlineCitationsboolean-Includi citazioni inline nei risultati
maxTurnsnumber-Numero massimo di turni di conversazione
timeoutSecondsnumber-Timeout della richiesta in secondi
cacheTtlMinutesnumber-Durata della cache in minuti
{
  plugins: {
    entries: {
      xai: {
        config: {
          xSearch: {
            enabled: true,
            model: "grok-4-1-fast",
            baseUrl: "https://api.x.ai/v1",
            inlineCitations: true,
          },
        },
      },
    },
  },
}
Il plugin xAI incluso espone code_execution come strumento OpenClaw per l’esecuzione di codice remota nell’ambiente sandbox di xAI.Percorso di configurazione: plugins.entries.xai.config.codeExecution
ChiaveTipoPredefinitoDescrizione
enabledbooleantrue (se la chiave è disponibile)Abilita o disabilita l’esecuzione di codice
modelstringgrok-4-1-fastModello usato per le richieste di esecuzione di codice
maxTurnsnumber-Numero massimo di turni di conversazione
timeoutSecondsnumber-Timeout della richiesta in secondi
Questa è esecuzione remota nella sandbox xAI, non exec locale.
{
  plugins: {
    entries: {
      xai: {
        config: {
          codeExecution: {
            enabled: true,
            model: "grok-4-1-fast",
          },
        },
      },
    },
  },
}
  • Oggi l’autenticazione avviene solo tramite chiave API. La chiave API può essere archiviata in un profilo di autenticazione xAI, in una variabile d’ambiente o nella configurazione del plugin; non esiste ancora un flusso OAuth xAI o con codice dispositivo in OpenClaw.
  • grok-4.20-multi-agent-experimental-beta-0304 non è supportato nel normale percorso del provider xAI perché richiede una superficie API upstream diversa dal trasporto xAI standard di OpenClaw.
  • La voce xAI Realtime non è ancora registrata come provider OpenClaw. Richiede un contratto di sessione vocale bidirezionale diverso rispetto a STT batch o trascrizione in streaming.
  • quality dell’immagine xAI, mask dell’immagine e rapporti d’aspetto aggiuntivi solo nativi non sono esposti finché lo strumento condiviso image_generate non dispone di controlli cross-provider corrispondenti.
  • OpenClaw applica automaticamente correzioni di compatibilità specifiche di xAI per schema degli strumenti e chiamate degli strumenti nel percorso del runner condiviso.
  • Le richieste xAI native hanno tool_stream: true come predefinito. Imposta agents.defaults.models["xai/<model>"].params.tool_stream su false per disabilitarlo.
  • Il wrapper xAI incluso rimuove flag di schema degli strumenti strict non supportati e chiavi del payload di reasoning prima di inviare richieste xAI native.
  • web_search, x_search e code_execution sono esposti come strumenti OpenClaw. OpenClaw abilita lo specifico built-in xAI di cui ha bisogno all’interno di ogni richiesta di strumento invece di collegare tutti gli strumenti nativi a ogni turno di chat.
  • Grok web_search legge plugins.entries.xai.config.webSearch.baseUrl. x_search legge plugins.entries.xai.config.xSearch.baseUrl, poi ripiega sull’URL di base della ricerca web Grok.
  • x_search e code_execution sono di proprietà del plugin xAI incluso invece di essere hardcoded nel runtime del modello core.
  • code_execution è esecuzione remota nella sandbox xAI, non exec locale.

Test live

I percorsi multimediali xAI sono coperti da test unitari e suite live opt-in. I comandi live caricano i segreti dalla shell di login, incluso ~/.profile, prima di verificare XAI_API_KEY.
pnpm test extensions/xai
OPENCLAW_LIVE_TEST=1 OPENCLAW_LIVE_TEST_QUIET=1 pnpm test:live -- extensions/xai/xai.live.test.ts
OPENCLAW_LIVE_TEST=1 OPENCLAW_LIVE_TEST_QUIET=1 OPENCLAW_LIVE_IMAGE_GENERATION_PROVIDERS=xai pnpm test:live -- test/image-generation.runtime.live.test.ts
Il file live specifico del provider sintetizza TTS normale, TTS PCM adatto alla telefonia, trascrive audio tramite STT batch xAI, invia in streaming lo stesso PCM tramite STT in tempo reale xAI, genera output text-to-image e modifica un’immagine di riferimento. Il file live condiviso per le immagini verifica lo stesso provider xAI tramite il percorso di selezione runtime, fallback, normalizzazione e allegato multimediale di OpenClaw.

Correlati

Model selection

Scelta dei provider, riferimenti dei modelli e comportamento di failover.

Video generation

Parametri dello strumento video condiviso e selezione del provider.

All providers

La panoramica più ampia dei provider.

Troubleshooting

Problemi comuni e correzioni.