Vai al contenuto principale

Documentation Index

Fetch the complete documentation index at: https://docs.openclaw.ai/llms.txt

Use this file to discover all available pages before exploring further.

OpenAI fornisce API per sviluppatori per i modelli GPT, e Codex è disponibile anche come agente di coding del piano ChatGPT tramite i client Codex di OpenAI. OpenClaw mantiene queste superfici separate in modo che la configurazione resti prevedibile. OpenClaw usa openai/* come route canonica dei modelli OpenAI. I turni degli agenti incorporati sui modelli OpenAI vengono eseguiti tramite il runtime nativo app-server di Codex per impostazione predefinita; l’autenticazione diretta con chiave API OpenAI resta disponibile per le superfici OpenAI non agent come immagini, embedding, voce e realtime.
  • Modelli agent - modelli openai/* tramite il runtime Codex; accedi con l’autenticazione Codex per usare l’abbonamento ChatGPT/Codex, oppure configura un backup compatibile con Codex basato su chiave API OpenAI quando vuoi intenzionalmente l’autenticazione con chiave API.
  • API OpenAI non agent - accesso diretto a OpenAI Platform con fatturazione basata sull’uso tramite OPENAI_API_KEY o onboarding con chiave API OpenAI.
  • Configurazione legacy - i riferimenti modello openai-codex/* vengono riparati da openclaw doctor --fix in openai/* più il runtime Codex.
OpenAI supporta esplicitamente l’uso OAuth in abbonamento in strumenti e workflow esterni come OpenClaw. Provider, modello, runtime e canale sono livelli separati. Se queste etichette si stanno confondendo tra loro, leggi Runtime degli agenti prima di modificare la configurazione.

Scelta rapida

ObiettivoUsaNote
Abbonamento ChatGPT/Codex con runtime Codex nativoopenai/gpt-5.5Configurazione OpenAI agent predefinita. Accedi con l’autenticazione Codex.
Fatturazione diretta con chiave API per modelli agentopenai/gpt-5.5 più un profilo con chiave API compatibile con CodexUsa auth.order.openai per posizionare il backup dopo l’autenticazione in abbonamento.
Fatturazione diretta con chiave API tramite PI esplicitoopenai/gpt-5.5 più runtime provider/modello piSeleziona un normale profilo con chiave API openai.
Alias API ChatGPT Instant più recenteopenai/chat-latestSolo chiave API diretta. Alias mobile per esperimenti, non predefinito.
Autenticazione abbonamento ChatGPT/Codex tramite PI esplicitoopenai/gpt-5.5 più runtime provider/modello piSeleziona un profilo di autenticazione openai-codex per la route di compatibilità.
Generazione o modifica di immaginiopenai/gpt-image-2Funziona con OPENAI_API_KEY o OpenAI Codex OAuth.
Immagini con sfondo trasparenteopenai/gpt-image-1.5Usa outputFormat=png o webp e openai.background=transparent.

Mappa dei nomi

I nomi sono simili ma non intercambiabili:
Nome che vediLivelloSignificato
openaiPrefisso providerRoute canonica dei modelli OpenAI; i turni agent usano il runtime Codex.
openai-codexPrefisso auth/profilo legacyNamespace precedente dei profili OAuth/abbonamento OpenAI Codex. I profili esistenti e auth.order.openai-codex funzionano ancora.
Plugin codexPluginPlugin OpenClaw in bundle che fornisce il runtime nativo app-server Codex e i controlli chat /codex.
provider/modello agentRuntime.id: codexRuntime agentForza l’harness nativo app-server Codex per i turni incorporati corrispondenti.
/codex ...Set di comandi chatCollega/controlla i thread app-server Codex da una conversazione.
runtime: "acp", agentId: "codex"Route sessione ACPPercorso di fallback esplicito che esegue Codex tramite ACP/acpx.
Questo significa che una configurazione può contenere intenzionalmente riferimenti modello openai/* mentre i profili di autenticazione puntano ancora a credenziali compatibili con Codex. Preferisci auth.order.openai per le nuove configurazioni; i profili openai-codex:* esistenti e auth.order.openai-codex restano supportati. openclaw doctor --fix riscrive i riferimenti modello legacy openai-codex/* nella route canonica dei modelli OpenAI.
GPT-5.5 è disponibile sia tramite accesso diretto con chiave API OpenAI Platform sia tramite route abbonamento/OAuth. Per abbonamento ChatGPT/Codex più esecuzione Codex nativa, usa openai/gpt-5.5; la configurazione runtime non impostata ora seleziona l’harness Codex per i turni agent OpenAI. Usa profili con chiave API OpenAI solo quando vuoi l’autenticazione diretta con chiave API per un modello agent OpenAI.
I turni dei modelli agent OpenAI richiedono il Plugin app-server Codex in bundle. La configurazione runtime PI esplicita resta disponibile come route di compatibilità opt-in. Quando PI è selezionato esplicitamente con un profilo di autenticazione openai-codex, OpenClaw mantiene il riferimento modello pubblico come openai/* e instrada PI internamente tramite il trasporto legacy di autenticazione Codex. Esegui openclaw doctor --fix per riparare riferimenti modello openai-codex/* obsoleti o vecchi pin di sessione PI che non derivano da configurazione runtime esplicita.

Copertura delle funzionalità OpenClaw

Funzionalità OpenAISuperficie OpenClawStato
Chat / Responsesprovider modello openai/<model>
Modelli in abbonamento Codexopenai/<model> con OAuth openai-codex
Riferimenti modello Codex legacyopenai-codex/<model>Riparati da doctor in openai/<model>
Harness app-server Codexopenai/<model> con runtime omesso o provider/modello agentRuntime.id: codex
Ricerca web lato serverStrumento nativo OpenAI ResponsesSì, quando la ricerca web è abilitata e non è fissato alcun provider
Immaginiimage_generate
Videovideo_generate
Sintesi vocalemessages.tts.provider: "openai" / tts
Speech-to-text batchtools.media.audio / comprensione media
Speech-to-text in streamingVoice Call streaming.provider: "openai"
Voce realtimeVoice Call realtime.provider: "openai" / Control UI Talk
Embeddingprovider embedding memoria

Embedding memoria

OpenClaw può usare OpenAI, o un endpoint di embedding compatibile con OpenAI, per l’indicizzazione memory_search e gli embedding delle query:
{
  agents: {
    defaults: {
      memorySearch: {
        provider: "openai",
        model: "text-embedding-3-small",
      },
    },
  },
}
Per endpoint compatibili con OpenAI che richiedono etichette di embedding asimmetriche, imposta queryInputType e documentInputType sotto memorySearch. OpenClaw inoltra questi valori come campi richiesta input_type specifici del provider: gli embedding delle query usano queryInputType; i frammenti di memoria indicizzati e l’indicizzazione batch usano documentInputType. Consulta il riferimento di configurazione della memoria per l’esempio completo.

Per iniziare

Scegli il metodo di autenticazione preferito e segui i passaggi di configurazione.
Ideale per: accesso API diretto e fatturazione basata sull’uso.
1

Ottieni la tua chiave API

Crea o copia una chiave API dalla dashboard di OpenAI Platform.
2

Esegui l'onboarding

openclaw onboard --auth-choice openai-api-key
Oppure passa direttamente la chiave:
openclaw onboard --openai-api-key "$OPENAI_API_KEY"
3

Verifica che il modello sia disponibile

openclaw models list --provider openai

Riepilogo delle route

Riferimento modelloConfigurazione runtimeRouteAuth
openai/gpt-5.5omesso / provider/modello agentRuntime.id: "codex"Harness app-server CodexProfilo OpenAI compatibile con Codex
openai/gpt-5.4-miniomesso / provider/modello agentRuntime.id: "codex"Harness app-server CodexProfilo OpenAI compatibile con Codex
openai/gpt-5.5provider/modello agentRuntime.id: "pi"Runtime incorporato PIProfilo openai o profilo openai-codex selezionato
I modelli agent openai/* usano l’harness app-server Codex. Per usare l’autenticazione con chiave API per un modello agent, crea un profilo con chiave API compatibile con Codex e ordinalo con auth.order.openai; OPENAI_API_KEY resta il fallback diretto per le superfici API OpenAI non agent. Le voci auth.order.openai-codex precedenti funzionano ancora.

Esempio di configurazione

{
  env: { OPENAI_API_KEY: "sk-..." },
  agents: { defaults: { model: { primary: "openai/gpt-5.5" } } },
}
Per provare il modello Instant attuale di ChatGPT dall’API OpenAI, imposta il modello su openai/chat-latest:
{
  env: { OPENAI_API_KEY: "sk-..." },
  agents: { defaults: { model: { primary: "openai/chat-latest" } } },
}
chat-latest è un alias mobile. OpenAI lo documenta come il modello Instant più recente usato in ChatGPT e consiglia gpt-5.5 per l’uso API in produzione, quindi mantieni openai/gpt-5.5 come default stabile a meno che tu non voglia esplicitamente quel comportamento dell’alias. L’alias attualmente accetta solo la verbosità del testo medium, quindi OpenClaw normalizza gli override di verbosità del testo OpenAI incompatibili per questo modello.
OpenClaw non espone openai/gpt-5.3-codex-spark. Le richieste live all’API OpenAI rifiutano quel modello, e nemmeno il catalogo Codex attuale lo espone.

Auth nativa dell’app-server Codex

L’harness nativo dell’app-server Codex usa riferimenti modello openai/* più una configurazione runtime omessa o provider/modello agentRuntime.id: "codex", ma la sua auth è comunque basata sull’account. OpenClaw seleziona l’auth in questo ordine:
  1. Profili auth OpenAI ordinati per l’agente, preferibilmente sotto auth.order.openai. I profili openai-codex:* esistenti e auth.order.openai-codex restano validi per installazioni più vecchie.
  2. L’account esistente dell’app-server, come un accesso ChatGPT locale della CLI Codex.
  3. Solo per avvii dell’app-server stdio locale, CODEX_API_KEY, poi OPENAI_API_KEY, quando l’app-server non segnala alcun account e richiede ancora l’auth OpenAI.
Ciò significa che un accesso locale con abbonamento ChatGPT/Codex non viene sostituito solo perché il processo Gateway ha anche OPENAI_API_KEY per modelli OpenAI diretti o embedding. Il fallback con chiave API env è solo il percorso locale stdio senza account; non viene inviato alle connessioni app-server WebSocket. Quando viene selezionato un profilo Codex in stile abbonamento, OpenClaw tiene anche CODEX_API_KEY e OPENAI_API_KEY fuori dal processo figlio app-server stdio generato e invia le credenziali selezionate tramite la RPC di login dell’app-server. Quando quel profilo di abbonamento è bloccato da un limite d’uso Codex, OpenClaw può ruotare al successivo profilo con chiave API openai:* ordinato senza cambiare il modello selezionato o uscire dall’harness Codex. Una volta trascorso il tempo di reset dell’abbonamento, il profilo dell’abbonamento torna idoneo.

Generazione di immagini

Il Plugin openai incluso registra la generazione di immagini tramite lo strumento image_generate. Supporta sia la generazione di immagini con chiave API OpenAI sia la generazione di immagini con OAuth Codex tramite lo stesso riferimento modello openai/gpt-image-2.
CapacitàChiave API OpenAIOAuth Codex
Rif. modelloopenai/gpt-image-2openai/gpt-image-2
AuthOPENAI_API_KEYAccesso OAuth OpenAI Codex
TrasportoAPI OpenAI ImagesBackend Codex Responses
Numero massimo di immagini per richiesta44
Modalità di modificaAbilitata (fino a 5 immagini di riferimento)Abilitata (fino a 5 immagini di riferimento)
Override delle dimensioniSupportati, incluse dimensioni 2K/4KSupportati, incluse dimensioni 2K/4K
Proporzioni / risoluzioneNon inoltrate all’API OpenAI ImagesMappate a una dimensione supportata quando sicuro
{
  agents: {
    defaults: {
      imageGenerationModel: { primary: "openai/gpt-image-2" },
    },
  },
}
Consulta Generazione di immagini per i parametri condivisi dello strumento, la selezione del provider e il comportamento di failover.
gpt-image-2 è il valore predefinito sia per la generazione testo-immagine OpenAI sia per la modifica di immagini. gpt-image-1.5, gpt-image-1 e gpt-image-1-mini restano utilizzabili come override espliciti del modello. Usa openai/gpt-image-1.5 per output PNG/WebP con sfondo trasparente; l’API corrente gpt-image-2 rifiuta background: "transparent". Per una richiesta con sfondo trasparente, gli agenti dovrebbero chiamare image_generate con model: "openai/gpt-image-1.5", outputFormat: "png" o "webp", e background: "transparent"; l’opzione provider più vecchia openai.background è ancora accettata. OpenClaw protegge anche le route pubbliche OpenAI e OpenAI Codex OAuth riscrivendo le richieste trasparenti predefinite openai/gpt-image-2 in gpt-image-1.5; Azure e gli endpoint personalizzati compatibili con OpenAI mantengono i nomi di deployment/modello configurati. La stessa impostazione è esposta per esecuzioni CLI headless:
openclaw infer image generate \
  --model openai/gpt-image-1.5 \
  --output-format png \
  --background transparent \
  --prompt "A simple red circle sticker on a transparent background" \
  --json
Usa gli stessi flag --output-format e --background con openclaw infer image edit quando parti da un file di input. --openai-background resta disponibile come alias specifico di OpenAI. Per installazioni OAuth Codex, mantieni lo stesso riferimento openai/gpt-image-2. Quando è configurato un profilo OAuth openai-codex, OpenClaw risolve quel token di accesso OAuth archiviato e invia le richieste di immagini tramite il backend Codex Responses. Non prova prima OPENAI_API_KEY né ripiega silenziosamente su una chiave API per quella richiesta. Configura esplicitamente models.providers.openai con una chiave API, un URL base personalizzato o un endpoint Azure quando vuoi invece il percorso diretto dell’API OpenAI Images. Se quell’endpoint immagini personalizzato si trova su una LAN/indirizzo privato attendibile, imposta anche browser.ssrfPolicy.dangerouslyAllowPrivateNetwork: true; OpenClaw mantiene bloccati gli endpoint immagini privati/interni compatibili con OpenAI salvo che sia presente questo opt-in. Genera:
/tool image_generate model=openai/gpt-image-2 prompt="A polished launch poster for OpenClaw on macOS" size=3840x2160 count=1
Genera un PNG trasparente:
/tool image_generate model=openai/gpt-image-1.5 prompt="A simple red circle sticker on a transparent background" outputFormat=png background=transparent
Modifica:
/tool image_generate model=openai/gpt-image-2 prompt="Preserve the object shape, change the material to translucent glass" image=/path/to/reference.png size=1024x1536

Generazione di video

Il plugin openai incluso registra la generazione video tramite lo strumento video_generate.
CapacitàValore
Modello predefinitoopenai/sora-2
ModalitàDa testo a video, da immagine a video, modifica di un singolo video
Input di riferimento1 immagine o 1 video
Override delle dimensioniSupportati
Altri overrideaspectRatio, resolution, audio, watermark vengono ignorati con un avviso dello strumento
{
  agents: {
    defaults: {
      videoGenerationModel: { primary: "openai/sora-2" },
    },
  },
}
Vedi Generazione video per i parametri condivisi dello strumento, la selezione del provider e il comportamento di failover.

Contributo al prompt GPT-5

OpenClaw aggiunge un contributo condiviso al prompt GPT-5 per le esecuzioni della famiglia GPT-5 tra provider. Si applica in base all’id del modello, quindi openai/gpt-5.5, riferimenti legacy pre-riparazione come openai-codex/gpt-5.5, openrouter/openai/gpt-5.5, opencode/gpt-5.5 e altri riferimenti GPT-5 compatibili ricevono lo stesso overlay. I modelli GPT-4.x precedenti no. L’harness Codex nativo incluso usa lo stesso comportamento GPT-5 e lo stesso overlay Heartbeat tramite le istruzioni per sviluppatori dell’app-server Codex, quindi le sessioni openai/gpt-5.x instradate tramite Codex mantengono la stessa guida di follow-through e Heartbeat proattivo, anche se Codex possiede il resto del prompt dell’harness. Il contributo GPT-5 aggiunge un contratto di comportamento con tag per persistenza della persona, sicurezza dell’esecuzione, disciplina degli strumenti, forma dell’output, controlli di completamento e verifica. Il comportamento di risposta specifico del canale e dei messaggi silenziosi resta nel prompt di sistema condiviso di OpenClaw e nella policy di consegna in uscita. La guida GPT-5 è sempre abilitata per i modelli corrispondenti. Il livello di stile di interazione amichevole è separato e configurabile.
ValoreEffetto
"friendly" (predefinito)Abilita il livello di stile di interazione amichevole
"on"Alias di "friendly"
"off"Disabilita solo il livello di stile amichevole
{
  agents: {
    defaults: {
      promptOverlays: {
        gpt5: { personality: "friendly" },
      },
    },
  },
}
I valori non distinguono tra maiuscole e minuscole a runtime, quindi "Off" e "off" disabilitano entrambi il livello di stile amichevole.
Il valore legacy plugins.entries.openai.config.personality viene ancora letto come fallback di compatibilità quando l’impostazione condivisa agents.defaults.promptOverlays.gpt5.personality non è impostata.

Voce e parlato

Il plugin openai incluso registra la sintesi vocale per la superficie messages.tts.
ImpostazionePercorso di configurazionePredefinito
Modellomessages.tts.providers.openai.modelgpt-4o-mini-tts
Vocemessages.tts.providers.openai.voicecoral
Velocitàmessages.tts.providers.openai.speed(non impostato)
Istruzionimessages.tts.providers.openai.instructions(non impostato, solo gpt-4o-mini-tts)
Formatomessages.tts.providers.openai.responseFormatopus per note vocali, mp3 per file
Chiave APImessages.tts.providers.openai.apiKeyRipiega su OPENAI_API_KEY
URL di basemessages.tts.providers.openai.baseUrlhttps://api.openai.com/v1
Corpo extramessages.tts.providers.openai.extraBody / extra_body(non impostato)
Modelli disponibili: gpt-4o-mini-tts, tts-1, tts-1-hd. Voci disponibili: alloy, ash, ballad, cedar, coral, echo, fable, juniper, marin, onyx, nova, sage, shimmer, verse.extraBody viene unito al JSON della richiesta /audio/speech dopo i campi generati da OpenClaw, quindi usalo per endpoint compatibili con OpenAI che richiedono chiavi aggiuntive come lang. Le chiavi prototype vengono ignorate.
{
  messages: {
    tts: {
      providers: {
        openai: { model: "gpt-4o-mini-tts", voice: "coral" },
      },
    },
  },
}
Imposta OPENAI_TTS_BASE_URL per sovrascrivere l’URL di base TTS senza influire sull’endpoint API della chat. OpenAI TTS è comunque configurato tramite una chiave API; per il talk-back live solo OAuth, usa il percorso voce Realtime invece del parlato STT -> TTS in modalità agente.
Il plugin openai incluso registra lo speech-to-text batch tramite la superficie di trascrizione per la comprensione dei media di OpenClaw.
  • Modello predefinito: gpt-4o-transcribe
  • Endpoint: OpenAI REST /v1/audio/transcriptions
  • Percorso di input: caricamento di file audio multipart
  • Supportato da OpenClaw ovunque la trascrizione audio in ingresso usi tools.media.audio, inclusi i segmenti dei canali vocali Discord e gli allegati audio dei canali
Per forzare OpenAI per la trascrizione audio in ingresso:
{
  tools: {
    media: {
      audio: {
        models: [
          {
            type: "provider",
            provider: "openai",
            model: "gpt-4o-transcribe",
          },
        ],
      },
    },
  },
}
I suggerimenti di lingua e prompt vengono inoltrati a OpenAI quando forniti dalla configurazione media audio condivisa o dalla richiesta di trascrizione per chiamata.
Il plugin openai incluso registra la trascrizione in tempo reale per il Plugin Voice Call.
ImpostazionePercorso di configurazionePredefinito
Modelloplugins.entries.voice-call.config.streaming.providers.openai.modelgpt-4o-transcribe
Lingua...openai.language(non impostato)
Prompt...openai.prompt(non impostato)
Durata del silenzio...openai.silenceDurationMs800
Soglia VAD...openai.vadThreshold0.5
Autenticazione...openai.apiKey, OPENAI_API_KEY, o OAuth openai-codexLe chiavi API si connettono direttamente; OAuth emette un client secret per la trascrizione Realtime
Usa una connessione WebSocket a wss://api.openai.com/v1/realtime con audio G.711 u-law (g711_ulaw / audio/pcmu). Quando è configurato solo OAuth openai-codex, il Gateway emette un client secret effimero per la trascrizione Realtime prima di aprire il WebSocket. Questo provider di streaming è per il percorso di trascrizione in tempo reale di Voice Call; la voce Discord attualmente registra segmenti brevi e usa invece il percorso di trascrizione batch tools.media.audio.
Il plugin openai incluso registra la voce in tempo reale per il Plugin Voice Call.
ImpostazionePercorso di configurazionePredefinito
Modelloplugins.entries.voice-call.config.realtime.providers.openai.modelgpt-realtime-2
Voce...openai.voicealloy
Temperatura (bridge di deployment Azure)...openai.temperature0.8
Soglia VAD...openai.vadThreshold0.5
Durata del silenzio...openai.silenceDurationMs500
Padding del prefisso...openai.prefixPaddingMs300
Sforzo di ragionamento...openai.reasoningEffort(non impostato)
Autenticazione...openai.apiKey, OPENAI_API_KEY, o OAuth openai-codexBrowser Talk e i bridge backend non Azure possono usare Codex OAuth
Voci Realtime integrate disponibili per gpt-realtime-2: alloy, ash, ballad, coral, echo, sage, shimmer, verse, marin, cedar. OpenAI consiglia marin e cedar per la migliore qualità Realtime. Questo è un set separato dalle voci di sintesi vocale sopra; non presumere che una voce TTS come fable, nova o onyx sia valida per le sessioni Realtime.
I bridge realtime backend OpenAI usano la forma di sessione WebSocket Realtime GA, che non accetta session.temperature. I deployment Azure OpenAI restano disponibili tramite azureEndpoint e azureDeployment e mantengono la forma di sessione compatibile con il deployment. Supporta la chiamata bidirezionale degli strumenti e l’audio G.711 u-law.
La voce Realtime viene selezionata quando la sessione viene creata. OpenAI consente di modificare la maggior parte dei campi della sessione in seguito, ma la voce non può essere cambiata dopo che il modello ha emesso audio in quella sessione. OpenClaw attualmente espone gli id delle voci Realtime integrate come stringhe.
Control UI Talk usa sessioni realtime browser OpenAI con un client secret effimero emesso dal Gateway e uno scambio WebRTC SDP diretto del browser con la OpenAI Realtime API. Quando non è configurata alcuna chiave API OpenAI diretta, il Gateway può emettere quel client secret con il profilo OAuth openai-codex selezionato. Il relay Gateway e i bridge WebSocket realtime backend di Voice Call usano lo stesso fallback OAuth per gli endpoint OpenAI nativi. La verifica live del maintainer è disponibile con OPENAI_API_KEY=... GEMINI_API_KEY=... node --import tsx scripts/dev/realtime-talk-live-smoke.ts; le tratte OpenAI verificano sia il bridge WebSocket backend sia lo scambio WebRTC SDP del browser senza registrare segreti.

Endpoint Azure OpenAI

Il provider openai incluso può indirizzare una risorsa Azure OpenAI per la generazione di immagini sovrascrivendo l’URL di base. Nel percorso di generazione delle immagini, OpenClaw rileva gli hostname Azure su models.providers.openai.baseUrl e passa automaticamente alla forma di richiesta di Azure.
La voce in tempo reale usa un percorso di configurazione separato (plugins.entries.voice-call.config.realtime.providers.openai.azureEndpoint) e non è influenzata da models.providers.openai.baseUrl. Vedi l’accordion Voce in tempo reale sotto Voce e parlato per le sue impostazioni Azure.
Usa Azure OpenAI quando:
  • Hai già una sottoscrizione, una quota o un contratto enterprise Azure OpenAI
  • Ti servono residenza dei dati regionale o controlli di conformità forniti da Azure
  • Vuoi mantenere il traffico all’interno di una tenancy Azure esistente

Configurazione

Per la generazione di immagini Azure tramite il provider openai incluso, punta models.providers.openai.baseUrl alla tua risorsa Azure e imposta apiKey sulla chiave Azure OpenAI (non una chiave OpenAI Platform):
{
  models: {
    providers: {
      openai: {
        baseUrl: "https://<your-resource>.openai.azure.com",
        apiKey: "<azure-openai-api-key>",
      },
    },
  },
}
OpenClaw riconosce questi suffissi host Azure per la route di generazione di immagini Azure:
  • *.openai.azure.com
  • *.services.ai.azure.com
  • *.cognitiveservices.azure.com
Per le richieste di generazione di immagini su un host Azure riconosciuto, OpenClaw:
  • Invia l’header api-key invece di Authorization: Bearer
  • Usa percorsi con ambito di deployment (/openai/deployments/{deployment}/...)
  • Aggiunge ?api-version=... a ogni richiesta
  • Usa un timeout di richiesta predefinito di 600s per le chiamate di generazione di immagini Azure. I valori timeoutMs per singola chiamata sovrascrivono comunque questo valore predefinito.
Altri URL di base (OpenAI pubblico, proxy compatibili con OpenAI) mantengono la forma standard della richiesta di immagini OpenAI.
Il routing Azure per il percorso di generazione di immagini del provider openai richiede OpenClaw 2026.4.22 o versione successiva. Le versioni precedenti trattano qualsiasi openai.baseUrl personalizzato come l’endpoint OpenAI pubblico e falliranno con i deployment di immagini Azure.

Versione API

Imposta AZURE_OPENAI_API_VERSION per fissare una specifica versione preview o GA di Azure per il percorso di generazione immagini di Azure:
export AZURE_OPENAI_API_VERSION="2024-12-01-preview"
Il valore predefinito è 2024-12-01-preview quando la variabile non è impostata.

I nomi dei modelli sono nomi di distribuzioni

Azure OpenAI associa i modelli alle distribuzioni. Per le richieste di generazione immagini di Azure instradate tramite il provider openai incluso, il campo model in OpenClaw deve essere il nome della distribuzione Azure configurato nel portale Azure, non l’id pubblico del modello OpenAI. Se crei una distribuzione chiamata gpt-image-2-prod che serve gpt-image-2:
/tool image_generate model=openai/gpt-image-2-prod prompt="A clean poster" size=1024x1024 count=1
La stessa regola del nome della distribuzione si applica alle chiamate di generazione immagini instradate tramite il provider openai incluso.

Disponibilità regionale

La generazione immagini di Azure è attualmente disponibile solo in un sottoinsieme di regioni (ad esempio eastus2, swedencentral, polandcentral, westus3, uaenorth). Controlla l’elenco attuale delle regioni Microsoft prima di creare una distribuzione e conferma che il modello specifico sia offerto nella tua regione.

Differenze nei parametri

Azure OpenAI e OpenAI pubblico non accettano sempre gli stessi parametri per le immagini. Azure può rifiutare opzioni consentite da OpenAI pubblico (ad esempio determinati valori di background su gpt-image-2) o esporle solo su versioni specifiche del modello. Queste differenze provengono da Azure e dal modello sottostante, non da OpenClaw. Se una richiesta Azure non riesce con un errore di validazione, controlla il set di parametri supportato dalla tua distribuzione specifica e dalla versione API nel portale Azure.
Azure OpenAI usa il trasporto nativo e il comportamento di compatibilità, ma non riceve gli header di attribuzione nascosti di OpenClaw: vedi il riquadro Rotte native e compatibili con OpenAI in Configurazione avanzata.Per il traffico chat o Responses su Azure (oltre alla generazione immagini), usa il flusso di onboarding o una configurazione dedicata del provider Azure: openai.baseUrl da solo non applica la forma API/auth di Azure. Esiste un provider separato azure-openai-responses/*; vedi il riquadro Compaction lato server qui sotto.

Configurazione avanzata

OpenClaw usa prima WebSocket con fallback SSE ("auto") per openai/*.In modalità "auto", OpenClaw:
  • Riprova un errore WebSocket iniziale prima di passare a SSE
  • Dopo un errore, contrassegna WebSocket come degradato per circa 60 secondi e usa SSE durante il periodo di raffreddamento
  • Allega header stabili di identità della sessione e del turno per tentativi e riconnessioni
  • Normalizza i contatori di utilizzo (input_tokens / prompt_tokens) tra le varianti di trasporto
ValoreComportamento
"auto" (predefinito)Prima WebSocket, fallback SSE
"sse"Forza solo SSE
"websocket"Forza solo WebSocket
{
  agents: {
    defaults: {
      models: {
        "openai/gpt-5.5": {
          params: { transport: "auto" },
        },
      },
    },
  },
}
Documentazione OpenAI correlata:
OpenClaw espone un interruttore condiviso per la modalità veloce per openai/*:
  • Chat/UI: /fast status|on|off
  • Configurazione: agents.defaults.models["<provider>/<model>"].params.fastMode
Quando è abilitata, OpenClaw mappa la modalità veloce sull’elaborazione prioritaria di OpenAI (service_tier = "priority"). I valori service_tier esistenti vengono preservati e la modalità veloce non riscrive reasoning o text.verbosity.
{
  agents: {
    defaults: {
      models: {
        "openai/gpt-5.5": { params: { fastMode: true } },
      },
    },
  },
}
Le sostituzioni di sessione prevalgono sulla configurazione. La cancellazione della sostituzione di sessione nell’interfaccia Sessions riporta la sessione al valore predefinito configurato.
L’API di OpenAI espone l’elaborazione prioritaria tramite service_tier. Impostala per modello in OpenClaw:
{
  agents: {
    defaults: {
      models: {
        "openai/gpt-5.5": { params: { serviceTier: "priority" } },
      },
    },
  },
}
Valori supportati: auto, default, flex, priority.
serviceTier viene inoltrato solo agli endpoint OpenAI nativi (api.openai.com) e agli endpoint Codex nativi (chatgpt.com/backend-api). Se instradi uno dei due provider tramite un proxy, OpenClaw lascia service_tier invariato.
Per i modelli OpenAI Responses diretti (openai/* su api.openai.com), il wrapper di stream Pi-harness del Plugin OpenAI abilita automaticamente la Compaction lato server:
  • Forza store: true (a meno che la compatibilità del modello imposti supportsStore: false)
  • Inserisce context_management: [{ type: "compaction", compact_threshold: ... }]
  • Valore predefinito di compact_threshold: 70% di contextWindow (o 80000 quando non disponibile)
Questo si applica al percorso Pi harness integrato e agli hook del provider OpenAI usati dalle esecuzioni incorporate. L’harness app-server nativo di Codex gestisce il proprio contesto tramite Codex ed è configurato dalla rotta agente predefinita di OpenAI o dalla policy di runtime provider/modello.
Utile per endpoint compatibili come Azure OpenAI Responses:
{
  agents: {
    defaults: {
      models: {
        "azure-openai-responses/gpt-5.5": {
          params: { responsesServerCompaction: true },
        },
      },
    },
  },
}
responsesServerCompaction controlla solo l’iniezione di context_management. I modelli OpenAI Responses diretti forzano comunque store: true a meno che la compatibilità non imposti supportsStore: false.
Per esecuzioni della famiglia GPT-5 su openai/*, OpenClaw può usare un contratto di esecuzione incorporato più rigoroso:
{
  agents: {
    defaults: {
      embeddedPi: { executionContract: "strict-agentic" },
    },
  },
}
Con strict-agentic, OpenClaw:
  • Non considera più un turno con solo piano come avanzamento riuscito quando è disponibile un’azione strumento
  • Riprova il turno con un’indicazione ad agire subito
  • Abilita automaticamente update_plan per lavori sostanziali
  • Mostra uno stato bloccato esplicito se il modello continua a pianificare senza agire
Limitato solo alle esecuzioni della famiglia GPT-5 di OpenAI e Codex. Gli altri provider e le famiglie di modelli precedenti mantengono il comportamento predefinito.
OpenClaw tratta gli endpoint OpenAI, Codex e Azure OpenAI diretti in modo diverso dai proxy /v1 generici compatibili con OpenAI:Rotte native (openai/*, Azure OpenAI):
  • Mantengono reasoning: { effort: "none" } solo per i modelli che supportano lo sforzo none di OpenAI
  • Omettono il reasoning disabilitato per modelli o proxy che rifiutano reasoning.effort: "none"
  • Impostano per impostazione predefinita gli schemi degli strumenti in modalità rigorosa
  • Allegano header di attribuzione nascosti solo su host nativi verificati
  • Mantengono la modellazione delle richieste specifica di OpenAI (service_tier, store, compatibilità del reasoning, suggerimenti per la cache dei prompt)
Rotte proxy/compatibili:
  • Usano un comportamento di compatibilità più permissivo
  • Rimuovono store di Completions dai payload openai-completions non nativi
  • Accettano JSON pass-through avanzato params.extra_body/params.extraBody per proxy Completions compatibili con OpenAI
  • Accettano params.chat_template_kwargs per proxy Completions compatibili con OpenAI come vLLM
  • Non forzano schemi degli strumenti rigorosi o header solo nativi
Azure OpenAI usa il trasporto nativo e il comportamento di compatibilità, ma non riceve gli header di attribuzione nascosti.

Correlati

Selezione del modello

Scelta dei provider, riferimenti ai modelli e comportamento di failover.

Generazione immagini

Parametri condivisi degli strumenti per immagini e selezione del provider.

Generazione video

Parametri condivisi degli strumenti per video e selezione del provider.

OAuth e autenticazione

Dettagli di autenticazione e regole di riutilizzo delle credenziali.