OpenAI fournit des API développeur pour les modèles GPT, et Codex est également disponible comme agent de codage avec formule ChatGPT via les clients Codex d’OpenAI. OpenClaw garde ces surfaces séparées afin que la configuration reste prévisible. OpenClaw utiliseDocumentation Index
Fetch the complete documentation index at: https://docs.openclaw.ai/llms.txt
Use this file to discover all available pages before exploring further.
openai/* comme route canonique des modèles OpenAI. Les tours d’agent intégrés sur les modèles OpenAI passent par le runtime natif du serveur d’application Codex par défaut ; l’authentification directe par clé d’API OpenAI reste disponible pour les surfaces OpenAI hors agent, comme les images, les embeddings, la parole et le temps réel.
- Modèles d’agent - modèles
openai/*via le runtime Codex ; connectez-vous avec l’authentification Codex pour l’utilisation d’un abonnement ChatGPT/Codex, ou configurez une sauvegarde par clé d’API OpenAI compatible Codex lorsque vous voulez intentionnellement une authentification par clé d’API. - API OpenAI hors agent - accès direct à la plateforme OpenAI avec facturation à l’usage via
OPENAI_API_KEYou l’onboarding par clé d’API OpenAI. - Configuration héritée - les références de modèle
openai-codex/*sont réparées paropenclaw doctor --fixenopenai/*plus le runtime Codex.
Choix rapide
| Objectif | Utiliser | Notes |
|---|---|---|
| Abonnement ChatGPT/Codex avec runtime Codex natif | openai/gpt-5.5 | Configuration d’agent OpenAI par défaut. Connectez-vous avec l’authentification Codex. |
| Facturation directe par clé d’API pour les modèles d’agent | openai/gpt-5.5 plus un profil de clé d’API compatible Codex | Utilisez auth.order.openai pour placer la sauvegarde après l’authentification par abonnement. |
| Facturation directe par clé d’API via PI explicite | openai/gpt-5.5 plus le runtime fournisseur/modèle pi | Sélectionnez un profil de clé d’API openai normal. |
| Dernier alias d’API ChatGPT Instant | openai/chat-latest | Clé d’API directe uniquement. Alias mobile pour les expérimentations, pas la valeur par défaut. |
| Authentification par abonnement ChatGPT/Codex via PI explicite | openai/gpt-5.5 plus le runtime fournisseur/modèle pi | Sélectionnez un profil d’authentification openai-codex pour la route de compatibilité. |
| Génération ou modification d’images | openai/gpt-image-2 | Fonctionne avec OPENAI_API_KEY ou OpenAI Codex OAuth. |
| Images à arrière-plan transparent | openai/gpt-image-1.5 | Utilisez outputFormat=png ou webp et openai.background=transparent. |
Carte de nommage
Les noms sont similaires, mais ne sont pas interchangeables :| Nom que vous voyez | Couche | Signification |
|---|---|---|
openai | Préfixe de fournisseur | Route canonique des modèles OpenAI ; les tours d’agent utilisent le runtime Codex. |
openai-codex | Préfixe d’authentification/profil hérité | Ancien espace de noms de profil OAuth/abonnement OpenAI Codex. Les profils existants et auth.order.openai-codex fonctionnent toujours. |
plugin codex | Plugin | Plugin OpenClaw groupé qui fournit le runtime natif du serveur d’application Codex et les contrôles de chat /codex. |
fournisseur/modèle agentRuntime.id: codex | Runtime d’agent | Force le harnais natif du serveur d’application Codex pour les tours intégrés correspondants. |
/codex ... | Jeu de commandes de chat | Lier/contrôler les fils du serveur d’application Codex depuis une conversation. |
runtime: "acp", agentId: "codex" | Route de session ACP | Chemin de repli explicite qui exécute Codex via ACP/acpx. |
openai/* tandis que les profils d’authentification pointent encore vers des identifiants compatibles Codex. Préférez auth.order.openai pour les nouvelles configurations ; les profils openai-codex:* existants et auth.order.openai-codex restent pris en charge. openclaw doctor --fix réécrit les références de modèle héritées openai-codex/* vers la route canonique des modèles OpenAI.
GPT-5.5 est disponible via l’accès direct par clé d’API à la plateforme OpenAI et via les routes abonnement/OAuth. Pour un abonnement ChatGPT/Codex plus l’exécution Codex native, utilisez
openai/gpt-5.5 ; une configuration de runtime non définie sélectionne désormais le harnais Codex pour les tours d’agent OpenAI. Utilisez les profils de clé d’API OpenAI uniquement lorsque vous voulez une authentification directe par clé d’API pour un modèle d’agent OpenAI.Les tours de modèle d’agent OpenAI nécessitent le plugin de serveur d’application Codex groupé. La configuration explicite du runtime PI reste disponible comme route de compatibilité optionnelle. Lorsque PI est explicitement sélectionné avec un profil d’authentification
openai-codex, OpenClaw conserve la référence de modèle publique sous la forme openai/* et route PI en interne via le transport hérité d’authentification Codex. Exécutez openclaw doctor --fix pour réparer les références de modèle openai-codex/* obsolètes ou les anciens épinglages de session PI qui ne proviennent pas d’une configuration explicite du runtime.Couverture des fonctionnalités OpenClaw
| Capacité OpenAI | Surface OpenClaw | État |
|---|---|---|
| Chat / Responses | Fournisseur de modèle openai/<model> | Oui |
| Modèles d’abonnement Codex | openai/<model> avec OAuth openai-codex | Oui |
| Références de modèle Codex héritées | openai-codex/<model> | Réparées par doctor en openai/<model> |
| Harnais de serveur d’application Codex | openai/<model> avec runtime omis ou fournisseur/modèle agentRuntime.id: codex | Oui |
| Recherche web côté serveur | Outil OpenAI Responses natif | Oui, lorsque la recherche web est activée et qu’aucun fournisseur n’est épinglé |
| Images | image_generate | Oui |
| Vidéos | video_generate | Oui |
| Synthèse vocale | messages.tts.provider: "openai" / tts | Oui |
| Transcription audio par lots | tools.media.audio / compréhension média | Oui |
| Transcription audio en streaming | Appel vocal streaming.provider: "openai" | Oui |
| Voix en temps réel | Appel vocal realtime.provider: "openai" / Parler dans l’interface de contrôle | Oui |
| Embeddings | Fournisseur d’embeddings mémoire | Oui |
Embeddings mémoire
OpenClaw peut utiliser OpenAI, ou un endpoint d’embeddings compatible OpenAI, pour l’indexationmemory_search et les embeddings de requête :
queryInputType et documentInputType sous memorySearch. OpenClaw les transmet comme champs de requête input_type propres au fournisseur : les embeddings de requête utilisent queryInputType ; les fragments de mémoire indexés et l’indexation par lots utilisent documentInputType. Consultez la référence de configuration de la mémoire pour l’exemple complet.
Démarrage
Choisissez votre méthode d’authentification préférée et suivez les étapes de configuration.- Clé d'API (plateforme OpenAI)
- Codex subscription
Idéal pour : l’accès direct à l’API et la facturation à l’usage.
Pour essayer le modèle Instant actuel de ChatGPT depuis l’API OpenAI, définissez le modèle sur
Obtenir votre clé d'API
Créez ou copiez une clé d’API depuis le tableau de bord de la plateforme OpenAI.
Résumé des routes
| Réf. de modèle | Configuration du runtime | Route | Authentification |
|---|---|---|---|
openai/gpt-5.5 | omis / fournisseur/modèle agentRuntime.id: "codex" | Harnais de serveur d’application Codex | Profil OpenAI compatible Codex |
openai/gpt-5.4-mini | omis / fournisseur/modèle agentRuntime.id: "codex" | Harnais de serveur d’application Codex | Profil OpenAI compatible Codex |
openai/gpt-5.5 | fournisseur/modèle agentRuntime.id: "pi" | Runtime intégré PI | Profil openai ou profil openai-codex sélectionné |
Les modèles d’agent
openai/* utilisent le harnais de serveur d’application Codex. Pour utiliser l’authentification par clé d’API avec un modèle d’agent, créez un profil de clé d’API compatible Codex et ordonnez-le avec auth.order.openai ; OPENAI_API_KEY reste le repli direct pour les surfaces d’API OpenAI hors agent. Les anciennes entrées auth.order.openai-codex fonctionnent toujours.Exemple de configuration
openai/chat-latest :chat-latest est un alias mobile. OpenAI le documente comme le dernier modèle Instant utilisé dans ChatGPT et recommande gpt-5.5 pour l’utilisation de l’API en production ; gardez donc openai/gpt-5.5 comme valeur par défaut stable, sauf si vous voulez explicitement ce comportement d’alias. L’alias accepte actuellement uniquement la verbosité de texte medium, OpenClaw normalise donc les remplacements de verbosité de texte OpenAI incompatibles pour ce modèle.Authentification native du serveur d’application Codex
Le harnais natif de serveur d’application Codex utilise des références de modèleopenai/* avec une
configuration d’exécution omise ou agentRuntime.id: "codex" au niveau fournisseur/modèle, mais son authentification
reste basée sur le compte. OpenClaw sélectionne l’authentification dans cet ordre :
- Profils d’authentification OpenAI ordonnés pour l’agent, de préférence sous
auth.order.openai. Les profilsopenai-codex:*existants etauth.order.openai-codexrestent valides pour les installations plus anciennes. - Le compte existant du serveur d’application, comme une connexion ChatGPT locale de la CLI Codex.
- Pour les lancements locaux du serveur d’application stdio uniquement,
CODEX_API_KEY, puisOPENAI_API_KEY, lorsque le serveur d’application ne signale aucun compte et nécessite encore une authentification OpenAI.
OPENAI_API_KEY pour les modèles OpenAI directs
ou les embeddings. Le recours à une clé d’API d’environnement est uniquement le chemin local stdio sans compte ; il
n’est pas envoyé aux connexions WebSocket du serveur d’application. Lorsqu’un profil Codex de type abonnement
est sélectionné, OpenClaw garde également CODEX_API_KEY et OPENAI_API_KEY
hors du processus enfant stdio du serveur d’application lancé, et envoie les identifiants sélectionnés
via le RPC de connexion du serveur d’application. Lorsque ce profil d’abonnement est bloqué par une
limite d’utilisation Codex, OpenClaw peut basculer vers le prochain profil de clé d’API openai:* ordonné
sans changer le modèle sélectionné ni quitter le harnais Codex. Une fois l’heure de réinitialisation de l’abonnement
passée, le profil d’abonnement redevient éligible.
Génération d’images
Le Pluginopenai inclus enregistre la génération d’images via l’outil image_generate.
Il prend en charge à la fois la génération d’images avec clé d’API OpenAI et la génération d’images OAuth Codex
via la même référence de modèle openai/gpt-image-2.
| Capacité | Clé d’API OpenAI | OAuth Codex |
|---|---|---|
| Référence de modèle | openai/gpt-image-2 | openai/gpt-image-2 |
| Authentification | OPENAI_API_KEY | Connexion OAuth OpenAI Codex |
| Transport | API OpenAI Images | Backend Codex Responses |
| Images max. par requête | 4 | 4 |
| Mode édition | Activé (jusqu’à 5 images de référence) | Activé (jusqu’à 5 images de référence) |
| Remplacements de taille | Pris en charge, y compris les tailles 2K/4K | Pris en charge, y compris les tailles 2K/4K |
| Format d’image / résolution | Non transmis à l’API OpenAI Images | Mappé vers une taille prise en charge lorsque c’est sûr |
Consultez Génération d’images pour les paramètres partagés de l’outil, la sélection du fournisseur et le comportement de bascule.
gpt-image-2 est la valeur par défaut pour la génération texte-vers-image OpenAI et
l’édition d’images. gpt-image-1.5, gpt-image-1 et gpt-image-1-mini restent utilisables comme
remplacements de modèle explicites. Utilisez openai/gpt-image-1.5 pour une sortie
PNG/WebP à arrière-plan transparent ; l’API gpt-image-2 actuelle rejette
background: "transparent".
Pour une requête avec arrière-plan transparent, les agents doivent appeler image_generate avec
model: "openai/gpt-image-1.5", outputFormat: "png" ou "webp", et
background: "transparent" ; l’ancienne option de fournisseur openai.background est
toujours acceptée. OpenClaw protège aussi les routes publiques OpenAI et
OpenAI Codex OAuth en réécrivant les requêtes transparentes openai/gpt-image-2 par défaut
vers gpt-image-1.5 ; Azure et les points de terminaison personnalisés compatibles OpenAI conservent
leurs noms de déploiement/modèle configurés.
Le même réglage est exposé pour les exécutions CLI sans interface :
--output-format et --background avec
openclaw infer image edit lorsque vous partez d’un fichier d’entrée.
--openai-background reste disponible comme alias spécifique à OpenAI.
Pour les installations OAuth Codex, conservez la même référence openai/gpt-image-2. Lorsqu’un
profil OAuth openai-codex est configuré, OpenClaw résout ce jeton d’accès OAuth stocké
et envoie les requêtes d’image via le backend Codex Responses. Il
n’essaie pas d’abord OPENAI_API_KEY et ne bascule pas silencieusement vers une clé d’API pour cette
requête. Configurez explicitement models.providers.openai avec une clé d’API,
une URL de base personnalisée ou un point de terminaison Azure lorsque vous voulez utiliser la route directe de l’API OpenAI Images.
Si ce point de terminaison d’image personnalisé se trouve sur un réseau local/adresse privée de confiance, définissez également
browser.ssrfPolicy.dangerouslyAllowPrivateNetwork: true ; OpenClaw garde les points de terminaison d’image
privés/internes compatibles OpenAI bloqués sauf si cette option d’adhésion est
présente.
Générer :
Génération de vidéos
Le Pluginopenai intégré enregistre la génération vidéo via l’outil video_generate.
| Capacité | Valeur |
|---|---|
| Modèle par défaut | openai/sora-2 |
| Modes | Texte vers vidéo, image vers vidéo, modification d’une seule vidéo |
| Entrées de référence | 1 image ou 1 vidéo |
| Remplacements de taille | Pris en charge |
| Autres remplacements | aspectRatio, resolution, audio, watermark sont ignorés avec un avertissement de l’outil |
Consultez Génération vidéo pour les paramètres d’outil partagés, la sélection de fournisseur et le comportement de basculement.
Contribution de prompt GPT-5
OpenClaw ajoute une contribution de prompt GPT-5 partagée pour les exécutions de la famille GPT-5 entre fournisseurs. Elle s’applique par id de modèle, doncopenai/gpt-5.5, les références héritées antérieures à la réparation telles que openai-codex/gpt-5.5, openrouter/openai/gpt-5.5, opencode/gpt-5.5 et les autres références GPT-5 compatibles reçoivent la même surcouche. Les anciens modèles GPT-4.x ne la reçoivent pas.
Le harnais Codex natif intégré utilise le même comportement GPT-5 et la même surcouche Heartbeat via les instructions développeur du serveur d’application Codex, donc les sessions openai/gpt-5.x acheminées via Codex conservent les mêmes consignes de suivi et de Heartbeat proactif, même si Codex possède le reste du prompt du harnais.
La contribution GPT-5 ajoute un contrat de comportement balisé pour la persistance de persona, la sécurité d’exécution, la discipline d’outils, la forme de sortie, les vérifications d’achèvement et la vérification. Le comportement de réponse propre au canal et de message silencieux reste dans le prompt système OpenClaw partagé et la politique de livraison sortante. Le guidage GPT-5 est toujours activé pour les modèles correspondants. La couche de style d’interaction conviviale est distincte et configurable.
| Valeur | Effet |
|---|---|
"friendly" (par défaut) | Active la couche de style d’interaction conviviale |
"on" | Alias de "friendly" |
"off" | Désactive uniquement la couche de style conviviale |
- Config
- CLI
L’ancien
plugins.entries.openai.config.personality est toujours lu comme solution de compatibilité lorsque le paramètre partagé agents.defaults.promptOverlays.gpt5.personality n’est pas défini.Voix et parole
Synthèse vocale (TTS)
Synthèse vocale (TTS)
Le Plugin
Modèles disponibles :
openai intégré enregistre la synthèse vocale pour la surface messages.tts.| Paramètre | Chemin de configuration | Par défaut |
|---|---|---|
| Modèle | messages.tts.providers.openai.model | gpt-4o-mini-tts |
| Voix | messages.tts.providers.openai.voice | coral |
| Vitesse | messages.tts.providers.openai.speed | (non défini) |
| Instructions | messages.tts.providers.openai.instructions | (non défini, gpt-4o-mini-tts uniquement) |
| Format | messages.tts.providers.openai.responseFormat | opus pour les notes vocales, mp3 pour les fichiers |
| Clé API | messages.tts.providers.openai.apiKey | Se rabat sur OPENAI_API_KEY |
| URL de base | messages.tts.providers.openai.baseUrl | https://api.openai.com/v1 |
| Corps supplémentaire | messages.tts.providers.openai.extraBody / extra_body | (non défini) |
gpt-4o-mini-tts, tts-1, tts-1-hd. Voix disponibles : alloy, ash, ballad, cedar, coral, echo, fable, juniper, marin, onyx, nova, sage, shimmer, verse.extraBody est fusionné dans le JSON de requête /audio/speech après les champs générés par OpenClaw ; utilisez-le donc pour les points de terminaison compatibles OpenAI qui exigent des clés supplémentaires telles que lang. Les clés de prototype sont ignorées.Définissez
OPENAI_TTS_BASE_URL pour remplacer l’URL de base TTS sans affecter le point de terminaison de l’API de chat. OpenAI TTS reste configuré via une clé API ; pour un retour vocal en direct uniquement OAuth, utilisez plutôt le chemin vocal Realtime au lieu de la parole STT -> TTS en mode agent.Transcription vocale
Transcription vocale
Le Plugin Les indications de langue et de prompt sont transmises à OpenAI lorsqu’elles sont fournies par la
configuration média audio partagée ou par la demande de transcription par appel.
openai intégré enregistre la transcription vocale par lots via
la surface de transcription de compréhension des médias d’OpenClaw.- Modèle par défaut :
gpt-4o-transcribe - Point de terminaison : OpenAI REST
/v1/audio/transcriptions - Chemin d’entrée : téléversement de fichier audio multipart
- Pris en charge par OpenClaw partout où la transcription audio entrante utilise
tools.media.audio, y compris les segments de salon vocal Discord et les pièces jointes audio de canal
Transcription en temps réel
Transcription en temps réel
Le Plugin
openai inclus enregistre la transcription en temps réel pour le Plugin Voice Call.| Paramètre | Chemin de configuration | Valeur par défaut |
|---|---|---|
| Modèle | plugins.entries.voice-call.config.streaming.providers.openai.model | gpt-4o-transcribe |
| Langue | ...openai.language | (non défini) |
| Prompt | ...openai.prompt | (non défini) |
| Durée du silence | ...openai.silenceDurationMs | 800 |
| Seuil VAD | ...openai.vadThreshold | 0.5 |
| Authentification | ...openai.apiKey, OPENAI_API_KEY, ou OAuth openai-codex | Les clés API se connectent directement ; OAuth crée un secret client de transcription Realtime |
Utilise une connexion WebSocket à
wss://api.openai.com/v1/realtime avec de l’audio G.711 u-law (g711_ulaw / audio/pcmu). Lorsque seul OAuth openai-codex est configuré, le Gateway crée un secret client éphémère de transcription Realtime avant d’ouvrir le WebSocket. Ce fournisseur de streaming est destiné au chemin de transcription en temps réel de Voice Call ; la voix Discord enregistre actuellement de courts segments et utilise plutôt le chemin de transcription par lots tools.media.audio.Voix en temps réel
Voix en temps réel
Le Plugin
Voix Realtime intégrées disponibles pour
openai inclus enregistre la voix en temps réel pour le Plugin Voice Call.| Paramètre | Chemin de configuration | Valeur par défaut |
|---|---|---|
| Modèle | plugins.entries.voice-call.config.realtime.providers.openai.model | gpt-realtime-2 |
| Voix | ...openai.voice | alloy |
| Température (pont de déploiement Azure) | ...openai.temperature | 0.8 |
| Seuil VAD | ...openai.vadThreshold | 0.5 |
| Durée du silence | ...openai.silenceDurationMs | 500 |
| Remplissage de préfixe | ...openai.prefixPaddingMs | 300 |
| Effort de raisonnement | ...openai.reasoningEffort | (non défini) |
| Authentification | ...openai.apiKey, OPENAI_API_KEY, ou OAuth openai-codex | Browser Talk et les ponts backend non Azure peuvent utiliser OAuth Codex |
gpt-realtime-2 : alloy, ash,
ballad, coral, echo, sage, shimmer, verse, marin, cedar.
OpenAI recommande marin et cedar pour la meilleure qualité Realtime. Il
s’agit d’un ensemble distinct des voix de synthèse vocale ci-dessus ; ne partez pas du principe qu’une voix TTS
comme fable, nova ou onyx est valide pour les sessions Realtime.Les ponts OpenAI realtime backend utilisent la forme de session WebSocket Realtime GA, qui n’accepte pas
session.temperature. Les déploiements Azure OpenAI restent disponibles via azureEndpoint et azureDeployment et conservent la forme de session compatible avec le déploiement. Prend en charge les appels d’outils bidirectionnels et l’audio G.711 u-law.La voix Realtime est sélectionnée lors de la création de la session. OpenAI autorise la modification ultérieure de la plupart
des champs de session, mais la voix ne peut pas être modifiée après que le
modèle a émis de l’audio dans cette session. OpenClaw expose actuellement les
identifiants des voix Realtime intégrées sous forme de chaînes.
Control UI Talk utilise des sessions realtime navigateur OpenAI avec un secret client
éphémère créé par le Gateway et un échange SDP WebRTC direct depuis le navigateur avec l’API
OpenAI Realtime. Lorsqu’aucune clé API OpenAI directe n’est configurée, le
Gateway peut créer ce secret client avec le profil OAuth
openai-codex
sélectionné. Le relais Gateway et les ponts WebSocket realtime backend Voice Call utilisent
le même repli OAuth pour les points de terminaison OpenAI natifs. La vérification live
par les mainteneurs est disponible avec
OPENAI_API_KEY=... GEMINI_API_KEY=... node --import tsx scripts/dev/realtime-talk-live-smoke.ts ;
les segments OpenAI vérifient à la fois le pont WebSocket backend et l’échange SDP WebRTC
du navigateur sans journaliser de secrets.Points de terminaison Azure OpenAI
Le fournisseuropenai inclus peut cibler une ressource Azure OpenAI pour la génération
d’images en remplaçant l’URL de base. Sur le chemin de génération d’images, OpenClaw
détecte les noms d’hôte Azure sur models.providers.openai.baseUrl et bascule
automatiquement vers la forme de requête d’Azure.
La voix Realtime utilise un chemin de configuration distinct
(
plugins.entries.voice-call.config.realtime.providers.openai.azureEndpoint)
et n’est pas affectée par models.providers.openai.baseUrl. Consultez l’accordéon Voix
en temps réel sous Voix et parole pour ses paramètres
Azure.- Vous disposez déjà d’un abonnement Azure OpenAI, d’un quota ou d’un accord d’entreprise
- Vous avez besoin de la résidence régionale des données ou des contrôles de conformité fournis par Azure
- Vous souhaitez conserver le trafic à l’intérieur d’un tenant Azure existant
Configuration
Pour la génération d’images Azure via le fournisseuropenai inclus, pointez
models.providers.openai.baseUrl vers votre ressource Azure et définissez apiKey sur
la clé Azure OpenAI (et non une clé OpenAI Platform) :
*.openai.azure.com*.services.ai.azure.com*.cognitiveservices.azure.com
- Envoie l’en-tête
api-keyau lieu deAuthorization: Bearer - Utilise des chemins limités au déploiement (
/openai/deployments/{deployment}/...) - Ajoute
?api-version=...à chaque requête - Utilise un délai d’expiration de requête par défaut de 600 s pour les appels de génération d’images Azure.
Les valeurs
timeoutMspar appel remplacent toujours cette valeur par défaut.
Le routage Azure pour le chemin de génération d’images du fournisseur
openai nécessite
OpenClaw 2026.4.22 ou version ultérieure. Les versions antérieures traitent tout
openai.baseUrl personnalisé comme le point de terminaison OpenAI public et échoueront avec les
déploiements d’images Azure.Version de l’API
DéfinissezAZURE_OPENAI_API_VERSION pour figer une version Azure spécifique en préversion ou GA
pour le chemin de génération d’images Azure :
2024-12-01-preview lorsque la variable n’est pas définie.
Les noms de modèles sont des noms de déploiements
Azure OpenAI associe les modèles à des déploiements. Pour les requêtes de génération d’images Azure acheminées via le fournisseuropenai intégré, le champ model dans OpenClaw
doit être le nom de déploiement Azure que vous avez configuré dans le portail Azure, et non
l’identifiant public du modèle OpenAI.
Si vous créez un déploiement appelé gpt-image-2-prod qui sert gpt-image-2 :
openai intégré.
Disponibilité régionale
La génération d’images Azure n’est actuellement disponible que dans un sous-ensemble de régions (par exempleeastus2, swedencentral, polandcentral, westus3,
uaenorth). Consultez la liste actuelle des régions de Microsoft avant de créer un
déploiement, et confirmez que le modèle spécifique est proposé dans votre région.
Différences de paramètres
Azure OpenAI et OpenAI public n’acceptent pas toujours les mêmes paramètres d’image. Azure peut rejeter des options qu’OpenAI public autorise (par exemple certaines valeursbackground sur gpt-image-2) ou ne les exposer que sur des versions de modèle
spécifiques. Ces différences viennent d’Azure et du modèle sous-jacent, pas
d’OpenClaw. Si une requête Azure échoue avec une erreur de validation, consultez
l’ensemble de paramètres pris en charge par votre déploiement spécifique et votre version d’API dans le
portail Azure.
Azure OpenAI utilise le transport natif et le comportement de compatibilité, mais ne reçoit pas
les en-têtes d’attribution masqués d’OpenClaw — consultez l’accordéon Native vs OpenAI-compatible
routes sous Configuration avancée.Pour le trafic chat ou Responses sur Azure (au-delà de la génération d’images), utilisez le
flux d’onboarding ou une configuration de fournisseur Azure dédiée —
openai.baseUrl seul
ne reprend pas la forme d’API/auth Azure. Un fournisseur distinct
azure-openai-responses/* existe ; consultez
l’accordéon Compaction côté serveur ci-dessous.Configuration avancée
Transport (WebSocket vs SSE)
Transport (WebSocket vs SSE)
OpenClaw utilise WebSocket en priorité avec repli SSE (
Documentation OpenAI associée :
"auto") pour openai/*.En mode "auto", OpenClaw :- Réessaie un échec WebSocket précoce une fois avant de se replier sur SSE
- Après un échec, marque WebSocket comme dégradé pendant environ 60 secondes et utilise SSE pendant le refroidissement
- Attache des en-têtes stables d’identité de session et de tour pour les nouvelles tentatives et les reconnexions
- Normalise les compteurs d’utilisation (
input_tokens/prompt_tokens) entre les variantes de transport
| Valeur | Comportement |
|---|---|
"auto" (par défaut) | WebSocket d’abord, repli SSE |
"sse" | Forcer SSE uniquement |
"websocket" | Forcer WebSocket uniquement |
Fast mode
Fast mode
OpenClaw expose un interrupteur partagé de mode rapide pour
openai/* :- Chat/UI :
/fast status|on|off - Configuration :
agents.defaults.models["<provider>/<model>"].params.fastMode
service_tier = "priority"). Les valeurs service_tier existantes sont préservées, et le mode rapide ne réécrit pas reasoning ni text.verbosity.Les remplacements de session l’emportent sur la configuration. Effacer le remplacement de session dans l’interface Sessions ramène la session à la valeur par défaut configurée.
Priority processing (service_tier)
Priority processing (service_tier)
L’API d’OpenAI expose le traitement prioritaire via Valeurs prises en charge :
service_tier. Définissez-le par modèle dans OpenClaw :auto, default, flex, priority.Server-side compaction (Responses API)
Server-side compaction (Responses API)
Pour les modèles OpenAI Responses directs (
openai/* sur api.openai.com), l’enveloppe de flux Pi-harness du Plugin OpenAI active automatiquement la Compaction côté serveur :- Force
store: true(sauf si la compatibilité du modèle définitsupportsStore: false) - Injecte
context_management: [{ type: "compaction", compact_threshold: ... }] compact_thresholdpar défaut : 70 % decontextWindow(ou80000lorsqu’indisponible)
- Enable explicitly
- Custom threshold
- Disable
Utile pour les points de terminaison compatibles comme Azure OpenAI Responses :
responsesServerCompaction contrôle uniquement l’injection de context_management. Les modèles OpenAI Responses directs forcent toujours store: true sauf si la compatibilité définit supportsStore: false.Strict-agentic GPT mode
Strict-agentic GPT mode
Pour les exécutions de la famille GPT-5 sur Avec
openai/*, OpenClaw peut utiliser un contrat d’exécution embarqué plus strict :strict-agentic, OpenClaw :- Ne traite plus un tour contenant seulement un plan comme une progression réussie lorsqu’une action d’outil est disponible
- Réessaie le tour avec une orientation pour agir maintenant
- Active automatiquement
update_planpour les travaux substantiels - Affiche un état bloqué explicite si le modèle continue à planifier sans agir
Limité aux exécutions des familles GPT-5 d’OpenAI et Codex uniquement. Les autres fournisseurs et les familles de modèles plus anciennes conservent le comportement par défaut.
Native vs OpenAI-compatible routes
Native vs OpenAI-compatible routes
OpenClaw traite les points de terminaison directs OpenAI, Codex et Azure OpenAI différemment des proxies génériques compatibles OpenAI
/v1 :Routes natives (openai/*, Azure OpenAI) :- Conservent
reasoning: { effort: "none" }uniquement pour les modèles qui prennent en charge l’effort OpenAInone - Omettent le raisonnement désactivé pour les modèles ou proxies qui rejettent
reasoning.effort: "none" - Définissent par défaut les schémas d’outils en mode strict
- Attachent des en-têtes d’attribution masqués uniquement sur les hôtes natifs vérifiés
- Conservent la mise en forme de requête propre à OpenAI (
service_tier,store, compatibilité de raisonnement, indices de cache de prompt)
- Utilisent un comportement de compatibilité plus permissif
- Suppriment
storede Completions des charges utilesopenai-completionsnon natives - Acceptent la transmission directe JSON avancée
params.extra_body/params.extraBodypour les proxies Completions compatibles OpenAI - Acceptent
params.chat_template_kwargspour les proxies Completions compatibles OpenAI comme vLLM - Ne forcent pas les schémas d’outils stricts ni les en-têtes réservés au natif
Associé
Model selection
Choix des fournisseurs, des références de modèles et du comportement de basculement.
Image generation
Paramètres partagés de l’outil d’image et sélection du fournisseur.
Video generation
Paramètres partagés de l’outil vidéo et sélection du fournisseur.
OAuth and auth
Détails d’authentification et règles de réutilisation des identifiants.