OpenAI stellt Entwickler-APIs für GPT-Modelle bereit, und Codex ist außerdem als Coding-Agent für ChatGPT-Abos über die Codex-Clients von OpenAI verfügbar. OpenClaw hält diese Oberflächen getrennt, damit die Konfiguration vorhersehbar bleibt. OpenClaw verwendetDocumentation Index
Fetch the complete documentation index at: https://docs.openclaw.ai/llms.txt
Use this file to discover all available pages before exploring further.
openai/* als kanonische OpenAI-Modellroute. Eingebettete Agenten-
Turns auf OpenAI-Modellen laufen standardmäßig über die native Codex-App-Server-Laufzeit;
direkte OpenAI-API-Key-Authentifizierung bleibt für Nicht-Agenten-OpenAI-
Oberflächen wie Bilder, Embeddings, Sprache und Realtime verfügbar.
- Agentenmodelle -
openai/*-Modelle über die Codex-Laufzeit; melden Sie sich mit Codex-Authentifizierung für die Nutzung eines ChatGPT-/Codex-Abos an, oder konfigurieren Sie eine Codex-kompatible OpenAI-API-Key-Reserve, wenn Sie bewusst API-Key-Authentifizierung verwenden möchten. - Nicht-Agenten-OpenAI-APIs - direkter OpenAI-Platform-Zugriff mit nutzungsbasierter
Abrechnung über
OPENAI_API_KEYoder OpenAI-API-Key-Onboarding. - Legacy-Konfiguration -
openai-codex/*-Modellrefs werden vonopenclaw doctor --fixzuopenai/*plus der Codex-Laufzeit repariert.
Schnellauswahl
| Ziel | Verwenden | Hinweise |
|---|---|---|
| ChatGPT-/Codex-Abo mit nativer Codex-Laufzeit | openai/gpt-5.5 | Standardmäßige OpenAI-Agenteneinrichtung. Mit Codex-Auth anmelden. |
| Direkte API-Key-Abrechnung für Agentenmodelle | openai/gpt-5.5 plus ein Codex-kompatibles API-Key-Profil | Verwenden Sie auth.order.openai, um die Reserve nach der Abo-Auth zu platzieren. |
| Direkte API-Key-Abrechnung über explizites PI | openai/gpt-5.5 plus Provider-/Modell-Laufzeit pi | Wählen Sie ein normales openai-API-Key-Profil aus. |
| Neuester ChatGPT-Instant-API-Alias | openai/chat-latest | Nur direkter API-Key. Veränderlicher Alias für Experimente, nicht der Standard. |
| ChatGPT-/Codex-Abo-Auth über explizites PI | openai/gpt-5.5 plus Provider-/Modell-Laufzeit pi | Wählen Sie ein openai-codex-Auth-Profil für die Kompatibilitätsroute aus. |
| Bilderzeugung oder -bearbeitung | openai/gpt-image-2 | Funktioniert entweder mit OPENAI_API_KEY oder OpenAI Codex OAuth. |
| Bilder mit transparentem Hintergrund | openai/gpt-image-1.5 | Verwenden Sie outputFormat=png oder webp und openai.background=transparent. |
Namenszuordnung
Die Namen sind ähnlich, aber nicht austauschbar:| Angezeigter Name | Ebene | Bedeutung |
|---|---|---|
openai | Provider-Präfix | Kanonische OpenAI-Modellroute; Agenten-Turns verwenden die Codex-Laufzeit. |
openai-codex | Legacy-Auth-/Profilpräfix | Älterer OpenAI-Codex-OAuth-/Abo-Profil-Namespace. Vorhandene Profile und auth.order.openai-codex funktionieren weiterhin. |
codex-Plugin | Plugin | Gebündeltes OpenClaw-Plugin, das die native Codex-App-Server-Laufzeit und /codex-Chatsteuerungen bereitstellt. |
Provider-/Modell-agentRuntime.id: codex | Agenten-Laufzeit | Erzwingt das native Codex-App-Server-Harness für passende eingebettete Turns. |
/codex ... | Chat-Befehlssatz | Codex-App-Server-Threads aus einer Unterhaltung heraus binden/steuern. |
runtime: "acp", agentId: "codex" | ACP-Sitzungsroute | Expliziter Fallback-Pfad, der Codex über ACP/acpx ausführt. |
openai/*-Modellrefs enthalten kann, während Auth-
Profile weiterhin auf Codex-kompatible Anmeldedaten zeigen. Bevorzugen Sie auth.order.openai
für neue Konfigurationen; vorhandene openai-codex:*-Profile und auth.order.openai-codex
bleiben unterstützt. openclaw doctor --fix schreibt Legacy-openai-codex/*-Modell-
Refs auf die kanonische OpenAI-Modellroute um.
GPT-5.5 ist sowohl über direkten OpenAI-Platform-API-Key-Zugriff als auch über
Abonnement-/OAuth-Routen verfügbar. Für ChatGPT-/Codex-Abo plus native Codex-
Ausführung verwenden Sie
openai/gpt-5.5; nicht gesetzte Laufzeitkonfiguration wählt jetzt das Codex-
Harness für OpenAI-Agenten-Turns aus. Verwenden Sie OpenAI-API-Key-Profile nur, wenn Sie
direkte API-Key-Auth für ein OpenAI-Agentenmodell möchten.OpenAI-Agentenmodell-Turns erfordern das gebündelte Codex-App-Server-Plugin. Explizite
PI-Laufzeitkonfiguration bleibt als optionale Kompatibilitätsroute verfügbar. Wenn PI
explizit mit einem
openai-codex-Auth-Profil ausgewählt ist, behält OpenClaw die
öffentliche Modellref als openai/* bei und leitet PI intern über den Legacy-
Codex-Auth-Transport. Führen Sie openclaw doctor --fix aus, um veraltete
openai-codex/*-Modellrefs oder alte PI-Sitzungspins zu reparieren, die nicht aus
expliziter Laufzeitkonfiguration stammen.OpenClaw-Funktionsabdeckung
| OpenAI-Fähigkeit | OpenClaw-Oberfläche | Status |
|---|---|---|
| Chat / Responses | openai/<model>-Modell-Provider | Ja |
| Codex-Abo-Modelle | openai/<model> mit openai-codex OAuth | Ja |
| Legacy-Codex-Modellrefs | openai-codex/<model> | Vom doctor zu openai/<model> repariert |
| Codex-App-Server-Harness | openai/<model> mit ausgelassener Laufzeit oder Provider-/Modell-agentRuntime.id: codex | Ja |
| Serverseitige Websuche | Natives OpenAI-Responses-Tool | Ja, wenn Websuche aktiviert ist und kein Provider fixiert wurde |
| Bilder | image_generate | Ja |
| Videos | video_generate | Ja |
| Text-to-Speech | messages.tts.provider: "openai" / tts | Ja |
| Batch-Speech-to-Text | tools.media.audio / Medienverständnis | Ja |
| Streaming-Speech-to-Text | Voice Call streaming.provider: "openai" | Ja |
| Realtime-Voice | Voice Call realtime.provider: "openai" / Control UI Talk | Ja |
| Embeddings | Memory-Embedding-Provider | Ja |
Memory-Embeddings
OpenClaw kann OpenAI oder einen OpenAI-kompatiblen Embedding-Endpunkt fürmemory_search-Indizierung und Abfrage-Embeddings verwenden:
queryInputType und documentInputType unter memorySearch. OpenClaw leitet
diese als Provider-spezifische input_type-Request-Felder weiter: Abfrage-Embeddings verwenden
queryInputType; indizierte Memory-Chunks und Batch-Indizierung verwenden
documentInputType. Das vollständige Beispiel finden Sie in der Referenz zur Memory-Konfiguration.
Erste Schritte
Wählen Sie Ihre bevorzugte Auth-Methode und folgen Sie den Einrichtungsschritten.- API-Key (OpenAI Platform)
- Codex-Abonnement
Am besten für: direkten API-Zugriff und nutzungsbasierte Abrechnung.
Um das aktuelle Instant-Modell von ChatGPT über die OpenAI API auszuprobieren, setzen Sie das Modell
auf
API-Key abrufen
Erstellen oder kopieren Sie einen API-Key aus dem OpenAI Platform-Dashboard.
Routenzusammenfassung
| Modellref | Laufzeitkonfiguration | Route | Auth |
|---|---|---|---|
openai/gpt-5.5 | ausgelassen / Provider-/Modell-agentRuntime.id: "codex" | Codex-App-Server-Harness | Codex-kompatibles OpenAI-Profil |
openai/gpt-5.4-mini | ausgelassen / Provider-/Modell-agentRuntime.id: "codex" | Codex-App-Server-Harness | Codex-kompatibles OpenAI-Profil |
openai/gpt-5.5 | Provider-/Modell-agentRuntime.id: "pi" | Eingebettete PI-Laufzeit | openai-Profil oder ausgewähltes openai-codex-Profil |
openai/*-Agentenmodelle verwenden das Codex-App-Server-Harness. Um API-Key-
Auth für ein Agentenmodell zu verwenden, erstellen Sie ein Codex-kompatibles API-Key-Profil und ordnen
es mit auth.order.openai ein; OPENAI_API_KEY bleibt der direkte Fallback für
Nicht-Agenten-OpenAI-API-Oberflächen. Ältere auth.order.openai-codex-Einträge funktionieren weiterhin.Konfigurationsbeispiel
openai/chat-latest:chat-latest ist ein veränderlicher Alias. OpenAI dokumentiert ihn als das neueste Instant-
Modell, das in ChatGPT verwendet wird, und empfiehlt gpt-5.5 für die produktive API-Nutzung. Behalten Sie daher
openai/gpt-5.5 als stabilen Standard bei, sofern Sie dieses Alias-Verhalten nicht ausdrücklich wünschen.
Der Alias akzeptiert derzeit nur medium-Textausführlichkeit, daher normalisiert
OpenClaw inkompatible OpenAI-Textausführlichkeits-Overrides für dieses
Modell.Native Codex-App-Server-Authentifizierung
Der native Codex-App-Server-Harness verwendetopenai/*-Modellreferenzen plus weggelassene
Runtime-Konfiguration oder Provider/Modell agentRuntime.id: "codex", seine Authentifizierung ist
jedoch weiterhin kontobasiert. OpenClaw wählt die Authentifizierung in dieser Reihenfolge aus:
- Geordnete OpenAI-Authentifizierungsprofile für den Agent, vorzugsweise unter
auth.order.openai. Vorhandeneopenai-codex:*-Profile undauth.order.openai-codexbleiben für ältere Installationen gültig. - Das vorhandene Konto des App-Servers, etwa eine lokale Codex-CLI-ChatGPT-Anmeldung.
- Nur für lokale stdio-App-Server-Starts:
CODEX_API_KEY, dannOPENAI_API_KEY, wenn der App-Server kein Konto meldet und weiterhin OpenAI-Authentifizierung benötigt.
OPENAI_API_KEY für direkte OpenAI-Modelle
oder Einbettungen hat. Env-API-Schlüssel-Fallback ist nur der lokale stdio-Pfad ohne Konto; er
wird nicht an WebSocket-App-Server-Verbindungen gesendet. Wenn ein Codex-Profil im Abonnementstil
ausgewählt ist, hält OpenClaw auch CODEX_API_KEY und OPENAI_API_KEY
aus dem gestarteten stdio-App-Server-Kindprozess heraus und sendet die ausgewählten Anmeldedaten
über den App-Server-Login-RPC. Wenn dieses Abonnementprofil durch ein
Codex-Nutzungslimit blockiert ist, kann OpenClaw zum nächsten geordneten openai:*-API-Schlüssel-
Profil rotieren, ohne das ausgewählte Modell zu ändern oder den Codex-
Harness zu verlassen. Sobald die Zurücksetzungszeit des Abonnements verstrichen ist, ist das Abonnementprofil
wieder berechtigt.
Bilderzeugung
Das gebündelteopenai-Plugin registriert Bilderzeugung über das Tool image_generate.
Es unterstützt sowohl OpenAI-Bilderzeugung mit API-Schlüssel als auch Codex-OAuth-Bilderzeugung
über dieselbe Modellreferenz openai/gpt-image-2.
| Fähigkeit | OpenAI-API-Schlüssel | Codex OAuth |
|---|---|---|
| Modellreferenz | openai/gpt-image-2 | openai/gpt-image-2 |
| Authentifizierung | OPENAI_API_KEY | OpenAI-Codex-OAuth-Anmeldung |
| Transport | OpenAI Images API | Codex Responses-Backend |
| Max. Bilder pro Anfrage | 4 | 4 |
| Bearbeitungsmodus | Aktiviert (bis zu 5 Referenzbilder) | Aktiviert (bis zu 5 Referenzbilder) |
| Größenüberschreibungen | Unterstützt, einschließlich 2K/4K-Größen | Unterstützt, einschließlich 2K/4K-Größen |
| Seitenverhältnis / Auflösung | Nicht an OpenAI Images API weitergeleitet | Wird, wenn sicher, einer unterstützten Größe zugeordnet |
Siehe Bilderzeugung für gemeinsame Tool-Parameter, Provider-Auswahl und Failover-Verhalten.
gpt-image-2 ist der Standard für sowohl OpenAI-Text-zu-Bild-Erzeugung als auch Bild-
bearbeitung. gpt-image-1.5, gpt-image-1 und gpt-image-1-mini bleiben als
explizite Modellüberschreibungen nutzbar. Verwenden Sie openai/gpt-image-1.5 für
PNG/WebP-Ausgabe mit transparentem Hintergrund; die aktuelle gpt-image-2-API lehnt
background: "transparent" ab.
Für eine Anfrage mit transparentem Hintergrund sollten Agents image_generate mit
model: "openai/gpt-image-1.5", outputFormat: "png" oder "webp" und
background: "transparent" aufrufen; die ältere Provider-Option openai.background wird
weiterhin akzeptiert. OpenClaw schützt außerdem die öffentlichen OpenAI- und
OpenAI-Codex-OAuth-Routen, indem standardmäßige transparente openai/gpt-image-2-Anfragen
zu gpt-image-1.5 umgeschrieben werden; Azure- und benutzerdefinierte OpenAI-kompatible Endpunkte behalten
ihre konfigurierten Deployment-/Modellnamen.
Dieselbe Einstellung ist für Headless-CLI-Läufe verfügbar:
--output-format und --background mit
openclaw infer image edit, wenn Sie von einer Eingabedatei ausgehen.
--openai-background bleibt als OpenAI-spezifischer Alias verfügbar.
Behalten Sie für Codex-OAuth-Installationen dieselbe Referenz openai/gpt-image-2 bei. Wenn ein
openai-codex-OAuth-Profil konfiguriert ist, löst OpenClaw dieses gespeicherte OAuth-
Zugriffstoken auf und sendet Bildanfragen über das Codex Responses-Backend. Es
versucht nicht zuerst OPENAI_API_KEY und fällt für diese Anfrage auch nicht stillschweigend auf einen API-Schlüssel
zurück. Konfigurieren Sie models.providers.openai explizit mit einem API-Schlüssel,
einer benutzerdefinierten Basis-URL oder einem Azure-Endpunkt, wenn Sie stattdessen die direkte OpenAI Images API-
Route verwenden möchten.
Wenn dieser benutzerdefinierte Bildendpunkt in einem vertrauenswürdigen LAN/einer privaten Adresse liegt, setzen Sie außerdem
browser.ssrfPolicy.dangerouslyAllowPrivateNetwork: true; OpenClaw hält
private/interne OpenAI-kompatible Bildendpunkte blockiert, sofern dieses Opt-in nicht
vorhanden ist.
Erzeugen:
Videoerzeugung
Das gebündelteopenai-Plugin registriert Videogenerierung über das Tool video_generate.
| Fähigkeit | Wert |
|---|---|
| Standardmodell | openai/sora-2 |
| Modi | Text-zu-Video, Bild-zu-Video, Einzelvideo-Bearbeitung |
| Referenzeingaben | 1 Bild oder 1 Video |
| Größen-Overrides | Unterstützt |
| Weitere Overrides | aspectRatio, resolution, audio, watermark werden mit einer Tool-Warnung ignoriert |
Siehe Videogenerierung für gemeinsam genutzte Tool-Parameter, Provider-Auswahl und Failover-Verhalten.
GPT-5-Prompt-Beitrag
OpenClaw fügt einen gemeinsamen GPT-5-Prompt-Beitrag für Läufe der GPT-5-Familie über Provider hinweg hinzu. Er wird nach Modell-ID angewendet, sodassopenai/gpt-5.5, ältere Referenzen vor der Reparatur wie openai-codex/gpt-5.5, openrouter/openai/gpt-5.5, opencode/gpt-5.5 und andere kompatible GPT-5-Referenzen dasselbe Overlay erhalten. Ältere GPT-4.x-Modelle erhalten es nicht.
Das gebündelte native Codex-Harness verwendet dasselbe GPT-5-Verhalten und Heartbeat-Overlay über Entwickleranweisungen des Codex-App-Servers, sodass über Codex geroutete openai/gpt-5.x-Sitzungen dieselbe Follow-through- und proaktive Heartbeat-Anleitung beibehalten, auch wenn Codex den Rest des Harness-Prompts besitzt.
Der GPT-5-Beitrag fügt einen getaggten Verhaltensvertrag für Persona-Persistenz, Ausführungssicherheit, Tool-Disziplin, Ausgabeform, Abschlussprüfungen und Verifizierung hinzu. Kanalspezifisches Antwort- und Silent-Message-Verhalten bleibt im gemeinsam genutzten OpenClaw-Systemprompt und in der Richtlinie für ausgehende Zustellung. Die GPT-5-Anleitung ist für passende Modelle immer aktiviert. Die freundliche Ebene für den Interaktionsstil ist separat und konfigurierbar.
| Wert | Wirkung |
|---|---|
"friendly" (Standard) | Aktiviert die freundliche Interaktionsstil-Ebene |
"on" | Alias für "friendly" |
"off" | Deaktiviert nur die freundliche Stil-Ebene |
- Konfiguration
- CLI
Das ältere
plugins.entries.openai.config.personality wird weiterhin als Kompatibilitäts-Fallback gelesen, wenn die gemeinsame Einstellung agents.defaults.promptOverlays.gpt5.personality nicht gesetzt ist.Stimme und Sprache
Sprachsynthese (TTS)
Sprachsynthese (TTS)
Das gebündelte
Verfügbare Modelle:
openai-Plugin registriert Sprachsynthese für die Oberfläche messages.tts.| Einstellung | Konfigurationspfad | Standard |
|---|---|---|
| Modell | messages.tts.providers.openai.model | gpt-4o-mini-tts |
| Stimme | messages.tts.providers.openai.voice | coral |
| Geschwindigkeit | messages.tts.providers.openai.speed | (nicht gesetzt) |
| Anweisungen | messages.tts.providers.openai.instructions | (nicht gesetzt, nur gpt-4o-mini-tts) |
| Format | messages.tts.providers.openai.responseFormat | opus für Sprachnachrichten, mp3 für Dateien |
| API-Schlüssel | messages.tts.providers.openai.apiKey | Fällt auf OPENAI_API_KEY zurück |
| Basis-URL | messages.tts.providers.openai.baseUrl | https://api.openai.com/v1 |
| Zusätzlicher Body | messages.tts.providers.openai.extraBody / extra_body | (nicht gesetzt) |
gpt-4o-mini-tts, tts-1, tts-1-hd. Verfügbare Stimmen: alloy, ash, ballad, cedar, coral, echo, fable, juniper, marin, onyx, nova, sage, shimmer, verse.extraBody wird nach den von OpenClaw generierten Feldern in das Anfrage-JSON von /audio/speech zusammengeführt. Verwenden Sie es daher für OpenAI-kompatible Endpunkte, die zusätzliche Schlüssel wie lang erfordern. Prototype-Schlüssel werden ignoriert.Setzen Sie
OPENAI_TTS_BASE_URL, um die TTS-Basis-URL zu überschreiben, ohne den Chat-API-Endpunkt zu beeinflussen. OpenAI TTS wird weiterhin über einen API-Schlüssel konfiguriert; für reine OAuth-Live-Rücksprache verwenden Sie den Realtime-Sprachpfad anstelle von STT -> TTS-Sprache im Agent-Modus.Speech-to-text
Speech-to-text
Das gebündelte Sprach- und Prompt-Hinweise werden an OpenAI weitergeleitet, wenn sie von der
gemeinsamen Audiomedien-Konfiguration oder der Transkriptionsanfrage pro Aufruf bereitgestellt werden.
openai-Plugin registriert Batch-Spracherkennung über
OpenClaws Transkriptionsoberfläche für Medienverständnis.- Standardmodell:
gpt-4o-transcribe - Endpunkt: OpenAI REST
/v1/audio/transcriptions - Eingabepfad: multipart-Audiodatei-Upload
- Unterstützt von OpenClaw überall dort, wo Transkription eingehender Audiodaten
tools.media.audioverwendet, einschließlich Discord-Sprachkanal-Segmenten und Kanal-Audioanhängen
Realtime-Transkription
Realtime-Transkription
Das gebündelte
openai-Plugin registriert Realtime-Transkription für das Voice Call-Plugin.| Einstellung | Konfigurationspfad | Standard |
|---|---|---|
| Modell | plugins.entries.voice-call.config.streaming.providers.openai.model | gpt-4o-transcribe |
| Sprache | ...openai.language | (nicht festgelegt) |
| Prompt | ...openai.prompt | (nicht festgelegt) |
| Dauer der Stille | ...openai.silenceDurationMs | 800 |
| VAD-Schwellenwert | ...openai.vadThreshold | 0.5 |
| Authentifizierung | ...openai.apiKey, OPENAI_API_KEY oder openai-codex OAuth | API-Schlüssel verbinden direkt; OAuth erstellt ein Client Secret für Realtime-Transkription |
Verwendet eine WebSocket-Verbindung zu
wss://api.openai.com/v1/realtime mit G.711 u-law-Audio (g711_ulaw / audio/pcmu). Wenn nur openai-codex OAuth konfiguriert ist, erstellt der Gateway ein kurzlebiges Client Secret für Realtime-Transkription, bevor der WebSocket geöffnet wird. Dieser Streaming-Provider ist für den Realtime-Transkriptionspfad von Voice Call vorgesehen; Discord Voice zeichnet derzeit kurze Segmente auf und verwendet stattdessen den Batch-Transkriptionspfad tools.media.audio.Realtime-Sprache
Realtime-Sprache
Das gebündelte
Verfügbare integrierte Realtime-Stimmen für
openai-Plugin registriert Realtime-Sprache für das Voice Call-Plugin.| Einstellung | Konfigurationspfad | Standard |
|---|---|---|
| Modell | plugins.entries.voice-call.config.realtime.providers.openai.model | gpt-realtime-2 |
| Stimme | ...openai.voice | alloy |
| Temperatur (Azure-Deployment-Bridge) | ...openai.temperature | 0.8 |
| VAD-Schwellenwert | ...openai.vadThreshold | 0.5 |
| Dauer der Stille | ...openai.silenceDurationMs | 500 |
| Präfix-Padding | ...openai.prefixPaddingMs | 300 |
| Reasoning-Aufwand | ...openai.reasoningEffort | (nicht festgelegt) |
| Authentifizierung | ...openai.apiKey, OPENAI_API_KEY oder openai-codex OAuth | Browser Talk und Nicht-Azure-Backend-Bridges können Codex OAuth verwenden |
gpt-realtime-2: alloy, ash,
ballad, coral, echo, sage, shimmer, verse, marin, cedar.
OpenAI empfiehlt marin und cedar für die beste Realtime-Qualität. Dies
ist ein separater Satz gegenüber den oben genannten Text-to-Speech-Stimmen; gehen Sie nicht davon aus, dass eine TTS-
Stimme wie fable, nova oder onyx für Realtime-Sitzungen gültig ist.Backend-OpenAI-Realtime-Bridges verwenden die GA-Realtime-WebSocket-Sitzungsform, die
session.temperature nicht akzeptiert. Azure OpenAI-Deployments bleiben über azureEndpoint und azureDeployment verfügbar und behalten die deploymentkompatible Sitzungsform bei. Unterstützt bidirektionales Tool-Calling und G.711 u-law-Audio.Die Realtime-Stimme wird ausgewählt, wenn die Sitzung erstellt wird. OpenAI erlaubt, die meisten
Sitzungsfelder später zu ändern, aber die Stimme kann nicht geändert werden, nachdem das
Modell in dieser Sitzung Audio ausgegeben hat. OpenClaw stellt derzeit die
integrierten Realtime-Stimmen-IDs als Strings bereit.
Control UI Talk verwendet OpenAI-Browser-Realtime-Sitzungen mit einem vom Gateway erstellten
kurzlebigen Client Secret und einem direkten Browser-WebRTC-SDP-Austausch gegen die
OpenAI Realtime API. Wenn kein direkter OpenAI-API-Schlüssel konfiguriert ist, kann der
Gateway dieses Client Secret mit dem ausgewählten
openai-codex OAuth-
Profil erstellen. Gateway-Relay- und Voice Call-Backend-Realtime-WebSocket-Bridges verwenden
denselben OAuth-Fallback für native OpenAI-Endpunkte. Maintainer-Live-
Verifikation ist verfügbar mit
OPENAI_API_KEY=... GEMINI_API_KEY=... node --import tsx scripts/dev/realtime-talk-live-smoke.ts;
die OpenAI-Abschnitte verifizieren sowohl die Backend-WebSocket-Bridge als auch den Browser-
WebRTC-SDP-Austausch, ohne Secrets zu protokollieren.Azure OpenAI-Endpunkte
Der gebündelteopenai-Provider kann für die Bildgenerierung auf eine Azure OpenAI-Ressource
ausgerichtet werden, indem die Basis-URL überschrieben wird. Auf dem Bildgenerierungspfad erkennt OpenClaw
Azure-Hostnamen in models.providers.openai.baseUrl und wechselt automatisch zur
Request-Form von Azure.
Realtime-Sprache verwendet einen separaten Konfigurationspfad
(
plugins.entries.voice-call.config.realtime.providers.openai.azureEndpoint)
und wird nicht von models.providers.openai.baseUrl beeinflusst. Siehe das Accordion Realtime-
Sprache unter Voice und Sprache für die Azure-
Einstellungen.- Sie bereits über ein Azure OpenAI-Abonnement, Kontingent oder eine Unternehmensvereinbarung verfügen
- Sie regionale Datenresidenz oder von Azure bereitgestellte Compliance-Kontrollen benötigen
- Sie Datenverkehr innerhalb einer bestehenden Azure-Tenancy halten möchten
Konfiguration
Für Azure-Bildgenerierung über den gebündeltenopenai-Provider verweisen Sie
models.providers.openai.baseUrl auf Ihre Azure-Ressource und setzen Sie apiKey auf
den Azure OpenAI-Schlüssel (nicht auf einen OpenAI Platform-Schlüssel):
*.openai.azure.com*.services.ai.azure.com*.cognitiveservices.azure.com
- Sendet den Header
api-keystattAuthorization: Bearer - Verwendet deploymentbezogene Pfade (
/openai/deployments/{deployment}/...) - Hängt
?api-version=...an jeden Request an - Verwendet ein Standard-Request-Timeout von 600 s für Azure-Bildgenerierungsaufrufe.
Pro-Aufruf-
timeoutMs-Werte überschreiben diesen Standard weiterhin.
Azure-Routing für den Bildgenerierungspfad des
openai-Providers erfordert
OpenClaw 2026.4.22 oder höher. Frühere Versionen behandeln jede benutzerdefinierte
openai.baseUrl wie den öffentlichen OpenAI-Endpunkt und schlagen bei Azure-
Bild-Deployments fehl.API-Version
Setzen SieAZURE_OPENAI_API_VERSION, um eine bestimmte Azure-Preview- oder GA-Version
für den Azure-Pfad zur Bildgenerierung festzulegen:
2024-12-01-preview, wenn die Variable nicht gesetzt ist.
Modellnamen sind Deployment-Namen
Azure OpenAI bindet Modelle an Deployments. Für Azure-Bildgenerierungsanfragen, die über den gebündeltenopenai-Provider geroutet werden, muss das Feld model
in OpenClaw der Azure-Deployment-Name sein, den Sie im Azure-Portal konfiguriert
haben, nicht die öffentliche OpenAI-Modell-ID.
Wenn Sie ein Deployment namens gpt-image-2-prod erstellen, das gpt-image-2 bereitstellt:
openai-Provider geroutet werden.
Regionale Verfügbarkeit
Azure-Bildgenerierung ist derzeit nur in einer Teilmenge von Regionen verfügbar (zum Beispieleastus2, swedencentral, polandcentral, westus3,
uaenorth). Prüfen Sie Microsofts aktuelle Regionsliste, bevor Sie ein
Deployment erstellen, und bestätigen Sie, dass das spezifische Modell in Ihrer
Region angeboten wird.
Parameterunterschiede
Azure OpenAI und öffentliches OpenAI akzeptieren nicht immer dieselben Bildparameter. Azure kann Optionen ablehnen, die öffentliches OpenAI erlaubt (zum Beispiel bestimmtebackground-Werte für gpt-image-2), oder sie nur für bestimmte Modellversionen
bereitstellen. Diese Unterschiede stammen von Azure und dem zugrunde liegenden
Modell, nicht von OpenClaw. Wenn eine Azure-Anfrage mit einem Validierungsfehler
fehlschlägt, prüfen Sie im Azure-Portal den Parametersatz, der von Ihrem spezifischen
Deployment und Ihrer API-Version unterstützt wird.
Azure OpenAI verwendet nativen Transport und Kompatibilitätsverhalten, erhält aber
nicht die ausgeblendeten Attribution-Header von OpenClaw — siehe das Akkordeon
Native vs OpenAI-kompatible Routen unter Erweiterte Konfiguration.Für Chat- oder Responses-Traffic auf Azure (über die Bildgenerierung hinaus) verwenden
Sie den Onboarding-Ablauf oder eine dedizierte Azure-Provider-Konfiguration —
openai.baseUrl allein übernimmt nicht die Azure-API-/Auth-Form. Ein separater
azure-openai-responses/*-Provider existiert; siehe das Akkordeon zur
serverseitigen Compaction unten.Erweiterte Konfiguration
Transport (WebSocket vs SSE)
Transport (WebSocket vs SSE)
OpenClaw verwendet für
Zugehörige OpenAI-Dokumentation:
openai/* bevorzugt WebSocket mit SSE-Fallback ("auto").Im Modus "auto":- Wiederholt OpenClaw einen frühen WebSocket-Fehler einmal, bevor auf SSE zurückgefallen wird
- Markiert OpenClaw WebSocket nach einem Fehler für ca. 60 Sekunden als beeinträchtigt und verwendet während der Abkühlphase SSE
- Fügt stabile Header für Sitzungs- und Turn-Identität für Wiederholungen und erneute Verbindungen an
- Normalisiert Nutzungszähler (
input_tokens/prompt_tokens) über Transportvarianten hinweg
| Wert | Verhalten |
|---|---|
"auto" (Standard) | Zuerst WebSocket, SSE-Fallback |
"sse" | Nur SSE erzwingen |
"websocket" | Nur WebSocket erzwingen |
Schnellmodus
Schnellmodus
OpenClaw stellt einen gemeinsamen Schnellmodus-Schalter für
openai/* bereit:- Chat/UI:
/fast status|on|off - Konfiguration:
agents.defaults.models["<provider>/<model>"].params.fastMode
service_tier = "priority"). Vorhandene service_tier-Werte bleiben erhalten, und der Schnellmodus überschreibt weder reasoning noch text.verbosity.Sitzungsüberschreibungen haben Vorrang vor der Konfiguration. Wenn Sie die Sitzungsüberschreibung in der Sessions-UI löschen, kehrt die Sitzung zum konfigurierten Standard zurück.
Prioritätsverarbeitung (service_tier)
Prioritätsverarbeitung (service_tier)
Die OpenAI-API stellt Prioritätsverarbeitung über Unterstützte Werte:
service_tier bereit. Legen Sie sie in OpenClaw pro Modell fest:auto, default, flex, priority.Serverseitige Compaction (Responses API)
Serverseitige Compaction (Responses API)
Für direkte OpenAI-Responses-Modelle (
openai/* auf api.openai.com) aktiviert der Pi-Harness-Stream-Wrapper des OpenAI-Plugins automatisch serverseitige Compaction:- Erzwingt
store: true(sofern Modellkompatibilität nichtsupportsStore: falsesetzt) - Injiziert
context_management: [{ type: "compaction", compact_threshold: ... }] - Standardwert für
compact_threshold: 70 % voncontextWindow(oder80000, wenn nicht verfügbar)
- Explizit aktivieren
- Benutzerdefinierter Schwellenwert
- Deaktivieren
Nützlich für kompatible Endpunkte wie Azure OpenAI Responses:
responsesServerCompaction steuert nur die Injektion von context_management. Direkte OpenAI-Responses-Modelle erzwingen weiterhin store: true, sofern die Kompatibilität nicht supportsStore: false setzt.Strikter agentischer GPT-Modus
Strikter agentischer GPT-Modus
Für Läufe der GPT-5-Familie auf Mit
openai/* kann OpenClaw einen strengeren eingebetteten Ausführungsvertrag verwenden:strict-agentic:- Behandelt OpenClaw einen reinen Planungs-Turn nicht mehr als erfolgreichen Fortschritt, wenn eine Tool-Aktion verfügbar ist
- Wiederholt OpenClaw den Turn mit einer Jetzt-handeln-Steuerung
- Aktiviert OpenClaw
update_planautomatisch für umfangreiche Arbeiten - Zeigt OpenClaw einen expliziten blockierten Zustand an, wenn das Modell weiter plant, ohne zu handeln
Nur auf OpenAI- und Codex-Läufe der GPT-5-Familie beschränkt. Andere Provider und ältere Modellfamilien behalten das Standardverhalten bei.
Native vs OpenAI-kompatible Routen
Native vs OpenAI-kompatible Routen
OpenClaw behandelt direkte OpenAI-, Codex- und Azure OpenAI-Endpunkte anders als generische OpenAI-kompatible
/v1-Proxys:Native Routen (openai/*, Azure OpenAI):- Behalten
reasoning: { effort: "none" }nur für Modelle bei, die den OpenAI-Aufwandnoneunterstützen - Lassen deaktiviertes Reasoning bei Modellen oder Proxys weg, die
reasoning.effort: "none"ablehnen - Setzen Tool-Schemas standardmäßig in den strikten Modus
- Fügen ausgeblendete Attribution-Header nur auf verifizierten nativen Hosts an
- Behalten OpenAI-spezifische Anfrageformung bei (
service_tier,store, Reasoning-Kompatibilität, Prompt-Cache-Hinweise)
- Verwenden lockereres Kompatibilitätsverhalten
- Entfernen Completions-
storeaus nicht nativenopenai-completions-Payloads - Akzeptieren erweitertes Durchreichen von
params.extra_body-/params.extraBody-JSON für OpenAI-kompatible Completions-Proxys - Akzeptieren
params.chat_template_kwargsfür OpenAI-kompatible Completions-Proxys wie vLLM - Erzwingen keine strikten Tool-Schemas oder nur nativen Header
Verwandt
Modellauswahl
Provider, Modellreferenzen und Failover-Verhalten auswählen.
Bildgenerierung
Gemeinsame Bild-Tool-Parameter und Provider-Auswahl.
Videogenerierung
Gemeinsame Video-Tool-Parameter und Provider-Auswahl.
OAuth und Auth
Auth-Details und Regeln zur Wiederverwendung von Anmeldedaten.