OpenAI udostępnia interfejsy API dla deweloperów do modeli GPT, a Codex jest także dostępny jako agent programistyczny w ramach planu ChatGPT przez klientów Codex firmy OpenAI. OpenClaw utrzymuje te powierzchnie oddzielnie, aby konfiguracja pozostała przewidywalna. OpenClaw używaDocumentation Index
Fetch the complete documentation index at: https://docs.openclaw.ai/llms.txt
Use this file to discover all available pages before exploring further.
openai/* jako kanonicznej trasy modelu OpenAI. Osadzone przebiegi agenta na modelach OpenAI są domyślnie uruchamiane przez natywne środowisko wykonawcze serwera aplikacji Codex; bezpośrednie uwierzytelnianie kluczem API OpenAI pozostaje dostępne dla nieagentowych powierzchni OpenAI, takich jak obrazy, osadzenia, mowa i tryb realtime.
- Modele agenta - modele
openai/*przez środowisko wykonawcze Codex; zaloguj się przy użyciu uwierzytelniania Codex, aby korzystać z subskrypcji ChatGPT/Codex, albo skonfiguruj zgodny z Codex zapasowy klucz API OpenAI, gdy celowo chcesz używać uwierzytelniania kluczem API. - Nieagentowe interfejsy API OpenAI - bezpośredni dostęp do OpenAI Platform z rozliczaniem według użycia przez
OPENAI_API_KEYlub wdrażanie klucza API OpenAI. - Starsza konfiguracja - odwołania do modeli
openai-codex/*są naprawiane przezopenclaw doctor --fixdoopenai/*oraz środowiska wykonawczego Codex.
Szybki wybór
| Cel | Użyj | Uwagi |
|---|---|---|
| Subskrypcja ChatGPT/Codex z natywnym środowiskiem wykonawczym Codex | openai/gpt-5.5 | Domyślna konfiguracja agenta OpenAI. Zaloguj się przez uwierzytelnianie Codex. |
| Bezpośrednie rozliczanie kluczem API dla modeli agenta | openai/gpt-5.5 plus zgodny z Codex profil klucza API | Użyj auth.order.openai, aby umieścić zapas po uwierzytelnianiu subskrypcyjnym. |
| Bezpośrednie rozliczanie kluczem API przez jawne PI | openai/gpt-5.5 plus środowisko wykonawcze dostawcy/modelu pi | Wybierz zwykły profil klucza API openai. |
| Najnowszy alias API ChatGPT Instant | openai/chat-latest | Tylko bezpośredni klucz API. Ruchomy alias do eksperymentów, nie domyślny. |
| Uwierzytelnianie subskrypcji ChatGPT/Codex przez jawne PI | openai/gpt-5.5 plus środowisko wykonawcze dostawcy/modelu pi | Wybierz profil uwierzytelniania openai-codex dla trasy zgodności. |
| Generowanie lub edycja obrazów | openai/gpt-image-2 | Działa z OPENAI_API_KEY albo OpenAI Codex OAuth. |
| Obrazy z przezroczystym tłem | openai/gpt-image-1.5 | Użyj outputFormat=png lub webp oraz openai.background=transparent. |
Mapa nazewnictwa
Nazwy są podobne, ale nie są zamienne:| Nazwa, którą widzisz | Warstwa | Znaczenie |
|---|---|---|
openai | Prefiks dostawcy | Kanoniczna trasa modelu OpenAI; przebiegi agenta używają środowiska wykonawczego Codex. |
openai-codex | Starszy prefiks uwierzytelniania/profilu | Starsza przestrzeń nazw profilu OpenAI Codex OAuth/subskrypcji. Istniejące profile i auth.order.openai-codex nadal działają. |
Plugin codex | Plugin | Dołączony Plugin OpenClaw, który zapewnia natywne środowisko wykonawcze serwera aplikacji Codex oraz kontrolki czatu /codex. |
provider/model agentRuntime.id: codex | Środowisko wykonawcze agenta | Wymusza natywny harness serwera aplikacji Codex dla pasujących osadzonych przebiegów. |
/codex ... | Zestaw poleceń czatu | Powiąż/kontroluj wątki serwera aplikacji Codex z rozmowy. |
runtime: "acp", agentId: "codex" | Trasa sesji ACP | Jawna ścieżka awaryjna uruchamiająca Codex przez ACP/acpx. |
openai/*, podczas gdy profile uwierzytelniania nadal wskazują na zgodne z Codex poświadczenia. Preferuj auth.order.openai dla nowej konfiguracji; istniejące profile openai-codex:* oraz auth.order.openai-codex pozostają obsługiwane. openclaw doctor --fix przepisuje starsze odwołania do modeli openai-codex/* na kanoniczną trasę modelu OpenAI.
GPT-5.5 jest dostępny zarówno przez bezpośredni dostęp kluczem API do OpenAI Platform, jak i przez trasy subskrypcji/OAuth. Dla subskrypcji ChatGPT/Codex oraz natywnego wykonania Codex użyj
openai/gpt-5.5; nieustawiona konfiguracja środowiska wykonawczego wybiera teraz harness Codex dla przebiegów agentów OpenAI. Używaj profili klucza API OpenAI tylko wtedy, gdy chcesz bezpośredniego uwierzytelniania kluczem API dla modelu agenta OpenAI.Przebiegi modeli agenta OpenAI wymagają dołączonego Pluginu serwera aplikacji Codex. Jawna konfiguracja środowiska wykonawczego PI pozostaje dostępna jako opcjonalna trasa zgodności. Gdy PI zostanie jawnie wybrane z profilem uwierzytelniania
openai-codex, OpenClaw zachowuje publiczne odwołanie do modelu jako openai/* i wewnętrznie kieruje PI przez starszy transport uwierzytelniania Codex. Uruchom openclaw doctor --fix, aby naprawić nieaktualne odwołania do modeli openai-codex/* lub stare przypięcia sesji PI, które nie pochodzą z jawnej konfiguracji środowiska wykonawczego.Pokrycie funkcji OpenClaw
| Możliwość OpenAI | Powierzchnia OpenClaw | Status |
|---|---|---|
| Chat / Responses | dostawca modelu openai/<model> | Tak |
| Modele subskrypcji Codex | openai/<model> z OAuth openai-codex | Tak |
| Starsze odwołania do modeli Codex | openai-codex/<model> | Naprawiane przez doctor do openai/<model> |
| Harness serwera aplikacji Codex | openai/<model> z pominiętym środowiskiem wykonawczym lub provider/model agentRuntime.id: codex | Tak |
| Wyszukiwanie w sieci po stronie serwera | Natywne narzędzie OpenAI Responses | Tak, gdy wyszukiwanie w sieci jest włączone i nie przypięto dostawcy |
| Obrazy | image_generate | Tak |
| Wideo | video_generate | Tak |
| Zamiana tekstu na mowę | messages.tts.provider: "openai" / tts | Tak |
| Wsadowa zamiana mowy na tekst | tools.media.audio / rozumienie mediów | Tak |
| Strumieniowa zamiana mowy na tekst | Voice Call streaming.provider: "openai" | Tak |
| Głos w czasie rzeczywistym | Voice Call realtime.provider: "openai" / Control UI Talk | Tak |
| Osadzenia | dostawca osadzeń pamięci | Tak |
Osadzenia pamięci
OpenClaw może używać OpenAI albo zgodnego z OpenAI punktu końcowego osadzeń do indeksowaniamemory_search i osadzeń zapytań:
queryInputType i documentInputType pod memorySearch. OpenClaw przekazuje je jako specyficzne dla dostawcy pola żądania input_type: osadzenia zapytań używają queryInputType; indeksowane fragmenty pamięci i indeksowanie wsadowe używają documentInputType. Pełny przykład znajdziesz w Dokumentacji referencyjnej konfiguracji pamięci.
Pierwsze kroki
Wybierz preferowaną metodę uwierzytelniania i wykonaj kroki konfiguracji.- Klucz API (OpenAI Platform)
- Subskrypcja Codex
Najlepsze do: bezpośredniego dostępu do API i rozliczania według użycia.
Aby wypróbować bieżący model Instant ChatGPT z API OpenAI, ustaw model na
Uzyskaj klucz API
Utwórz lub skopiuj klucz API z panelu OpenAI Platform.
Podsumowanie tras
| Odwołanie do modelu | Konfiguracja środowiska wykonawczego | Trasa | Uwierzytelnianie |
|---|---|---|---|
openai/gpt-5.5 | pominięte / provider/model agentRuntime.id: "codex" | harness serwera aplikacji Codex | zgodny z Codex profil OpenAI |
openai/gpt-5.4-mini | pominięte / provider/model agentRuntime.id: "codex" | harness serwera aplikacji Codex | zgodny z Codex profil OpenAI |
openai/gpt-5.5 | provider/model agentRuntime.id: "pi" | osadzone środowisko wykonawcze PI | profil openai lub wybrany profil openai-codex |
Modele agentów
openai/* używają harnessu serwera aplikacji Codex. Aby użyć uwierzytelniania kluczem API dla modelu agenta, utwórz zgodny z Codex profil klucza API i uporządkuj go przez auth.order.openai; OPENAI_API_KEY pozostaje bezpośrednią ścieżką awaryjną dla nieagentowych powierzchni API OpenAI. Starsze wpisy auth.order.openai-codex nadal działają.Przykład konfiguracji
openai/chat-latest:chat-latest jest ruchomym aliasem. OpenAI dokumentuje go jako najnowszy model Instant używany w ChatGPT i zaleca gpt-5.5 do produkcyjnego użycia API, więc pozostaw openai/gpt-5.5 jako stabilną wartość domyślną, chyba że jawnie chcesz zachowania tego aliasu. Alias obecnie akceptuje tylko medium szczegółowości tekstu, więc OpenClaw normalizuje niezgodne nadpisania szczegółowości tekstu OpenAI dla tego modelu.Natywna autoryzacja serwera aplikacji Codex
Natywny harness serwera aplikacji Codex używa odwołań do modeliopenai/* oraz pominiętej
konfiguracji runtime albo provider/model agentRuntime.id: "codex", ale jego autoryzacja
nadal opiera się na koncie. OpenClaw wybiera autoryzację w tej kolejności:
- Uporządkowane profile autoryzacji OpenAI dla agenta, najlepiej pod
auth.order.openai. Istniejące profileopenai-codex:*iauth.order.openai-codexpozostają prawidłowe dla starszych instalacji. - Istniejące konto serwera aplikacji, takie jak lokalne logowanie ChatGPT w Codex CLI.
- Tylko dla lokalnych uruchomień serwera aplikacji stdio:
CODEX_API_KEY, następnieOPENAI_API_KEY, gdy serwer aplikacji zgłasza brak konta i nadal wymaga autoryzacji OpenAI.
OPENAI_API_KEY dla bezpośrednich modeli OpenAI
lub embeddingów. Fallback klucza API z env jest używany tylko w lokalnej ścieżce stdio bez konta; nie
jest wysyłany do połączeń WebSocket serwera aplikacji. Gdy wybrany jest profil Codex
typu subskrypcyjnego, OpenClaw również nie przekazuje CODEX_API_KEY ani OPENAI_API_KEY
do utworzonego procesu potomnego serwera aplikacji stdio i wysyła wybrane dane uwierzytelniające
przez RPC logowania serwera aplikacji. Gdy ten profil subskrypcyjny jest zablokowany przez
limit użycia Codex, OpenClaw może przełączyć się na następny uporządkowany profil klucza API openai:*
bez zmiany wybranego modelu ani wychodzenia z harnessu Codex. Po upływie czasu resetu subskrypcji profil subskrypcyjny
ponownie kwalifikuje się do użycia.
Generowanie obrazów
Dołączony Pluginopenai rejestruje generowanie obrazów przez narzędzie image_generate.
Obsługuje zarówno generowanie obrazów z kluczem API OpenAI, jak i generowanie obrazów
przez Codex OAuth, używając tego samego odwołania do modelu openai/gpt-image-2.
| Możliwość | Klucz API OpenAI | Codex OAuth |
|---|---|---|
| Odwołanie do modelu | openai/gpt-image-2 | openai/gpt-image-2 |
| Autoryzacja | OPENAI_API_KEY | Logowanie OpenAI Codex OAuth |
| Transport | OpenAI Images API | Backend Codex Responses |
| Maks. liczba obrazów na żądanie | 4 | 4 |
| Tryb edycji | Włączony (do 5 obrazów referencyjnych) | Włączony (do 5 obrazów referencyjnych) |
| Nadpisania rozmiaru | Obsługiwane, w tym rozmiary 2K/4K | Obsługiwane, w tym rozmiary 2K/4K |
| Proporcje / rozdzielczość | Nieprzekazywane do OpenAI Images API | Mapowane na obsługiwany rozmiar, gdy jest to bezpieczne |
Zobacz Generowanie obrazów, aby poznać wspólne parametry narzędzia, wybór dostawcy i zachowanie failover.
gpt-image-2 jest domyślne zarówno dla generowania obrazów z tekstu OpenAI, jak i edycji obrazów.
gpt-image-1.5, gpt-image-1 i gpt-image-1-mini pozostają dostępne jako
jawne nadpisania modelu. Użyj openai/gpt-image-1.5 dla wyjścia PNG/WebP
z przezroczystym tłem; obecne API gpt-image-2 odrzuca
background: "transparent".
Dla żądania z przezroczystym tłem agenci powinni wywołać image_generate z
model: "openai/gpt-image-1.5", outputFormat: "png" lub "webp" oraz
background: "transparent"; starsza opcja dostawcy openai.background jest
nadal akceptowana. OpenClaw chroni też publiczne trasy OpenAI i
OpenAI Codex OAuth, przepisując domyślne żądania przezroczystości openai/gpt-image-2
na gpt-image-1.5; Azure i niestandardowe punkty końcowe zgodne z OpenAI zachowują
skonfigurowane nazwy wdrożeń/modeli.
To samo ustawienie jest dostępne dla uruchomień CLI bez interfejsu:
--output-format i --background z
openclaw infer image edit, gdy zaczynasz od pliku wejściowego.
--openai-background pozostaje dostępne jako alias specyficzny dla OpenAI.
W instalacjach Codex OAuth zachowaj to samo odwołanie openai/gpt-image-2. Gdy
skonfigurowany jest profil OAuth openai-codex, OpenClaw rozwiązuje zapisany token dostępu OAuth
i wysyła żądania obrazów przez backend Codex Responses. Nie próbuje najpierw
OPENAI_API_KEY ani po cichu nie wraca do klucza API dla tego
żądania. Skonfiguruj models.providers.openai jawnie z kluczem API,
niestandardowym bazowym URL lub punktem końcowym Azure, gdy chcesz użyć bezpośredniej trasy
OpenAI Images API.
Jeśli ten niestandardowy punkt końcowy obrazów znajduje się w zaufanej sieci LAN/adresie prywatnym, ustaw też
browser.ssrfPolicy.dangerouslyAllowPrivateNetwork: true; OpenClaw pozostawia
prywatne/wewnętrzne punkty końcowe obrazów zgodne z OpenAI zablokowane, chyba że ta zgoda
jest obecna.
Generuj:
Generowanie wideo
Wbudowany Pluginopenai rejestruje generowanie wideo przez narzędzie video_generate.
| Możliwość | Wartość |
|---|---|
| Model domyślny | openai/sora-2 |
| Tryby | Tekst na wideo, obraz na wideo, edycja pojedynczego wideo |
| Dane referencyjne | 1 obraz lub 1 wideo |
| Nadpisania rozmiaru | Obsługiwane |
| Inne nadpisania | aspectRatio, resolution, audio, watermark są ignorowane z ostrzeżeniem narzędzia |
Zobacz Generowanie wideo, aby poznać współdzielone parametry narzędzia, wybór dostawcy i zachowanie przełączania awaryjnego.
Wkład promptu GPT-5
OpenClaw dodaje współdzielony wkład promptu GPT-5 dla uruchomień z rodziny GPT-5 u różnych dostawców. Jest stosowany według identyfikatora modelu, więcopenai/gpt-5.5, starsze referencje sprzed naprawy, takie jak openai-codex/gpt-5.5, openrouter/openai/gpt-5.5, opencode/gpt-5.5, oraz inne zgodne referencje GPT-5 otrzymują tę samą nakładkę. Starsze modele GPT-4.x jej nie otrzymują.
Wbudowany natywny harness Codex używa tego samego zachowania GPT-5 i nakładki Heartbeat przez instrukcje deweloperskie serwera aplikacji Codex, więc sesje openai/gpt-5.x kierowane przez Codex zachowują te same wskazówki dotyczące doprowadzania zadań do końca i proaktywnego Heartbeat, mimo że Codex zarządza resztą promptu harnessu.
Wkład GPT-5 dodaje oznaczony kontrakt zachowania dla trwałości persony, bezpieczeństwa wykonania, dyscypliny narzędzi, kształtu danych wyjściowych, kontroli ukończenia i weryfikacji. Zachowanie odpowiedzi specyficzne dla kanału i zachowanie cichych wiadomości pozostaje we współdzielonym prompcie systemowym OpenClaw oraz zasadach dostarczania wychodzącego. Wskazówki GPT-5 są zawsze włączone dla pasujących modeli. Przyjazna warstwa stylu interakcji jest osobna i konfigurowalna.
| Wartość | Efekt |
|---|---|
"friendly" (domyślne) | Włącza przyjazną warstwę stylu interakcji |
"on" | Alias dla "friendly" |
"off" | Wyłącza tylko przyjazną warstwę stylu |
- Konfiguracja
- CLI
Starsze
plugins.entries.openai.config.personality jest nadal odczytywane jako zgodnościowe rozwiązanie awaryjne, gdy współdzielone ustawienie agents.defaults.promptOverlays.gpt5.personality nie jest ustawione.Głos i mowa
Synteza mowy (TTS)
Synteza mowy (TTS)
Wbudowany Plugin
Dostępne modele:
openai rejestruje syntezę mowy dla powierzchni messages.tts.| Ustawienie | Ścieżka konfiguracji | Domyślne |
|---|---|---|
| Model | messages.tts.providers.openai.model | gpt-4o-mini-tts |
| Głos | messages.tts.providers.openai.voice | coral |
| Szybkość | messages.tts.providers.openai.speed | (nieustawione) |
| Instrukcje | messages.tts.providers.openai.instructions | (nieustawione, tylko gpt-4o-mini-tts) |
| Format | messages.tts.providers.openai.responseFormat | opus dla notatek głosowych, mp3 dla plików |
| Klucz API | messages.tts.providers.openai.apiKey | Wraca awaryjnie do OPENAI_API_KEY |
| Bazowy URL | messages.tts.providers.openai.baseUrl | https://api.openai.com/v1 |
| Dodatkowe body | messages.tts.providers.openai.extraBody / extra_body | (nieustawione) |
gpt-4o-mini-tts, tts-1, tts-1-hd. Dostępne głosy: alloy, ash, ballad, cedar, coral, echo, fable, juniper, marin, onyx, nova, sage, shimmer, verse.extraBody jest scalane z JSON żądania /audio/speech po wygenerowanych polach OpenClaw, więc używaj go dla punktów końcowych zgodnych z OpenAI, które wymagają dodatkowych kluczy, takich jak lang. Klucze prototypu są ignorowane.Ustaw
OPENAI_TTS_BASE_URL, aby nadpisać bazowy URL TTS bez wpływu na punkt końcowy API czatu. OpenAI TTS nadal jest konfigurowane przez klucz API; dla odpowiedzi głosowej na żywo tylko przez OAuth użyj ścieżki głosowej Realtime zamiast mowy STT -> TTS w trybie agenta.Mowa na tekst
Mowa na tekst
Wbudowany Plugin Wskazówki dotyczące języka i promptu są przekazywane do OpenAI, gdy zostaną podane przez
współdzieloną konfigurację mediów audio lub żądanie transkrypcji dla pojedynczego wywołania.
openai rejestruje wsadowe przekształcanie mowy na tekst przez
powierzchnię transkrypcji rozumienia mediów OpenClaw.- Model domyślny:
gpt-4o-transcribe - Punkt końcowy: OpenAI REST
/v1/audio/transcriptions - Ścieżka wejściowa: przesyłanie pliku audio jako multipart
- Obsługiwane przez OpenClaw wszędzie tam, gdzie transkrypcja przychodzącego audio używa
tools.media.audio, w tym segmenty kanałów głosowych Discord i załączniki audio kanałów
Transkrypcja w czasie rzeczywistym
Transkrypcja w czasie rzeczywistym
Dołączony Plugin
openai rejestruje transkrypcję w czasie rzeczywistym dla Pluginu Voice Call.| Ustawienie | Ścieżka konfiguracji | Wartość domyślna |
|---|---|---|
| Model | plugins.entries.voice-call.config.streaming.providers.openai.model | gpt-4o-transcribe |
| Język | ...openai.language | (nieustawione) |
| Prompt | ...openai.prompt | (nieustawione) |
| Czas trwania ciszy | ...openai.silenceDurationMs | 800 |
| Próg VAD | ...openai.vadThreshold | 0.5 |
| Uwierzytelnianie | ...openai.apiKey, OPENAI_API_KEY lub OAuth openai-codex | Klucze API łączą się bezpośrednio; OAuth wystawia sekret klienta transkrypcji Realtime |
Używa połączenia WebSocket z
wss://api.openai.com/v1/realtime z dźwiękiem G.711 u-law (g711_ulaw / audio/pcmu). Gdy skonfigurowano tylko OAuth openai-codex, Gateway wystawia efemeryczny sekret klienta transkrypcji Realtime przed otwarciem WebSocket. Ten dostawca przesyłania strumieniowego jest przeznaczony dla ścieżki transkrypcji w czasie rzeczywistym Voice Call; głos Discord obecnie nagrywa krótkie segmenty i zamiast tego używa ścieżki transkrypcji wsadowej tools.media.audio.Głos w czasie rzeczywistym
Głos w czasie rzeczywistym
Dołączony Plugin
Dostępne wbudowane głosy Realtime dla
openai rejestruje głos w czasie rzeczywistym dla Pluginu Voice Call.| Ustawienie | Ścieżka konfiguracji | Wartość domyślna |
|---|---|---|
| Model | plugins.entries.voice-call.config.realtime.providers.openai.model | gpt-realtime-2 |
| Głos | ...openai.voice | alloy |
| Temperatura (mostek wdrożenia Azure) | ...openai.temperature | 0.8 |
| Próg VAD | ...openai.vadThreshold | 0.5 |
| Czas trwania ciszy | ...openai.silenceDurationMs | 500 |
| Wypełnienie prefiksu | ...openai.prefixPaddingMs | 300 |
| Nakład rozumowania | ...openai.reasoningEffort | (nieustawione) |
| Uwierzytelnianie | ...openai.apiKey, OPENAI_API_KEY lub OAuth openai-codex | Browser Talk i mostki backendowe inne niż Azure mogą używać OAuth Codex |
gpt-realtime-2: alloy, ash,
ballad, coral, echo, sage, shimmer, verse, marin, cedar.
OpenAI zaleca marin i cedar dla najlepszej jakości Realtime. To
osobny zestaw względem głosów zamiany tekstu na mowę powyżej; nie zakładaj, że głos TTS
taki jak fable, nova lub onyx jest prawidłowy dla sesji Realtime.Backendowe mostki OpenAI realtime używają kształtu sesji GA Realtime WebSocket, który nie akceptuje
session.temperature. Wdrożenia Azure OpenAI pozostają dostępne przez azureEndpoint i azureDeployment oraz zachowują kształt sesji zgodny z wdrożeniem. Obsługuje dwukierunkowe wywoływanie narzędzi i dźwięk G.711 u-law.Głos Realtime jest wybierany podczas tworzenia sesji. OpenAI pozwala później zmienić większość
pól sesji, ale głosu nie można zmienić po tym, jak
model wyemituje dźwięk w tej sesji. OpenClaw obecnie udostępnia
wbudowane identyfikatory głosów Realtime jako ciągi znaków.
Control UI Talk używa przeglądarkowych sesji realtime OpenAI z wystawianym przez Gateway
efemerycznym sekretem klienta oraz bezpośrednią przeglądarkową wymianą WebRTC SDP z
OpenAI Realtime API. Gdy nie skonfigurowano bezpośredniego klucza API OpenAI,
Gateway może wystawić ten sekret klienta z wybranym profilem OAuth
openai-codex.
Gateway relay i backendowe mostki Voice Call realtime WebSocket używają
tego samego awaryjnego OAuth dla natywnych punktów końcowych OpenAI. Weryfikacja na żywo dla opiekunów
jest dostępna za pomocą
OPENAI_API_KEY=... GEMINI_API_KEY=... node --import tsx scripts/dev/realtime-talk-live-smoke.ts;
ścieżki OpenAI weryfikują zarówno backendowy mostek WebSocket, jak i przeglądarkową
wymianę WebRTC SDP bez logowania sekretów.Punkty końcowe Azure OpenAI
Dołączony dostawcaopenai może kierować generowanie obrazów do zasobu Azure OpenAI
przez nadpisanie bazowego adresu URL. Na ścieżce generowania obrazów OpenClaw
wykrywa nazwy hostów Azure w models.providers.openai.baseUrl i automatycznie przełącza się na
kształt żądania Azure.
Głos w czasie rzeczywistym używa osobnej ścieżki konfiguracji
(
plugins.entries.voice-call.config.realtime.providers.openai.azureEndpoint)
i models.providers.openai.baseUrl na niego nie wpływa. Zobacz akordeon Głos w czasie rzeczywistym
w sekcji Głos i mowa, aby znaleźć jego ustawienia Azure.- Masz już subskrypcję, limit lub umowę enterprise Azure OpenAI
- Potrzebujesz regionalnej rezydencji danych lub kontroli zgodności zapewnianych przez Azure
- Chcesz utrzymać ruch w istniejącej dzierżawie Azure
Konfiguracja
Aby generować obrazy przez Azure przy użyciu dołączonego dostawcyopenai, ustaw
models.providers.openai.baseUrl na swój zasób Azure i ustaw apiKey na
klucz Azure OpenAI (nie klucz OpenAI Platform):
*.openai.azure.com*.services.ai.azure.com*.cognitiveservices.azure.com
- Wysyła nagłówek
api-keyzamiastAuthorization: Bearer - Używa ścieżek w zakresie wdrożenia (
/openai/deployments/{deployment}/...) - Dołącza
?api-version=...do każdego żądania - Używa domyślnego limitu czasu żądania 600 s dla wywołań generowania obrazów Azure.
Wartości
timeoutMsdla poszczególnych wywołań nadal nadpisują tę wartość domyślną.
Routing Azure dla ścieżki generowania obrazów dostawcy
openai wymaga
OpenClaw 2026.4.22 lub nowszego. Wcześniejsze wersje traktują każdy niestandardowy
openai.baseUrl jak publiczny punkt końcowy OpenAI i nie zadziałają z wdrożeniami obrazów
Azure.Wersja API
UstawAZURE_OPENAI_API_VERSION, aby przypiąć konkretną wersję Azure Preview lub GA
dla ścieżki generowania obrazów w Azure:
2024-12-01-preview, gdy zmienna nie jest ustawiona.
Nazwy modeli są nazwami wdrożeń
Azure OpenAI wiąże modele z wdrożeniami. Dla żądań generowania obrazów Azure kierowanych przez dołączonego provideraopenai, pole model w OpenClaw
musi być nazwą wdrożenia Azure skonfigurowaną w portalu Azure, a nie
publicznym identyfikatorem modelu OpenAI.
Jeśli utworzysz wdrożenie o nazwie gpt-image-2-prod, które obsługuje gpt-image-2:
openai.
Dostępność regionalna
Generowanie obrazów Azure jest obecnie dostępne tylko w wybranych regionach (na przykładeastus2, swedencentral, polandcentral, westus3,
uaenorth). Przed utworzeniem wdrożenia sprawdź aktualną listę regionów Microsoft
i potwierdź, że dany model jest oferowany w Twoim regionie.
Różnice parametrów
Azure OpenAI i publiczne OpenAI nie zawsze akceptują te same parametry obrazów. Azure może odrzucać opcje, które publiczne OpenAI dopuszcza (na przykład niektóre wartościbackground w gpt-image-2) albo udostępniać je tylko w określonych wersjach
modelu. Te różnice wynikają z Azure i bazowego modelu, a nie z
OpenClaw. Jeśli żądanie Azure zakończy się błędem walidacji, sprawdź
zestaw parametrów obsługiwany przez konkretne wdrożenie i wersję API w
portalu Azure.
Azure OpenAI używa natywnego transportu i zachowania zgodności, ale nie otrzymuje
ukrytych nagłówków atrybucji OpenClaw — zobacz akordeon Trasy natywne vs zgodne z OpenAI
w sekcji Konfiguracja zaawansowana.Dla ruchu czatu lub Responses w Azure (poza generowaniem obrazów) użyj
przepływu wdrażania albo dedykowanej konfiguracji providera Azure — samo
openai.baseUrl
nie wybiera kształtu API/uwierzytelniania Azure. Istnieje osobny
provider azure-openai-responses/*; zobacz
akordeon Compaction po stronie serwera poniżej.Konfiguracja zaawansowana
Transport (WebSocket vs SSE)
Transport (WebSocket vs SSE)
OpenClaw używa najpierw WebSocket z rezerwowym SSE (
Powiązana dokumentacja OpenAI:
"auto") dla openai/*.W trybie "auto" OpenClaw:- Ponawia jedną wczesną awarię WebSocket przed przełączeniem rezerwowym na SSE
- Po awarii oznacza WebSocket jako zdegradowany na około 60 sekund i używa SSE w czasie schłodzenia
- Dołącza stabilne nagłówki tożsamości sesji i tury dla ponowień oraz ponownych połączeń
- Normalizuje liczniki użycia (
input_tokens/prompt_tokens) między wariantami transportu
| Wartość | Zachowanie |
|---|---|
"auto" (domyślnie) | Najpierw WebSocket, rezerwowo SSE |
"sse" | Wymuś tylko SSE |
"websocket" | Wymuś tylko WebSocket |
Tryb szybki
Tryb szybki
OpenClaw udostępnia współdzielony przełącznik trybu szybkiego dla
openai/*:- Czat/UI:
/fast status|on|off - Konfiguracja:
agents.defaults.models["<provider>/<model>"].params.fastMode
service_tier = "priority"). Istniejące wartości service_tier są zachowywane, a tryb szybki nie przepisuje reasoning ani text.verbosity.Nadpisania sesji mają pierwszeństwo przed konfiguracją. Wyczyszczenie nadpisania sesji w UI sesji przywraca sesję do skonfigurowanej wartości domyślnej.
Przetwarzanie priorytetowe (service_tier)
Przetwarzanie priorytetowe (service_tier)
API OpenAI udostępnia przetwarzanie priorytetowe przez Obsługiwane wartości:
service_tier. Ustaw je osobno dla modelu w OpenClaw:auto, default, flex, priority.Compaction po stronie serwera (Responses API)
Compaction po stronie serwera (Responses API)
Dla bezpośrednich modeli OpenAI Responses (
openai/* na api.openai.com) wrapper strumienia Pi-harness w Pluginie OpenAI automatycznie włącza Compaction po stronie serwera:- Wymusza
store: true(chyba że zgodność modelu ustawiasupportsStore: false) - Wstrzykuje
context_management: [{ type: "compaction", compact_threshold: ... }] - Domyślny
compact_threshold: 70%contextWindow(albo80000, gdy jest niedostępne)
- Włącz jawnie
- Niestandardowy próg
- Wyłącz
Przydatne dla zgodnych endpointów, takich jak Azure OpenAI Responses:
responsesServerCompaction kontroluje tylko wstrzykiwanie context_management. Bezpośrednie modele OpenAI Responses nadal wymuszają store: true, chyba że zgodność ustawia supportsStore: false.Tryb GPT strict-agentic
Tryb GPT strict-agentic
Dla uruchomień z rodziny GPT-5 na Z
openai/* OpenClaw może używać bardziej rygorystycznego kontraktu osadzonego wykonywania:strict-agentic OpenClaw:- Nie traktuje już tury zawierającej tylko plan jako udanego postępu, gdy dostępna jest akcja narzędzia
- Ponawia turę ze wskazówką do natychmiastowego działania
- Automatycznie włącza
update_plandla znaczącej pracy - Ujawnia jawny stan zablokowania, jeśli model nadal planuje bez działania
Ograniczone tylko do uruchomień rodziny GPT-5 OpenAI i Codex. Inni providerzy i starsze rodziny modeli zachowują domyślne zachowanie.
Trasy natywne vs zgodne z OpenAI
Trasy natywne vs zgodne z OpenAI
OpenClaw traktuje bezpośrednie endpointy OpenAI, Codex i Azure OpenAI inaczej niż ogólne proxy
/v1 zgodne z OpenAI:Trasy natywne (openai/*, Azure OpenAI):- Zachowują
reasoning: { effort: "none" }tylko dla modeli obsługujących poziom wysiłku OpenAInone - Pomijają wyłączone rozumowanie dla modeli lub proxy, które odrzucają
reasoning.effort: "none" - Domyślnie ustawiają schematy narzędzi w trybie ścisłym
- Dołączają ukryte nagłówki atrybucji tylko na zweryfikowanych natywnych hostach
- Zachowują kształtowanie żądań wyłącznie dla OpenAI (
service_tier,store, zgodność rozumowania, wskazówki cache promptów)
- Używają luźniejszego zachowania zgodności
- Usuwają
storeCompletions z nienatywnych ładunkówopenai-completions - Akceptują zaawansowane przekazywanie JSON
params.extra_body/params.extraBodydla proxy Completions zgodnych z OpenAI - Akceptują
params.chat_template_kwargsdla proxy Completions zgodnych z OpenAI, takich jak vLLM - Nie wymuszają ścisłych schematów narzędzi ani nagłówków dostępnych tylko w trasach natywnych
Powiązane
Wybór modelu
Wybór providerów, odwołań modeli i zachowania przełączania awaryjnego.
Generowanie obrazów
Wspólne parametry narzędzia obrazów i wybór providera.
Generowanie wideo
Wspólne parametry narzędzia wideo i wybór providera.
OAuth i uwierzytelnianie
Szczegóły uwierzytelniania i zasady ponownego użycia poświadczeń.