OpenAI proporciona API para desarrolladores para modelos GPT, y Codex también está disponible como agente de programación de plan de ChatGPT a través de los clientes Codex de OpenAI. OpenClaw mantiene esas superficies separadas para que la configuración siga siendo predecible. OpenClaw usaDocumentation Index
Fetch the complete documentation index at: https://docs.openclaw.ai/llms.txt
Use this file to discover all available pages before exploring further.
openai/* como la ruta canónica de modelos de OpenAI. Los turnos de agente incrustado en modelos de OpenAI se ejecutan de forma predeterminada mediante el runtime nativo del servidor de aplicaciones de Codex; la autenticación directa con clave de API de OpenAI sigue disponible para superficies de OpenAI que no son de agente, como imágenes, embeddings, voz y realtime.
- Modelos de agente - modelos
openai/*mediante el runtime de Codex; inicia sesión con autenticación de Codex para usar una suscripción de ChatGPT/Codex, o configura una copia de seguridad con clave de API de OpenAI compatible con Codex cuando quieras usar intencionadamente autenticación con clave de API. - API de OpenAI que no son de agente - acceso directo a OpenAI Platform con facturación basada en uso mediante
OPENAI_API_KEYo incorporación con clave de API de OpenAI. - Configuración heredada - las referencias de modelo
openai-codex/*se reparan conopenclaw doctor --fixaopenai/*más el runtime de Codex.
Elección rápida
| Objetivo | Usar | Notas |
|---|---|---|
| Suscripción ChatGPT/Codex con runtime nativo de Codex | openai/gpt-5.5 | Configuración predeterminada de agente de OpenAI. Inicia sesión con autenticación de Codex. |
| Facturación directa con clave de API para modelos de agente | openai/gpt-5.5 más un perfil de clave de API compatible con Codex | Usa auth.order.openai para colocar la copia de seguridad después de la autenticación de suscripción. |
| Facturación directa con clave de API mediante PI explícito | openai/gpt-5.5 más runtime de proveedor/modelo pi | Selecciona un perfil normal de clave de API openai. |
| Alias de API de ChatGPT Instant más reciente | openai/chat-latest | Solo clave de API directa. Alias móvil para experimentos, no el predeterminado. |
| Autenticación de suscripción ChatGPT/Codex mediante PI explícito | openai/gpt-5.5 más runtime de proveedor/modelo pi | Selecciona un perfil de autenticación openai-codex para la ruta de compatibilidad. |
| Generación o edición de imágenes | openai/gpt-image-2 | Funciona con OPENAI_API_KEY u OAuth de OpenAI Codex. |
| Imágenes con fondo transparente | openai/gpt-image-1.5 | Usa outputFormat=png o webp y openai.background=transparent. |
Mapa de nombres
Los nombres son similares, pero no intercambiables:| Nombre que ves | Capa | Significado |
|---|---|---|
openai | Prefijo de proveedor | Ruta canónica de modelos de OpenAI; los turnos de agente usan el runtime de Codex. |
openai-codex | Prefijo de autenticación/perfil heredado | Espacio de nombres anterior de perfiles OAuth/suscripción de OpenAI Codex. Los perfiles existentes y auth.order.openai-codex siguen funcionando. |
plugin codex | Plugin | Plugin incluido de OpenClaw que proporciona el runtime nativo del servidor de aplicaciones de Codex y controles de chat /codex. |
proveedor/modelo agentRuntime.id: codex | Runtime de agente | Fuerza el arnés nativo del servidor de aplicaciones de Codex para turnos incrustados coincidentes. |
/codex ... | Conjunto de comandos de chat | Vincula/controla hilos del servidor de aplicaciones de Codex desde una conversación. |
runtime: "acp", agentId: "codex" | Ruta de sesión ACP | Ruta de respaldo explícita que ejecuta Codex mediante ACP/acpx. |
openai/* mientras los perfiles de autenticación siguen apuntando a credenciales compatibles con Codex. Prefiere auth.order.openai para configuraciones nuevas; los perfiles openai-codex:* existentes y auth.order.openai-codex siguen siendo compatibles. openclaw doctor --fix reescribe las referencias de modelo heredadas openai-codex/* a la ruta canónica de modelos de OpenAI.
GPT-5.5 está disponible mediante acceso directo con clave de API de OpenAI Platform y mediante rutas de suscripción/OAuth. Para suscripción ChatGPT/Codex más ejecución nativa de Codex, usa
openai/gpt-5.5; la configuración de runtime no definida ahora selecciona el arnés de Codex para turnos de agente de OpenAI. Usa perfiles de clave de API de OpenAI solo cuando quieras autenticación directa con clave de API para un modelo de agente de OpenAI.Los turnos de modelos de agente de OpenAI requieren el plugin incluido de servidor de aplicaciones de Codex. La configuración explícita de runtime PI sigue disponible como ruta de compatibilidad opcional. Cuando PI se selecciona explícitamente con un perfil de autenticación
openai-codex, OpenClaw mantiene la referencia pública del modelo como openai/* y enruta PI internamente mediante el transporte heredado de autenticación de Codex. Ejecuta openclaw doctor --fix para reparar referencias de modelo openai-codex/* obsoletas o anclajes de sesión PI antiguos que no provengan de configuración explícita de runtime.Cobertura de características de OpenClaw
| Capacidad de OpenAI | Superficie de OpenClaw | Estado |
|---|---|---|
| Chat / Responses | Proveedor de modelos openai/<model> | Sí |
| Modelos de suscripción de Codex | openai/<model> con OAuth openai-codex | Sí |
| Referencias de modelo Codex heredadas | openai-codex/<model> | Reparadas por doctor a openai/<model> |
| Arnés de servidor de aplicaciones de Codex | openai/<model> con runtime omitido o proveedor/modelo agentRuntime.id: codex | Sí |
| Búsqueda web del lado del servidor | Herramienta nativa Responses de OpenAI | Sí, cuando la búsqueda web está habilitada y no hay proveedor fijado |
| Imágenes | image_generate | Sí |
| Videos | video_generate | Sí |
| Texto a voz | messages.tts.provider: "openai" / tts | Sí |
| Voz a texto por lotes | tools.media.audio / comprensión multimedia | Sí |
| Voz a texto en streaming | Voice Call streaming.provider: "openai" | Sí |
| Voz en realtime | Voice Call realtime.provider: "openai" / Control UI Talk | Sí |
| Embeddings | Proveedor de embeddings de memoria | Sí |
Embeddings de memoria
OpenClaw puede usar OpenAI, o un endpoint de embeddings compatible con OpenAI, para la indexación dememory_search y los embeddings de consulta:
queryInputType y documentInputType en memorySearch. OpenClaw los reenvía como campos de solicitud input_type específicos del proveedor: los embeddings de consulta usan queryInputType; los fragmentos de memoria indexados y la indexación por lotes usan documentInputType. Consulta la referencia de configuración de memoria para ver el ejemplo completo.
Primeros pasos
Elige tu método de autenticación preferido y sigue los pasos de configuración.- Clave de API (OpenAI Platform)
- Codex subscription
Ideal para: acceso directo a API y facturación basada en uso.
Para probar el modelo Instant actual de ChatGPT desde la API de OpenAI, establece el modelo en
Obtén tu clave de API
Crea o copia una clave de API desde el panel de OpenAI Platform.
Resumen de rutas
| Referencia de modelo | Configuración de runtime | Ruta | Autenticación |
|---|---|---|---|
openai/gpt-5.5 | omitida / proveedor/modelo agentRuntime.id: "codex" | Arnés de servidor de aplicaciones de Codex | Perfil de OpenAI compatible con Codex |
openai/gpt-5.4-mini | omitida / proveedor/modelo agentRuntime.id: "codex" | Arnés de servidor de aplicaciones de Codex | Perfil de OpenAI compatible con Codex |
openai/gpt-5.5 | proveedor/modelo agentRuntime.id: "pi" | Runtime incrustado PI | Perfil openai o perfil openai-codex seleccionado |
Los modelos de agente
openai/* usan el arnés de servidor de aplicaciones de Codex. Para usar autenticación con clave de API para un modelo de agente, crea un perfil de clave de API compatible con Codex y ordénalo con auth.order.openai; OPENAI_API_KEY sigue siendo la opción de respaldo directa para superficies de API de OpenAI que no son de agente. Las entradas auth.order.openai-codex anteriores siguen funcionando.Ejemplo de configuración
openai/chat-latest:chat-latest es un alias móvil. OpenAI lo documenta como el modelo Instant más reciente usado en ChatGPT y recomienda gpt-5.5 para uso de API en producción, así que mantén openai/gpt-5.5 como valor predeterminado estable salvo que quieras explícitamente ese comportamiento de alias. Actualmente, el alias solo acepta verbosidad de texto medium, por lo que OpenClaw normaliza las anulaciones incompatibles de verbosidad de texto de OpenAI para este modelo.Autenticación nativa del servidor de aplicación de Codex
El arnés nativo del servidor de aplicación de Codex usa refs. de modeloopenai/* más configuración de
runtime omitida o proveedor/modelo agentRuntime.id: "codex", pero su autenticación
sigue estando basada en cuenta. OpenClaw selecciona la autenticación en este orden:
- Perfiles de autenticación de OpenAI ordenados para el agente, preferiblemente en
auth.order.openai. Los perfiles existentesopenai-codex:*yauth.order.openai-codexsiguen siendo válidos para instalaciones antiguas. - La cuenta existente del servidor de aplicación, como un inicio de sesión local de ChatGPT en Codex CLI.
- Solo para lanzamientos locales del servidor de aplicación por stdio,
CODEX_API_KEYy luegoOPENAI_API_KEY, cuando el servidor de aplicación informa que no hay cuenta y todavía requiere autenticación de OpenAI.
OPENAI_API_KEY para modelos directos de OpenAI
o embeddings. El respaldo de clave de API por env solo es la ruta local stdio sin cuenta; no
se envía a conexiones WebSocket del servidor de aplicación. Cuando se selecciona un perfil de Codex
de tipo suscripción, OpenClaw también mantiene CODEX_API_KEY y OPENAI_API_KEY
fuera del proceso hijo stdio del servidor de aplicación generado y envía las credenciales seleccionadas
mediante el RPC de inicio de sesión del servidor de aplicación. Cuando ese perfil de suscripción está bloqueado por un
límite de uso de Codex, OpenClaw puede rotar al siguiente perfil de clave de API openai:*
ordenado sin cambiar el modelo seleccionado ni salir del arnés de Codex.
Una vez que pasa la hora de restablecimiento de la suscripción, el perfil de suscripción vuelve a ser
elegible.
Generación de imágenes
El Pluginopenai incluido registra la generación de imágenes mediante la herramienta image_generate.
Admite generación de imágenes tanto con clave de API de OpenAI como con OAuth de Codex
mediante la misma ref. de modelo openai/gpt-image-2.
| Capacidad | Clave de API de OpenAI | OAuth de Codex |
|---|---|---|
| Ref. de modelo | openai/gpt-image-2 | openai/gpt-image-2 |
| Autenticación | OPENAI_API_KEY | Inicio de sesión OAuth de OpenAI Codex |
| Transporte | API de imágenes de OpenAI | Backend de Responses de Codex |
| Máx. imágenes por solicitud | 4 | 4 |
| Modo de edición | Habilitado (hasta 5 imágenes de referencia) | Habilitado (hasta 5 imágenes de referencia) |
| Sobrescrituras de tamaño | Compatibles, incluidos tamaños 2K/4K | Compatibles, incluidos tamaños 2K/4K |
| Relación de aspecto / resolución | No se reenvía a la API de imágenes de OpenAI | Se asigna a un tamaño compatible cuando es seguro |
Consulta Generación de imágenes para ver los parámetros compartidos de la herramienta, la selección de proveedor y el comportamiento de conmutación por error.
gpt-image-2 es el valor predeterminado tanto para la generación de texto a imagen de OpenAI como para la
edición de imágenes. gpt-image-1.5, gpt-image-1 y gpt-image-1-mini siguen siendo utilizables como
sobrescrituras explícitas de modelo. Usa openai/gpt-image-1.5 para salida
PNG/WebP con fondo transparente; la API actual de gpt-image-2 rechaza
background: "transparent".
Para una solicitud con fondo transparente, los agentes deben llamar a image_generate con
model: "openai/gpt-image-1.5", outputFormat: "png" o "webp", y
background: "transparent"; la opción de proveedor antigua openai.background todavía se
acepta. OpenClaw también protege las rutas públicas de OpenAI y
OAuth de OpenAI Codex reescribiendo las solicitudes transparentes predeterminadas openai/gpt-image-2
a gpt-image-1.5; Azure y los endpoints personalizados compatibles con OpenAI conservan
sus nombres de implementación/modelo configurados.
La misma configuración se expone para ejecuciones de CLI sin interfaz:
--output-format y --background con
openclaw infer image edit al partir de un archivo de entrada.
--openai-background sigue disponible como alias específico de OpenAI.
Para instalaciones con OAuth de Codex, conserva la misma ref. openai/gpt-image-2. Cuando se
configura un perfil OAuth openai-codex, OpenClaw resuelve ese token de acceso OAuth
almacenado y envía las solicitudes de imagen a través del backend de Responses de Codex. No
prueba primero OPENAI_API_KEY ni recurre silenciosamente a una clave de API para esa
solicitud. Configura models.providers.openai explícitamente con una clave de API,
URL base personalizada o endpoint de Azure cuando quieras usar la ruta directa de la API de imágenes de OpenAI
en su lugar.
Si ese endpoint de imagen personalizado está en una dirección LAN/privada de confianza, configura también
browser.ssrfPolicy.dangerouslyAllowPrivateNetwork: true; OpenClaw mantiene bloqueados
los endpoints de imagen privados/internos compatibles con OpenAI salvo que esta adhesión explícita esté
presente.
Generar:
Generación de video
El pluginopenai incluido registra la generación de video mediante la herramienta video_generate.
| Capacidad | Valor |
|---|---|
| Modelo predeterminado | openai/sora-2 |
| Modos | Texto a video, imagen a video, edición de un solo video |
| Entradas de referencia | 1 imagen o 1 video |
| Sobrescrituras de tamaño | Admitidas |
| Otras sobrescrituras | aspectRatio, resolution, audio, watermark se ignoran con una advertencia de la herramienta |
Consulta Generación de video para conocer los parámetros compartidos de la herramienta, la selección de proveedores y el comportamiento de conmutación por error.
Contribución de prompt de GPT-5
OpenClaw añade una contribución compartida de prompt de GPT-5 para ejecuciones de la familia GPT-5 en distintos proveedores. Se aplica por id de modelo, por lo queopenai/gpt-5.5, referencias heredadas previas a la reparación como openai-codex/gpt-5.5, openrouter/openai/gpt-5.5, opencode/gpt-5.5 y otras referencias compatibles con GPT-5 reciben la misma superposición. Los modelos GPT-4.x anteriores no.
El arnés nativo de Codex incluido usa el mismo comportamiento de GPT-5 y la misma superposición de Heartbeat mediante las instrucciones de desarrollador del servidor de aplicaciones de Codex, por lo que las sesiones openai/gpt-5.x enrutadas a través de Codex conservan la misma guía de seguimiento y Heartbeat proactivo, aunque Codex controla el resto del prompt del arnés.
La contribución de GPT-5 añade un contrato de comportamiento etiquetado para la persistencia de la persona, la seguridad de ejecución, la disciplina de herramientas, la forma de salida, las comprobaciones de finalización y la verificación. El comportamiento de respuestas específico del canal y de mensajes silenciosos permanece en el prompt compartido del sistema de OpenClaw y en la política de entrega saliente. La guía de GPT-5 siempre está habilitada para los modelos coincidentes. La capa de estilo de interacción amistoso es independiente y configurable.
| Valor | Efecto |
|---|---|
"friendly" (predeterminado) | Habilita la capa de estilo de interacción amistoso |
"on" | Alias de "friendly" |
"off" | Deshabilita solo la capa de estilo amistoso |
- Configuración
- CLI
plugins.entries.openai.config.personality heredado todavía se lee como alternativa de compatibilidad cuando el ajuste compartido agents.defaults.promptOverlays.gpt5.personality no está definido.Voz y habla
Síntesis de voz (TTS)
Síntesis de voz (TTS)
El plugin
Modelos disponibles:
openai incluido registra la síntesis de voz para la superficie messages.tts.| Ajuste | Ruta de configuración | Predeterminado |
|---|---|---|
| Modelo | messages.tts.providers.openai.model | gpt-4o-mini-tts |
| Voz | messages.tts.providers.openai.voice | coral |
| Velocidad | messages.tts.providers.openai.speed | (sin definir) |
| Instrucciones | messages.tts.providers.openai.instructions | (sin definir, solo gpt-4o-mini-tts) |
| Formato | messages.tts.providers.openai.responseFormat | opus para notas de voz, mp3 para archivos |
| Clave de API | messages.tts.providers.openai.apiKey | Recurre a OPENAI_API_KEY |
| URL base | messages.tts.providers.openai.baseUrl | https://api.openai.com/v1 |
| Cuerpo adicional | messages.tts.providers.openai.extraBody / extra_body | (sin definir) |
gpt-4o-mini-tts, tts-1, tts-1-hd. Voces disponibles: alloy, ash, ballad, cedar, coral, echo, fable, juniper, marin, onyx, nova, sage, shimmer, verse.extraBody se fusiona en el JSON de la solicitud /audio/speech después de los campos generados por OpenClaw, así que úsalo para endpoints compatibles con OpenAI que requieren claves adicionales como lang. Las claves de prototipo se ignoran.Define
OPENAI_TTS_BASE_URL para sobrescribir la URL base de TTS sin afectar el endpoint de la API de chat. OpenAI TTS todavía se configura mediante una clave de API; para respuestas de voz en vivo solo con OAuth, usa la ruta de voz Realtime en lugar del habla STT -> TTS en modo agente.Voz a texto
Voz a texto
El plugin Las sugerencias de idioma y prompt se reenvían a OpenAI cuando las proporciona la
configuración compartida de medios de audio o la solicitud de transcripción por llamada.
openai incluido registra la voz a texto por lotes mediante
la superficie de transcripción de comprensión de medios de OpenClaw.- Modelo predeterminado:
gpt-4o-transcribe - Endpoint: REST de OpenAI
/v1/audio/transcriptions - Ruta de entrada: carga de archivo de audio multipart
- Admitido por OpenClaw siempre que la transcripción de audio entrante use
tools.media.audio, incluidos segmentos de canales de voz de Discord y archivos adjuntos de audio de canal
Transcripción en tiempo real
Transcripción en tiempo real
El plugin
openai incluido registra la transcripción en tiempo real para el plugin Voice Call.| Ajuste | Ruta de configuración | Valor predeterminado |
|---|---|---|
| Modelo | plugins.entries.voice-call.config.streaming.providers.openai.model | gpt-4o-transcribe |
| Idioma | ...openai.language | (sin establecer) |
| Prompt | ...openai.prompt | (sin establecer) |
| Duración del silencio | ...openai.silenceDurationMs | 800 |
| Umbral de VAD | ...openai.vadThreshold | 0.5 |
| Autenticación | ...openai.apiKey, OPENAI_API_KEY, u OAuth de openai-codex | Las claves de API se conectan directamente; OAuth emite un secreto de cliente de transcripción Realtime |
Usa una conexión WebSocket a
wss://api.openai.com/v1/realtime con audio G.711 u-law (g711_ulaw / audio/pcmu). Cuando solo está configurado OAuth de openai-codex, el Gateway emite un secreto de cliente efímero de transcripción Realtime antes de abrir el WebSocket. Este proveedor de streaming es para la ruta de transcripción en tiempo real de Voice Call; la voz de Discord actualmente graba segmentos cortos y usa en su lugar la ruta de transcripción por lotes tools.media.audio.Voz en tiempo real
Voz en tiempo real
El plugin
Voces Realtime integradas disponibles para
openai incluido registra voz en tiempo real para el plugin Voice Call.| Ajuste | Ruta de configuración | Valor predeterminado |
|---|---|---|
| Modelo | plugins.entries.voice-call.config.realtime.providers.openai.model | gpt-realtime-2 |
| Voz | ...openai.voice | alloy |
| Temperatura (puente de despliegue de Azure) | ...openai.temperature | 0.8 |
| Umbral de VAD | ...openai.vadThreshold | 0.5 |
| Duración del silencio | ...openai.silenceDurationMs | 500 |
| Relleno de prefijo | ...openai.prefixPaddingMs | 300 |
| Esfuerzo de razonamiento | ...openai.reasoningEffort | (sin establecer) |
| Autenticación | ...openai.apiKey, OPENAI_API_KEY, u OAuth de openai-codex | Browser Talk y los puentes de backend no Azure pueden usar OAuth de Codex |
gpt-realtime-2: alloy, ash,
ballad, coral, echo, sage, shimmer, verse, marin, cedar.
OpenAI recomienda marin y cedar para obtener la mejor calidad Realtime. Este
es un conjunto independiente de las voces de texto a voz anteriores; no asumas que una voz TTS
como fable, nova u onyx es válida para sesiones Realtime.Los puentes realtime de backend de OpenAI usan la forma de sesión WebSocket Realtime GA, que no acepta
session.temperature. Los despliegues de Azure OpenAI siguen estando disponibles mediante azureEndpoint y azureDeployment, y conservan la forma de sesión compatible con despliegues. Admite llamadas de herramientas bidireccionales y audio G.711 u-law.La voz Realtime se selecciona cuando se crea la sesión. OpenAI permite cambiar más adelante la mayoría de los campos
de sesión, pero la voz no se puede cambiar después de que el modelo haya emitido audio en esa sesión. OpenClaw actualmente expone los
ids de voz Realtime integrados como cadenas.
Control UI Talk usa sesiones realtime de navegador de OpenAI con un
secreto de cliente efímero emitido por el Gateway y un intercambio SDP WebRTC directo desde el navegador contra la
API Realtime de OpenAI. Cuando no hay configurada una clave de API directa de OpenAI, el
Gateway puede emitir ese secreto de cliente con el perfil OAuth de
openai-codex
seleccionado. El relé del Gateway y los puentes WebSocket realtime de backend de Voice Call usan
la misma alternativa OAuth para endpoints nativos de OpenAI. La verificación en vivo de mantenedor
está disponible con
OPENAI_API_KEY=... GEMINI_API_KEY=... node --import tsx scripts/dev/realtime-talk-live-smoke.ts;
los tramos de OpenAI verifican tanto el puente WebSocket de backend como el intercambio SDP
WebRTC del navegador sin registrar secretos.Endpoints de Azure OpenAI
El proveedoropenai incluido puede apuntar a un recurso de Azure OpenAI para la generación de
imágenes sobrescribiendo la URL base. En la ruta de generación de imágenes, OpenClaw
detecta nombres de host de Azure en models.providers.openai.baseUrl y cambia a
la forma de solicitud de Azure automáticamente.
La voz Realtime usa una ruta de configuración separada
(
plugins.entries.voice-call.config.realtime.providers.openai.azureEndpoint)
y no se ve afectada por models.providers.openai.baseUrl. Consulta el acordeón Voz en tiempo real en Voz y habla para sus ajustes de Azure.- Ya tengas una suscripción, cuota o acuerdo empresarial de Azure OpenAI
- Necesites residencia regional de datos o controles de cumplimiento que Azure proporciona
- Quieras mantener el tráfico dentro de una tenencia de Azure existente
Configuración
Para la generación de imágenes de Azure mediante el proveedoropenai incluido, apunta
models.providers.openai.baseUrl a tu recurso de Azure y establece apiKey en
la clave de Azure OpenAI (no una clave de OpenAI Platform):
*.openai.azure.com*.services.ai.azure.com*.cognitiveservices.azure.com
- Envía el encabezado
api-keyen lugar deAuthorization: Bearer - Usa rutas con ámbito de despliegue (
/openai/deployments/{deployment}/...) - Añade
?api-version=...a cada solicitud - Usa un tiempo de espera de solicitud predeterminado de 600 s para llamadas de generación de imágenes de Azure.
Los valores
timeoutMspor llamada siguen sobrescribiendo este valor predeterminado.
El enrutamiento de Azure para la ruta de generación de imágenes del proveedor
openai requiere
OpenClaw 2026.4.22 o posterior. Las versiones anteriores tratan cualquier
openai.baseUrl personalizado como el endpoint público de OpenAI y fallarán contra despliegues
de imágenes de Azure.Versión de la API
ConfiguraAZURE_OPENAI_API_VERSION para fijar una versión específica de Azure en vista previa o GA
para la ruta de generación de imágenes de Azure:
2024-12-01-preview cuando la variable no está definida.
Los nombres de modelo son nombres de despliegue
Azure OpenAI vincula los modelos a despliegues. Para las solicitudes de generación de imágenes de Azure enrutadas a través del proveedoropenai incluido, el campo model en OpenClaw
debe ser el nombre de despliegue de Azure que configuraste en el portal de Azure, no
el id público del modelo de OpenAI.
Si creas un despliegue llamado gpt-image-2-prod que sirve gpt-image-2:
openai incluido.
Disponibilidad regional
La generación de imágenes de Azure actualmente solo está disponible en un subconjunto de regiones (por ejemploeastus2, swedencentral, polandcentral, westus3,
uaenorth). Consulta la lista actual de regiones de Microsoft antes de crear un
despliegue y confirma que el modelo específico se ofrezca en tu región.
Diferencias de parámetros
Azure OpenAI y OpenAI público no siempre aceptan los mismos parámetros de imagen. Azure puede rechazar opciones que OpenAI público permite (por ejemplo, ciertos valores debackground en gpt-image-2) o exponerlas solo en versiones de modelo
específicas. Estas diferencias provienen de Azure y del modelo subyacente, no de
OpenClaw. Si una solicitud de Azure falla con un error de validación, consulta el
conjunto de parámetros admitido por tu despliegue y versión de API específicos en el
portal de Azure.
Azure OpenAI usa transporte nativo y comportamiento de compatibilidad, pero no recibe
los encabezados de atribución ocultos de OpenClaw; consulta el acordeón Rutas nativas frente a compatibles con OpenAI
en Configuración avanzada.Para tráfico de chat o Responses en Azure (más allá de la generación de imágenes), usa el
flujo de incorporación o una configuración dedicada del proveedor de Azure;
openai.baseUrl por sí solo
no adopta la forma de API/autenticación de Azure. Existe un proveedor separado
azure-openai-responses/*; consulta el acordeón de Compaction del lado del servidor más abajo.Configuración avanzada
Transport (WebSocket vs SSE)
Transport (WebSocket vs SSE)
OpenClaw usa WebSocket primero con reserva SSE (
Documentación relacionada de OpenAI:
"auto") para openai/*.En modo "auto", OpenClaw:- Reintenta una falla temprana de WebSocket antes de recurrir a SSE
- Después de una falla, marca WebSocket como degradado durante ~60 segundos y usa SSE durante el enfriamiento
- Adjunta encabezados estables de identidad de sesión y turno para reintentos y reconexiones
- Normaliza los contadores de uso (
input_tokens/prompt_tokens) entre variantes de transporte
| Valor | Comportamiento |
|---|---|
"auto" (predeterminado) | WebSocket primero, reserva SSE |
"sse" | Forzar solo SSE |
"websocket" | Forzar solo WebSocket |
Fast mode
Fast mode
OpenClaw expone un interruptor compartido de modo rápido para
openai/*:- Chat/IU:
/fast status|on|off - Configuración:
agents.defaults.models["<provider>/<model>"].params.fastMode
service_tier = "priority"). Los valores existentes de service_tier se conservan, y el modo rápido no reescribe reasoning ni text.verbosity.Las anulaciones de sesión tienen prioridad sobre la configuración. Al borrar la anulación de sesión en la interfaz de Sesiones, la sesión vuelve al valor predeterminado configurado.
Procesamiento prioritario (service_tier)
Procesamiento prioritario (service_tier)
La API de OpenAI expone el procesamiento prioritario mediante Valores admitidos:
service_tier. Configúralo por modelo en OpenClaw:auto, default, flex, priority.Compaction del lado del servidor (Responses API)
Compaction del lado del servidor (Responses API)
Para modelos directos de OpenAI Responses (
openai/* en api.openai.com), el envoltorio de flujo del arnés Pi del plugin de OpenAI habilita automáticamente la Compaction del lado del servidor:- Fuerza
store: true(a menos que la compatibilidad del modelo establezcasupportsStore: false) - Inyecta
context_management: [{ type: "compaction", compact_threshold: ... }] compact_thresholdpredeterminado: 70 % decontextWindow(o80000cuando no está disponible)
- Habilitar explícitamente
- Umbral personalizado
- Deshabilitar
Útil para endpoints compatibles como Azure OpenAI Responses:
responsesServerCompaction solo controla la inyección de context_management. Los modelos directos de OpenAI Responses siguen forzando store: true a menos que la compatibilidad establezca supportsStore: false.Modo GPT agentivo estricto
Modo GPT agentivo estricto
Para ejecuciones de la familia GPT-5 en Con
openai/*, OpenClaw puede usar un contrato de ejecución embebida más estricto:strict-agentic, OpenClaw:- Ya no trata un turno solo de plan como progreso correcto cuando hay una acción de herramienta disponible
- Reintenta el turno con una orientación para actuar ahora
- Habilita automáticamente
update_planpara trabajo sustancial - Muestra un estado bloqueado explícito si el modelo sigue planificando sin actuar
Limitado solo a ejecuciones de la familia GPT-5 de OpenAI y Codex. Otros proveedores y familias de modelos anteriores mantienen el comportamiento predeterminado.
Rutas nativas frente a rutas compatibles con OpenAI
Rutas nativas frente a rutas compatibles con OpenAI
OpenClaw trata los endpoints directos de OpenAI, Codex y Azure OpenAI de forma diferente a los proxies genéricos
/v1 compatibles con OpenAI:Rutas nativas (openai/*, Azure OpenAI):- Conservan
reasoning: { effort: "none" }solo para modelos que admiten el esfuerzononede OpenAI - Omiten el razonamiento deshabilitado para modelos o proxies que rechazan
reasoning.effort: "none" - Establecen los esquemas de herramientas en modo estricto de forma predeterminada
- Adjuntan encabezados de atribución ocultos solo en hosts nativos verificados
- Conservan el modelado de solicitudes exclusivo de OpenAI (
service_tier,store, compatibilidad de razonamiento, indicaciones de caché de prompts)
- Usan un comportamiento de compatibilidad más flexible
- Eliminan
storede Completions de las cargas útilesopenai-completionsno nativas - Aceptan JSON de paso directo avanzado
params.extra_body/params.extraBodypara proxies de Completions compatibles con OpenAI - Aceptan
params.chat_template_kwargspara proxies de Completions compatibles con OpenAI, como vLLM - No fuerzan esquemas de herramientas estrictos ni encabezados exclusivos de rutas nativas
Relacionado
Selección de modelos
Elección de proveedores, referencias de modelo y comportamiento de conmutación por error.
Generación de imágenes
Parámetros compartidos de la herramienta de imagen y selección de proveedor.
Generación de vídeo
Parámetros compartidos de la herramienta de vídeo y selección de proveedor.
OAuth y autenticación
Detalles de autenticación y reglas de reutilización de credenciales.