Providers
OpenAI
OpenAI proporciona API para desarrolladores para los modelos GPT, y Codex también está disponible como un
agente de programación del plan ChatGPT mediante los clientes Codex de OpenAI. OpenClaw usa un único
id. de proveedor, openai, para ambas formas de autenticación.
OpenClaw usa openai/* como la ruta canónica de modelos de OpenAI. Los turnos de agentes integrados
en modelos de OpenAI se ejecutan mediante el runtime nativo del servidor de aplicaciones de Codex de forma
predeterminada; la autenticación directa con clave de API de OpenAI sigue estando disponible para superficies de OpenAI
que no son de agente, como imágenes, embeddings, voz y tiempo real.
- Modelos de agente - modelos
openai/*mediante el runtime de Codex; inicia sesión con autenticación de Codex para usar una suscripción de ChatGPT/Codex, o configura una copia de seguridad de clave de API de OpenAI compatible con Codex cuando quieras intencionalmente autenticación con clave de API. - API de OpenAI que no son de agente - acceso directo a OpenAI Platform con facturación basada en uso
mediante
OPENAI_API_KEYo incorporación con clave de API de OpenAI. - Configuración heredada - las referencias de modelos Codex heredadas se reparan con
openclaw doctor --fixaopenai/*más el runtime de Codex.
OpenAI admite explícitamente el uso de OAuth de suscripción en herramientas externas y flujos de trabajo como OpenClaw.
Proveedor, modelo, runtime y canal son capas separadas. Si esas etiquetas se están mezclando, lee Runtimes de agentes antes de cambiar la configuración.
Elección rápida
| Objetivo | Usa | Notas |
|---|---|---|
| Suscripción ChatGPT/Codex con runtime nativo de Codex | openai/gpt-5.5 |
Configuración predeterminada de agente de OpenAI. Inicia sesión con autenticación de Codex. |
| Vista previa limitada de GPT-5.6 | openai/gpt-5.6-sol, -terra o -luna |
Requiere una organización de API aprobada por OpenAI o un espacio de trabajo de Codex. |
| Facturación directa con clave de API para modelos de agente | openai/gpt-5.5 más un perfil de clave de API compatible con Codex |
Usa auth.order.openai para colocar la copia de seguridad después de la autenticación de suscripción. |
| Facturación directa con clave de API mediante OpenClaw explícito | openai/gpt-5.5 más runtime de proveedor/modelo openclaw |
Selecciona un perfil normal de clave de API openai. |
| Alias de API más reciente de ChatGPT Instant | openai/chat-latest |
Solo clave de API directa. Alias móvil para experimentos, no el valor predeterminado. |
| Autenticación de suscripción ChatGPT/Codex mediante OpenClaw | openai/gpt-5.5 más runtime de proveedor/modelo openclaw |
Selecciona un perfil OAuth openai para la ruta de compatibilidad. |
| Generación o edición de imágenes | openai/gpt-image-2 |
Funciona con OPENAI_API_KEY o con OAuth de OpenAI Codex. |
| Imágenes con fondo transparente | openai/gpt-image-1.5 |
Usa outputFormat=png o webp y openai.background=transparent. |
Mapa de nombres
Los nombres son similares, pero no intercambiables:
| Nombre que ves | Capa | Significado |
|---|---|---|
openai |
Prefijo de proveedor | Ruta canónica de modelos de OpenAI; los turnos de agente usan el runtime de Codex. |
| prefijo heredado OpenAI Codex | Prefijo heredado | Espacio de nombres antiguo de modelo/perfil. openclaw doctor --fix lo migra a openai. |
Plugin codex |
Plugin | Plugin incluido de OpenClaw que proporciona el runtime nativo del servidor de aplicaciones de Codex y controles de chat /codex. |
provider/model agentRuntime.id: codex |
Runtime de agente | Fuerza el arnés nativo de servidor de aplicaciones de Codex para turnos integrados coincidentes. |
/codex ... |
Conjunto de comandos de chat | Vincula/controla hilos del servidor de aplicaciones de Codex desde una conversación. |
runtime: "acp", agentId: "codex" |
Ruta de sesión ACP | Ruta de respaldo explícita que ejecuta Codex mediante ACP/acpx. |
Esto significa que una configuración puede contener intencionalmente referencias de modelo openai/* mientras los perfiles de autenticación
apuntan a credenciales de clave de API o de OAuth de ChatGPT/Codex. Usa
auth.order.openai para la configuración; openclaw doctor --fix reescribe referencias de modelos Codex heredadas,
ids de perfiles de autenticación Codex heredados y
orden de autenticación Codex heredado a la ruta canónica de OpenAI.
Vista previa limitada de GPT-5.6
OpenClaw reconoce los tres ids públicos de modelos GPT-5.6:
openai/gpt-5.6-solopenai/gpt-5.6-terraopenai/gpt-5.6-luna
Los tres exponen razonamiento max en el catálogo actual del servidor de aplicaciones de Codex. El
anuncio de lanzamiento de OpenAI describe Sol como el nivel insignia, Terra como el
nivel equilibrado y Luna como el nivel rápido y de menor costo. Consulta el
anuncio de lanzamiento de GPT-5.6
y la guía de acceso a la vista previa.
El acceso está en lista de permitidos durante la vista previa y puede concederse por separado para la
API y Codex. Un plan ChatGPT de pago por sí solo no concede acceso. OpenClaw mantiene
openai/gpt-5.5 como valor predeterminado; seleccionar una referencia GPT-5.6 sin acceso devuelve
el error de acceso de upstream en lugar de volver silenciosamente a otra opción.
Cobertura de funciones de OpenClaw
| Capacidad de OpenAI | Superficie de OpenClaw | Estado |
|---|---|---|
| Chat / Responses | proveedor de modelos openai/<model> |
Sí |
| Modelos de suscripción de Codex | openai/<model> con OAuth de OpenAI |
Sí |
| Referencias de modelos Codex heredadas | referencias de modelos Codex heredadas o codex-cli/<model> |
Reparado por doctor a openai/<model> |
| Arnés del servidor de aplicaciones de Codex | openai/<model> con runtime omitido o provider/model agentRuntime.id: codex |
Sí |
| Búsqueda web del lado del servidor | Herramienta nativa Responses de OpenAI | Sí, cuando la búsqueda web está habilitada y no hay proveedor fijado |
| Imágenes | image_generate |
Sí |
| Videos | video_generate |
Sí |
| Texto a voz | messages.tts.provider: "openai" / tts |
Sí |
| Voz a texto por lotes | tools.media.audio / comprensión de medios |
Sí |
| Voz a texto en streaming | Voice Call streaming.provider: "openai" |
Sí |
| Voz en tiempo real | Voice Call realtime.provider: "openai" / Control UI Talk talk.realtime.provider: "openai" |
Sí (requiere créditos de OpenAI Platform, no suscripción Codex/ChatGPT) |
| Embeddings | proveedor de embeddings de memoria | Sí |
Embeddings de memoria
OpenClaw puede usar OpenAI, o un endpoint de embeddings compatible con OpenAI, para la
indexación de memory_search y los embeddings de consulta:
{ agents: { defaults: { memorySearch: { provider: "openai", model: "text-embedding-3-small", }, }, },}Para endpoints compatibles con OpenAI que requieren etiquetas de embeddings asimétricas, establece
queryInputType y documentInputType en memorySearch. OpenClaw reenvía
esos valores como campos de solicitud input_type específicos del proveedor: los embeddings de consulta usan
queryInputType; los fragmentos de memoria indexados y la indexación por lotes usan
documentInputType. Consulta la referencia de configuración de memoria para ver el ejemplo completo.
Primeros pasos
Elige tu método de autenticación preferido y sigue los pasos de configuración.
Clave de API (OpenAI Platform)
Ideal para: acceso directo a la API y facturación basada en uso.
Obtén tu clave de API
Crea o copia una clave de API desde el panel de OpenAI Platform.
Ejecuta la incorporación
openclaw onboard --auth-choice openai-api-keyO pasa la clave directamente:
openclaw onboard --openai-api-key "$OPENAI_API_KEY"Verificar que el modelo esté disponible
openclaw models list --provider openaiResumen de rutas
| Ref. de modelo | Configuración de runtime | Ruta | Autenticación |
|---|---|---|---|
openai/gpt-5.5 |
omitida / proveedor/modelo agentRuntime.id: "codex" |
arnés de app-server de Codex | perfil de OpenAI compatible con Codex |
openai/gpt-5.4-mini |
omitida / proveedor/modelo agentRuntime.id: "codex" |
arnés de app-server de Codex | perfil de OpenAI compatible con Codex |
openai/gpt-5.5 |
proveedor/modelo agentRuntime.id: "openclaw" |
runtime integrado de OpenClaw | perfil openai seleccionado |
Ejemplo de configuración
{ env: { OPENAI_API_KEY: "example-openai-key-not-real" }, agents: { defaults: { model: { primary: "openai/gpt-5.5" } } },}Para probar el modelo Instant actual de ChatGPT desde la API de OpenAI, establece el modelo
en openai/chat-latest:
{ env: { OPENAI_API_KEY: "example-openai-key-not-real" }, agents: { defaults: { model: { primary: "openai/chat-latest" } } },}chat-latest es un alias variable. OpenAI lo documenta como el modelo Instant más reciente
usado en ChatGPT y recomienda gpt-5.5 para el uso de API en producción, así que
mantén openai/gpt-5.5 como valor predeterminado estable salvo que quieras explícitamente ese
comportamiento de alias. Actualmente, el alias acepta solo verbosidad de texto medium, por lo que
OpenClaw normaliza las sobrescrituras incompatibles de verbosidad de texto de OpenAI para este
modelo.
Suscripción de Codex
Ideal para: usar tu suscripción de ChatGPT/Codex con ejecución nativa de app-server de Codex en lugar de una clave de API separada. La nube de Codex requiere iniciar sesión en ChatGPT.
Ejecutar OAuth de Codex
openclaw onboard --auth-choice openaiO ejecuta OAuth directamente:
openclaw models auth login --provider openaiPara configuraciones sin interfaz gráfica o problemáticas con callbacks, agrega --device-code para iniciar sesión con un flujo de código de dispositivo de ChatGPT en lugar del callback del navegador localhost:
openclaw models auth login --provider openai --device-codeUsar la ruta canónica del modelo de OpenAI
openclaw config set agents.defaults.model.primary openai/gpt-5.5No se requiere configuración de runtime para la ruta predeterminada. Los turnos de agente de OpenAI seleccionan automáticamente el runtime nativo de app-server de Codex, y OpenClaw instala o repara el Plugin de Codex incluido cuando se elige esta ruta.
Verificar que la autenticación de Codex esté disponible
openclaw models list --provider openaiDespués de que el gateway esté en ejecución, envía /codex status o /codex models
en el chat para verificar el runtime nativo de app-server.
Resumen de rutas
| Ref. de modelo | Configuración de runtime | Ruta | Autenticación |
|---|---|---|---|
openai/gpt-5.5 |
omitida / proveedor/modelo agentRuntime.id: "codex" |
arnés nativo de app-server de Codex | inicio de sesión de Codex o perfil de autenticación openai ordenado |
openai/gpt-5.5 |
proveedor/modelo agentRuntime.id: "openclaw" |
runtime integrado de OpenClaw con transporte interno de autenticación de Codex | perfil OAuth openai seleccionado |
| ref. heredada GPT-5.5 de Codex | reparada por doctor | ruta heredada reescrita a openai/gpt-5.5 |
perfil OAuth de OpenAI migrado |
codex-cli/gpt-5.5 |
reparada por doctor | ruta CLI heredada reescrita a openai/gpt-5.5 |
autenticación de app-server de Codex |
Ejemplo de configuración
{ plugins: { entries: { codex: { enabled: true } } }, agents: { defaults: { model: { primary: "openai/gpt-5.5" }, }, },}Con una copia de seguridad de clave de API, mantén el modelo en openai/gpt-5.5 y pon el
orden de autenticación bajo openai. OpenClaw intentará primero la suscripción y luego
la clave de API, mientras permanece en el arnés de Codex:
{ plugins: { entries: { codex: { enabled: true } } }, agents: { defaults: { model: { primary: "openai/gpt-5.5" }, }, }, auth: { order: { openai: [ "openai:user@example.com", "openai:api-key-backup", ], }, },}Comprobar y recuperar el enrutamiento OAuth de Codex
Usa estos comandos para ver qué modelo, runtime y ruta de autenticación usa tu agente predeterminado:
openclaw models statusopenclaw models auth list --provider openaiopenclaw config get agents.defaults.model --jsonopenclaw config get models.providers.openai.agentRuntime --jsonPara un agente específico, agrega --agent <id>:
openclaw models status --agent <id>openclaw models auth list --agent <id> --provider openaiSi una configuración antigua aún tiene refs GPT heredadas de Codex o un pin obsoleto de sesión de runtime de OpenAI sin configuración explícita de runtime, repárala:
openclaw doctor --fixopenclaw config validateSi models auth list --provider openai no muestra ningún perfil utilizable, inicia
sesión de nuevo:
openclaw models auth login --provider openaiopenclaw models status --probe --probe-provider openaiUsa --profile-id cuando quieras múltiples inicios de sesión OAuth de Codex en el mismo
agente y luego quieras controlarlos mediante ordenamiento de autenticación o /model ...@<profileId>:
openclaw models auth login --provider openai --profile-id openai:ritsukoopenclaw models auth login --provider openai --profile-id openai:lainopenai/* es la ruta de modelo para turnos de agente de OpenAI mediante Codex. Ejecuta
openclaw doctor --fix para migrar ids de perfil antiguos con prefijo heredado OpenAI Codex y
entradas de orden antes de depender del ordenamiento de perfiles.
Indicador de estado
El /status del chat muestra qué runtime de modelo está activo para la sesión actual.
El arnés de app-server de Codex incluido aparece como Runtime: OpenAI Codex para
turnos de modelo de agente de OpenAI. Los pins obsoletos de sesión de runtime de OpenAI se reparan a Codex salvo que
la configuración fije explícitamente OpenClaw.
Advertencia de doctor
Si las refs de modelo heredadas de Codex o los pins obsoletos de runtime de OpenAI permanecen en la configuración o
el estado de sesión, openclaw doctor --fix los reescribe a openai/* con el
runtime de Codex salvo que OpenClaw esté configurado explícitamente.
Límite de ventana de contexto
OpenClaw trata los metadatos de modelo y el límite de contexto del runtime como valores separados.
Para openai/gpt-5.5 mediante el catálogo OAuth de Codex:
contextWindownativo:1000000- Límite predeterminado de
contextTokensdel runtime:272000
En la práctica, el límite predeterminado más pequeño tiene mejores características de latencia y calidad. Sobrescríbelo con contextTokens:
{ models: { providers: { openai: { models: [{ id: "gpt-5.5", contextTokens: 160000 }], }, }, },}Recuperación del catálogo
OpenClaw usa metadatos del catálogo upstream de Codex para gpt-5.5 cuando están
presentes. Si el descubrimiento en vivo de Codex omite la fila gpt-5.5 mientras
la cuenta está autenticada, OpenClaw sintetiza esa fila de modelo OAuth para que
las ejecuciones de cron, subagente y modelo predeterminado configurado no fallen con
Unknown model.
Autenticación nativa de app-server de Codex
El arnés nativo de app-server de Codex usa refs de modelo openai/* más configuración
de runtime omitida o proveedor/modelo agentRuntime.id: "codex", pero su autenticación
sigue estando basada en cuenta. OpenClaw selecciona la autenticación en este orden:
- Perfiles de autenticación de OpenAI ordenados para el agente, preferentemente bajo
auth.order.openai. Ejecutaopenclaw doctor --fixpara migrar ids de perfil de autenticación heredados de Codex antiguos y el orden de autenticación heredado de Codex. - La cuenta existente del app-server, como un inicio de sesión local de ChatGPT en la CLI de Codex.
- Solo para lanzamientos locales de app-server con stdio,
CODEX_API_KEY, luegoOPENAI_API_KEY, cuando el app-server informa que no hay cuenta y aún requiere autenticación de OpenAI.
Eso significa que un inicio de sesión local de suscripción de ChatGPT/Codex no se reemplaza solo
porque el proceso del gateway también tenga OPENAI_API_KEY para modelos directos de OpenAI
o embeddings. El respaldo de clave de API de entorno es solo la ruta local de stdio sin cuenta; no
se envía a conexiones WebSocket de app-server. Cuando se selecciona un perfil de Codex
de estilo suscripción, OpenClaw también mantiene CODEX_API_KEY y OPENAI_API_KEY
fuera del proceso hijo de app-server stdio generado y envía las credenciales seleccionadas
mediante el RPC de inicio de sesión del app-server. Cuando ese perfil de suscripción queda bloqueado por un
límite de uso de Codex, OpenClaw puede rotar al siguiente perfil de clave de API openai:*
ordenado sin cambiar el modelo seleccionado ni salir del arnés de Codex.
Una vez que pasa la hora de reinicio de la suscripción, el perfil de suscripción vuelve a ser
elegible.
Generación de imágenes
El Plugin openai incluido registra la generación de imágenes mediante la herramienta image_generate.
Admite tanto generación de imágenes con clave de API de OpenAI como generación de imágenes con OAuth de Codex
mediante la misma ref. de modelo openai/gpt-image-2.
| Capacidad | Clave de API de OpenAI | OAuth de Codex |
|---|---|---|
| Ref. de modelo | openai/gpt-image-2 |
openai/gpt-image-2 |
| Autenticación | OPENAI_API_KEY |
Inicio de sesión con OAuth de OpenAI Codex |
| Transporte | API de OpenAI Images | Backend de Codex Responses |
| Imágenes máx. por solicitud | 4 | 4 |
| Modo de edición | Habilitado (hasta 5 imágenes de referencia) | Habilitado (hasta 5 imágenes de referencia) |
| Sobrescrituras de tamaño | Compatibles, incluidos tamaños 2K/4K | Compatibles, incluidos tamaños 2K/4K |
| Relación de aspecto / resolución | No se reenvía a la API de OpenAI Images | Se asigna a un tamaño compatible cuando es seguro |
{ agents: { defaults: { imageGenerationModel: { primary: "openai/gpt-image-2" }, }, },}gpt-image-2 es el valor predeterminado tanto para la generación de texto a imagen de OpenAI como para la
edición de imágenes. gpt-image-1.5, gpt-image-1 y gpt-image-1-mini siguen siendo utilizables como
sobrescrituras explícitas de modelo. Usa openai/gpt-image-1.5 para salida
PNG/WebP con fondo transparente; la API actual de gpt-image-2 rechaza
background: "transparent".
Para una solicitud con fondo transparente, los agentes deben llamar a image_generate con
model: "openai/gpt-image-1.5", outputFormat: "png" o "webp", y
background: "transparent"; la opción anterior de proveedor openai.background
sigue siendo aceptada. OpenClaw también protege las rutas públicas de OpenAI y
OAuth de OpenAI Codex reescribiendo las solicitudes transparentes predeterminadas de openai/gpt-image-2
a gpt-image-1.5; Azure y los endpoints personalizados compatibles con OpenAI conservan
sus nombres configurados de despliegue/modelo.
La misma configuración se expone para ejecuciones de CLI sin interfaz:
openclaw infer image generate \ --model openai/gpt-image-1.5 \ --output-format png \ --background transparent \ --prompt "A simple red circle sticker on a transparent background" \ --jsonUsa las mismas marcas --output-format y --background con
openclaw infer image edit cuando comiences desde un archivo de entrada.
--openai-background sigue estando disponible como alias específico de OpenAI.
Usa --quality low|medium|high|auto cuando necesites controlar la calidad
y el costo de OpenAI Images. Usa --openai-moderation low|auto para pasar la
sugerencia de moderación específica del proveedor de OpenAI desde image generate o image edit.
Para instalaciones de ChatGPT/Codex OAuth, conserva la misma ref. openai/gpt-image-2. Cuando se
configura un perfil OAuth de openai, OpenClaw resuelve ese token de acceso OAuth
almacenado y envía las solicitudes de imagen a través del backend de Codex Responses. No
intenta primero OPENAI_API_KEY ni hace fallback silencioso a una clave de API para esa
solicitud. Configura models.providers.openai explícitamente con una clave de API,
URL base personalizada o endpoint de Azure cuando quieras usar la ruta directa de la API
de OpenAI Images en su lugar.
Si ese endpoint de imagen personalizado está en una LAN o dirección privada de confianza, también establece
browser.ssrfPolicy.dangerouslyAllowPrivateNetwork: true; OpenClaw mantiene
bloqueados los endpoints de imagen privados/internos compatibles con OpenAI salvo que esta opción explícita esté
presente.
Generar:
/tool image_generate model=openai/gpt-image-2 prompt="A polished launch poster for OpenClaw on macOS" size=3840x2160 count=1Generar un PNG transparente:
/tool image_generate model=openai/gpt-image-1.5 prompt="A simple red circle sticker on a transparent background" outputFormat=png background=transparentEditar:
/tool image_generate model=openai/gpt-image-2 prompt="Preserve the object shape, change the material to translucent glass" image=/path/to/reference.png size=1024x1536Generación de video
El Plugin openai incluido registra la generación de video mediante la herramienta video_generate.
| Capacidad | Valor |
|---|---|
| Modelo predeterminado | openai/sora-2 |
| Modos | Texto a video, imagen a video, edición de un solo video |
| Entradas de referencia | 1 imagen o 1 video |
| Sobrescrituras de tamaño | Compatibles para texto a video e imagen a video |
| Otras sobrescrituras | aspectRatio, resolution, audio, watermark se ignoran con una advertencia de herramienta |
Las solicitudes de imagen a video de OpenAI usan POST /v1/videos con una
input_reference de imagen. Las ediciones de un solo video usan POST /v1/videos/edits con el
video cargado en el campo video.
{ agents: { defaults: { videoGenerationModel: { primary: "openai/sora-2" }, }, },}Contribución de prompt de GPT-5
OpenClaw agrega una contribución compartida de prompt de GPT-5 para ejecuciones de la familia GPT-5 en superficies de prompt ensambladas por OpenClaw. Se aplica por id de modelo, por lo que rutas de OpenClaw/proveedor como refs heredadas previas a reparación (ref heredada de Codex GPT-5.5), openrouter/openai/gpt-5.5, opencode/gpt-5.5 y otras refs compatibles con GPT-5 reciben la misma superposición. Los modelos GPT-4.x anteriores no.
El arnés nativo de Codex incluido no recibe esta superposición de GPT-5 de OpenClaw mediante instrucciones de desarrollador del app-server de Codex. Codex nativo conserva el comportamiento base, de modelo y de documentos de proyecto propiedad de Codex, mientras que OpenClaw deshabilita la personalidad integrada de Codex para hilos nativos, de modo que los archivos de personalidad del área de trabajo del agente sigan siendo autoritativos. OpenClaw contribuye solo contexto de runtime, como entrega de canal, herramientas dinámicas de OpenClaw, delegación ACP, contexto de área de trabajo y Skills de OpenClaw.
La contribución de GPT-5 agrega un contrato de comportamiento etiquetado para persistencia de persona, seguridad de ejecución, disciplina de herramientas, forma de salida, comprobaciones de finalización y verificación en prompts coincidentes ensamblados por OpenClaw. El comportamiento de respuesta específico del canal y de mensajes silenciosos permanece en el prompt de sistema compartido de OpenClaw y la política de entrega saliente. La capa de estilo de interacción amigable es independiente y configurable.
| Valor | Efecto |
|---|---|
"friendly" (predeterminado) |
Habilita la capa de estilo de interacción amigable |
"on" |
Alias de "friendly" |
"off" |
Deshabilita solo la capa de estilo amigable |
Config
{ agents: { defaults: { promptOverlays: { gpt5: { personality: "friendly" }, }, }, },}CLI
openclaw config set agents.defaults.promptOverlays.gpt5.personality offVoz y habla
Speech synthesis (TTS)
El Plugin openai incluido registra síntesis de voz para la superficie messages.tts.
| Configuración | Ruta de configuración | Predeterminado |
|---|---|---|
| Modelo | messages.tts.providers.openai.model |
gpt-4o-mini-tts |
| Voz | messages.tts.providers.openai.speakerVoice |
coral |
| Velocidad | messages.tts.providers.openai.speed |
(sin establecer) |
| Instrucciones | messages.tts.providers.openai.instructions |
(sin establecer, solo gpt-4o-mini-tts) |
| Formato | messages.tts.providers.openai.responseFormat |
opus para notas de voz, mp3 para archivos |
| Clave de API | messages.tts.providers.openai.apiKey |
Hace fallback a OPENAI_API_KEY |
| URL base | messages.tts.providers.openai.baseUrl |
https://api.openai.com/v1 |
| Cuerpo extra | messages.tts.providers.openai.extraBody / extra_body |
(sin establecer) |
Modelos disponibles: gpt-4o-mini-tts, tts-1, tts-1-hd. Voces disponibles: alloy, ash, ballad, cedar, coral, echo, fable, juniper, marin, onyx, nova, sage, shimmer, verse.
extraBody se combina en el JSON de solicitud de /audio/speech después de los campos generados por OpenClaw, así que úsalo para endpoints compatibles con OpenAI que requieren claves adicionales como lang. Las claves de prototipo se ignoran.
{ messages: { tts: { providers: { openai: { model: "gpt-4o-mini-tts", speakerVoice: "coral" }, }, }, },}Speech-to-text
El Plugin openai incluido registra conversión de voz a texto por lotes mediante
la superficie de transcripción de comprensión de medios de OpenClaw.
- Modelo predeterminado:
gpt-4o-transcribe - Endpoint: REST de OpenAI
/v1/audio/transcriptions - Ruta de entrada: carga de archivo de audio multipart
- Compatible con OpenClaw dondequiera que la transcripción de audio entrante use
tools.media.audio, incluidos segmentos de canales de voz de Discord y archivos adjuntos de audio de canales
Para forzar OpenAI para la transcripción de audio entrante:
{ tools: { media: { audio: { models: [ { type: "provider", provider: "openai", model: "gpt-4o-transcribe", }, ], }, }, },}Las sugerencias de idioma y prompt se reenvían a OpenAI cuando las proporciona la configuración compartida de medios de audio o la solicitud de transcripción por llamada.
Realtime transcription
El Plugin openai incluido registra transcripción Realtime para el Plugin Voice Call.
| Configuración | Ruta de configuración | Predeterminado |
|---|---|---|
| Modelo | plugins.entries.voice-call.config.streaming.providers.openai.model |
gpt-4o-transcribe |
| Idioma | ...openai.language |
(sin establecer) |
| Prompt | ...openai.prompt |
(sin establecer) |
| Duración del silencio | ...openai.silenceDurationMs |
800 |
| Umbral de VAD | ...openai.vadThreshold |
0.5 |
| Autenticación | ...openai.apiKey, OPENAI_API_KEY, u OAuth de openai |
Las claves de API se conectan directamente; OAuth emite un secreto de cliente de transcripción Realtime |
Realtime voice
El Plugin openai incluido registra voz Realtime para el Plugin Voice Call.
| Configuración | Ruta de configuración | Predeterminado |
|---|---|---|
| Modelo | plugins.entries.voice-call.config.realtime.providers.openai.model |
gpt-realtime-2 |
| Voz | ...openai.voice |
alloy |
| Temperatura (puente de despliegue de Azure) | ...openai.temperature |
0.8 |
| Umbral de VAD | ...openai.vadThreshold |
0.5 |
| Duración del silencio | ...openai.silenceDurationMs |
500 |
| Relleno de prefijo | ...openai.prefixPaddingMs |
300 |
| Esfuerzo de razonamiento | ...openai.reasoningEffort |
(sin definir) |
| Autenticación | perfil de autenticación con clave de API openai, ...openai.apiKey u OPENAI_API_KEY |
Se requiere una clave de API de OpenAI Platform; OpenAI OAuth no configura la voz Realtime |
Voces Realtime integradas disponibles para gpt-realtime-2: alloy, ash,
ballad, coral, echo, sage, shimmer, verse, marin, cedar.
OpenAI recomienda marin y cedar para obtener la mejor calidad Realtime. Este
es un conjunto separado de las voces de texto a voz anteriores; no asumas que una voz TTS
como fable, nova u onyx es válida para sesiones Realtime.
Endpoints de Azure OpenAI
El proveedor openai incluido puede apuntar a un recurso de Azure OpenAI para la generación de imágenes
mediante la sobrescritura de la URL base. En la ruta de generación de imágenes, OpenClaw
detecta nombres de host de Azure en models.providers.openai.baseUrl y cambia automáticamente a
la forma de solicitud de Azure.
Usa Azure OpenAI cuando:
- Ya tienes una suscripción, cuota o acuerdo empresarial de Azure OpenAI
- Necesitas residencia de datos regional o controles de cumplimiento que proporciona Azure
- Quieres mantener el tráfico dentro de una tenencia de Azure existente
Configuración
Para la generación de imágenes de Azure mediante el proveedor openai incluido, apunta
models.providers.openai.baseUrl a tu recurso de Azure y establece apiKey en
la clave de Azure OpenAI (no una clave de OpenAI Platform):
{ models: { providers: { openai: { baseUrl: "https://<your-resource>.openai.azure.com", apiKey: "<azure-openai-api-key>", }, }, },}OpenClaw reconoce estos sufijos de host de Azure para la ruta de generación de imágenes de Azure:
*.openai.azure.com*.services.ai.azure.com*.cognitiveservices.azure.com
Para solicitudes de generación de imágenes en un host de Azure reconocido, OpenClaw:
- Envía el encabezado
api-keyen lugar deAuthorization: Bearer - Usa rutas con alcance de despliegue (
/openai/deployments/{deployment}/...) - Añade
?api-version=...a cada solicitud - Usa un tiempo de espera de solicitud predeterminado de 600 s para llamadas de generación de imágenes de Azure.
Los valores
timeoutMspor llamada siguen sobrescribiendo este predeterminado.
Otras URL base (OpenAI público, proxies compatibles con OpenAI) conservan la forma estándar de solicitud de imágenes de OpenAI.
Versión de API
Establece AZURE_OPENAI_API_VERSION para fijar una versión preview o GA específica de Azure
para la ruta de generación de imágenes de Azure:
export AZURE_OPENAI_API_VERSION="2024-12-01-preview"El valor predeterminado es 2024-12-01-preview cuando la variable no está definida.
Los nombres de modelo son nombres de despliegue
Azure OpenAI vincula modelos a despliegues. Para solicitudes de generación de imágenes de Azure
enrutadas mediante el proveedor openai incluido, el campo model en OpenClaw
debe ser el nombre de despliegue de Azure que configuraste en el portal de Azure, no
el id. público del modelo de OpenAI.
Si creas un despliegue llamado gpt-image-2-prod que sirve gpt-image-2:
/tool image_generate model=openai/gpt-image-2-prod prompt="A clean poster" size=1024x1024 count=1La misma regla de nombre de despliegue se aplica a las llamadas de generación de imágenes enrutadas mediante
el proveedor openai incluido.
Disponibilidad regional
La generación de imágenes de Azure está disponible actualmente solo en un subconjunto de regiones
(por ejemplo, eastus2, swedencentral, polandcentral, westus3,
uaenorth). Consulta la lista actual de regiones de Microsoft antes de crear un
despliegue y confirma que el modelo específico se ofrece en tu región.
Diferencias de parámetros
Azure OpenAI y OpenAI público no siempre aceptan los mismos parámetros de imagen.
Azure puede rechazar opciones que OpenAI público permite (por ejemplo, ciertos
valores de background en gpt-image-2) o exponerlas solo en versiones específicas
del modelo. Estas diferencias provienen de Azure y del modelo subyacente, no de
OpenClaw. Si una solicitud de Azure falla con un error de validación, revisa el
conjunto de parámetros admitido por tu despliegue y versión de API específicos en el
portal de Azure.
Configuración avanzada
Transporte (WebSocket frente a SSE)
OpenClaw usa primero WebSocket con alternativa SSE ("auto") para openai/*.
En modo "auto", OpenClaw:
- Reintenta un fallo temprano de WebSocket antes de pasar a SSE
- Después de un fallo, marca WebSocket como degradado durante unos 60 segundos y usa SSE durante el enfriamiento
- Adjunta encabezados estables de identidad de sesión y turno para reintentos y reconexiones
- Normaliza los contadores de uso (
input_tokens/prompt_tokens) entre variantes de transporte
| Valor | Comportamiento |
|---|---|
"auto" (predeterminado) |
WebSocket primero, alternativa SSE |
"sse" |
Forzar solo SSE |
"websocket" |
Forzar solo WebSocket |
{ agents: { defaults: { models: { "openai/gpt-5.5": { params: { transport: "auto" }, }, }, }, },}Documentación relacionada de OpenAI:
Modo rápido
OpenClaw expone un interruptor compartido de modo rápido para openai/*:
- Chat/IU:
/fast status|auto|on|off - Configuración:
agents.defaults.models["<provider>/<model>"].params.fastMode
Cuando está habilitado, OpenClaw asigna el modo rápido al procesamiento prioritario de OpenAI (service_tier = "priority"). Los valores existentes de service_tier se conservan, y el modo rápido no reescribe reasoning ni text.verbosity. fastMode: "auto" inicia las nuevas llamadas de modelo en modo rápido hasta el corte automático y luego inicia llamadas posteriores de reintento, alternativa, resultado de herramienta o continuación sin modo rápido. El corte predeterminado es de 60 segundos; establece params.fastAutoOnSeconds en el modelo activo para cambiarlo.
{ agents: { defaults: { models: { "openai/gpt-5.5": { params: { fastMode: "auto", fastAutoOnSeconds: 30 } }, }, }, },}Procesamiento prioritario (service_tier)
La API de OpenAI expone el procesamiento prioritario mediante service_tier. Configúralo por modelo en OpenClaw:
{ agents: { defaults: { models: { "openai/gpt-5.5": { params: { serviceTier: "priority" } }, }, }, },}Valores admitidos: auto, default, flex, priority.
Compactación del lado del servidor (Responses API)
Para modelos directos de OpenAI Responses (openai/* en api.openai.com), el envoltorio de stream de OpenClaw del Plugin de OpenAI habilita automáticamente la compactación del lado del servidor:
- Fuerza
store: true(a menos que la compatibilidad del modelo establezcasupportsStore: false) - Inyecta
context_management: [{ type: "compaction", compact_threshold: ... }] compact_thresholdpredeterminado: 70 % decontextWindow(o80000cuando no esté disponible)
Esto se aplica a la ruta de runtime integrada de OpenClaw y a los hooks del proveedor OpenAI usados por ejecuciones embebidas. El arnés nativo del servidor de aplicaciones Codex gestiona su propio contexto mediante Codex y se configura mediante la ruta de agente predeterminada de OpenAI o la política de runtime de proveedor/modelo.
Habilitar explícitamente
Útil para endpoints compatibles como Azure OpenAI Responses:
{ agents: { defaults: { models: { "azure-openai-responses/gpt-5.5": { params: { responsesServerCompaction: true }, }, }, }, },}Umbral personalizado
{ agents: { defaults: { models: { "openai/gpt-5.5": { params: { responsesServerCompaction: true, responsesCompactThreshold: 120000, }, }, }, }, },}Deshabilitar
{ agents: { defaults: { models: { "openai/gpt-5.5": { params: { responsesServerCompaction: false }, }, }, }, },}Modo GPT strict-agentic
Para ejecuciones de la familia GPT-5 en openai/*, OpenClaw puede usar un contrato de ejecución incrustado más estricto:
{ agents: { defaults: { embeddedAgent: { executionContract: "strict-agentic" }, }, },}Con strict-agentic, OpenClaw:
- Habilita automáticamente
update_planpara trabajo sustancial - Reintenta turnos estructuralmente vacíos o solo de razonamiento con una continuación de respuesta visible
- Usa eventos de plan explícitos del arnés cuando el arnés seleccionado los proporciona
OpenClaw no clasifica la prosa del asistente para decidir si un turno es un plan, una actualización de progreso o una respuesta final.
Rutas nativas frente a compatibles con OpenAI
OpenClaw trata los endpoints directos de OpenAI, Codex y Azure OpenAI de forma diferente a los proxies /v1 genéricos compatibles con OpenAI:
Rutas nativas (openai/*, Azure OpenAI):
- Conservan
reasoning: { effort: "none" }solo para modelos que admiten el esfuerzononede OpenAI - Omiten el razonamiento deshabilitado para modelos o proxies que rechazan
reasoning.effort: "none" - Establecen de forma predeterminada los esquemas de herramientas en modo estricto
- Adjuntan encabezados de atribución ocultos solo en hosts nativos verificados
- Conservan el modelado de solicitudes exclusivo de OpenAI (
service_tier,store, compatibilidad de razonamiento, indicios de caché de prompts)
Rutas proxy/compatibles:
- Usan un comportamiento de compatibilidad más flexible
- Eliminan
storede Completions de cargas útilesopenai-completionsno nativas - Aceptan JSON de transferencia directa avanzado
params.extra_body/params.extraBodypara proxies de Completions compatibles con OpenAI - Aceptan
params.chat_template_kwargspara proxies de Completions compatibles con OpenAI, como vLLM - No fuerzan esquemas de herramientas estrictos ni encabezados exclusivos de rutas nativas
Azure OpenAI usa transporte nativo y comportamiento de compatibilidad, pero no recibe los encabezados de atribución ocultos.
Relacionado
Elegir proveedores, referencias de modelos y comportamiento de conmutación por error.
Parámetros compartidos de herramientas de imagen y selección de proveedor.
Parámetros compartidos de herramientas de video y selección de proveedor.
Detalles de autenticación y reglas de reutilización de credenciales.