Providers
OpenAI
OpenAI fornece APIs de desenvolvedor para modelos GPT, e o Codex também está disponível como um agente de programação em planos ChatGPT por meio dos clientes Codex da OpenAI. O OpenClaw usa um único id de provedor, openai, para ambos os formatos de autenticação.
O OpenClaw usa openai/* como a rota canônica de modelos OpenAI. Turnos de agente embutidos em modelos OpenAI são executados por padrão pelo runtime nativo do servidor de aplicativo Codex; a autenticação direta por chave de API da OpenAI continua disponível para superfícies OpenAI que não são de agente, como imagens, embeddings, fala e realtime.
- Modelos de agente - modelos
openai/*por meio do runtime Codex; entre com autenticação Codex para uso de assinatura ChatGPT/Codex, ou configure um backup de chave de API da OpenAI compatível com Codex quando você quiser intencionalmente autenticação por chave de API. - APIs OpenAI que não são de agente - acesso direto à OpenAI Platform com cobrança baseada em uso por meio de
OPENAI_API_KEYou onboarding por chave de API da OpenAI. - Configuração legada - refs de modelo Codex legadas são reparadas por
openclaw doctor --fixparaopenai/*mais o runtime Codex.
A OpenAI oferece suporte explícito ao uso de OAuth de assinatura em ferramentas e fluxos de trabalho externos como o OpenClaw.
Provedor, modelo, runtime e canal são camadas separadas. Se esses rótulos estiverem se misturando, leia Runtimes de agente antes de alterar a configuração.
Escolha rápida
| Objetivo | Use | Observações |
|---|---|---|
| Assinatura ChatGPT/Codex com runtime Codex nativo | openai/gpt-5.5 |
Configuração padrão de agente OpenAI. Entre com autenticação Codex. |
| Preview limitado do GPT-5.6 | openai/gpt-5.6-sol, -terra ou -luna |
Requer uma organização de API aprovada pela OpenAI ou um workspace Codex. |
| Cobrança direta por chave de API para modelos de agente | openai/gpt-5.5 mais um perfil de chave de API compatível com Codex |
Use auth.order.openai para colocar o backup depois da autenticação por assinatura. |
| Cobrança direta por chave de API por meio do OpenClaw explícito | openai/gpt-5.5 mais runtime de provedor/modelo openclaw |
Selecione um perfil normal de chave de API openai. |
| Alias mais recente da API ChatGPT Instant | openai/chat-latest |
Somente chave de API direta. Alias móvel para experimentos, não o padrão. |
| Autenticação de assinatura ChatGPT/Codex por meio do OpenClaw | openai/gpt-5.5 mais runtime de provedor/modelo openclaw |
Selecione um perfil OAuth openai para a rota de compatibilidade. |
| Geração ou edição de imagens | openai/gpt-image-2 |
Funciona com OPENAI_API_KEY ou OAuth OpenAI Codex. |
| Imagens com fundo transparente | openai/gpt-image-1.5 |
Use outputFormat=png ou webp e openai.background=transparent. |
Mapa de nomes
Os nomes são parecidos, mas não são intercambiáveis:
| Nome que você vê | Camada | Significado |
|---|---|---|
openai |
Prefixo de provedor | Rota canônica de modelos OpenAI; turnos de agente usam o runtime Codex. |
| prefixo legado OpenAI Codex | Prefixo legado | Namespace mais antigo de modelo/perfil. openclaw doctor --fix o migra para openai. |
Plugin codex |
Plugin | Plugin incluído no OpenClaw que fornece o runtime nativo do servidor de aplicativo Codex e controles de chat /codex. |
provedor/modelo agentRuntime.id: codex |
Runtime de agente | Força o harness nativo do servidor de aplicativo Codex para turnos embutidos correspondentes. |
/codex ... |
Conjunto de comandos de chat | Vincula/controla threads do servidor de aplicativo Codex a partir de uma conversa. |
runtime: "acp", agentId: "codex" |
Rota de sessão ACP | Caminho de fallback explícito que executa o Codex por meio de ACP/acpx. |
Isso significa que uma configuração pode conter intencionalmente refs de modelo openai/* enquanto os perfis de autenticação apontam para credenciais de chave de API ou OAuth ChatGPT/Codex. Use auth.order.openai para configuração; openclaw doctor --fix reescreve refs de modelo Codex legadas, ids de perfil de autenticação Codex legados e ordem de autenticação Codex legada para a rota canônica da OpenAI.
Preview limitado do GPT-5.6
O OpenClaw reconhece os três ids públicos de modelo GPT-5.6:
openai/gpt-5.6-solopenai/gpt-5.6-terraopenai/gpt-5.6-luna
Todos os três expõem raciocínio max no catálogo atual do servidor de aplicativo Codex. O anúncio de lançamento da OpenAI descreve Sol como o nível flagship, Terra como o nível balanceado e Luna como o nível rápido e de menor custo. Consulte o anúncio de lançamento do GPT-5.6 e o guia de acesso ao preview.
O acesso é por allowlist durante o preview e pode ser concedido separadamente para a API e o Codex. Um plano pago do ChatGPT sozinho não concede acesso. O OpenClaw mantém openai/gpt-5.5 como padrão; selecionar uma ref GPT-5.6 sem acesso retorna o erro de acesso upstream em vez de fazer fallback silenciosamente.
Cobertura de recursos do OpenClaw
| Capacidade OpenAI | Superfície do OpenClaw | Status |
|---|---|---|
| Chat / Responses | provedor de modelo openai/<model> |
Sim |
| Modelos de assinatura Codex | openai/<model> com OAuth OpenAI |
Sim |
| Refs de modelo Codex legadas | refs de modelo Codex legadas ou codex-cli/<model> |
Reparadas pelo doctor para openai/<model> |
| Harness de servidor de aplicativo Codex | openai/<model> com runtime omitido ou provedor/modelo agentRuntime.id: codex |
Sim |
| Busca web no servidor | Ferramenta nativa OpenAI Responses | Sim, quando a busca web está habilitada e nenhum provedor está fixado |
| Imagens | image_generate |
Sim |
| Vídeos | video_generate |
Sim |
| Texto para fala | messages.tts.provider: "openai" / tts |
Sim |
| Fala para texto em lote | tools.media.audio / compreensão de mídia |
Sim |
| Fala para texto por streaming | Voice Call streaming.provider: "openai" |
Sim |
| Voz realtime | Voice Call realtime.provider: "openai" / Control UI Talk talk.realtime.provider: "openai" |
Sim (requer créditos da OpenAI Platform, não assinatura Codex/ChatGPT) |
| Embeddings | provedor de embeddings de memória | Sim |
Embeddings de memória
O OpenClaw pode usar a OpenAI, ou um endpoint de embeddings compatível com OpenAI, para indexação de memory_search e embeddings de consulta:
{ agents: { defaults: { memorySearch: { provider: "openai", model: "text-embedding-3-small", }, }, },}Para endpoints compatíveis com OpenAI que exigem rótulos de embedding assimétricos, defina queryInputType e documentInputType em memorySearch. O OpenClaw os encaminha como campos de solicitação input_type específicos do provedor: embeddings de consulta usam queryInputType; blocos de memória indexados e indexação em lote usam documentInputType. Consulte a referência de configuração de memória para o exemplo completo.
Introdução
Escolha seu método de autenticação preferido e siga as etapas de configuração.
API key (OpenAI Platform)
Melhor para: acesso direto à API e cobrança baseada em uso.
Get your API key
Crie ou copie uma chave de API do dashboard da OpenAI Platform.
Run onboarding
openclaw onboard --auth-choice openai-api-keyOu passe a chave diretamente:
openclaw onboard --openai-api-key "$OPENAI_API_KEY"Verifique se o modelo está disponível
openclaw models list --provider openaiResumo de rota
| Ref. do modelo | Configuração de runtime | Rota | Autenticação |
|---|---|---|---|
openai/gpt-5.5 |
omitido / provider/model agentRuntime.id: "codex" |
harness Codex app-server | perfil OpenAI compatível com Codex |
openai/gpt-5.4-mini |
omitido / provider/model agentRuntime.id: "codex" |
harness Codex app-server | perfil OpenAI compatível com Codex |
openai/gpt-5.5 |
provider/model agentRuntime.id: "openclaw" |
runtime incorporado do OpenClaw | perfil openai selecionado |
Exemplo de configuração
{ env: { OPENAI_API_KEY: "example-openai-key-not-real" }, agents: { defaults: { model: { primary: "openai/gpt-5.5" } } },}Para testar o modelo Instant atual do ChatGPT pela API da OpenAI, defina o modelo
como openai/chat-latest:
{ env: { OPENAI_API_KEY: "example-openai-key-not-real" }, agents: { defaults: { model: { primary: "openai/chat-latest" } } },}chat-latest é um alias móvel. A OpenAI o documenta como o modelo Instant mais recente
usado no ChatGPT e recomenda gpt-5.5 para uso da API em produção, portanto
mantenha openai/gpt-5.5 como o padrão estável, a menos que você queira explicitamente esse
comportamento de alias. Atualmente, o alias aceita apenas verbosidade de texto medium, então
o OpenClaw normaliza substituições incompatíveis de verbosidade de texto da OpenAI para este
modelo.
Assinatura Codex
Melhor para: usar sua assinatura ChatGPT/Codex com execução nativa do Codex app-server em vez de uma chave de API separada. A nuvem Codex requer login no ChatGPT.
Execute o OAuth do Codex
openclaw onboard --auth-choice openaiOu execute o OAuth diretamente:
openclaw models auth login --provider openaiPara configurações headless ou hostis a callback, adicione --device-code para entrar com um fluxo de código de dispositivo do ChatGPT em vez do callback de navegador localhost:
openclaw models auth login --provider openai --device-codeUse a rota canônica do modelo OpenAI
openclaw config set agents.defaults.model.primary openai/gpt-5.5Nenhuma configuração de runtime é necessária para o caminho padrão. Turnos de agente da OpenAI selecionam o runtime nativo Codex app-server automaticamente, e o OpenClaw instala ou repara o Plugin Codex empacotado quando esta rota é escolhida.
Verifique se a autenticação Codex está disponível
openclaw models list --provider openaiDepois que o Gateway estiver em execução, envie /codex status ou /codex models
no chat para verificar o runtime nativo app-server.
Resumo de rota
| Ref. do modelo | Configuração de runtime | Rota | Autenticação |
|---|---|---|---|
openai/gpt-5.5 |
omitido / provider/model agentRuntime.id: "codex" |
harness nativo Codex app-server | login Codex ou perfil de autenticação openai ordenado |
openai/gpt-5.5 |
provider/model agentRuntime.id: "openclaw" |
runtime incorporado do OpenClaw com transporte interno de autenticação Codex | perfil OAuth openai selecionado |
| ref. GPT-5.5 Codex legada | reparada pelo doctor | rota legada reescrita para openai/gpt-5.5 |
perfil OAuth OpenAI migrado |
codex-cli/gpt-5.5 |
reparada pelo doctor | rota CLI legada reescrita para openai/gpt-5.5 |
autenticação Codex app-server |
Exemplo de configuração
{ plugins: { entries: { codex: { enabled: true } } }, agents: { defaults: { model: { primary: "openai/gpt-5.5" }, }, },}Com um backup por chave de API, mantenha o modelo em openai/gpt-5.5 e coloque a
ordem de autenticação em openai. O OpenClaw tentará a assinatura primeiro, depois
a chave de API, permanecendo no harness Codex:
{ plugins: { entries: { codex: { enabled: true } } }, agents: { defaults: { model: { primary: "openai/gpt-5.5" }, }, }, auth: { order: { openai: [ "openai:user@example.com", "openai:api-key-backup", ], }, },}Verificar e recuperar roteamento OAuth Codex
Use estes comandos para ver qual modelo, runtime e rota de autenticação seu agente padrão está usando:
openclaw models statusopenclaw models auth list --provider openaiopenclaw config get agents.defaults.model --jsonopenclaw config get models.providers.openai.agentRuntime --jsonPara um agente específico, adicione --agent <id>:
openclaw models status --agent <id>openclaw models auth list --agent <id> --provider openaiSe uma configuração mais antiga ainda tiver referências legadas a GPT do Codex ou uma fixação obsoleta de sessão do runtime OpenAI sem configuração explícita de runtime, repare-a:
openclaw doctor --fixopenclaw config validateSe models auth list --provider openai não mostrar nenhum perfil utilizável, faça
login novamente:
openclaw models auth login --provider openaiopenclaw models status --probe --probe-provider openaiUse --profile-id quando quiser vários logins OAuth do Codex no mesmo
agente e depois quiser controlá-los pela ordenação de autenticação ou por /model ...@<profileId>:
openclaw models auth login --provider openai --profile-id openai:ritsukoopenclaw models auth login --provider openai --profile-id openai:lainopenai/* é a rota de modelo para turnos de agente OpenAI pelo Codex. Execute
openclaw doctor --fix para migrar ids de perfil com prefixo legado OpenAI Codex e
entradas de ordenação antes de depender da ordenação de perfis.
Indicador de status
O chat /status mostra qual runtime de modelo está ativo na sessão atual.
O harness app-server Codex incluído aparece como Runtime: OpenAI Codex para
turnos de modelo de agente OpenAI. Fixações obsoletas de sessão do runtime OpenAI são reparadas para Codex, a menos que
a configuração fixe explicitamente OpenClaw.
Aviso do Doctor
Se referências legadas a modelos Codex ou fixações obsoletas do runtime OpenAI permanecerem na configuração ou
no estado da sessão, openclaw doctor --fix as reescreve para openai/* com o
runtime Codex, a menos que OpenClaw esteja configurado explicitamente.
Limite da janela de contexto
OpenClaw trata os metadados do modelo e o limite de contexto do runtime como valores separados.
Para openai/gpt-5.5 pelo catálogo OAuth do Codex:
contextWindownativo:1000000- Limite padrão de
contextTokensdo runtime:272000
O limite padrão menor tem melhores características de latência e qualidade na prática. Substitua-o com contextTokens:
{ models: { providers: { openai: { models: [{ id: "gpt-5.5", contextTokens: 160000 }], }, }, },}Recuperação do catálogo
OpenClaw usa metadados do catálogo upstream do Codex para gpt-5.5 quando eles estão
presentes. Se a descoberta ao vivo do Codex omitir a linha gpt-5.5 enquanto
a conta estiver autenticada, OpenClaw sintetiza essa linha de modelo OAuth para que
execuções de Cron, subagente e modelo padrão configurado não falhem com
Unknown model.
Autenticação nativa do app-server Codex
O harness app-server Codex nativo usa referências de modelo openai/* mais configuração
de runtime omitida ou agentRuntime.id: "codex" de provedor/modelo, mas sua autenticação
ainda é baseada em conta. OpenClaw seleciona a autenticação nesta ordem:
- Perfis ordenados de autenticação OpenAI para o agente, preferencialmente em
auth.order.openai. Executeopenclaw doctor --fixpara migrar ids de perfil de autenticação Codex legados mais antigos e a ordem legada de autenticação Codex. - A conta existente do app-server, como um login local ChatGPT do CLI Codex.
- Somente para inicializações locais do app-server por stdio,
CODEX_API_KEY, depoisOPENAI_API_KEY, quando o app-server não relata nenhuma conta e ainda exige autenticação OpenAI.
Isso significa que um login local de assinatura ChatGPT/Codex não é substituído apenas
porque o processo do Gateway também tem OPENAI_API_KEY para modelos OpenAI diretos
ou embeddings. O fallback de chave de API por env é apenas o caminho local stdio sem conta; ele
não é enviado para conexões WebSocket do app-server. Quando um perfil Codex
no estilo assinatura é selecionado, OpenClaw também mantém CODEX_API_KEY e OPENAI_API_KEY
fora do filho app-server stdio iniciado e envia as credenciais selecionadas
pela RPC de login do app-server. Quando esse perfil de assinatura é bloqueado por um
limite de uso do Codex, OpenClaw pode alternar para o próximo perfil de chave de API
openai:* ordenado sem alterar o modelo selecionado nem sair do harness
Codex. Depois que o horário de redefinição da assinatura passa, o perfil de assinatura fica
elegível novamente.
Geração de imagens
O Plugin openai incluído registra a geração de imagens pela ferramenta image_generate.
Ele oferece suporte tanto à geração de imagens com chave de API OpenAI quanto à geração de imagens
com OAuth do Codex pela mesma referência de modelo openai/gpt-image-2.
| Capacidade | Chave de API da OpenAI | OAuth do Codex |
|---|---|---|
| Ref. do modelo | openai/gpt-image-2 |
openai/gpt-image-2 |
| Autenticação | OPENAI_API_KEY |
Login OAuth do OpenAI Codex |
| Transporte | API de Imagens da OpenAI | Backend Responses do Codex |
| Máx. de imagens por solicitação | 4 | 4 |
| Modo de edição | Habilitado (até 5 imagens de referência) | Habilitado (até 5 imagens de referência) |
| Substituições de tamanho | Compatíveis, incluindo tamanhos 2K/4K | Compatíveis, incluindo tamanhos 2K/4K |
| Proporção / resolução | Não encaminhado para a API de Imagens da OpenAI | Mapeado para um tamanho compatível quando seguro |
{ agents: { defaults: { imageGenerationModel: { primary: "openai/gpt-image-2" }, }, },}gpt-image-2 é o padrão tanto para geração de texto para imagem da OpenAI quanto para
edição de imagens. gpt-image-1.5, gpt-image-1 e gpt-image-1-mini continuam utilizáveis como
substituições explícitas de modelo. Use openai/gpt-image-1.5 para saída
PNG/WebP com fundo transparente; a API atual gpt-image-2 rejeita
background: "transparent".
Para uma solicitação com fundo transparente, agentes devem chamar image_generate com
model: "openai/gpt-image-1.5", outputFormat: "png" ou "webp" e
background: "transparent"; a opção de provedor openai.background mais antiga
ainda é aceita. O OpenClaw também protege as rotas públicas da OpenAI e
do OAuth do OpenAI Codex reescrevendo solicitações transparentes padrão de
openai/gpt-image-2 para gpt-image-1.5; endpoints Azure e personalizados compatíveis com OpenAI mantêm
seus nomes configurados de implantação/modelo.
A mesma configuração é exposta para execuções CLI sem interface:
openclaw infer image generate \ --model openai/gpt-image-1.5 \ --output-format png \ --background transparent \ --prompt "A simple red circle sticker on a transparent background" \ --jsonUse as mesmas flags --output-format e --background com
openclaw infer image edit ao partir de um arquivo de entrada.
--openai-background continua disponível como um alias específico da OpenAI.
Use --quality low|medium|high|auto quando precisar controlar a qualidade e o custo
do OpenAI Images. Use --openai-moderation low|auto para passar a dica de
moderação específica do provedor da OpenAI a partir de image generate ou image edit.
Para instalações OAuth do ChatGPT/Codex, mantenha a mesma ref. openai/gpt-image-2. Quando um
perfil OAuth openai está configurado, o OpenClaw resolve esse token de acesso OAuth
armazenado e envia solicitações de imagem pelo backend Responses do Codex. Ele
não tenta primeiro OPENAI_API_KEY nem recorre silenciosamente a uma chave de API para essa
solicitação. Configure models.providers.openai explicitamente com uma chave de API,
URL base personalizada ou endpoint Azure quando quiser a rota direta da API de Imagens da OpenAI.
Se esse endpoint de imagem personalizado estiver em uma LAN/endereço privado confiável, também defina
browser.ssrfPolicy.dangerouslyAllowPrivateNetwork: true; o OpenClaw mantém
endpoints de imagem privados/internos compatíveis com OpenAI bloqueados a menos que essa adesão explícita
esteja presente.
Gerar:
/tool image_generate model=openai/gpt-image-2 prompt="A polished launch poster for OpenClaw on macOS" size=3840x2160 count=1Gerar um PNG transparente:
/tool image_generate model=openai/gpt-image-1.5 prompt="A simple red circle sticker on a transparent background" outputFormat=png background=transparentEditar:
/tool image_generate model=openai/gpt-image-2 prompt="Preserve the object shape, change the material to translucent glass" image=/path/to/reference.png size=1024x1536Geração de vídeo
O Plugin openai integrado registra geração de vídeo por meio da ferramenta video_generate.
| Capacidade | Valor |
|---|---|
| Modelo padrão | openai/sora-2 |
| Modos | Texto para vídeo, imagem para vídeo, edição de vídeo único |
| Entradas de referência | 1 imagem ou 1 vídeo |
| Substituições de tamanho | Compatíveis para texto para vídeo e imagem para vídeo |
| Outras substituições | aspectRatio, resolution, audio, watermark são ignorados com um aviso da ferramenta |
Solicitações de imagem para vídeo da OpenAI usam POST /v1/videos com uma imagem
input_reference. Edições de vídeo único usam POST /v1/videos/edits com o
vídeo enviado no campo video.
{ agents: { defaults: { videoGenerationModel: { primary: "openai/sora-2" }, }, },}Contribuição de prompt GPT-5
O OpenClaw adiciona uma contribuição compartilhada de prompt GPT-5 para execuções da família GPT-5 em superfícies de prompt montadas pelo OpenClaw. Ela se aplica por id de modelo, então rotas OpenClaw/provedor como refs legadas pré-reparo (ref legada GPT-5.5 do Codex), openrouter/openai/gpt-5.5, opencode/gpt-5.5 e outras refs GPT-5 compatíveis recebem a mesma sobreposição. Modelos GPT-4.x mais antigos não recebem.
O harness Codex nativo integrado não recebe essa sobreposição GPT-5 do OpenClaw por meio das instruções de desenvolvedor do servidor de app do Codex. O Codex nativo mantém o comportamento de base, modelo e documentos de projeto pertencente ao Codex, enquanto o OpenClaw desabilita a personalidade integrada do Codex para threads nativas para que os arquivos de personalidade do workspace do agente permaneçam autoritativos. O OpenClaw contribui apenas contexto de runtime, como entrega por canal, ferramentas dinâmicas do OpenClaw, delegação ACP, contexto do workspace e Skills do OpenClaw.
A contribuição GPT-5 adiciona um contrato de comportamento marcado para persistência de persona, segurança de execução, disciplina de ferramentas, formato de saída, verificações de conclusão e verificação em prompts montados pelo OpenClaw correspondentes. O comportamento de resposta específico do canal e de mensagem silenciosa permanece no prompt de sistema compartilhado do OpenClaw e na política de entrega de saída. A camada de estilo de interação amigável é separada e configurável.
| Valor | Efeito |
|---|---|
"friendly" (padrão) |
Habilita a camada de estilo de interação amigável |
"on" |
Alias para "friendly" |
"off" |
Desabilita apenas a camada de estilo amigável |
Configuração
{ agents: { defaults: { promptOverlays: { gpt5: { personality: "friendly" }, }, }, },}CLI
openclaw config set agents.defaults.promptOverlays.gpt5.personality offVoz e fala
Síntese de fala (TTS)
O Plugin openai integrado registra síntese de fala para a superfície messages.tts.
| Configuração | Caminho de configuração | Padrão |
|---|---|---|
| Modelo | messages.tts.providers.openai.model |
gpt-4o-mini-tts |
| Voz | messages.tts.providers.openai.speakerVoice |
coral |
| Velocidade | messages.tts.providers.openai.speed |
(não definido) |
| Instruções | messages.tts.providers.openai.instructions |
(não definido, somente gpt-4o-mini-tts) |
| Formato | messages.tts.providers.openai.responseFormat |
opus para notas de voz, mp3 para arquivos |
| Chave de API | messages.tts.providers.openai.apiKey |
Usa fallback para OPENAI_API_KEY |
| URL base | messages.tts.providers.openai.baseUrl |
https://api.openai.com/v1 |
| Corpo extra | messages.tts.providers.openai.extraBody / extra_body |
(não definido) |
Modelos disponíveis: gpt-4o-mini-tts, tts-1, tts-1-hd. Vozes disponíveis: alloy, ash, ballad, cedar, coral, echo, fable, juniper, marin, onyx, nova, sage, shimmer, verse.
extraBody é mesclado ao JSON da solicitação /audio/speech após os campos gerados pelo OpenClaw, então use-o para endpoints compatíveis com OpenAI que exigem chaves adicionais, como lang. Chaves de protótipo são ignoradas.
{ messages: { tts: { providers: { openai: { model: "gpt-4o-mini-tts", speakerVoice: "coral" }, }, }, },}Fala para texto
O Plugin openai integrado registra fala para texto em lote por meio da
superfície de transcrição de compreensão de mídia do OpenClaw.
- Modelo padrão:
gpt-4o-transcribe - Endpoint: REST da OpenAI
/v1/audio/transcriptions - Caminho de entrada: upload de arquivo de áudio multipart
- Compatível com o OpenClaw onde quer que a transcrição de áudio de entrada use
tools.media.audio, incluindo segmentos de canal de voz do Discord e anexos de áudio de canal
Para forçar a OpenAI na transcrição de áudio de entrada:
{ tools: { media: { audio: { models: [ { type: "provider", provider: "openai", model: "gpt-4o-transcribe", }, ], }, }, },}Dicas de idioma e prompt são encaminhadas para a OpenAI quando fornecidas pela configuração compartilhada de mídia de áudio ou pela solicitação de transcrição por chamada.
Transcrição em tempo real
O Plugin openai integrado registra transcrição em tempo real para o Plugin Voice Call.
| Configuração | Caminho de configuração | Padrão |
|---|---|---|
| Modelo | plugins.entries.voice-call.config.streaming.providers.openai.model |
gpt-4o-transcribe |
| Idioma | ...openai.language |
(não definido) |
| Prompt | ...openai.prompt |
(não definido) |
| Duração do silêncio | ...openai.silenceDurationMs |
800 |
| Limite de VAD | ...openai.vadThreshold |
0.5 |
| Autenticação | ...openai.apiKey, OPENAI_API_KEY ou OAuth openai |
Chaves de API conectam diretamente; OAuth emite um segredo de cliente de transcrição Realtime |
Voz em tempo real
O Plugin openai integrado registra voz em tempo real para o Plugin Voice Call.
| Configuração | Caminho de configuração | Padrão |
|---|---|---|
| Modelo | plugins.entries.voice-call.config.realtime.providers.openai.model |
gpt-realtime-2 |
| Voz | ...openai.voice |
alloy |
| Temperatura (ponte de implantação do Azure) | ...openai.temperature |
0.8 |
| Limite de VAD | ...openai.vadThreshold |
0.5 |
| Duração do silêncio | ...openai.silenceDurationMs |
500 |
| Preenchimento de prefixo | ...openai.prefixPaddingMs |
300 |
| Esforço de raciocínio | ...openai.reasoningEffort |
(não definido) |
| Autenticação | perfil de autenticação por chave de API openai, ...openai.apiKey ou OPENAI_API_KEY |
chave de API da OpenAI Platform obrigatória; OAuth da OpenAI não configura voz Realtime |
Vozes Realtime integradas disponíveis para gpt-realtime-2: alloy, ash,
ballad, coral, echo, sage, shimmer, verse, marin, cedar.
A OpenAI recomenda marin e cedar para a melhor qualidade Realtime. Este
é um conjunto separado das vozes de conversão de texto em fala acima; não presuma que uma voz TTS
como fable, nova ou onyx seja válida para sessões Realtime.
Endpoints do Azure OpenAI
O provedor openai integrado pode apontar para um recurso do Azure OpenAI para geração
de imagens substituindo a URL base. No caminho de geração de imagens, o OpenClaw
detecta nomes de host do Azure em models.providers.openai.baseUrl e alterna para
o formato de solicitação do Azure automaticamente.
Use o Azure OpenAI quando:
- Você já tiver uma assinatura, cota ou contrato empresarial do Azure OpenAI
- Você precisar de residência regional de dados ou controles de conformidade fornecidos pelo Azure
- Você quiser manter o tráfego dentro de uma tenancy existente do Azure
Configuração
Para geração de imagens no Azure por meio do provedor openai integrado, aponte
models.providers.openai.baseUrl para seu recurso do Azure e defina apiKey como
a chave do Azure OpenAI (não uma chave da OpenAI Platform):
{ models: { providers: { openai: { baseUrl: "https://<your-resource>.openai.azure.com", apiKey: "<azure-openai-api-key>", }, }, },}O OpenClaw reconhece estes sufixos de host do Azure para a rota de geração de imagens do Azure:
*.openai.azure.com*.services.ai.azure.com*.cognitiveservices.azure.com
Para solicitações de geração de imagens em um host reconhecido do Azure, o OpenClaw:
- Envia o cabeçalho
api-keyem vez deAuthorization: Bearer - Usa caminhos com escopo de implantação (
/openai/deployments/{deployment}/...) - Acrescenta
?api-version=...a cada solicitação - Usa um tempo limite padrão de solicitação de 600s para chamadas de geração de imagens do Azure.
Valores
timeoutMspor chamada ainda substituem esse padrão.
Outras URLs base (OpenAI pública, proxies compatíveis com OpenAI) mantêm o formato padrão de solicitação de imagem da OpenAI.
Versão da API
Defina AZURE_OPENAI_API_VERSION para fixar uma versão preview ou GA específica do Azure
para o caminho de geração de imagens do Azure:
export AZURE_OPENAI_API_VERSION="2024-12-01-preview"O padrão é 2024-12-01-preview quando a variável não está definida.
Nomes de modelo são nomes de implantação
O Azure OpenAI vincula modelos a implantações. Para solicitações de geração de imagens do Azure
roteadas pelo provedor openai integrado, o campo model no OpenClaw
deve ser o nome da implantação do Azure que você configurou no portal do Azure, não
o ID público do modelo da OpenAI.
Se você criar uma implantação chamada gpt-image-2-prod que serve gpt-image-2:
/tool image_generate model=openai/gpt-image-2-prod prompt="A clean poster" size=1024x1024 count=1A mesma regra de nome de implantação se aplica a chamadas de geração de imagens roteadas pelo
provedor openai integrado.
Disponibilidade regional
A geração de imagens do Azure está disponível atualmente apenas em um subconjunto de regiões
(por exemplo, eastus2, swedencentral, polandcentral, westus3,
uaenorth). Verifique a lista atual de regiões da Microsoft antes de criar uma
implantação e confirme se o modelo específico é oferecido na sua região.
Diferenças de parâmetros
O Azure OpenAI e a OpenAI pública nem sempre aceitam os mesmos parâmetros de imagem.
O Azure pode rejeitar opções que a OpenAI pública permite (por exemplo, certos
valores de background em gpt-image-2) ou expô-las apenas em versões específicas
do modelo. Essas diferenças vêm do Azure e do modelo subjacente, não do
OpenClaw. Se uma solicitação do Azure falhar com um erro de validação, verifique o
conjunto de parâmetros compatível com sua implantação e versão de API específicas no
portal do Azure.
Configuração avançada
Transporte (WebSocket vs SSE)
O OpenClaw usa WebSocket primeiro com fallback para SSE ("auto") para openai/*.
No modo "auto", o OpenClaw:
- Tenta novamente uma falha inicial de WebSocket antes de fazer fallback para SSE
- Após uma falha, marca o WebSocket como degradado por ~60 segundos e usa SSE durante o período de espera
- Anexa cabeçalhos estáveis de identidade de sessão e turno para novas tentativas e reconexões
- Normaliza contadores de uso (
input_tokens/prompt_tokens) entre variantes de transporte
| Valor | Comportamento |
|---|---|
"auto" (padrão) |
WebSocket primeiro, fallback para SSE |
"sse" |
Forçar somente SSE |
"websocket" |
Forçar somente WebSocket |
{ agents: { defaults: { models: { "openai/gpt-5.5": { params: { transport: "auto" }, }, }, }, },}Documentação relacionada da OpenAI:
Modo rápido
O OpenClaw expõe uma alternância compartilhada de modo rápido para openai/*:
- Chat/UI:
/fast status|auto|on|off - Configuração:
agents.defaults.models["<provider>/<model>"].params.fastMode
Quando habilitado, o OpenClaw mapeia o modo rápido para o processamento prioritário da OpenAI (service_tier = "priority"). Valores existentes de service_tier são preservados, e o modo rápido não reescreve reasoning ou text.verbosity. fastMode: "auto" inicia novas chamadas de modelo em modo rápido até o corte automático e, depois, inicia chamadas posteriores de nova tentativa, fallback, resultado de ferramenta ou continuação sem modo rápido. O corte padrão é 60 segundos; defina params.fastAutoOnSeconds no modelo ativo para alterá-lo.
{ agents: { defaults: { models: { "openai/gpt-5.5": { params: { fastMode: "auto", fastAutoOnSeconds: 30 } }, }, }, },}Processamento prioritário (service_tier)
A API da OpenAI expõe processamento prioritário via service_tier. Defina por modelo no OpenClaw:
{ agents: { defaults: { models: { "openai/gpt-5.5": { params: { serviceTier: "priority" } }, }, }, },}Valores compatíveis: auto, default, flex, priority.
Compaction do lado do servidor (Responses API)
Para modelos OpenAI Responses diretos (openai/* em api.openai.com), o wrapper de stream OpenClaw do Plugin OpenAI habilita automaticamente a Compaction do lado do servidor:
- Força
store: true(a menos que a compatibilidade do modelo definasupportsStore: false) - Injeta
context_management: [{ type: "compaction", compact_threshold: ... }] compact_thresholdpadrão: 70% decontextWindow(ou80000quando indisponível)
Isso se aplica ao caminho de runtime integrado do OpenClaw e aos hooks do provedor OpenAI usados por execuções incorporadas. O harness do app-server nativo do Codex gerencia seu próprio contexto por meio do Codex e é configurado pela rota padrão de agente da OpenAI ou pela política de runtime de provedor/modelo.
Habilitar explicitamente
Útil para endpoints compatíveis, como Azure OpenAI Responses:
{ agents: { defaults: { models: { "azure-openai-responses/gpt-5.5": { params: { responsesServerCompaction: true }, }, }, }, },}Limite personalizado
{ agents: { defaults: { models: { "openai/gpt-5.5": { params: { responsesServerCompaction: true, responsesCompactThreshold: 120000, }, }, }, }, },}Desabilitar
{ agents: { defaults: { models: { "openai/gpt-5.5": { params: { responsesServerCompaction: false }, }, }, }, },}Modo GPT strict-agentic
Para execuções da família GPT-5 em openai/*, o OpenClaw pode usar um contrato de execução embarcado mais rigoroso:
{ agents: { defaults: { embeddedAgent: { executionContract: "strict-agentic" }, }, },}Com strict-agentic, o OpenClaw:
- Ativa automaticamente
update_planpara trabalho substancial - Tenta novamente turnos estruturalmente vazios ou contendo apenas raciocínio com uma continuação de resposta visível
- Usa eventos explícitos de plano do harness quando o harness selecionado os fornece
O OpenClaw não classifica a prosa do assistente para decidir se um turno é um plano, uma atualização de progresso ou uma resposta final.
Rotas nativas vs. compatíveis com OpenAI
O OpenClaw trata endpoints diretos da OpenAI, do Codex e do Azure OpenAI de forma diferente de proxies /v1 genéricos compatíveis com OpenAI:
Rotas nativas (openai/*, Azure OpenAI):
- Mantêm
reasoning: { effort: "none" }apenas para modelos compatíveis com o esforçononeda OpenAI - Omitem o raciocínio desativado para modelos ou proxies que rejeitam
reasoning.effort: "none" - Definem esquemas de ferramentas como modo estrito por padrão
- Anexam cabeçalhos ocultos de atribuição apenas em hosts nativos verificados
- Mantêm a modelagem de solicitação exclusiva da OpenAI (
service_tier,store, compatibilidade de raciocínio, dicas de cache de prompt)
Rotas de proxy/compatíveis:
- Usam comportamento de compatibilidade mais flexível
- Removem
storedo Completions de payloadsopenai-completionsnão nativos - Aceitam JSON avançado de passagem direta
params.extra_body/params.extraBodypara proxies de Completions compatíveis com OpenAI - Aceitam
params.chat_template_kwargspara proxies de Completions compatíveis com OpenAI, como vLLM - Não forçam esquemas de ferramentas estritos nem cabeçalhos exclusivos de nativos
O Azure OpenAI usa transporte nativo e comportamento de compatibilidade, mas não recebe os cabeçalhos ocultos de atribuição.
Relacionados
Escolha de provedores, refs de modelo e comportamento de failover.
Parâmetros compartilhados da ferramenta de imagem e seleção de provedor.
Parâmetros compartilhados da ferramenta de vídeo e seleção de provedor.
Detalhes de autenticação e regras de reutilização de credenciais.