Pular para o conteúdo principal

Documentation Index

Fetch the complete documentation index at: https://docs.openclaw.ai/llms.txt

Use this file to discover all available pages before exploring further.

OpenAI fornece APIs de desenvolvedor para modelos GPT, e Codex também está disponível como um agente de codificação de plano ChatGPT por meio dos clientes Codex da OpenAI. O OpenClaw mantém essas superfícies separadas para que a configuração permaneça previsível. O OpenClaw usa openai/* como a rota canônica de modelo da OpenAI. Turnos de agente incorporados em modelos OpenAI são executados pelo runtime nativo do servidor de app do Codex por padrão; a autenticação direta por chave de API da OpenAI permanece disponível para superfícies OpenAI sem agente, como imagens, embeddings, fala e tempo real.
  • Modelos de agente - modelos openai/* pelo runtime Codex; entre com autenticação Codex para uso de assinatura ChatGPT/Codex ou configure um backup de chave de API OpenAI compatível com Codex quando você quiser intencionalmente autenticação por chave de API.
  • APIs OpenAI sem agente - acesso direto à OpenAI Platform com cobrança baseada em uso por meio de OPENAI_API_KEY ou onboarding de chave de API da OpenAI.
  • Configuração legada - referências de modelo openai-codex/* são reparadas por openclaw doctor --fix para openai/* mais o runtime Codex.
A OpenAI oferece suporte explicitamente ao uso de OAuth de assinatura em ferramentas externas e fluxos de trabalho como o OpenClaw. Provedor, modelo, runtime e canal são camadas separadas. Se esses rótulos estiverem sendo misturados, leia Runtimes de agente antes de alterar a configuração.

Escolha rápida

ObjetivoUseObservações
Assinatura ChatGPT/Codex com runtime Codex nativoopenai/gpt-5.5Configuração padrão de agente OpenAI. Entre com autenticação Codex.
Cobrança direta por chave de API para modelos de agenteopenai/gpt-5.5 mais um perfil de chave de API compatível com CodexUse auth.order.openai para colocar o backup depois da autenticação de assinatura.
Cobrança direta por chave de API por PI explícitoopenai/gpt-5.5 mais runtime de provedor/modelo piSelecione um perfil normal de chave de API openai.
Alias mais recente da API ChatGPT Instantopenai/chat-latestSomente chave de API direta. Alias móvel para experimentos, não o padrão.
Autenticação de assinatura ChatGPT/Codex por PI explícitoopenai/gpt-5.5 mais runtime de provedor/modelo piSelecione um perfil de autenticação openai-codex para a rota de compatibilidade.
Geração ou edição de imagensopenai/gpt-image-2Funciona com OPENAI_API_KEY ou OAuth OpenAI Codex.
Imagens com fundo transparenteopenai/gpt-image-1.5Use outputFormat=png ou webp e openai.background=transparent.

Mapa de nomes

Os nomes são parecidos, mas não intercambiáveis:
Nome que você vêCamadaSignificado
openaiPrefixo do provedorRota canônica de modelo da OpenAI; turnos de agente usam o runtime Codex.
openai-codexPrefixo legado de autenticação/perfilNamespace mais antigo de perfil OAuth/assinatura OpenAI Codex. Perfis existentes e auth.order.openai-codex ainda funcionam.
Plugin codexPluginPlugin integrado do OpenClaw que fornece runtime nativo do servidor de app do Codex e controles de chat /codex.
agentRuntime.id: codex de provedor/modeloRuntime de agenteForça o harness nativo do servidor de app do Codex para turnos incorporados correspondentes.
/codex ...Conjunto de comandos de chatVincule/controle threads do servidor de app do Codex a partir de uma conversa.
runtime: "acp", agentId: "codex"Rota de sessão ACPCaminho de fallback explícito que executa Codex por ACP/acpx.
Isso significa que uma configuração pode conter intencionalmente referências de modelo openai/* enquanto perfis de autenticação ainda apontam para credenciais compatíveis com Codex. Prefira auth.order.openai para novas configurações; perfis openai-codex:* existentes e auth.order.openai-codex continuam compatíveis. openclaw doctor --fix reescreve referências de modelo legadas openai-codex/* para a rota canônica de modelo da OpenAI.
GPT-5.5 está disponível tanto pelo acesso direto com chave de API da OpenAI Platform quanto por rotas de assinatura/OAuth. Para assinatura ChatGPT/Codex mais execução Codex nativa, use openai/gpt-5.5; a configuração de runtime não definida agora seleciona o harness Codex para turnos de agente OpenAI. Use perfis de chave de API da OpenAI somente quando quiser autenticação direta por chave de API para um modelo de agente OpenAI.
Turnos de modelo de agente OpenAI exigem o Plugin integrado do servidor de app Codex. A configuração explícita de runtime PI permanece disponível como uma rota de compatibilidade opcional. Quando PI é selecionado explicitamente com um perfil de autenticação openai-codex, o OpenClaw mantém a referência de modelo pública como openai/* e roteia PI internamente pelo transporte legado de autenticação Codex. Execute openclaw doctor --fix para reparar referências de modelo openai-codex/* obsoletas ou pins antigos de sessão PI que não venham de uma configuração explícita de runtime.

Cobertura de recursos do OpenClaw

Capacidade OpenAISuperfície OpenClawStatus
Chat / Responsesprovedor de modelo openai/<model>Sim
Modelos de assinatura Codexopenai/<model> com OAuth openai-codexSim
Referências de modelo Codex legadasopenai-codex/<model>Reparado pelo doctor para openai/<model>
Harness do servidor de app Codexopenai/<model> com runtime omitido ou agentRuntime.id: codex de provedor/modeloSim
Busca na web do lado do servidorFerramenta nativa OpenAI ResponsesSim, quando a busca na web está habilitada e nenhum provedor está fixado
Imagensimage_generateSim
Vídeosvideo_generateSim
Texto para falamessages.tts.provider: "openai" / ttsSim
Fala para texto em lotetools.media.audio / compreensão de mídiaSim
Fala para texto em streamingVoice Call streaming.provider: "openai"Sim
Voz em tempo realVoice Call realtime.provider: "openai" / Talk da Control UISim
Embeddingsprovedor de embeddings de memóriaSim

Embeddings de memória

O OpenClaw pode usar a OpenAI, ou um endpoint de embeddings compatível com OpenAI, para indexação memory_search e embeddings de consulta:
{
  agents: {
    defaults: {
      memorySearch: {
        provider: "openai",
        model: "text-embedding-3-small",
      },
    },
  },
}
Para endpoints compatíveis com OpenAI que exigem rótulos de embedding assimétricos, defina queryInputType e documentInputType em memorySearch. O OpenClaw os encaminha como campos de solicitação input_type específicos do provedor: embeddings de consulta usam queryInputType; fragmentos de memória indexados e indexação em lote usam documentInputType. Consulte a referência de configuração de memória para ver o exemplo completo.

Introdução

Escolha seu método de autenticação preferido e siga as etapas de configuração.
Melhor para: acesso direto à API e cobrança baseada em uso.
1

Obtenha sua chave de API

Crie ou copie uma chave de API no painel da OpenAI Platform.
2

Execute o onboarding

openclaw onboard --auth-choice openai-api-key
Ou passe a chave diretamente:
openclaw onboard --openai-api-key "$OPENAI_API_KEY"
3

Verifique se o modelo está disponível

openclaw models list --provider openai

Resumo de rota

Referência de modeloConfiguração de runtimeRotaAutenticação
openai/gpt-5.5omitido / agentRuntime.id: "codex" de provedor/modeloHarness do servidor de app CodexPerfil OpenAI compatível com Codex
openai/gpt-5.4-miniomitido / agentRuntime.id: "codex" de provedor/modeloHarness do servidor de app CodexPerfil OpenAI compatível com Codex
openai/gpt-5.5agentRuntime.id: "pi" de provedor/modeloRuntime incorporado PIperfil openai ou perfil openai-codex selecionado
Modelos de agente openai/* usam o harness do servidor de app Codex. Para usar autenticação por chave de API para um modelo de agente, crie um perfil de chave de API compatível com Codex e ordene-o com auth.order.openai; OPENAI_API_KEY permanece como fallback direto para superfícies da API OpenAI sem agente. Entradas auth.order.openai-codex mais antigas ainda funcionam.

Exemplo de configuração

{
  env: { OPENAI_API_KEY: "sk-..." },
  agents: { defaults: { model: { primary: "openai/gpt-5.5" } } },
}
Para testar o modelo Instant atual do ChatGPT pela API OpenAI, defina o modelo como openai/chat-latest:
{
  env: { OPENAI_API_KEY: "sk-..." },
  agents: { defaults: { model: { primary: "openai/chat-latest" } } },
}
chat-latest é um alias móvel. A OpenAI o documenta como o modelo Instant mais recente usado no ChatGPT e recomenda gpt-5.5 para uso de API em produção, então mantenha openai/gpt-5.5 como o padrão estável, a menos que você queira explicitamente esse comportamento de alias. Atualmente, o alias aceita apenas verbosidade de texto medium, então o OpenClaw normaliza substituições incompatíveis de verbosidade de texto da OpenAI para este modelo.
O OpenClaw não expõe openai/gpt-5.3-codex-spark. Solicitações ativas à API OpenAI rejeitam esse modelo, e o catálogo Codex atual também não o expõe.

Autenticação nativa do servidor de aplicativo do Codex

O harness nativo do servidor de aplicativo do Codex usa refs de modelo openai/* mais configuração de runtime omitida ou provider/model agentRuntime.id: "codex", mas sua autenticação ainda é baseada em conta. O OpenClaw seleciona a autenticação nesta ordem:
  1. Perfis de autenticação OpenAI ordenados para o agente, de preferência em auth.order.openai. Perfis openai-codex:* existentes e auth.order.openai-codex continuam válidos para instalações mais antigas.
  2. A conta existente do servidor de aplicativo, como um login local do ChatGPT pela CLI do Codex.
  3. Somente para inicializações locais do servidor de aplicativo stdio, CODEX_API_KEY e depois OPENAI_API_KEY, quando o servidor de aplicativo não relata nenhuma conta e ainda exige autenticação OpenAI.
Isso significa que um login local de assinatura ChatGPT/Codex não é substituído apenas porque o processo do gateway também tem OPENAI_API_KEY para modelos OpenAI diretos ou embeddings. O fallback de chave de API por variável de ambiente é apenas o caminho local stdio sem conta; ele não é enviado a conexões WebSocket do servidor de aplicativo. Quando um perfil de Codex no estilo assinatura é selecionado, o OpenClaw também mantém CODEX_API_KEY e OPENAI_API_KEY fora do processo filho stdio do servidor de aplicativo gerado e envia as credenciais selecionadas pela RPC de login do servidor de aplicativo. Quando esse perfil de assinatura é bloqueado por um limite de uso do Codex, o OpenClaw pode alternar para o próximo perfil de chave de API openai:* ordenado sem mudar o modelo selecionado nem sair do harness do Codex. Depois que o tempo de redefinição da assinatura passa, o perfil de assinatura fica elegível novamente.

Geração de imagens

O plugin openai empacotado registra geração de imagens pela ferramenta image_generate. Ele oferece suporte tanto à geração de imagens com chave de API OpenAI quanto à geração de imagens com OAuth do Codex pela mesma ref. de modelo openai/gpt-image-2.
RecursoChave de API OpenAIOAuth do Codex
Ref. do modeloopenai/gpt-image-2openai/gpt-image-2
AutenticaçãoOPENAI_API_KEYLogin OAuth do OpenAI Codex
TransporteAPI OpenAI ImagesBackend Codex Responses
Máximo de imagens por solicitação44
Modo de ediçãoHabilitado (até 5 imagens de referência)Habilitado (até 5 imagens de referência)
Substituições de tamanhoCompatíveis, incluindo tamanhos 2K/4KCompatíveis, incluindo tamanhos 2K/4K
Proporção / resoluçãoNão encaminhado para a API OpenAI ImagesMapeado para um tamanho compatível quando seguro
{
  agents: {
    defaults: {
      imageGenerationModel: { primary: "openai/gpt-image-2" },
    },
  },
}
Consulte Geração de Imagens para parâmetros de ferramenta compartilhados, seleção de provedor e comportamento de failover.
gpt-image-2 é o padrão tanto para geração de texto para imagem da OpenAI quanto para edição de imagens. gpt-image-1.5, gpt-image-1 e gpt-image-1-mini continuam utilizáveis como substituições explícitas de modelo. Use openai/gpt-image-1.5 para saída PNG/WebP com fundo transparente; a API atual de gpt-image-2 rejeita background: "transparent". Para uma solicitação de fundo transparente, agentes devem chamar image_generate com model: "openai/gpt-image-1.5", outputFormat: "png" ou "webp" e background: "transparent"; a opção de provedor antiga openai.background ainda é aceita. O OpenClaw também protege as rotas públicas OpenAI e OpenAI Codex OAuth reescrevendo solicitações transparentes padrão openai/gpt-image-2 para gpt-image-1.5; endpoints Azure e OpenAI-compatíveis personalizados mantêm seus nomes de implantação/modelo configurados. A mesma configuração é exposta para execuções CLI sem interface:
openclaw infer image generate \
  --model openai/gpt-image-1.5 \
  --output-format png \
  --background transparent \
  --prompt "A simple red circle sticker on a transparent background" \
  --json
Use as mesmas flags --output-format e --background com openclaw infer image edit ao começar a partir de um arquivo de entrada. --openai-background permanece disponível como um alias específico da OpenAI. Para instalações com OAuth do Codex, mantenha a mesma ref. openai/gpt-image-2. Quando um perfil OAuth openai-codex estiver configurado, o OpenClaw resolve esse token de acesso OAuth armazenado e envia solicitações de imagem pelo backend Codex Responses. Ele não tenta primeiro OPENAI_API_KEY nem faz fallback silencioso para uma chave de API para essa solicitação. Configure models.providers.openai explicitamente com uma chave de API, URL base personalizada ou endpoint Azure quando quiser a rota direta da API OpenAI Images. Se esse endpoint de imagem personalizado estiver em uma LAN/endereço privado confiável, também defina browser.ssrfPolicy.dangerouslyAllowPrivateNetwork: true; o OpenClaw mantém endpoints de imagem OpenAI-compatíveis privados/internos bloqueados, a menos que essa adesão explícita esteja presente. Gerar:
/tool image_generate model=openai/gpt-image-2 prompt="A polished launch poster for OpenClaw on macOS" size=3840x2160 count=1
Gerar um PNG transparente:
/tool image_generate model=openai/gpt-image-1.5 prompt="A simple red circle sticker on a transparent background" outputFormat=png background=transparent
Editar:
/tool image_generate model=openai/gpt-image-2 prompt="Preserve the object shape, change the material to translucent glass" image=/path/to/reference.png size=1024x1536

Geração de vídeo

O Plugin openai incluído registra geração de vídeo por meio da ferramenta video_generate.
RecursoValor
Modelo padrãoopenai/sora-2
ModosTexto para vídeo, imagem para vídeo, edição de vídeo único
Entradas de referência1 imagem ou 1 vídeo
Substituições de tamanhoCompatíveis
Outras substituiçõesaspectRatio, resolution, audio, watermark são ignorados com um aviso da ferramenta
{
  agents: {
    defaults: {
      videoGenerationModel: { primary: "openai/sora-2" },
    },
  },
}
Consulte Geração de vídeo para parâmetros compartilhados da ferramenta, seleção de provedor e comportamento de failover.

Contribuição de prompt do GPT-5

O OpenClaw adiciona uma contribuição compartilhada de prompt do GPT-5 para execuções da família GPT-5 entre provedores. Ela se aplica pelo id do modelo, portanto openai/gpt-5.5, refs legadas anteriores ao reparo como openai-codex/gpt-5.5, openrouter/openai/gpt-5.5, opencode/gpt-5.5 e outras refs compatíveis com GPT-5 recebem a mesma sobreposição. Modelos GPT-4.x mais antigos não recebem. O harness Codex nativo incluído usa o mesmo comportamento do GPT-5 e a mesma sobreposição de Heartbeat por meio das instruções de desenvolvedor do servidor de aplicativo Codex, portanto sessões openai/gpt-5.x roteadas pelo Codex mantêm a mesma orientação de acompanhamento e Heartbeat proativo, embora o Codex seja dono do restante do prompt do harness. A contribuição do GPT-5 adiciona um contrato de comportamento marcado para persistência de persona, segurança de execução, disciplina de ferramentas, formato de saída, verificações de conclusão e verificação. O comportamento de resposta específico do canal e de mensagem silenciosa permanece no prompt de sistema compartilhado do OpenClaw e na política de entrega de saída. A orientação do GPT-5 está sempre habilitada para modelos correspondentes. A camada de estilo de interação amigável é separada e configurável.
ValorEfeito
"friendly" (padrão)Habilitar a camada de estilo de interação amigável
"on"Alias para "friendly"
"off"Desabilitar apenas a camada de estilo amigável
{
  agents: {
    defaults: {
      promptOverlays: {
        gpt5: { personality: "friendly" },
      },
    },
  },
}
Os valores não diferenciam maiúsculas de minúsculas em tempo de execução, portanto "Off" e "off" desabilitam a camada de estilo amigável.
O plugins.entries.openai.config.personality legado ainda é lido como fallback de compatibilidade quando a configuração compartilhada agents.defaults.promptOverlays.gpt5.personality não está definida.

Voz e fala

O Plugin openai incluído registra síntese de fala para a superfície messages.tts.
ConfiguraçãoCaminho de configuraçãoPadrão
Modelomessages.tts.providers.openai.modelgpt-4o-mini-tts
Vozmessages.tts.providers.openai.voicecoral
Velocidademessages.tts.providers.openai.speed(não definido)
Instruçõesmessages.tts.providers.openai.instructions(não definido, somente gpt-4o-mini-tts)
Formatomessages.tts.providers.openai.responseFormatopus para notas de voz, mp3 para arquivos
Chave de APImessages.tts.providers.openai.apiKeyRecorre a OPENAI_API_KEY
URL basemessages.tts.providers.openai.baseUrlhttps://api.openai.com/v1
Corpo extramessages.tts.providers.openai.extraBody / extra_body(não definido)
Modelos disponíveis: gpt-4o-mini-tts, tts-1, tts-1-hd. Vozes disponíveis: alloy, ash, ballad, cedar, coral, echo, fable, juniper, marin, onyx, nova, sage, shimmer, verse.extraBody é mesclado ao JSON da solicitação /audio/speech após os campos gerados pelo OpenClaw, portanto use-o para endpoints compatíveis com OpenAI que exigem chaves adicionais, como lang. Chaves de protótipo são ignoradas.
{
  messages: {
    tts: {
      providers: {
        openai: { model: "gpt-4o-mini-tts", voice: "coral" },
      },
    },
  },
}
Defina OPENAI_TTS_BASE_URL para substituir a URL base de TTS sem afetar o endpoint da API de chat. O TTS da OpenAI ainda é configurado por meio de uma chave de API; para retorno de fala ao vivo somente com OAuth, use o caminho de voz em tempo real em vez de fala STT -> TTS em modo de agente.
O Plugin openai incluído registra fala para texto em lote por meio da superfície de transcrição de entendimento de mídia do OpenClaw.
  • Modelo padrão: gpt-4o-transcribe
  • Endpoint: REST OpenAI /v1/audio/transcriptions
  • Caminho de entrada: upload de arquivo de áudio multipart
  • Compatível com o OpenClaw sempre que a transcrição de áudio de entrada usa tools.media.audio, incluindo segmentos de canal de voz do Discord e anexos de áudio de canal
Para forçar a OpenAI para transcrição de áudio de entrada:
{
  tools: {
    media: {
      audio: {
        models: [
          {
            type: "provider",
            provider: "openai",
            model: "gpt-4o-transcribe",
          },
        ],
      },
    },
  },
}
Dicas de idioma e prompt são encaminhadas para a OpenAI quando fornecidas pela configuração compartilhada de mídia de áudio ou pela solicitação de transcrição por chamada.
O Plugin openai incluído registra transcrição em tempo real para o Plugin Voice Call.
ConfiguraçãoCaminho de configuraçãoPadrão
Modeloplugins.entries.voice-call.config.streaming.providers.openai.modelgpt-4o-transcribe
Idioma...openai.language(não definido)
Prompt...openai.prompt(não definido)
Duração do silêncio...openai.silenceDurationMs800
Limite de VAD...openai.vadThreshold0.5
Autenticação...openai.apiKey, OPENAI_API_KEY ou OAuth openai-codexChaves de API se conectam diretamente; OAuth emite um segredo de cliente de transcrição Realtime
Usa uma conexão WebSocket com wss://api.openai.com/v1/realtime com áudio G.711 u-law (g711_ulaw / audio/pcmu). Quando apenas o OAuth openai-codex está configurado, o Gateway emite um segredo de cliente efêmero de transcrição Realtime antes de abrir o WebSocket. Este provedor de streaming é para o caminho de transcrição em tempo real do Voice Call; a voz do Discord atualmente grava segmentos curtos e usa o caminho de transcrição em lote tools.media.audio.
O Plugin openai incluído registra voz em tempo real para o Plugin Voice Call.
ConfiguraçãoCaminho de configuraçãoPadrão
Modeloplugins.entries.voice-call.config.realtime.providers.openai.modelgpt-realtime-2
Voz...openai.voicealloy
Temperatura (ponte de implantação do Azure)...openai.temperature0.8
Limite de VAD...openai.vadThreshold0.5
Duração do silêncio...openai.silenceDurationMs500
Preenchimento de prefixo...openai.prefixPaddingMs300
Esforço de raciocínio...openai.reasoningEffort(não definido)
Autenticação...openai.apiKey, OPENAI_API_KEY ou OAuth openai-codexO Talk no navegador e pontes de backend que não sejam Azure podem usar OAuth do Codex
Vozes Realtime integradas disponíveis para gpt-realtime-2: alloy, ash, ballad, coral, echo, sage, shimmer, verse, marin, cedar. A OpenAI recomenda marin e cedar para a melhor qualidade Realtime. Este é um conjunto separado das vozes de texto para fala acima; não presuma que uma voz de TTS como fable, nova ou onyx seja válida para sessões Realtime.
As pontes Realtime de backend da OpenAI usam o formato de sessão WebSocket Realtime GA, que não aceita session.temperature. Implantações do Azure OpenAI continuam disponíveis por meio de azureEndpoint e azureDeployment e mantêm o formato de sessão compatível com a implantação. Oferece suporte a chamadas de ferramentas bidirecionais e áudio G.711 u-law.
A voz Realtime é selecionada quando a sessão é criada. A OpenAI permite que a maioria dos campos da sessão seja alterada depois, mas a voz não pode ser alterada depois que o modelo tiver emitido áudio nessa sessão. O OpenClaw atualmente expõe os ids de voz Realtime integrados como strings.
O Talk da interface de controle usa sessões Realtime da OpenAI no navegador com um segredo de cliente efêmero emitido pelo Gateway e uma troca SDP WebRTC direta do navegador com a API Realtime da OpenAI. Quando nenhuma chave de API direta da OpenAI está configurada, o Gateway pode emitir esse segredo de cliente com o perfil OAuth openai-codex selecionado. O relay do Gateway e as pontes WebSocket Realtime de backend do Voice Call usam o mesmo fallback OAuth para endpoints nativos da OpenAI. A verificação ao vivo de mantenedor está disponível com OPENAI_API_KEY=... GEMINI_API_KEY=... node --import tsx scripts/dev/realtime-talk-live-smoke.ts; os trechos da OpenAI verificam tanto a ponte WebSocket de backend quanto a troca SDP WebRTC do navegador sem registrar segredos.

Endpoints do Azure OpenAI

O provedor openai incluído pode apontar para um recurso do Azure OpenAI para geração de imagens substituindo a URL base. No caminho de geração de imagens, o OpenClaw detecta nomes de host do Azure em models.providers.openai.baseUrl e muda para o formato de solicitação do Azure automaticamente.
A voz em tempo real usa um caminho de configuração separado (plugins.entries.voice-call.config.realtime.providers.openai.azureEndpoint) e não é afetada por models.providers.openai.baseUrl. Consulte o acordeão Voz em tempo real em Voz e fala para suas configurações do Azure.
Use o Azure OpenAI quando:
  • Você já tem uma assinatura, cota ou contrato empresarial do Azure OpenAI
  • Você precisa de residência regional de dados ou controles de conformidade fornecidos pelo Azure
  • Você quer manter o tráfego dentro de uma locação existente do Azure

Configuração

Para geração de imagens do Azure por meio do provedor openai incluído, aponte models.providers.openai.baseUrl para o seu recurso do Azure e defina apiKey como a chave do Azure OpenAI (não uma chave da OpenAI Platform):
{
  models: {
    providers: {
      openai: {
        baseUrl: "https://<your-resource>.openai.azure.com",
        apiKey: "<azure-openai-api-key>",
      },
    },
  },
}
O OpenClaw reconhece estes sufixos de host do Azure para a rota de geração de imagens do Azure:
  • *.openai.azure.com
  • *.services.ai.azure.com
  • *.cognitiveservices.azure.com
Para solicitações de geração de imagens em um host do Azure reconhecido, o OpenClaw:
  • Envia o cabeçalho api-key em vez de Authorization: Bearer
  • Usa caminhos com escopo de implantação (/openai/deployments/{deployment}/...)
  • Anexa ?api-version=... a cada solicitação
  • Usa um tempo limite de solicitação padrão de 600s para chamadas de geração de imagens do Azure. Valores timeoutMs por chamada ainda substituem esse padrão.
Outras URLs base (OpenAI pública, proxies compatíveis com OpenAI) mantêm o formato padrão de solicitação de imagem da OpenAI.
O roteamento do Azure para o caminho de geração de imagens do provedor openai requer OpenClaw 2026.4.22 ou posterior. Versões anteriores tratam qualquer openai.baseUrl personalizado como o endpoint público da OpenAI e falharão em implantações de imagens do Azure.

Versão da API

Defina AZURE_OPENAI_API_VERSION para fixar uma versão específica de preview ou GA do Azure para o caminho de geração de imagens do Azure:
export AZURE_OPENAI_API_VERSION="2024-12-01-preview"
O padrão é 2024-12-01-preview quando a variável não está definida.

Nomes de modelos são nomes de implantação

O Azure OpenAI vincula modelos a implantações. Para solicitações de geração de imagens do Azure roteadas pelo provedor openai incluído, o campo model no OpenClaw deve ser o nome da implantação do Azure que você configurou no portal do Azure, não o ID público do modelo da OpenAI. Se você criar uma implantação chamada gpt-image-2-prod que serve gpt-image-2:
/tool image_generate model=openai/gpt-image-2-prod prompt="A clean poster" size=1024x1024 count=1
A mesma regra de nome de implantação se aplica às chamadas de geração de imagens roteadas pelo provedor openai incluído.

Disponibilidade regional

A geração de imagens do Azure está disponível atualmente apenas em um subconjunto de regiões (por exemplo, eastus2, swedencentral, polandcentral, westus3, uaenorth). Verifique a lista atual de regiões da Microsoft antes de criar uma implantação e confirme se o modelo específico é oferecido na sua região.

Diferenças de parâmetros

O Azure OpenAI e a OpenAI pública nem sempre aceitam os mesmos parâmetros de imagem. O Azure pode rejeitar opções que a OpenAI pública permite (por exemplo, certos valores de background em gpt-image-2) ou expô-las apenas em versões específicas de modelo. Essas diferenças vêm do Azure e do modelo subjacente, não do OpenClaw. Se uma solicitação do Azure falhar com um erro de validação, verifique o conjunto de parâmetros compatível com sua implantação específica e versão da API no portal do Azure.
O Azure OpenAI usa transporte nativo e comportamento compatível, mas não recebe os cabeçalhos ocultos de atribuição do OpenClaw — veja o acordeão Rotas nativas vs. compatíveis com OpenAI em Configuração avançada.Para tráfego de chat ou Responses no Azure (além da geração de imagens), use o fluxo de integração ou uma configuração dedicada de provedor do Azure — openai.baseUrl sozinho não adota o formato de API/autenticação do Azure. Existe um provedor separado azure-openai-responses/*; veja o acordeão de compactação no lado do servidor abaixo.

Configuração avançada

O OpenClaw usa WebSocket primeiro com fallback para SSE ("auto") para openai/*.No modo "auto", o OpenClaw:
  • Tenta novamente uma falha inicial de WebSocket antes de fazer fallback para SSE
  • Após uma falha, marca o WebSocket como degradado por ~60 segundos e usa SSE durante o período de resfriamento
  • Anexa cabeçalhos estáveis de identidade de sessão e turno para novas tentativas e reconexões
  • Normaliza contadores de uso (input_tokens / prompt_tokens) entre variantes de transporte
ValorComportamento
"auto" (padrão)WebSocket primeiro, fallback para SSE
"sse"Forçar apenas SSE
"websocket"Forçar apenas WebSocket
{
  agents: {
    defaults: {
      models: {
        "openai/gpt-5.5": {
          params: { transport: "auto" },
        },
      },
    },
  },
}
Documentação relacionada da OpenAI:
O OpenClaw expõe um alternador compartilhado de modo rápido para openai/*:
  • Chat/UI: /fast status|on|off
  • Configuração: agents.defaults.models["<provider>/<model>"].params.fastMode
Quando ativado, o OpenClaw mapeia o modo rápido para o processamento prioritário da OpenAI (service_tier = "priority"). Valores existentes de service_tier são preservados, e o modo rápido não reescreve reasoning nem text.verbosity.
{
  agents: {
    defaults: {
      models: {
        "openai/gpt-5.5": { params: { fastMode: true } },
      },
    },
  },
}
Substituições de sessão prevalecem sobre a configuração. Limpar a substituição da sessão na UI de Sessões retorna a sessão ao padrão configurado.
A API da OpenAI expõe processamento prioritário por meio de service_tier. Defina-o por modelo no OpenClaw:
{
  agents: {
    defaults: {
      models: {
        "openai/gpt-5.5": { params: { serviceTier: "priority" } },
      },
    },
  },
}
Valores compatíveis: auto, default, flex, priority.
serviceTier é encaminhado apenas para endpoints nativos da OpenAI (api.openai.com) e endpoints nativos do Codex (chatgpt.com/backend-api). Se você rotear qualquer um dos provedores por um proxy, o OpenClaw deixa service_tier intacto.
Para modelos OpenAI Responses diretos (openai/* em api.openai.com), o wrapper de stream do harness Pi do Plugin OpenAI ativa automaticamente a compactação no lado do servidor:
  • Força store: true (a menos que a compatibilidade do modelo defina supportsStore: false)
  • Injeta context_management: [{ type: "compaction", compact_threshold: ... }]
  • compact_threshold padrão: 70% de contextWindow (ou 80000 quando indisponível)
Isso se aplica ao caminho integrado do harness Pi e aos hooks do provedor OpenAI usados por execuções incorporadas. O harness nativo do servidor de apps Codex gerencia seu próprio contexto por meio do Codex e é configurado pela rota padrão de agente da OpenAI ou pela política de runtime de provedor/modelo.
Útil para endpoints compatíveis, como Azure OpenAI Responses:
{
  agents: {
    defaults: {
      models: {
        "azure-openai-responses/gpt-5.5": {
          params: { responsesServerCompaction: true },
        },
      },
    },
  },
}
responsesServerCompaction controla apenas a injeção de context_management. Modelos OpenAI Responses diretos ainda forçam store: true, a menos que a compatibilidade defina supportsStore: false.
Para execuções da família GPT-5 em openai/*, o OpenClaw pode usar um contrato de execução incorporado mais estrito:
{
  agents: {
    defaults: {
      embeddedPi: { executionContract: "strict-agentic" },
    },
  },
}
Com strict-agentic, o OpenClaw:
  • Não trata mais um turno apenas com plano como progresso bem-sucedido quando uma ação de ferramenta está disponível
  • Tenta novamente o turno com uma orientação para agir agora
  • Ativa automaticamente update_plan para trabalhos substanciais
  • Expõe um estado bloqueado explícito se o modelo continuar planejando sem agir
Escopo limitado apenas a execuções das famílias GPT-5 da OpenAI e do Codex. Outros provedores e famílias de modelos mais antigas mantêm o comportamento padrão.
O OpenClaw trata endpoints diretos da OpenAI, Codex e Azure OpenAI de forma diferente de proxies /v1 genéricos compatíveis com OpenAI:Rotas nativas (openai/*, Azure OpenAI):
  • Mantêm reasoning: { effort: "none" } apenas para modelos compatíveis com o esforço none da OpenAI
  • Omitem raciocínio desativado para modelos ou proxies que rejeitam reasoning.effort: "none"
  • Definem esquemas de ferramentas como modo estrito por padrão
  • Anexam cabeçalhos ocultos de atribuição apenas em hosts nativos verificados
  • Mantêm formatação de solicitação exclusiva da OpenAI (service_tier, store, compatibilidade de raciocínio, dicas de cache de prompt)
Rotas proxy/compatíveis:
  • Usam comportamento de compatibilidade mais flexível
  • Removem store de Completions de payloads openai-completions não nativos
  • Aceitam JSON avançado de passagem direta params.extra_body/params.extraBody para proxies Completions compatíveis com OpenAI
  • Aceitam params.chat_template_kwargs para proxies Completions compatíveis com OpenAI, como vLLM
  • Não forçam esquemas de ferramentas estritos nem cabeçalhos exclusivos de rotas nativas
O Azure OpenAI usa transporte nativo e comportamento compatível, mas não recebe os cabeçalhos ocultos de atribuição.

Relacionado

Seleção de modelo

Escolha de provedores, referências de modelo e comportamento de failover.

Geração de imagens

Parâmetros compartilhados da ferramenta de imagem e seleção de provedor.

Geração de vídeo

Parâmetros compartilhados da ferramenta de vídeo e seleção de provedor.

OAuth e autenticação

Detalhes de autenticação e regras de reutilização de credenciais.