Concepts and configuration
Proveedores de modelos
Referencia para proveedores de LLM/modelos (no canales de chat como WhatsApp/Telegram). Para las reglas de selección de modelos, consulta Modelos.
Reglas rápidas
Referencias de modelo y ayudantes de la CLI
- Las referencias de modelo usan
provider/model(ejemplo:opencode/claude-opus-4-6). agents.defaults.modelsactúa como una lista de permitidos cuando está configurado.- Ayudantes de la CLI:
openclaw onboard,openclaw models list,openclaw models set <provider/model>. models.providers.*.contextWindow/contextTokens/maxTokensestablecen valores predeterminados a nivel de proveedor;models.providers.*.models[].contextWindow/contextTokens/maxTokenslos anulan por modelo.- Reglas de respaldo, sondeos de enfriamiento y persistencia de anulaciones de sesión: Conmutación por error de modelo.
Agregar autenticación de proveedor no cambia tu modelo principal
openclaw configure conserva un agents.defaults.model.primary existente cuando agregas o vuelves a autenticar un proveedor. openclaw models auth login hace lo mismo salvo que pases --set-default. Los Plugins de proveedor aún pueden devolver un modelo predeterminado recomendado en su parche de configuración de autenticación, pero OpenClaw lo trata como "hacer que este modelo esté disponible" cuando ya existe un modelo principal, no como "reemplazar el modelo principal actual".
Para cambiar intencionalmente el modelo predeterminado, usa openclaw models set <provider/model> o openclaw models auth login --provider <id> --set-default.
Separación entre proveedor y runtime de OpenAI
Las rutas de la familia OpenAI son específicas por prefijo:
openai/<model>usa de forma predeterminada el arnés nativo de servidor de aplicación Codex para turnos de agente. Esta es la configuración habitual de suscripción de ChatGPT/Codex.- las referencias de modelo heredadas de Codex son configuración heredada que doctor reescribe a
openai/<model>. openai/<model>másagentRuntime.id: "openclaw"de proveedor/modelo usa el runtime integrado de OpenClaw para rutas explícitas de clave de API o compatibilidad.
Consulta OpenAI y Arnés de Codex. Si la separación entre proveedor y runtime resulta confusa, lee primero Runtimes de agente.
La activación automática de Plugins sigue el mismo límite: las referencias de agente openai/* activan el Plugin de Codex para la ruta predeterminada, y agentRuntime.id: "codex" explícito de proveedor/modelo o las referencias heredadas codex/<model> también lo requieren.
GPT-5.5 está disponible a través del arnés nativo de servidor de aplicación Codex de forma predeterminada en openai/gpt-5.5, y a través del runtime de OpenClaw cuando la política de runtime de proveedor/modelo selecciona explícitamente openclaw.
Runtimes de CLI
Los runtimes de CLI usan la misma separación: elige referencias de modelo canónicas como anthropic/claude-* o google/gemini-*, y luego establece la política de runtime de proveedor/modelo en claude-cli o google-gemini-cli cuando quieras un backend de CLI local.
Las referencias heredadas claude-cli/* y google-gemini-cli/* migran de vuelta a referencias de proveedor canónicas con el runtime registrado por separado. Las referencias heredadas codex-cli/* migran a openai/* y usan la ruta de servidor de aplicación Codex; OpenClaw ya no mantiene un backend de CLI de Codex incluido.
Comportamiento de proveedor propiedad del Plugin
La mayor parte de la lógica específica de proveedor vive en los Plugins de proveedor (registerProvider(...)), mientras OpenClaw conserva el bucle de inferencia genérico. Los Plugins son responsables de la incorporación, los catálogos de modelos, la asignación de variables de entorno de autenticación, la normalización de transporte/configuración, la limpieza del esquema de herramientas, la clasificación de conmutación por error, la actualización OAuth, los informes de uso, los perfiles de pensamiento/razonamiento y más.
La lista completa de hooks del SDK de proveedor y ejemplos de Plugins incluidos está en Plugins de proveedor. Un proveedor que necesita un ejecutor de solicitudes totalmente personalizado es una superficie de extensión separada y más profunda.
Rotación de claves de API
Fuentes de claves y prioridad
Configura varias claves mediante:
OPENCLAW_LIVE_<PROVIDER>_KEY(anulación live única, máxima prioridad)<PROVIDER>_API_KEYS(lista separada por comas o punto y coma)<PROVIDER>_API_KEY(clave principal)<PROVIDER>_API_KEY_*(lista numerada, por ejemplo<PROVIDER>_API_KEY_1)
Para proveedores de Google, GOOGLE_API_KEY también se incluye como respaldo. El orden de selección de claves conserva la prioridad y elimina valores duplicados.
Cuándo se activa la rotación
- Las solicitudes se reintentan con la siguiente clave solo ante respuestas de límite de frecuencia (por ejemplo
429,rate_limit,quota,resource exhausted,Too many concurrent requests,ThrottlingException,concurrency limit reached,workers_ai ... quota limit exceededo mensajes periódicos de límite de uso). - Los fallos que no son de límite de frecuencia fallan de inmediato; no se intenta rotación de claves.
- Cuando todas las claves candidatas fallan, se devuelve el error final del último intento.
Plugins de proveedor oficiales
Los Plugins de proveedor oficiales publican sus propias filas de catálogo de modelos. Estos proveedores no requieren entradas de modelo en models.providers; activa el Plugin de proveedor, configura la autenticación y elige un modelo. Usa models.providers solo para proveedores personalizados explícitos o ajustes estrechos de solicitudes, como tiempos de espera.
OpenAI
- Proveedor:
openai - Autenticación:
OPENAI_API_KEY - Rotación opcional:
OPENAI_API_KEYS,OPENAI_API_KEY_1,OPENAI_API_KEY_2, másOPENCLAW_LIVE_OPENAI_KEY(anulación única) - Modelos de ejemplo:
openai/gpt-5.5,openai/gpt-5.4-mini - Verifica la disponibilidad de cuenta/modelo con
openclaw models list --provider openaisi una instalación o clave de API específica se comporta de forma diferente. - CLI:
openclaw onboard --auth-choice openai-api-key - El transporte predeterminado es
auto; OpenClaw pasa la elección de transporte al runtime de modelo compartido. - Anula por modelo mediante
agents.defaults.models["openai/<model>"].params.transport("sse","websocket"o"auto") - El procesamiento prioritario de OpenAI se puede activar mediante
agents.defaults.models["openai/<model>"].params.serviceTier /fastyparams.fastModeasignan las solicitudes directas de Responsesopenai/*aservice_tier=priorityenapi.openai.com- Usa
params.serviceTiercuando quieras un nivel explícito en lugar del conmutador compartido/fast - Los encabezados ocultos de atribución de OpenClaw (
originator,version,User-Agent) se aplican solo en tráfico nativo de OpenAI haciaapi.openai.com, no en proxies genéricos compatibles con OpenAI - Las rutas nativas de OpenAI también conservan
storede Responses, sugerencias de caché de prompts y la conformación de carga útil compatible con razonamiento de OpenAI; las rutas proxy no openai/gpt-5.3-codex-sparkestá disponible mediante autenticación de suscripción OAuth de ChatGPT/Codex cuando tu cuenta iniciada la expone; OpenClaw sigue suprimiendo rutas directas con clave de API de OpenAI y clave de API de Azure para este modelo porque esos transportes lo rechazan
{ agents: { defaults: { model: { primary: "openai/gpt-5.5" } } },}Anthropic
- Proveedor:
anthropic - Autenticación:
ANTHROPIC_API_KEY - Rotación opcional:
ANTHROPIC_API_KEYS,ANTHROPIC_API_KEY_1,ANTHROPIC_API_KEY_2, másOPENCLAW_LIVE_ANTHROPIC_KEY(anulación única) - Modelo de ejemplo:
anthropic/claude-opus-4-6 - CLI:
openclaw onboard --auth-choice apiKey - Las solicitudes públicas directas de Anthropic admiten el conmutador compartido
/fastyparams.fastMode, incluido el tráfico autenticado con clave de API y OAuth enviado aapi.anthropic.com; OpenClaw lo asigna aservice_tierde Anthropic (autofrente astandard_only) - La configuración preferida de Claude CLI mantiene la referencia de modelo canónica y selecciona el backend de CLI por separado:
anthropic/claude-opus-4-8conagentRuntime.id: "claude-cli"con alcance de modelo. Las referencias heredadasclaude-cli/claude-opus-4-7siguen funcionando por compatibilidad.
{ agents: { defaults: { model: { primary: "anthropic/claude-opus-4-6" } } },}OAuth de OpenAI ChatGPT/Codex
- Proveedor:
openai - Autenticación: OAuth (ChatGPT)
- Referencia de modelo heredada de OpenAI Codex:
openai/gpt-5.5 - Referencia del arnés nativo de servidor de aplicación Codex:
openai/gpt-5.5 - Documentación del arnés nativo de servidor de aplicación Codex: Arnés de Codex
- Referencias de modelo heredadas:
codex/gpt-* - Límite de Plugin:
openai/*carga el Plugin de OpenAI; el Plugin nativo de servidor de aplicación Codex lo selecciona el runtime del arnés de Codex. - CLI:
openclaw onboard --auth-choice openaioopenclaw models auth login --provider openai - El transporte predeterminado es
auto(WebSocket primero, SSE como respaldo) - Anula por modelo de OpenAI Codex mediante
agents.defaults.models["openai/<model>"].params.transport("sse","websocket"o"auto") params.serviceTiertambién se reenvía en solicitudes nativas de Responses de Codex (chatgpt.com/backend-api)- Los encabezados ocultos de atribución de OpenClaw (
originator,version,User-Agent) solo se adjuntan en tráfico nativo de Codex haciachatgpt.com/backend-api, no en proxies genéricos compatibles con OpenAI - Comparte el mismo conmutador
/fasty la configuraciónparams.fastModequeopenai/*directo; OpenClaw lo asigna aservice_tier=priority openai/gpt-5.5usa elcontextWindow = 400000nativo del catálogo de Codex y el runtime predeterminadocontextTokens = 272000; anula el límite del runtime conmodels.providers.openai.models[].contextTokens- Nota de política: OpenAI Codex OAuth es compatible explícitamente con herramientas/flujos de trabajo externos como OpenClaw.
- Para la ruta común de suscripción más runtime nativo de Codex, inicia sesión con autenticación
openaiy configuraopenai/gpt-5.5; los turnos de agente de OpenAI seleccionan Codex de forma predeterminada. - Usa
agentRuntime.id: "openclaw"de proveedor/modelo solo cuando quieras la ruta integrada de OpenClaw; de lo contrario, manténopenai/gpt-5.5en el arnés predeterminado de Codex. - las referencias GPT heredadas de Codex son estado heredado, no una ruta de proveedor live. Usa
openai/gpt-5.5en el runtime nativo de Codex para nueva configuración de agente y ejecutaopenclaw doctor --fixpara migrar referencias de modelo heredadas antiguas de Codex a referencias canónicasopenai/*.
{ plugins: { entries: { codex: { enabled: true } } }, agents: { defaults: { model: { primary: "openai/gpt-5.5" }, }, },}{ models: { providers: { openai: { models: [{ id: "gpt-5.5", contextTokens: 160000 }], }, }, },}Otras opciones alojadas con estilo de suscripción
Plan de Codificación de Z.AI o endpoints de API generales.
OAuth del Plan de Codificación de MiniMax o acceso con clave de API.
Superficie de proveedor de Qwen Cloud más asignación de endpoints de Alibaba DashScope y del Plan de Codificación.
OpenCode
- Autenticación:
OPENCODE_API_KEY(oOPENCODE_ZEN_API_KEY) - Proveedor de runtime Zen:
opencode - Proveedor de runtime Go:
opencode-go - Modelos de ejemplo:
opencode/claude-opus-4-6,opencode-go/kimi-k2.6 - CLI:
openclaw onboard --auth-choice opencode-zenoopenclaw onboard --auth-choice opencode-go
{ agents: { defaults: { model: { primary: "opencode/claude-opus-4-6" } } },}Google Gemini (clave de API)
- Proveedor:
google - Autenticación:
GEMINI_API_KEY - Rotación opcional:
GEMINI_API_KEYS,GEMINI_API_KEY_1,GEMINI_API_KEY_2, respaldo deGOOGLE_API_KEYyOPENCLAW_LIVE_GEMINI_KEY(sobrescritura única) - Modelos de ejemplo:
google/gemini-3.1-pro-preview,google/gemini-3-flash-preview - Compatibilidad: la configuración heredada de OpenClaw que usa
google/gemini-3.1-flash-previewse normaliza agoogle/gemini-3-flash-preview - Alias: se acepta
google/gemini-3.1-proy se normaliza al id de la API Gemini en vivo de Google,google/gemini-3.1-pro-preview - CLI:
openclaw onboard --auth-choice gemini-api-key - Razonamiento:
/think adaptiveusa el razonamiento dinámico de Google. Gemini 3/3.1 omiten unthinkingLevelfijo; Gemini 2.5 envíathinkingBudget: -1. - Las ejecuciones directas de Gemini también aceptan
agents.defaults.models["google/<model>"].params.cachedContent(o el heredadocached_content) para reenviar un identificador nativo del proveedorcachedContents/...; los aciertos de caché de Gemini aparecen comocacheReadde OpenClaw
Google Vertex y Gemini CLI
- Proveedores:
google-vertex,google-gemini-cli - Autenticación: Vertex usa ADC de gcloud; Gemini CLI usa su flujo de OAuth
Gemini CLI OAuth se distribuye como parte del Plugin google incluido.
Install Gemini CLI
brew
brew install gemini-clinpm
npm install -g @google/gemini-cliEnable plugin
openclaw plugins enable googleLogin
openclaw models auth login --provider google-gemini-cli --set-defaultModelo predeterminado: google-gemini-cli/gemini-3-flash-preview. No pegas un id de cliente ni un secreto en openclaw.json. El flujo de inicio de sesión de la CLI almacena tokens en perfiles de autenticación en el host del Gateway.
Set project (if needed)
Si las solicitudes fallan después de iniciar sesión, define GOOGLE_CLOUD_PROJECT o GOOGLE_CLOUD_PROJECT_ID en el host del Gateway.
Gemini CLI usa stream-json de forma predeterminada. OpenClaw lee los mensajes de flujo del asistente
y normaliza stats.cached a cacheRead; las sobrescrituras heredadas de
--output-format json siguen leyendo el texto de respuesta desde response.
Z.AI (GLM)
- Proveedor:
zai - Autenticación:
ZAI_API_KEY - Modelo de ejemplo:
zai/glm-5.2 - CLI:
openclaw onboard --auth-choice zai-api-key- Las referencias de modelo usan el ID de proveedor canónico
zai/*. zai-api-keydetecta automáticamente el punto de conexión de Z.AI correspondiente;zai-coding-global,zai-coding-cn,zai-globalyzai-cnfuerzan una superficie específica
- Las referencias de modelo usan el ID de proveedor canónico
Vercel AI Gateway
- Proveedor:
vercel-ai-gateway - Autenticación:
AI_GATEWAY_API_KEY - Modelos de ejemplo:
vercel-ai-gateway/anthropic/claude-opus-4.6,vercel-ai-gateway/moonshotai/kimi-k2.6 - CLI:
openclaw onboard --auth-choice ai-gateway-api-key
Otros Plugins de proveedor incluidos
| Proveedor | Id | Env de autenticación | Modelo de ejemplo |
|---|---|---|---|
| BytePlus | byteplus / byteplus-plan |
BYTEPLUS_API_KEY |
byteplus-plan/ark-code-latest |
| ClawRouter | clawrouter |
CLAWROUTER_API_KEY |
clawrouter/anthropic/claude-sonnet-4-6 |
| Cohere | cohere |
COHERE_API_KEY |
cohere/command-a-03-2025 |
| GitHub Copilot | github-copilot |
COPILOT_GITHUB_TOKEN / GH_TOKEN / GITHUB_TOKEN |
- |
| Hugging Face Inference | huggingface |
HUGGINGFACE_HUB_TOKEN o HF_TOKEN |
huggingface/deepseek-ai/DeepSeek-R1 |
| MiniMax | minimax / minimax-portal |
MINIMAX_API_KEY / MINIMAX_OAUTH_TOKEN |
minimax/MiniMax-M3 |
| Mistral | mistral |
MISTRAL_API_KEY |
mistral/mistral-large-latest |
| Moonshot | moonshot |
MOONSHOT_API_KEY |
moonshot/kimi-k2.6 |
| NVIDIA | nvidia |
NVIDIA_API_KEY |
nvidia/nvidia/nemotron-3-ultra-550b-a55b |
| NovitaAI | novita |
NOVITA_API_KEY |
novita/deepseek/deepseek-v3-0324 |
| Ollama Cloud | ollama-cloud |
OLLAMA_API_KEY |
ollama-cloud/kimi-k2.6 |
| OpenRouter | openrouter |
OpenRouter OAuth o OPENROUTER_API_KEY |
openrouter/auto |
| Qwen OAuth | qwen-oauth |
QWEN_API_KEY |
qwen-oauth/qwen3.5-plus |
| Together | together |
TOGETHER_API_KEY |
together/meta-llama/Llama-3.3-70B-Instruct-Turbo |
| Venice | venice |
VENICE_API_KEY |
- |
| Vercel AI Gateway | vercel-ai-gateway |
AI_GATEWAY_API_KEY |
vercel-ai-gateway/anthropic/claude-opus-4.6 |
| Volcano Engine (Doubao) | volcengine / volcengine-plan |
VOLCANO_ENGINE_API_KEY |
volcengine-plan/ark-code-latest |
| xAI | xai |
SuperGrok/X Premium OAuth o XAI_API_KEY |
xai/grok-4.3 |
| Xiaomi | xiaomi / xiaomi-token-plan |
XIAOMI_API_KEY / XIAOMI_TOKEN_PLAN_API_KEY |
xiaomi/mimo-v2-flash / xiaomi-token-plan/mimo-v2.5-pro |
Particularidades que conviene conocer
OpenRouter
Aplica sus encabezados de atribución de aplicación y marcadores cache_control de Anthropic solo en rutas verificadas de openrouter.ai. Las referencias de DeepSeek, Moonshot y ZAI son aptas para TTL de caché en el almacenamiento en caché de prompts gestionado por OpenRouter, pero no reciben marcadores de caché de Anthropic. Como ruta de proxy compatible con OpenAI, omite el modelado exclusivo de OpenAI nativo (serviceTier, store de Responses, indicios de caché de prompts, compatibilidad de razonamiento de OpenAI). Las referencias respaldadas por Gemini conservan solo el saneamiento de firmas de pensamiento de proxy-Gemini.
Kilo Gateway
Las referencias respaldadas por Gemini siguen la misma ruta de saneamiento de proxy-Gemini; kilocode/kilo/auto y otras referencias de proxy sin soporte de razonamiento omiten la inyección de razonamiento de proxy.
MiniMax
La incorporación con clave de API escribe definiciones explícitas de modelos de chat M3 y M2.7; la comprensión de imágenes permanece en el proveedor multimedia MiniMax-VL-01 propiedad del Plugin.
NVIDIA
Los ids de modelo usan un espacio de nombres nvidia/<vendor>/<model> (por ejemplo nvidia/nvidia/nemotron-... junto a nvidia/moonshotai/kimi-k2.5); los selectores conservan la composición literal <provider>/<model-id> mientras que la clave canónica enviada a la API permanece con un solo prefijo.
xAI
Usa la ruta Responses de xAI. La ruta recomendada es SuperGrok/X Premium OAuth; las claves de API siguen funcionando mediante XAI_API_KEY o la configuración del Plugin, y web_search de Grok reutiliza el mismo perfil de autenticación antes del respaldo con clave de API. grok-4.3 es el modelo de chat predeterminado incluido, y grok-build-0.1 se puede seleccionar para trabajo centrado en compilación/codificación. /fast o params.fastMode: true reescribe grok-3, grok-3-mini, grok-4 y grok-4-0709 a sus variantes *-fast. tool_stream está activado de forma predeterminada; desactívalo mediante agents.defaults.models["xai/<model>"].params.tool_stream=false.
Proveedores mediante models.providers (URL personalizada/base)
Usa models.providers (o models.json) para añadir proveedores personalizados o proxies compatibles con OpenAI/Anthropic.
Muchos de los Plugins de proveedor incluidos a continuación ya publican un catálogo predeterminado. Usa entradas explícitas models.providers.<id> solo cuando quieras anular la URL base, los encabezados o la lista de modelos predeterminados.
Las comprobaciones de capacidades de modelos del Gateway también leen metadatos explícitos de models.providers.<id>.models[]. Si un modelo personalizado o proxy acepta imágenes, configura input: ["text", "image"] en ese modelo para que WebChat y las rutas de adjuntos originadas en Node pasen imágenes como entradas nativas del modelo en lugar de referencias de medios solo de texto.
agents.defaults.models["provider/model"] solo controla la visibilidad del modelo, los alias y los metadatos por modelo para los agentes. No registra por sí solo un nuevo modelo de tiempo de ejecución. Para modelos de proveedores personalizados, añade también models.providers.<provider>.models[] con al menos el id correspondiente.
Moonshot AI (Kimi)
Instala @openclaw/moonshot-provider antes de la incorporación. Añade una entrada explícita models.providers.moonshot solo cuando necesites anular la URL base o los metadatos del modelo:
- Proveedor:
moonshot - Autenticación:
MOONSHOT_API_KEY - Modelo de ejemplo:
moonshot/kimi-k2.6 - CLI:
openclaw onboard --auth-choice moonshot-api-keyoopenclaw onboard --auth-choice moonshot-api-key-cn
IDs de modelo Kimi K2:
moonshot/kimi-k2.6moonshot/kimi-k2.7-codemoonshot/kimi-k2.5moonshot/kimi-k2-thinkingmoonshot/kimi-k2-thinking-turbomoonshot/kimi-k2-turbo
{ agents: { defaults: { model: { primary: "moonshot/kimi-k2.6" } }, }, models: { mode: "merge", providers: { moonshot: { baseUrl: "https://api.moonshot.ai/v1", apiKey: "${MOONSHOT_API_KEY}", api: "openai-completions", models: [{ id: "kimi-k2.6", name: "Kimi K2.6" }], }, }, },}Programación con Kimi
Kimi Coding usa el endpoint compatible con Anthropic de Moonshot AI:
- Proveedor:
kimi - Autenticación:
KIMI_API_KEY - Modelo de ejemplo:
kimi/kimi-for-coding
{ env: { KIMI_API_KEY: "sk-..." }, agents: { defaults: { model: { primary: "kimi/kimi-for-coding" } }, },}Los id de modelo heredados kimi/kimi-code y kimi/k2p5 siguen aceptándose por compatibilidad y se normalizan al id de modelo de API estable de Kimi.
Volcano Engine (Doubao)
Volcano Engine (火山引擎) proporciona acceso a Doubao y a otros modelos en China.
- Proveedor:
volcengine(programación:volcengine-plan) - Autenticación:
VOLCANO_ENGINE_API_KEY - Modelo de ejemplo:
volcengine-plan/ark-code-latest - CLI:
openclaw onboard --auth-choice volcengine-api-key
{ agents: { defaults: { model: { primary: "volcengine-plan/ark-code-latest" } }, },}La incorporación usa de forma predeterminada la superficie de codificación, pero el catálogo general volcengine/* se registra al mismo tiempo.
En los selectores de modelos de incorporación/configuración, la opción de autenticación de Volcengine prefiere tanto las filas volcengine/* como volcengine-plan/*. Si esos modelos aún no se han cargado, OpenClaw recurre al catálogo sin filtrar en lugar de mostrar un selector vacío limitado al proveedor.
Modelos estándar
volcengine/doubao-seed-1-8-251228(Doubao Seed 1.8)volcengine/doubao-seed-code-preview-251028volcengine/kimi-k2-5-260127(Kimi K2.5)volcengine/glm-4-7-251222(GLM 4.7)volcengine/deepseek-v3-2-251201(DeepSeek V3.2 128K)
Modelos de codificación (volcengine-plan)
volcengine-plan/ark-code-latestvolcengine-plan/doubao-seed-codevolcengine-plan/kimi-k2.5volcengine-plan/kimi-k2-thinkingvolcengine-plan/glm-4.7
BytePlus (Internacional)
BytePlus ARK proporciona acceso a los mismos modelos que Volcano Engine para usuarios internacionales.
- Proveedor:
byteplus(codificación:byteplus-plan) - Autenticación:
BYTEPLUS_API_KEY - Modelo de ejemplo:
byteplus-plan/ark-code-latest - CLI:
openclaw onboard --auth-choice byteplus-api-key
{ agents: { defaults: { model: { primary: "byteplus-plan/ark-code-latest" } }, },}La incorporación usa de forma predeterminada la superficie de codificación, pero el catálogo general byteplus/* se registra al mismo tiempo.
En los selectores de modelos de incorporación/configuración, la opción de autenticación de BytePlus prefiere tanto las filas byteplus/* como byteplus-plan/*. Si esos modelos aún no se han cargado, OpenClaw recurre al catálogo sin filtrar en lugar de mostrar un selector vacío limitado al proveedor.
Modelos estándar
byteplus/seed-1-8-251228(Seed 1.8)byteplus/kimi-k2-5-260127(Kimi K2.5)byteplus/glm-4-7-251222(GLM 4.7)
Modelos de codificación (byteplus-plan)
byteplus-plan/ark-code-latestbyteplus-plan/doubao-seed-codebyteplus-plan/kimi-k2.5byteplus-plan/kimi-k2-thinkingbyteplus-plan/glm-4.7
Synthetic
Synthetic proporciona modelos compatibles con Anthropic detrás del proveedor synthetic:
- Proveedor:
synthetic - Autenticación:
SYNTHETIC_API_KEY - Modelo de ejemplo:
synthetic/hf:MiniMaxAI/MiniMax-M2.5 - CLI:
openclaw onboard --auth-choice synthetic-api-key
{ agents: { defaults: { model: { primary: "synthetic/hf:MiniMaxAI/MiniMax-M2.5" } }, }, models: { mode: "merge", providers: { synthetic: { baseUrl: "https://api.synthetic.new/anthropic", apiKey: "${SYNTHETIC_API_KEY}", api: "anthropic-messages", models: [{ id: "hf:MiniMaxAI/MiniMax-M2.5", name: "MiniMax M2.5" }], }, }, },}MiniMax
MiniMax se configura mediante models.providers porque usa endpoints personalizados:
- MiniMax OAuth (Global):
--auth-choice minimax-global-oauth - MiniMax OAuth (CN):
--auth-choice minimax-cn-oauth - Clave de API de MiniMax (Global):
--auth-choice minimax-global-api - Clave de API de MiniMax (CN):
--auth-choice minimax-cn-api - Autenticación:
MINIMAX_API_KEYparaminimax;MINIMAX_OAUTH_TOKENoMINIMAX_API_KEYparaminimax-portal
Consulta /providers/minimax para obtener detalles de configuración, opciones de modelos y fragmentos de configuración.
División de capacidades propiedad del Plugin:
- Los valores predeterminados de texto/chat permanecen en
minimax/MiniMax-M3 - La generación de imágenes es
minimax/image-01ominimax-portal/image-01 - La comprensión de imágenes es
MiniMax-VL-01, propiedad del Plugin, en ambas rutas de autenticación de MiniMax - La búsqueda web permanece en el id de proveedor
minimax
LM Studio
LM Studio se distribuye como un Plugin de proveedor incluido que usa la API nativa:
- Proveedor:
lmstudio - Autenticación:
LM_API_TOKEN - URL base de inferencia predeterminada:
http://localhost:1234/v1
Después configura un modelo (reemplázalo por uno de los ID devueltos por http://localhost:1234/api/v1/models):
{ agents: { defaults: { model: { primary: "lmstudio/openai/gpt-oss-20b" } }, },}OpenClaw usa los endpoints nativos /api/v1/models y /api/v1/models/load de LM Studio para descubrimiento y carga automática, con /v1/chat/completions para inferencia de forma predeterminada. Si quieres que la carga JIT, TTL y expulsión automática de LM Studio sean propietarias del ciclo de vida del modelo, configura models.providers.lmstudio.params.preload: false. Consulta /providers/lmstudio para configuración y solución de problemas.
Ollama
Ollama se distribuye como un Plugin de proveedor incluido y usa la API nativa de Ollama:
- Proveedor:
ollama - Autenticación: no requerida (servidor local)
- Modelo de ejemplo:
ollama/llama3.3 - Instalación: https://ollama.com/download
# Install Ollama, then pull a model:ollama pull llama3.3{ agents: { defaults: { model: { primary: "ollama/llama3.3" } }, },}Ollama se detecta localmente en http://127.0.0.1:11434 cuando habilitas OLLAMA_API_KEY, y el Plugin de proveedor incluido agrega Ollama directamente a openclaw onboard y al selector de modelos. Consulta /providers/ollama para incorporación, modo cloud/local y configuración personalizada.
vLLM
vLLM se distribuye como un Plugin de proveedor incluido para servidores locales/autohospedados compatibles con OpenAI:
- Proveedor:
vllm - Autenticación: opcional (depende de tu servidor)
- URL base predeterminada:
http://127.0.0.1:8000/v1
Para habilitar el descubrimiento automático localmente (cualquier valor funciona si tu servidor no exige autenticación):
export VLLM_API_KEY="vllm-local"Después configura un modelo (reemplázalo por uno de los ID devueltos por /v1/models):
{ agents: { defaults: { model: { primary: "vllm/your-model-id" } }, },}Consulta /providers/vllm para obtener detalles.
SGLang
SGLang se distribuye como un Plugin de proveedor incluido para servidores rápidos autohospedados compatibles con OpenAI:
- Proveedor:
sglang - Autenticación: opcional (depende de tu servidor)
- URL base predeterminada:
http://127.0.0.1:30000/v1
Para habilitar el descubrimiento automático localmente (cualquier valor funciona si tu servidor no exige autenticación):
export SGLANG_API_KEY="sglang-local"Después configura un modelo (reemplázalo por uno de los ID devueltos por /v1/models):
{ agents: { defaults: { model: { primary: "sglang/your-model-id" } }, },}Consulta /providers/sglang para obtener detalles.
Proxies locales (LM Studio, vLLM, LiteLLM, etc.)
Ejemplo (compatible con OpenAI):
{ agents: { defaults: { model: { primary: "lmstudio/my-local-model" }, models: { "lmstudio/my-local-model": { alias: "Local" } }, }, }, models: { providers: { lmstudio: { baseUrl: "http://localhost:1234/v1", apiKey: "${LM_API_TOKEN}", api: "openai-completions", timeoutSeconds: 300, models: [ { id: "my-local-model", name: "Local Model", reasoning: false, input: ["text"], cost: { input: 0, output: 0, cacheRead: 0, cacheWrite: 0 }, contextWindow: 200000, maxTokens: 8192, }, ], }, }, },}Campos opcionales predeterminados
Para proveedores personalizados, reasoning, input, cost, contextWindow y maxTokens son opcionales. Cuando se omiten, OpenClaw usa de forma predeterminada:
reasoning: falseinput: ["text"]cost: { input: 0, output: 0, cacheRead: 0, cacheWrite: 0 }contextWindow: 200000maxTokens: 8192
Recomendado: configura valores explícitos que coincidan con los límites de tu proxy/modelo.
Reglas de conformación de rutas de proxy
- Para
api: "openai-completions"en endpoints no nativos (cualquierbaseUrlno vacío cuyo host no seaapi.openai.com), OpenClaw fuerzacompat.supportsDeveloperRole: falsepara evitar errores 400 del proveedor por rolesdeveloperno admitidos. - Las rutas compatibles con OpenAI de estilo proxy también omiten la conformación de solicitudes exclusiva de OpenAI nativo: sin
service_tier, sin Responsesstore, sin Completionsstore, sin sugerencias de caché de prompts, sin conformación de payload de compatibilidad con razonamiento de OpenAI y sin encabezados ocultos de atribución de OpenClaw. - Para proxies de Completions compatibles con OpenAI que necesitan campos específicos del proveedor, configura
agents.defaults.models["provider/model"].params.extra_body(oextraBody) para combinar JSON adicional en el cuerpo de la solicitud saliente. - Para controles de plantillas de chat de vLLM, configura
agents.defaults.models["provider/model"].params.chat_template_kwargs. El Plugin de vLLM incluido envía automáticamenteenable_thinking: falseyforce_nonempty_content: trueparavllm/nemotron-3-*cuando el nivel de thinking de la sesión está desactivado. - Para modelos locales lentos o hosts remotos de LAN/tailnet, configura
models.providers.<id>.timeoutSeconds. Esto amplía el manejo de solicitudes HTTP de modelos del proveedor, incluida la conexión, los encabezados, el streaming del cuerpo y la cancelación total de guarded-fetch, sin aumentar el tiempo de espera de toda la ejecución del agente. Siagents.defaults.timeoutSecondso un tiempo de espera específico de la ejecución es menor, aumenta también ese límite; los tiempos de espera del proveedor no pueden ampliar toda la ejecución. - Las llamadas HTTP del proveedor de modelos permiten respuestas DNS de IP falsa de Surge, Clash y sing-box en
198.18.0.0/15yfc00::/7solo para el hostname configurado debaseUrldel proveedor. Los endpoints de proveedores personalizados/locales también confían en el origen exacto configuradoscheme://host:portpara solicitudes de modelo protegidas, incluidos hosts loopback, LAN y tailnet. Esta no es una nueva opción de configuración; elbaseUrlque configuras amplía la política de solicitudes solo para ese origen. La autorización de hostname con IP falsa y la confianza de origen exacto son mecanismos independientes. Otros destinos privados, loopback, link-local, de metadatos y puertos distintos siguen requiriendo una habilitación explícita conmodels.providers.<id>.request.allowPrivateNetwork: true. Configuramodels.providers.<id>.request.allowPrivateNetwork: falsepara desactivar la confianza de origen exacto. - Si
baseUrlestá vacío/omitido, OpenClaw mantiene el comportamiento predeterminado de OpenAI (que resuelve aapi.openai.com). - Por seguridad, un
compat.supportsDeveloperRole: trueexplícito se sigue sobrescribiendo en endpointsopenai-completionsno nativos. - Para
api: "anthropic-messages"en endpoints no directos (cualquier proveedor que no sea elanthropiccanónico, o unmodels.providers.anthropic.baseUrlpersonalizado cuyo host no sea un endpoint público deapi.anthropic.com), OpenClaw suprime los encabezados beta implícitos de Anthropic comoclaude-code-20250219,interleaved-thinking-2025-05-14y marcadores de OAuth, para que los proxies personalizados compatibles con Anthropic no rechacen flags beta no admitidos. Configuramodels.providers.<id>.headers["anthropic-beta"]explícitamente si tu proxy necesita características beta específicas.
Ejemplos de CLI
openclaw onboard --auth-choice opencode-zenopenclaw models set opencode/claude-opus-4-6openclaw models listConsulta también: Configuración para ver ejemplos completos de configuración.
Relacionado
- Referencia de configuración - claves de configuración de modelos
- Conmutación por error de modelos - cadenas de fallback y comportamiento de reintento
- Modelos - configuración y alias de modelos
- Proveedores - guías de configuración por proveedor