Concepts and configuration

मॉडल प्रदाता

LLM/model providers के लिए संदर्भ (WhatsApp/Telegram जैसे chat channels नहीं)। model चयन नियमों के लिए, Models देखें।

त्वरित नियम

Model refs और CLI helpers

Model refs provider/model का उपयोग करते हैं (उदाहरण: opencode/claude-opus-4-6)।
सेट होने पर agents.defaults.models allowlist की तरह काम करता है।
CLI helpers: openclaw onboard, openclaw models list, openclaw models set <provider/model>।
models.providers.*.contextWindow / contextTokens / maxTokens provider-स्तर के defaults सेट करते हैं; models.providers.*.models[].contextWindow / contextTokens / maxTokens उन्हें प्रति model override करते हैं।
Fallback नियम, cooldown probes, और session-override persistence: Model failover।

Provider auth जोड़ने से आपका primary model नहीं बदलता

जब आप किसी provider को जोड़ते या reauth करते हैं, तो openclaw configure मौजूदा agents.defaults.model.primary को सुरक्षित रखता है। openclaw models auth login भी ऐसा ही करता है, जब तक आप --set-default पास न करें। Provider plugins अपने auth config patch में अब भी recommended default model लौटा सकते हैं, लेकिन जब primary model पहले से मौजूद हो, तो OpenClaw इसे "इस model को उपलब्ध कराएं" के रूप में मानता है, "मौजूदा primary model को बदलें" के रूप में नहीं।

Default model को जानबूझकर बदलने के लिए, openclaw models set <provider/model> या openclaw models auth login --provider <id> --set-default का उपयोग करें।

OpenAI provider/runtime विभाजन

OpenAI-family routes prefix-specific हैं:

openai/<model> default रूप से agent turns के लिए native Codex app-server harness का उपयोग करता है। यह सामान्य ChatGPT/Codex subscription setup है।
legacy Codex model refs legacy config हैं जिन्हें doctor openai/<model> में फिर से लिखता है।
openai/<model> और provider/model agentRuntime.id: "openclaw" explicit API-key या compatibility routes के लिए OpenClaw के built-in runtime का उपयोग करते हैं।

OpenAI और Codex harness देखें। अगर provider/runtime विभाजन भ्रमित कर रहा है, तो पहले Agent runtimes पढ़ें।

Plugin auto-enable वही boundary follow करता है: openai/* agent refs default route के लिए Codex plugin enable करते हैं, और explicit provider/model agentRuntime.id: "codex" या legacy codex/<model> refs को भी इसकी आवश्यकता होती है।

GPT-5.5 default रूप से openai/gpt-5.5 पर native Codex app-server harness के माध्यम से उपलब्ध है, और OpenClaw runtime के माध्यम से तब उपलब्ध है जब provider/model runtime policy स्पष्ट रूप से openclaw चुनती है।

CLI runtimes

CLI runtimes वही विभाजन उपयोग करते हैं: anthropic/claude-* या google/gemini-* जैसे canonical model refs चुनें, फिर जब आपको local CLI backend चाहिए हो, तो provider/model runtime policy को claude-cli या google-gemini-cli पर सेट करें।

Legacy claude-cli/* और google-gemini-cli/* refs वापस canonical provider refs में migrate होते हैं, runtime अलग से recorded रहता है। Legacy codex-cli/* refs openai/* में migrate होते हैं और Codex app-server route का उपयोग करते हैं; OpenClaw अब bundled Codex CLI backend नहीं रखता।

Plugin-owned provider behavior

अधिकांश provider-specific logic provider plugins (registerProvider(...)) में रहता है, जबकि OpenClaw generic inference loop रखता है। Plugins onboarding, model catalogs, auth env-var mapping, transport/config normalization, tool-schema cleanup, failover classification, OAuth refresh, usage reporting, thinking/reasoning profiles, और बहुत कुछ own करते हैं।

provider-SDK hooks और bundled-plugin examples की पूरी सूची Provider plugins में है। जिस provider को पूरी तरह custom request executor चाहिए, वह एक अलग, गहरा extension surface है।

API key rotation

Key sources और priority

कई keys इस तरह configure करें:

OPENCLAW_LIVE_<PROVIDER>_KEY (single live override, सबसे उच्च priority)
<PROVIDER>_API_KEYS (comma या semicolon list)
<PROVIDER>_API_KEY (primary key)
<PROVIDER>_API_KEY_* (numbered list, जैसे <PROVIDER>_API_KEY_1)

Google providers के लिए, GOOGLE_API_KEY भी fallback के रूप में शामिल है। Key selection order priority को सुरक्षित रखता है और values को deduplicate करता है।

Rotation कब शुरू होता है

Requests को अगली key के साथ केवल rate-limit responses पर retry किया जाता है (उदाहरण के लिए 429, rate_limit, quota, resource exhausted, Too many concurrent requests, ThrottlingException, concurrency limit reached, workers_ai ... quota limit exceeded, या periodic usage-limit messages)।
Non-rate-limit failures तुरंत fail होते हैं; कोई key rotation attempt नहीं किया जाता।
जब सभी candidate keys fail हो जाती हैं, तो अंतिम error last attempt से लौटाया जाता है।

Official provider plugins

Official provider plugins अपनी model catalog rows publish करते हैं। इन providers को किसी models.providers model entries की आवश्यकता नहीं होती; provider plugin enable करें, auth सेट करें, और model चुनें। models.providers का उपयोग केवल explicit custom providers या timeouts जैसी narrow request settings के लिए करें।

OpenAI

Provider: openai
Auth: OPENAI_API_KEY
Optional rotation: OPENAI_API_KEYS, OPENAI_API_KEY_1, OPENAI_API_KEY_2, साथ में OPENCLAW_LIVE_OPENAI_KEY (single override)
Example models: openai/gpt-5.5, openai/gpt-5.4-mini
अगर कोई specific install या API key अलग तरह से behave करती है, तो openclaw models list --provider openai से account/model availability verify करें।
CLI: openclaw onboard --auth-choice openai-api-key
Default transport auto है; OpenClaw transport choice को shared model runtime में pass करता है।
प्रति model override करें agents.defaults.models["openai/<model>"].params.transport के जरिए ("sse", "websocket", या "auto")
OpenAI priority processing agents.defaults.models["openai/<model>"].params.serviceTier के जरिए enable की जा सकती है
/fast और params.fastMode direct openai/* Responses requests को api.openai.com पर service_tier=priority से map करते हैं
जब shared /fast toggle की जगह explicit tier चाहिए हो, तो params.serviceTier का उपयोग करें
Hidden OpenClaw attribution headers (originator, version, User-Agent) केवल api.openai.com पर native OpenAI traffic पर लागू होते हैं, generic OpenAI-compatible proxies पर नहीं
Native OpenAI routes Responses store, prompt-cache hints, और OpenAI reasoning-compat payload shaping भी बनाए रखते हैं; proxy routes ऐसा नहीं करते
openai/gpt-5.3-codex-spark ChatGPT/Codex OAuth subscription auth के माध्यम से उपलब्ध है जब आपका signed-in account इसे expose करता है; OpenClaw अब भी इस model के लिए direct OpenAI API-key और Azure API-key routes को suppress करता है क्योंकि वे transports इसे reject करते हैं

json5

{  agents: { defaults: { model: { primary: "openai/gpt-5.5" } } },}

Anthropic

Provider: anthropic
Auth: ANTHROPIC_API_KEY
Optional rotation: ANTHROPIC_API_KEYS, ANTHROPIC_API_KEY_1, ANTHROPIC_API_KEY_2, साथ में OPENCLAW_LIVE_ANTHROPIC_KEY (single override)
Example model: anthropic/claude-opus-4-6
CLI: openclaw onboard --auth-choice apiKey
Direct public Anthropic requests shared /fast toggle और params.fastMode support करते हैं, जिसमें api.anthropic.com पर भेजा गया API-key और OAuth-authenticated traffic शामिल है; OpenClaw इसे Anthropic service_tier (auto बनाम standard_only) से map करता है
Preferred Claude CLI config model ref को canonical रखता है और CLI backend को अलग से चुनता है: anthropic/claude-opus-4-8 के साथ model-scoped agentRuntime.id: "claude-cli"। Legacy claude-cli/claude-opus-4-7 refs compatibility के लिए अब भी काम करते हैं।

json5

{  agents: { defaults: { model: { primary: "anthropic/claude-opus-4-6" } } },}

OpenAI ChatGPT/Codex OAuth

Provider: openai
Auth: OAuth (ChatGPT)
Legacy OpenAI Codex model ref: openai/gpt-5.5
Native Codex app-server harness ref: openai/gpt-5.5
Native Codex app-server harness docs: Codex harness
Legacy model refs: codex/gpt-*
Plugin boundary: openai/* OpenAI plugin load करता है; native Codex app-server plugin Codex harness runtime द्वारा चुना जाता है।
CLI: openclaw onboard --auth-choice openai या openclaw models auth login --provider openai
Default transport auto है (WebSocket-first, SSE fallback)
प्रति OpenAI Codex model override करें agents.defaults.models["openai/<model>"].params.transport के जरिए ("sse", "websocket", या "auto")
params.serviceTier native Codex Responses requests (chatgpt.com/backend-api) पर भी forward किया जाता है
Hidden OpenClaw attribution headers (originator, version, User-Agent) केवल chatgpt.com/backend-api पर native Codex traffic पर attached होते हैं, generic OpenAI-compatible proxies पर नहीं
Direct openai/* जैसा वही /fast toggle और params.fastMode config share करता है; OpenClaw इसे service_tier=priority से map करता है
openai/gpt-5.5 Codex catalog native contextWindow = 400000 और default runtime contextTokens = 272000 का उपयोग करता है; runtime cap को models.providers.openai.models[].contextTokens से override करें
Policy note: OpenAI Codex OAuth OpenClaw जैसे external tools/workflows के लिए स्पष्ट रूप से supported है।
Common subscription plus native Codex runtime route के लिए, openai auth से sign in करें और openai/gpt-5.5 configure करें; OpenAI agent turns default रूप से Codex चुनते हैं।
Provider/model agentRuntime.id: "openclaw" का उपयोग केवल तब करें जब आपको built-in OpenClaw route चाहिए; अन्यथा openai/gpt-5.5 को default Codex harness पर रखें।
legacy Codex GPT refs legacy state हैं, live provider route नहीं। नए agent config के लिए native Codex runtime पर openai/gpt-5.5 का उपयोग करें, और पुराने legacy Codex model refs को canonical openai/* refs में migrate करने के लिए openclaw doctor --fix चलाएं।

json5

{  plugins: { entries: { codex: { enabled: true } } },  agents: {    defaults: {      model: { primary: "openai/gpt-5.5" },    },  },}

json5

{  models: {    providers: {      openai: {        models: [{ id: "gpt-5.5", contextTokens: 160000 }],      },    },  },}

अन्य subscription-style hosted options

Z.AI (GLM)

Z.AI Coding Plan या general API endpoints।

MiniMax

MiniMax Coding Plan OAuth या API key access।

Qwen Cloud

Qwen Cloud provider surface plus Alibaba DashScope और Coding Plan endpoint mapping।

OpenCode

Auth: OPENCODE_API_KEY (या OPENCODE_ZEN_API_KEY)
Zen runtime provider: opencode
Go runtime provider: opencode-go
Example models: opencode/claude-opus-4-6, opencode-go/kimi-k2.6
CLI: openclaw onboard --auth-choice opencode-zen या openclaw onboard --auth-choice opencode-go

json5

{  agents: { defaults: { model: { primary: "opencode/claude-opus-4-6" } } },}

Google Gemini (API key)

प्रदाता: google
प्रमाणीकरण: GEMINI_API_KEY
वैकल्पिक रोटेशन: GEMINI_API_KEYS, GEMINI_API_KEY_1, GEMINI_API_KEY_2, GOOGLE_API_KEY फ़ॉलबैक, और OPENCLAW_LIVE_GEMINI_KEY (एकल ओवरराइड)
उदाहरण मॉडल: google/gemini-3.1-pro-preview, google/gemini-3-flash-preview
संगतता: google/gemini-3.1-flash-preview का उपयोग करने वाला लेगेसी OpenClaw कॉन्फ़िग google/gemini-3-flash-preview में सामान्यीकृत किया जाता है
उपनाम: google/gemini-3.1-pro स्वीकार किया जाता है और Google के लाइव Gemini API id, google/gemini-3.1-pro-preview, में सामान्यीकृत किया जाता है
CLI: openclaw onboard --auth-choice gemini-api-key
सोच: /think adaptive Google dynamic thinking का उपयोग करता है। Gemini 3/3.1 एक निश्चित thinkingLevel छोड़ते हैं; Gemini 2.5 thinkingBudget: -1 भेजता है।
सीधे Gemini रन agents.defaults.models["google/<model>"].params.cachedContent (या लेगेसी cached_content) भी स्वीकार करते हैं, ताकि प्रदाता-नेटिव cachedContents/... हैंडल आगे भेजा जा सके; Gemini कैश हिट OpenClaw cacheRead के रूप में दिखते हैं

Google Vertex और Gemini CLI

प्रदाता: google-vertex, google-gemini-cli
प्रमाणीकरण: Vertex gcloud ADC का उपयोग करता है; Gemini CLI अपने OAuth फ़्लो का उपयोग करता है

Gemini CLI OAuth बंडल किए गए google Plugin के हिस्से के रूप में शिप किया जाता है।

Gemini CLI इंस्टॉल करें

brew

bash

brew install gemini-cli

npm

bash

npm install -g @google/gemini-cli

Plugin सक्षम करें

bash

openclaw plugins enable google

लॉग इन करें

bash

openclaw models auth login --provider google-gemini-cli --set-default

डिफ़ॉल्ट मॉडल: google-gemini-cli/gemini-3-flash-preview। आप openclaw.json में क्लाइंट id या सीक्रेट पेस्ट नहीं करते। CLI लॉगिन फ़्लो Gateway होस्ट पर auth प्रोफ़ाइलों में टोकन स्टोर करता है।

प्रोजेक्ट सेट करें (यदि आवश्यक हो)

यदि लॉगिन के बाद अनुरोध विफल हों, तो Gateway होस्ट पर GOOGLE_CLOUD_PROJECT या GOOGLE_CLOUD_PROJECT_ID सेट करें।

Gemini CLI डिफ़ॉल्ट रूप से stream-json का उपयोग करता है। OpenClaw assistant stream संदेश पढ़ता है और stats.cached को cacheRead में सामान्यीकृत करता है; लेगेसी --output-format json ओवरराइड अब भी response से उत्तर टेक्स्ट पढ़ते हैं।

Z.AI (GLM)

प्रदाता: zai
प्रमाणीकरण: ZAI_API_KEY
उदाहरण मॉडल: zai/glm-5.2
CLI: openclaw onboard --auth-choice zai-api-key
- मॉडल refs canonical zai/* प्रदाता ID का उपयोग करते हैं।
- zai-api-key मिलते-जुलते Z.AI endpoint को अपने आप पहचानता है; zai-coding-global, zai-coding-cn, zai-global, और zai-cn किसी विशिष्ट सतह को बाध्य करते हैं

Vercel AI Gateway

प्रदाता: vercel-ai-gateway
प्रमाणीकरण: AI_GATEWAY_API_KEY
उदाहरण मॉडल: vercel-ai-gateway/anthropic/claude-opus-4.6, vercel-ai-gateway/moonshotai/kimi-k2.6
CLI: openclaw onboard --auth-choice ai-gateway-api-key

अन्य बंडल किए गए प्रदाता Plugin

प्रदाता	Id	प्रमाणीकरण env	उदाहरण मॉडल
BytePlus	`byteplus` / `byteplus-plan`	`BYTEPLUS_API_KEY`	`byteplus-plan/ark-code-latest`
Cohere	`cohere`	`COHERE_API_KEY`	`cohere/command-a-03-2025`
GitHub Copilot	`github-copilot`	`COPILOT_GITHUB_TOKEN` / `GH_TOKEN` / `GITHUB_TOKEN`	-
Hugging Face Inference	`huggingface`	`HUGGINGFACE_HUB_TOKEN` या `HF_TOKEN`	`huggingface/deepseek-ai/DeepSeek-R1`
MiniMax	`minimax` / `minimax-portal`	`MINIMAX_API_KEY` / `MINIMAX_OAUTH_TOKEN`	`minimax/MiniMax-M3`
Mistral	`mistral`	`MISTRAL_API_KEY`	`mistral/mistral-large-latest`
Moonshot	`moonshot`	`MOONSHOT_API_KEY`	`moonshot/kimi-k2.6`
NVIDIA	`nvidia`	`NVIDIA_API_KEY`	`nvidia/nvidia/nemotron-3-ultra-550b-a55b`
NovitaAI	`novita`	`NOVITA_API_KEY`	`novita/deepseek/deepseek-v3-0324`
Ollama Cloud	`ollama-cloud`	`OLLAMA_API_KEY`	`ollama-cloud/kimi-k2.6`
OpenRouter	`openrouter`	OpenRouter OAuth या `OPENROUTER_API_KEY`	`openrouter/auto`
Qwen OAuth	`qwen-oauth`	`QWEN_API_KEY`	`qwen-oauth/qwen3.5-plus`
Together	`together`	`TOGETHER_API_KEY`	`together/meta-llama/Llama-3.3-70B-Instruct-Turbo`
Venice	`venice`	`VENICE_API_KEY`	-
Vercel AI Gateway	`vercel-ai-gateway`	`AI_GATEWAY_API_KEY`	`vercel-ai-gateway/anthropic/claude-opus-4.6`
Volcano Engine (Doubao)	`volcengine` / `volcengine-plan`	`VOLCANO_ENGINE_API_KEY`	`volcengine-plan/ark-code-latest`
xAI	`xai`	SuperGrok/X Premium OAuth या `XAI_API_KEY`	`xai/grok-4.3`
Xiaomi	`xiaomi` / `xiaomi-token-plan`	`XIAOMI_API_KEY` / `XIAOMI_TOKEN_PLAN_API_KEY`	`xiaomi/mimo-v2-flash` / `xiaomi-token-plan/mimo-v2.5-pro`

जानने योग्य विचित्रताएं

OpenRouter

अपने app-attribution headers और Anthropic cache_control markers केवल सत्यापित openrouter.ai routes पर लागू करता है। DeepSeek, Moonshot, और ZAI refs OpenRouter-प्रबंधित prompt caching के लिए cache-TTL योग्य हैं, लेकिन Anthropic cache markers प्राप्त नहीं करते। proxy-शैली OpenAI-compatible पथ के रूप में, यह native-OpenAI-only shaping (serviceTier, Responses store, prompt-cache hints, OpenAI reasoning-compat) छोड़ देता है। Gemini-backed refs केवल proxy-Gemini thought-signature sanitation बनाए रखते हैं।

Kilo Gateway

Gemini-backed refs वही proxy-Gemini sanitation पथ अपनाते हैं; kilocode/kilo/auto और अन्य proxy-reasoning-unsupported refs proxy reasoning injection छोड़ देते हैं।

MiniMax

API-key onboarding स्पष्ट M3 और M2.7 chat model definitions लिखता है; image understanding Plugin-स्वामित्व वाले MiniMax-VL-01 media provider पर रहता है।

NVIDIA

मॉडल ids nvidia/<vendor>/<model> namespace का उपयोग करते हैं (उदाहरण के लिए nvidia/moonshotai/kimi-k2.5 के साथ nvidia/nvidia/nemotron-...); pickers literal <provider>/<model-id> composition को बनाए रखते हैं, जबकि API को भेजी जाने वाली canonical key single-prefixed रहती है।

xAI

xAI Responses पथ का उपयोग करता है। अनुशंसित पथ SuperGrok/X Premium OAuth है; API keys अब भी XAI_API_KEY या Plugin config के माध्यम से काम करती हैं, और Grok web_search API-key fallback से पहले वही auth profile फिर से उपयोग करता है। grok-4.3 बंडल किया गया default chat model है, और grok-build-0.1 build/coding-focused कार्य के लिए चुना जा सकता है। /fast या params.fastMode: true grok-3, grok-3-mini, grok-4, और grok-4-0709 को उनके *-fast variants में rewrite करता है। tool_stream डिफ़ॉल्ट रूप से चालू है; agents.defaults.models["xai/<model>"].params.tool_stream=false से अक्षम करें।

`models.providers` के माध्यम से प्रदाता (custom/base URL)

custom providers या OpenAI/Anthropic-compatible proxies जोड़ने के लिए models.providers (या models.json) का उपयोग करें।

नीचे दिए गए कई बंडल किए गए प्रदाता Plugin पहले से ही default catalog प्रकाशित करते हैं। स्पष्ट models.providers.<id> entries केवल तब उपयोग करें जब आप default base URL, headers, या model list को override करना चाहते हों।

Gateway मॉडल क्षमता जांचें स्पष्ट models.providers.<id>.models[] मेटाडेटा भी पढ़ती हैं। यदि कोई कस्टम या प्रॉक्सी मॉडल इमेज स्वीकार करता है, तो उस मॉडल पर input: ["text", "image"] सेट करें ताकि WebChat और node-origin अटैचमेंट पथ इमेज को केवल-टेक्स्ट मीडिया refs के बजाय नेटिव मॉडल इनपुट के रूप में पास करें।

agents.defaults.models["provider/model"] केवल एजेंटों के लिए मॉडल दृश्यता, aliases, और प्रति-मॉडल मेटाडेटा नियंत्रित करता है। यह अपने आप नया runtime मॉडल रजिस्टर नहीं करता। कस्टम provider मॉडल के लिए, कम से कम मिलते-जुलते id के साथ models.providers.<provider>.models[] भी जोड़ें।

Moonshot AI (Kimi)

ऑनबोर्डिंग से पहले @openclaw/moonshot-provider इंस्टॉल करें। स्पष्ट models.providers.moonshot प्रविष्टि केवल तब जोड़ें जब आपको base URL या मॉडल मेटाडेटा ओवरराइड करना हो:

Provider: moonshot
Auth: MOONSHOT_API_KEY
उदाहरण मॉडल: moonshot/kimi-k2.6
CLI: openclaw onboard --auth-choice moonshot-api-key या openclaw onboard --auth-choice moonshot-api-key-cn

Kimi K2 मॉडल IDs:

moonshot/kimi-k2.6
moonshot/kimi-k2.7-code
moonshot/kimi-k2.5
moonshot/kimi-k2-thinking
moonshot/kimi-k2-thinking-turbo
moonshot/kimi-k2-turbo

json5

{  agents: {    defaults: { model: { primary: "moonshot/kimi-k2.6" } },  },  models: {    mode: "merge",    providers: {      moonshot: {        baseUrl: "https://api.moonshot.ai/v1",        apiKey: "${MOONSHOT_API_KEY}",        api: "openai-completions",        models: [{ id: "kimi-k2.6", name: "Kimi K2.6" }],      },    },  },}

Kimi coding

Kimi Coding Moonshot AI के Anthropic-compatible endpoint का उपयोग करता है:

Provider: kimi
Auth: KIMI_API_KEY
उदाहरण मॉडल: kimi/kimi-for-coding

json5

{  env: { KIMI_API_KEY: "sk-..." },  agents: {    defaults: { model: { primary: "kimi/kimi-for-coding" } },  },}

लेगेसी kimi/kimi-code और kimi/k2p5 compatibility model ids के रूप में स्वीकार किए जाते हैं और Kimi के स्थिर API मॉडल id में normalize होते हैं।

Volcano Engine (Doubao)

Volcano Engine (火山引擎) चीन में Doubao और अन्य मॉडलों तक पहुंच प्रदान करता है।

Provider: volcengine (coding: volcengine-plan)
Auth: VOLCANO_ENGINE_API_KEY
उदाहरण मॉडल: volcengine-plan/ark-code-latest
CLI: openclaw onboard --auth-choice volcengine-api-key

json5

{  agents: {    defaults: { model: { primary: "volcengine-plan/ark-code-latest" } },  },}

ऑनबोर्डिंग डिफ़ॉल्ट रूप से coding surface का उपयोग करती है, लेकिन सामान्य volcengine/* catalog उसी समय रजिस्टर हो जाता है।

ऑनबोर्डिंग/कॉन्फ़िगर मॉडल पिकर में, Volcengine auth विकल्प volcengine/* और volcengine-plan/* दोनों पंक्तियों को प्राथमिकता देता है। अगर वे मॉडल अभी तक लोड नहीं हुए हैं, तो OpenClaw खाली provider-स्कोप्ड पिकर दिखाने के बजाय अनफ़िल्टर्ड कैटलॉग पर वापस जाता है।

मानक मॉडल

volcengine/doubao-seed-1-8-251228 (Doubao Seed 1.8)
volcengine/doubao-seed-code-preview-251028
volcengine/kimi-k2-5-260127 (Kimi K2.5)
volcengine/glm-4-7-251222 (GLM 4.7)
volcengine/deepseek-v3-2-251201 (DeepSeek V3.2 128K)

कोडिंग मॉडल (volcengine-plan)

volcengine-plan/ark-code-latest
volcengine-plan/doubao-seed-code
volcengine-plan/kimi-k2.5
volcengine-plan/kimi-k2-thinking
volcengine-plan/glm-4.7

BytePlus (अंतरराष्ट्रीय)

BytePlus ARK अंतरराष्ट्रीय उपयोगकर्ताओं के लिए Volcano Engine जैसे ही मॉडल तक पहुंच देता है।

Provider: byteplus (कोडिंग: byteplus-plan)
Auth: BYTEPLUS_API_KEY
उदाहरण मॉडल: byteplus-plan/ark-code-latest
CLI: openclaw onboard --auth-choice byteplus-api-key

json5

{  agents: {    defaults: { model: { primary: "byteplus-plan/ark-code-latest" } },  },}

ऑनबोर्डिंग डिफ़ॉल्ट रूप से कोडिंग सतह का उपयोग करती है, लेकिन सामान्य byteplus/* कैटलॉग भी उसी समय पंजीकृत होता है।

ऑनबोर्डिंग/कॉन्फ़िगर मॉडल पिकर में, BytePlus auth विकल्प byteplus/* और byteplus-plan/* दोनों पंक्तियों को प्राथमिकता देता है। अगर वे मॉडल अभी तक लोड नहीं हुए हैं, तो OpenClaw खाली provider-स्कोप्ड पिकर दिखाने के बजाय अनफ़िल्टर्ड कैटलॉग पर वापस जाता है।

मानक मॉडल

byteplus/seed-1-8-251228 (Seed 1.8)
byteplus/kimi-k2-5-260127 (Kimi K2.5)
byteplus/glm-4-7-251222 (GLM 4.7)

कोडिंग मॉडल (byteplus-plan)

byteplus-plan/ark-code-latest
byteplus-plan/doubao-seed-code
byteplus-plan/kimi-k2.5
byteplus-plan/kimi-k2-thinking
byteplus-plan/glm-4.7

Synthetic

Synthetic synthetic provider के पीछे Anthropic-संगत मॉडल उपलब्ध कराता है:

Provider: synthetic
Auth: SYNTHETIC_API_KEY
उदाहरण मॉडल: synthetic/hf:MiniMaxAI/MiniMax-M2.5
CLI: openclaw onboard --auth-choice synthetic-api-key

json5

{  agents: {    defaults: { model: { primary: "synthetic/hf:MiniMaxAI/MiniMax-M2.5" } },  },  models: {    mode: "merge",    providers: {      synthetic: {        baseUrl: "https://api.synthetic.new/anthropic",        apiKey: "${SYNTHETIC_API_KEY}",        api: "anthropic-messages",        models: [{ id: "hf:MiniMaxAI/MiniMax-M2.5", name: "MiniMax M2.5" }],      },    },  },}

MiniMax

MiniMax को models.providers के जरिए कॉन्फ़िगर किया जाता है क्योंकि यह कस्टम endpoints का उपयोग करता है:

MiniMax OAuth (Global): --auth-choice minimax-global-oauth
MiniMax OAuth (CN): --auth-choice minimax-cn-oauth
MiniMax API key (Global): --auth-choice minimax-global-api
MiniMax API key (CN): --auth-choice minimax-cn-api
Auth: minimax के लिए MINIMAX_API_KEY; minimax-portal के लिए MINIMAX_OAUTH_TOKEN या MINIMAX_API_KEY

सेटअप विवरण, मॉडल विकल्पों और कॉन्फ़िग स्निपेट के लिए /providers/minimax देखें।

Plugin-स्वामित्व वाली क्षमता विभाजन:

टेक्स्ट/चैट डिफ़ॉल्ट minimax/MiniMax-M3 पर रहते हैं
इमेज जनरेशन minimax/image-01 या minimax-portal/image-01 है
इमेज समझना दोनों MiniMax auth पथों पर Plugin-स्वामित्व वाला MiniMax-VL-01 है
वेब खोज provider id minimax पर रहती है

LM Studio

LM Studio एक bundled provider Plugin के रूप में शिप होता है, जो native API का उपयोग करता है:

Provider: lmstudio
Auth: LM_API_TOKEN
डिफ़ॉल्ट inference base URL: http://localhost:1234/v1

फिर एक मॉडल सेट करें (http://localhost:1234/api/v1/models द्वारा लौटाए गए IDs में से किसी एक से बदलें):

json5

{  agents: {    defaults: { model: { primary: "lmstudio/openai/gpt-oss-20b" } },  },}

OpenClaw खोज + auto-load के लिए LM Studio के native /api/v1/models और /api/v1/models/load का उपयोग करता है, और डिफ़ॉल्ट रूप से inference के लिए /v1/chat/completions का। अगर आप चाहते हैं कि LM Studio JIT loading, TTL, और auto-evict मॉडल lifecycle का स्वामित्व लें, तो models.providers.lmstudio.params.preload: false सेट करें। सेटअप और troubleshooting के लिए /providers/lmstudio देखें।

Ollama

Ollama एक bundled provider Plugin के रूप में शिप होता है और Ollama के native API का उपयोग करता है:

Provider: ollama
Auth: आवश्यक नहीं (local server)
उदाहरण मॉडल: ollama/llama3.3
इंस्टॉलेशन: https://ollama.com/download

bash

# Install Ollama, then pull a model:ollama pull llama3.3

json5

{  agents: {    defaults: { model: { primary: "ollama/llama3.3" } },  },}

जब आप OLLAMA_API_KEY के साथ opt in करते हैं, तो Ollama को स्थानीय रूप से http://127.0.0.1:11434 पर detect किया जाता है, और bundled provider Plugin Ollama को सीधे openclaw onboard और मॉडल पिकर में जोड़ देता है। ऑनबोर्डिंग, cloud/local mode, और कस्टम कॉन्फ़िगरेशन के लिए /providers/ollama देखें।

vLLM

vLLM local/self-hosted OpenAI-संगत सर्वरों के लिए bundled provider Plugin के रूप में शिप होता है:

Provider: vllm
Auth: वैकल्पिक (आपके server पर निर्भर)
डिफ़ॉल्ट base URL: http://127.0.0.1:8000/v1

स्थानीय रूप से auto-discovery में opt in करने के लिए (अगर आपका server auth लागू नहीं करता, तो कोई भी value काम करती है):

bash

export VLLM_API_KEY="vllm-local"

फिर एक मॉडल सेट करें (/v1/models द्वारा लौटाए गए IDs में से किसी एक से बदलें):

json5

{  agents: {    defaults: { model: { primary: "vllm/your-model-id" } },  },}

विवरण के लिए /providers/vllm देखें।

SGLang

SGLang तेज self-hosted OpenAI-संगत सर्वरों के लिए bundled provider Plugin के रूप में शिप होता है:

Provider: sglang
Auth: वैकल्पिक (आपके server पर निर्भर)
डिफ़ॉल्ट base URL: http://127.0.0.1:30000/v1

स्थानीय रूप से auto-discovery में opt in करने के लिए (अगर आपका server auth लागू नहीं करता है, तो कोई भी value काम करती है):

bash

export SGLANG_API_KEY="sglang-local"

फिर एक मॉडल सेट करें (/v1/models द्वारा लौटाए गए IDs में से किसी एक से बदलें):

json5

{  agents: {    defaults: { model: { primary: "sglang/your-model-id" } },  },}

विवरण के लिए /providers/sglang देखें।

Local proxies (LM Studio, vLLM, LiteLLM, आदि)

उदाहरण (OpenAI-संगत):

json5

{  agents: {    defaults: {      model: { primary: "lmstudio/my-local-model" },      models: { "lmstudio/my-local-model": { alias: "Local" } },    },  },  models: {    providers: {      lmstudio: {        baseUrl: "http://localhost:1234/v1",        apiKey: "${LM_API_TOKEN}",        api: "openai-completions",        timeoutSeconds: 300,        models: [          {            id: "my-local-model",            name: "Local Model",            reasoning: false,            input: ["text"],            cost: { input: 0, output: 0, cacheRead: 0, cacheWrite: 0 },            contextWindow: 200000,            maxTokens: 8192,          },        ],      },    },  },}

डिफ़ॉल्ट वैकल्पिक फ़ील्ड

कस्टम providers के लिए, reasoning, input, cost, contextWindow, और maxTokens वैकल्पिक हैं। छोड़े जाने पर, OpenClaw डिफ़ॉल्ट रूप से ये मान उपयोग करता है:

reasoning: false
input: ["text"]
cost: { input: 0, output: 0, cacheRead: 0, cacheWrite: 0 }
contextWindow: 200000
maxTokens: 8192

अनुशंसित: ऐसे स्पष्ट मान सेट करें जो आपकी proxy/model सीमाओं से मेल खाते हों।

Proxy-route shaping rules

non-native endpoints (कोई भी non-empty baseUrl जिसका host api.openai.com नहीं है) पर api: "openai-completions" के लिए, OpenClaw असमर्थित developer भूमिकाओं के लिए provider 400 errors से बचने हेतु compat.supportsDeveloperRole: false बाध्य करता है।
Proxy-style OpenAI-संगत routes native OpenAI-only request shaping को भी छोड़ देते हैं: कोई service_tier नहीं, कोई Responses store नहीं, कोई Completions store नहीं, कोई prompt-cache hints नहीं, कोई OpenAI reasoning-compat payload shaping नहीं, और कोई hidden OpenClaw attribution headers नहीं।
vendor-specific fields की जरूरत वाले OpenAI-संगत Completions proxies के लिए, outbound request body में अतिरिक्त JSON merge करने हेतु agents.defaults.models["provider/model"].params.extra_body (या extraBody) सेट करें।
vLLM chat-template controls के लिए, agents.defaults.models["provider/model"].params.chat_template_kwargs सेट करें। bundled vLLM Plugin session thinking level बंद होने पर vllm/nemotron-3-* के लिए अपने-आप enable_thinking: false और force_nonempty_content: true भेजता है।
धीमे local models या remote LAN/tailnet hosts के लिए, models.providers.<id>.timeoutSeconds सेट करें। यह connect, headers, body streaming, और कुल guarded-fetch abort सहित provider model HTTP request handling को बढ़ाता है, पूरे agent runtime timeout को बढ़ाए बिना। अगर agents.defaults.timeoutSeconds या run-specific timeout कम है, तो वह ceiling भी बढ़ाएं; provider timeouts पूरे run को extend नहीं कर सकते।
Model provider HTTP calls configured provider baseUrl hostname के लिए ही 198.18.0.0/15 और fc00::/7 में Surge, Clash, और sing-box fake-IP DNS answers की अनुमति देते हैं। Custom/local provider endpoints guarded model requests के लिए ठीक उसी configured scheme://host:port origin पर भी भरोसा करते हैं, जिसमें loopback, LAN, और tailnet hosts शामिल हैं। यह कोई नया config option नहीं है; आपका configured baseUrl केवल उस origin के लिए request policy को extend करता है। Fake-IP hostname allowance और exact-origin trust स्वतंत्र mechanisms हैं। अन्य private, loopback, link-local, metadata destinations, और अलग ports के लिए अब भी explicit models.providers.<id>.request.allowPrivateNetwork: true opt-in चाहिए। exact-origin trust से opt out करने के लिए models.providers.<id>.request.allowPrivateNetwork: false सेट करें।
अगर baseUrl खाली/छोड़ा गया है, तो OpenClaw डिफ़ॉल्ट OpenAI behavior रखता है (जो api.openai.com पर resolve होता है)।
सुरक्षा के लिए, explicit compat.supportsDeveloperRole: true भी non-native openai-completions endpoints पर override हो जाता है।
non-direct endpoints (canonical anthropic के अलावा कोई भी provider, या ऐसा custom models.providers.anthropic.baseUrl जिसका host public api.anthropic.com endpoint नहीं है) पर api: "anthropic-messages" के लिए, OpenClaw claude-code-20250219, interleaved-thinking-2025-05-14, और OAuth markers जैसे implicit Anthropic beta headers दबा देता है, ताकि custom Anthropic-संगत proxies unsupported beta flags को reject न करें। अगर आपके proxy को specific beta features चाहिए, तो models.providers.<id>.headers["anthropic-beta"] स्पष्ट रूप से सेट करें।

CLI उदाहरण

bash

openclaw onboard --auth-choice opencode-zenopenclaw models set opencode/claude-opus-4-6openclaw models list

यह भी देखें: पूरे कॉन्फ़िगरेशन उदाहरणों के लिए Configuration।

त्वरित नियम

Plugin-owned provider behavior

API key rotation

Official provider plugins

OpenAI

Anthropic

OpenAI ChatGPT/Codex OAuth

अन्य subscription-style hosted options

OpenCode

Google Gemini (API key)

Google Vertex और Gemini CLI

Gemini CLI इंस्टॉल करें

brew

npm

Plugin सक्षम करें

लॉग इन करें

प्रोजेक्ट सेट करें (यदि आवश्यक हो)

Z.AI (GLM)

Vercel AI Gateway

अन्य बंडल किए गए प्रदाता Plugin

जानने योग्य विचित्रताएं

models.providers के माध्यम से प्रदाता (custom/base URL)

Moonshot AI (Kimi)

Kimi coding

Volcano Engine (Doubao)

मानक मॉडल

कोडिंग मॉडल (volcengine-plan)

BytePlus (अंतरराष्ट्रीय)

मानक मॉडल

कोडिंग मॉडल (byteplus-plan)

Synthetic

MiniMax

LM Studio

Ollama

vLLM

SGLang

Local proxies (LM Studio, vLLM, LiteLLM, आदि)

CLI उदाहरण

संबंधित

On this page

`models.providers` के माध्यम से प्रदाता (custom/base URL)