Concepts and configuration
मॉडल प्रदाता
LLM/model providers के लिए संदर्भ (WhatsApp/Telegram जैसे chat channels नहीं)। model चयन नियमों के लिए, Models देखें।
त्वरित नियम
Model refs और CLI helpers
- Model refs
provider/modelका उपयोग करते हैं (उदाहरण:opencode/claude-opus-4-6)। - सेट होने पर
agents.defaults.modelsallowlist की तरह काम करता है। - CLI helpers:
openclaw onboard,openclaw models list,openclaw models set <provider/model>। models.providers.*.contextWindow/contextTokens/maxTokensprovider-स्तर के defaults सेट करते हैं;models.providers.*.models[].contextWindow/contextTokens/maxTokensउन्हें प्रति model override करते हैं।- Fallback नियम, cooldown probes, और session-override persistence: Model failover।
Provider auth जोड़ने से आपका primary model नहीं बदलता
जब आप किसी provider को जोड़ते या reauth करते हैं, तो openclaw configure मौजूदा agents.defaults.model.primary को सुरक्षित रखता है। openclaw models auth login भी ऐसा ही करता है, जब तक आप --set-default पास न करें। Provider plugins अपने auth config patch में अब भी recommended default model लौटा सकते हैं, लेकिन जब primary model पहले से मौजूद हो, तो OpenClaw इसे "इस model को उपलब्ध कराएं" के रूप में मानता है, "मौजूदा primary model को बदलें" के रूप में नहीं।
Default model को जानबूझकर बदलने के लिए, openclaw models set <provider/model> या openclaw models auth login --provider <id> --set-default का उपयोग करें।
OpenAI provider/runtime विभाजन
OpenAI-family routes prefix-specific हैं:
openai/<model>default रूप से agent turns के लिए native Codex app-server harness का उपयोग करता है। यह सामान्य ChatGPT/Codex subscription setup है।- legacy Codex model refs legacy config हैं जिन्हें doctor
openai/<model>में फिर से लिखता है। openai/<model>और provider/modelagentRuntime.id: "openclaw"explicit API-key या compatibility routes के लिए OpenClaw के built-in runtime का उपयोग करते हैं।
OpenAI और Codex harness देखें। अगर provider/runtime विभाजन भ्रमित कर रहा है, तो पहले Agent runtimes पढ़ें।
Plugin auto-enable वही boundary follow करता है: openai/* agent refs default route के लिए Codex plugin enable करते हैं, और explicit provider/model agentRuntime.id: "codex" या legacy codex/<model> refs को भी इसकी आवश्यकता होती है।
GPT-5.5 default रूप से openai/gpt-5.5 पर native Codex app-server harness के माध्यम से उपलब्ध है, और OpenClaw runtime के माध्यम से तब उपलब्ध है जब provider/model runtime policy स्पष्ट रूप से openclaw चुनती है।
CLI runtimes
CLI runtimes वही विभाजन उपयोग करते हैं: anthropic/claude-* या google/gemini-* जैसे canonical model refs चुनें, फिर जब आपको local CLI backend चाहिए हो, तो provider/model runtime policy को claude-cli या google-gemini-cli पर सेट करें।
Legacy claude-cli/* और google-gemini-cli/* refs वापस canonical provider refs में migrate होते हैं, runtime अलग से recorded रहता है। Legacy codex-cli/* refs openai/* में migrate होते हैं और Codex app-server route का उपयोग करते हैं; OpenClaw अब bundled Codex CLI backend नहीं रखता।
Plugin-owned provider behavior
अधिकांश provider-specific logic provider plugins (registerProvider(...)) में रहता है, जबकि OpenClaw generic inference loop रखता है। Plugins onboarding, model catalogs, auth env-var mapping, transport/config normalization, tool-schema cleanup, failover classification, OAuth refresh, usage reporting, thinking/reasoning profiles, और बहुत कुछ own करते हैं।
provider-SDK hooks और bundled-plugin examples की पूरी सूची Provider plugins में है। जिस provider को पूरी तरह custom request executor चाहिए, वह एक अलग, गहरा extension surface है।
API key rotation
Key sources और priority
कई keys इस तरह configure करें:
OPENCLAW_LIVE_<PROVIDER>_KEY(single live override, सबसे उच्च priority)<PROVIDER>_API_KEYS(comma या semicolon list)<PROVIDER>_API_KEY(primary key)<PROVIDER>_API_KEY_*(numbered list, जैसे<PROVIDER>_API_KEY_1)
Google providers के लिए, GOOGLE_API_KEY भी fallback के रूप में शामिल है। Key selection order priority को सुरक्षित रखता है और values को deduplicate करता है।
Rotation कब शुरू होता है
- Requests को अगली key के साथ केवल rate-limit responses पर retry किया जाता है (उदाहरण के लिए
429,rate_limit,quota,resource exhausted,Too many concurrent requests,ThrottlingException,concurrency limit reached,workers_ai ... quota limit exceeded, या periodic usage-limit messages)। - Non-rate-limit failures तुरंत fail होते हैं; कोई key rotation attempt नहीं किया जाता।
- जब सभी candidate keys fail हो जाती हैं, तो अंतिम error last attempt से लौटाया जाता है।
Official provider plugins
Official provider plugins अपनी model catalog rows publish करते हैं। इन providers को किसी models.providers model entries की आवश्यकता नहीं होती; provider plugin enable करें, auth सेट करें, और model चुनें। models.providers का उपयोग केवल explicit custom providers या timeouts जैसी narrow request settings के लिए करें।
OpenAI
- Provider:
openai - Auth:
OPENAI_API_KEY - Optional rotation:
OPENAI_API_KEYS,OPENAI_API_KEY_1,OPENAI_API_KEY_2, साथ मेंOPENCLAW_LIVE_OPENAI_KEY(single override) - Example models:
openai/gpt-5.5,openai/gpt-5.4-mini - अगर कोई specific install या API key अलग तरह से behave करती है, तो
openclaw models list --provider openaiसे account/model availability verify करें। - CLI:
openclaw onboard --auth-choice openai-api-key - Default transport
autoहै; OpenClaw transport choice को shared model runtime में pass करता है। - प्रति model override करें
agents.defaults.models["openai/<model>"].params.transportके जरिए ("sse","websocket", या"auto") - OpenAI priority processing
agents.defaults.models["openai/<model>"].params.serviceTierके जरिए enable की जा सकती है /fastऔरparams.fastModedirectopenai/*Responses requests कोapi.openai.comपरservice_tier=priorityसे map करते हैं- जब shared
/fasttoggle की जगह explicit tier चाहिए हो, तोparams.serviceTierका उपयोग करें - Hidden OpenClaw attribution headers (
originator,version,User-Agent) केवलapi.openai.comपर native OpenAI traffic पर लागू होते हैं, generic OpenAI-compatible proxies पर नहीं - Native OpenAI routes Responses
store, prompt-cache hints, और OpenAI reasoning-compat payload shaping भी बनाए रखते हैं; proxy routes ऐसा नहीं करते openai/gpt-5.3-codex-sparkChatGPT/Codex OAuth subscription auth के माध्यम से उपलब्ध है जब आपका signed-in account इसे expose करता है; OpenClaw अब भी इस model के लिए direct OpenAI API-key और Azure API-key routes को suppress करता है क्योंकि वे transports इसे reject करते हैं
{ agents: { defaults: { model: { primary: "openai/gpt-5.5" } } },}Anthropic
- Provider:
anthropic - Auth:
ANTHROPIC_API_KEY - Optional rotation:
ANTHROPIC_API_KEYS,ANTHROPIC_API_KEY_1,ANTHROPIC_API_KEY_2, साथ मेंOPENCLAW_LIVE_ANTHROPIC_KEY(single override) - Example model:
anthropic/claude-opus-4-6 - CLI:
openclaw onboard --auth-choice apiKey - Direct public Anthropic requests shared
/fasttoggle औरparams.fastModesupport करते हैं, जिसमेंapi.anthropic.comपर भेजा गया API-key और OAuth-authenticated traffic शामिल है; OpenClaw इसे Anthropicservice_tier(autoबनामstandard_only) से map करता है - Preferred Claude CLI config model ref को canonical रखता है और CLI
backend को अलग से चुनता है:
anthropic/claude-opus-4-8के साथ model-scopedagentRuntime.id: "claude-cli"। Legacyclaude-cli/claude-opus-4-7refs compatibility के लिए अब भी काम करते हैं।
{ agents: { defaults: { model: { primary: "anthropic/claude-opus-4-6" } } },}OpenAI ChatGPT/Codex OAuth
- Provider:
openai - Auth: OAuth (ChatGPT)
- Legacy OpenAI Codex model ref:
openai/gpt-5.5 - Native Codex app-server harness ref:
openai/gpt-5.5 - Native Codex app-server harness docs: Codex harness
- Legacy model refs:
codex/gpt-* - Plugin boundary:
openai/*OpenAI plugin load करता है; native Codex app-server plugin Codex harness runtime द्वारा चुना जाता है। - CLI:
openclaw onboard --auth-choice openaiयाopenclaw models auth login --provider openai - Default transport
autoहै (WebSocket-first, SSE fallback) - प्रति OpenAI Codex model override करें
agents.defaults.models["openai/<model>"].params.transportके जरिए ("sse","websocket", या"auto") params.serviceTiernative Codex Responses requests (chatgpt.com/backend-api) पर भी forward किया जाता है- Hidden OpenClaw attribution headers (
originator,version,User-Agent) केवलchatgpt.com/backend-apiपर native Codex traffic पर attached होते हैं, generic OpenAI-compatible proxies पर नहीं - Direct
openai/*जैसा वही/fasttoggle औरparams.fastModeconfig share करता है; OpenClaw इसेservice_tier=priorityसे map करता है openai/gpt-5.5Codex catalog nativecontextWindow = 400000और default runtimecontextTokens = 272000का उपयोग करता है; runtime cap कोmodels.providers.openai.models[].contextTokensसे override करें- Policy note: OpenAI Codex OAuth OpenClaw जैसे external tools/workflows के लिए स्पष्ट रूप से supported है।
- Common subscription plus native Codex runtime route के लिए,
openaiauth से sign in करें औरopenai/gpt-5.5configure करें; OpenAI agent turns default रूप से Codex चुनते हैं। - Provider/model
agentRuntime.id: "openclaw"का उपयोग केवल तब करें जब आपको built-in OpenClaw route चाहिए; अन्यथाopenai/gpt-5.5को default Codex harness पर रखें। - legacy Codex GPT refs legacy state हैं, live provider route नहीं। नए agent config के लिए native Codex runtime पर
openai/gpt-5.5का उपयोग करें, और पुराने legacy Codex model refs को canonicalopenai/*refs में migrate करने के लिएopenclaw doctor --fixचलाएं।
{ plugins: { entries: { codex: { enabled: true } } }, agents: { defaults: { model: { primary: "openai/gpt-5.5" }, }, },}{ models: { providers: { openai: { models: [{ id: "gpt-5.5", contextTokens: 160000 }], }, }, },}अन्य subscription-style hosted options
Z.AI Coding Plan या general API endpoints।
MiniMax Coding Plan OAuth या API key access।
Qwen Cloud provider surface plus Alibaba DashScope और Coding Plan endpoint mapping।
OpenCode
- Auth:
OPENCODE_API_KEY(याOPENCODE_ZEN_API_KEY) - Zen runtime provider:
opencode - Go runtime provider:
opencode-go - Example models:
opencode/claude-opus-4-6,opencode-go/kimi-k2.6 - CLI:
openclaw onboard --auth-choice opencode-zenयाopenclaw onboard --auth-choice opencode-go
{ agents: { defaults: { model: { primary: "opencode/claude-opus-4-6" } } },}Google Gemini (API key)
- प्रदाता:
google - प्रमाणीकरण:
GEMINI_API_KEY - वैकल्पिक रोटेशन:
GEMINI_API_KEYS,GEMINI_API_KEY_1,GEMINI_API_KEY_2,GOOGLE_API_KEYफ़ॉलबैक, औरOPENCLAW_LIVE_GEMINI_KEY(एकल ओवरराइड) - उदाहरण मॉडल:
google/gemini-3.1-pro-preview,google/gemini-3-flash-preview - संगतता:
google/gemini-3.1-flash-previewका उपयोग करने वाला लेगेसी OpenClaw कॉन्फ़िगgoogle/gemini-3-flash-previewमें सामान्यीकृत किया जाता है - उपनाम:
google/gemini-3.1-proस्वीकार किया जाता है और Google के लाइव Gemini API id,google/gemini-3.1-pro-preview, में सामान्यीकृत किया जाता है - CLI:
openclaw onboard --auth-choice gemini-api-key - सोच:
/think adaptiveGoogle dynamic thinking का उपयोग करता है। Gemini 3/3.1 एक निश्चितthinkingLevelछोड़ते हैं; Gemini 2.5thinkingBudget: -1भेजता है। - सीधे Gemini रन
agents.defaults.models["google/<model>"].params.cachedContent(या लेगेसीcached_content) भी स्वीकार करते हैं, ताकि प्रदाता-नेटिवcachedContents/...हैंडल आगे भेजा जा सके; Gemini कैश हिट OpenClawcacheReadके रूप में दिखते हैं
Google Vertex और Gemini CLI
- प्रदाता:
google-vertex,google-gemini-cli - प्रमाणीकरण: Vertex gcloud ADC का उपयोग करता है; Gemini CLI अपने OAuth फ़्लो का उपयोग करता है
Gemini CLI OAuth बंडल किए गए google Plugin के हिस्से के रूप में शिप किया जाता है।
Gemini CLI इंस्टॉल करें
brew
brew install gemini-clinpm
npm install -g @google/gemini-cliPlugin सक्षम करें
openclaw plugins enable googleलॉग इन करें
openclaw models auth login --provider google-gemini-cli --set-defaultडिफ़ॉल्ट मॉडल: google-gemini-cli/gemini-3-flash-preview। आप openclaw.json में क्लाइंट id या सीक्रेट पेस्ट नहीं करते। CLI लॉगिन फ़्लो Gateway होस्ट पर auth प्रोफ़ाइलों में टोकन स्टोर करता है।
प्रोजेक्ट सेट करें (यदि आवश्यक हो)
यदि लॉगिन के बाद अनुरोध विफल हों, तो Gateway होस्ट पर GOOGLE_CLOUD_PROJECT या GOOGLE_CLOUD_PROJECT_ID सेट करें।
Gemini CLI डिफ़ॉल्ट रूप से stream-json का उपयोग करता है। OpenClaw assistant stream
संदेश पढ़ता है और stats.cached को cacheRead में सामान्यीकृत करता है; लेगेसी
--output-format json ओवरराइड अब भी response से उत्तर टेक्स्ट पढ़ते हैं।
Z.AI (GLM)
- प्रदाता:
zai - प्रमाणीकरण:
ZAI_API_KEY - उदाहरण मॉडल:
zai/glm-5.2 - CLI:
openclaw onboard --auth-choice zai-api-key- मॉडल refs canonical
zai/*प्रदाता ID का उपयोग करते हैं। zai-api-keyमिलते-जुलते Z.AI endpoint को अपने आप पहचानता है;zai-coding-global,zai-coding-cn,zai-global, औरzai-cnकिसी विशिष्ट सतह को बाध्य करते हैं
- मॉडल refs canonical
Vercel AI Gateway
- प्रदाता:
vercel-ai-gateway - प्रमाणीकरण:
AI_GATEWAY_API_KEY - उदाहरण मॉडल:
vercel-ai-gateway/anthropic/claude-opus-4.6,vercel-ai-gateway/moonshotai/kimi-k2.6 - CLI:
openclaw onboard --auth-choice ai-gateway-api-key
अन्य बंडल किए गए प्रदाता Plugin
| प्रदाता | Id | प्रमाणीकरण env | उदाहरण मॉडल |
|---|---|---|---|
| BytePlus | byteplus / byteplus-plan |
BYTEPLUS_API_KEY |
byteplus-plan/ark-code-latest |
| Cohere | cohere |
COHERE_API_KEY |
cohere/command-a-03-2025 |
| GitHub Copilot | github-copilot |
COPILOT_GITHUB_TOKEN / GH_TOKEN / GITHUB_TOKEN |
- |
| Hugging Face Inference | huggingface |
HUGGINGFACE_HUB_TOKEN या HF_TOKEN |
huggingface/deepseek-ai/DeepSeek-R1 |
| MiniMax | minimax / minimax-portal |
MINIMAX_API_KEY / MINIMAX_OAUTH_TOKEN |
minimax/MiniMax-M3 |
| Mistral | mistral |
MISTRAL_API_KEY |
mistral/mistral-large-latest |
| Moonshot | moonshot |
MOONSHOT_API_KEY |
moonshot/kimi-k2.6 |
| NVIDIA | nvidia |
NVIDIA_API_KEY |
nvidia/nvidia/nemotron-3-ultra-550b-a55b |
| NovitaAI | novita |
NOVITA_API_KEY |
novita/deepseek/deepseek-v3-0324 |
| Ollama Cloud | ollama-cloud |
OLLAMA_API_KEY |
ollama-cloud/kimi-k2.6 |
| OpenRouter | openrouter |
OpenRouter OAuth या OPENROUTER_API_KEY |
openrouter/auto |
| Qwen OAuth | qwen-oauth |
QWEN_API_KEY |
qwen-oauth/qwen3.5-plus |
| Together | together |
TOGETHER_API_KEY |
together/meta-llama/Llama-3.3-70B-Instruct-Turbo |
| Venice | venice |
VENICE_API_KEY |
- |
| Vercel AI Gateway | vercel-ai-gateway |
AI_GATEWAY_API_KEY |
vercel-ai-gateway/anthropic/claude-opus-4.6 |
| Volcano Engine (Doubao) | volcengine / volcengine-plan |
VOLCANO_ENGINE_API_KEY |
volcengine-plan/ark-code-latest |
| xAI | xai |
SuperGrok/X Premium OAuth या XAI_API_KEY |
xai/grok-4.3 |
| Xiaomi | xiaomi / xiaomi-token-plan |
XIAOMI_API_KEY / XIAOMI_TOKEN_PLAN_API_KEY |
xiaomi/mimo-v2-flash / xiaomi-token-plan/mimo-v2.5-pro |
जानने योग्य विचित्रताएं
OpenRouter
अपने app-attribution headers और Anthropic cache_control markers केवल सत्यापित openrouter.ai routes पर लागू करता है। DeepSeek, Moonshot, और ZAI refs OpenRouter-प्रबंधित prompt caching के लिए cache-TTL योग्य हैं, लेकिन Anthropic cache markers प्राप्त नहीं करते। proxy-शैली OpenAI-compatible पथ के रूप में, यह native-OpenAI-only shaping (serviceTier, Responses store, prompt-cache hints, OpenAI reasoning-compat) छोड़ देता है। Gemini-backed refs केवल proxy-Gemini thought-signature sanitation बनाए रखते हैं।
Kilo Gateway
Gemini-backed refs वही proxy-Gemini sanitation पथ अपनाते हैं; kilocode/kilo/auto और अन्य proxy-reasoning-unsupported refs proxy reasoning injection छोड़ देते हैं।
MiniMax
API-key onboarding स्पष्ट M3 और M2.7 chat model definitions लिखता है; image understanding Plugin-स्वामित्व वाले MiniMax-VL-01 media provider पर रहता है।
NVIDIA
मॉडल ids nvidia/<vendor>/<model> namespace का उपयोग करते हैं (उदाहरण के लिए nvidia/moonshotai/kimi-k2.5 के साथ nvidia/nvidia/nemotron-...); pickers literal <provider>/<model-id> composition को बनाए रखते हैं, जबकि API को भेजी जाने वाली canonical key single-prefixed रहती है।
xAI
xAI Responses पथ का उपयोग करता है। अनुशंसित पथ SuperGrok/X Premium OAuth है; API keys अब भी XAI_API_KEY या Plugin config के माध्यम से काम करती हैं, और Grok web_search API-key fallback से पहले वही auth profile फिर से उपयोग करता है। grok-4.3 बंडल किया गया default chat model है, और grok-build-0.1 build/coding-focused कार्य के लिए चुना जा सकता है। /fast या params.fastMode: true grok-3, grok-3-mini, grok-4, और grok-4-0709 को उनके *-fast variants में rewrite करता है। tool_stream डिफ़ॉल्ट रूप से चालू है; agents.defaults.models["xai/<model>"].params.tool_stream=false से अक्षम करें।
models.providers के माध्यम से प्रदाता (custom/base URL)
custom providers या OpenAI/Anthropic-compatible proxies जोड़ने के लिए models.providers (या models.json) का उपयोग करें।
नीचे दिए गए कई बंडल किए गए प्रदाता Plugin पहले से ही default catalog प्रकाशित करते हैं। स्पष्ट models.providers.<id> entries केवल तब उपयोग करें जब आप default base URL, headers, या model list को override करना चाहते हों।
Gateway मॉडल क्षमता जांचें स्पष्ट models.providers.<id>.models[] मेटाडेटा भी पढ़ती हैं। यदि कोई कस्टम या प्रॉक्सी मॉडल इमेज स्वीकार करता है, तो उस मॉडल पर input: ["text", "image"] सेट करें ताकि WebChat और node-origin अटैचमेंट पथ इमेज को केवल-टेक्स्ट मीडिया refs के बजाय नेटिव मॉडल इनपुट के रूप में पास करें।
agents.defaults.models["provider/model"] केवल एजेंटों के लिए मॉडल दृश्यता, aliases, और प्रति-मॉडल मेटाडेटा नियंत्रित करता है। यह अपने आप नया runtime मॉडल रजिस्टर नहीं करता। कस्टम provider मॉडल के लिए, कम से कम मिलते-जुलते id के साथ models.providers.<provider>.models[] भी जोड़ें।
Moonshot AI (Kimi)
ऑनबोर्डिंग से पहले @openclaw/moonshot-provider इंस्टॉल करें। स्पष्ट models.providers.moonshot प्रविष्टि केवल तब जोड़ें जब आपको base URL या मॉडल मेटाडेटा ओवरराइड करना हो:
- Provider:
moonshot - Auth:
MOONSHOT_API_KEY - उदाहरण मॉडल:
moonshot/kimi-k2.6 - CLI:
openclaw onboard --auth-choice moonshot-api-keyयाopenclaw onboard --auth-choice moonshot-api-key-cn
Kimi K2 मॉडल IDs:
moonshot/kimi-k2.6moonshot/kimi-k2.7-codemoonshot/kimi-k2.5moonshot/kimi-k2-thinkingmoonshot/kimi-k2-thinking-turbomoonshot/kimi-k2-turbo
{ agents: { defaults: { model: { primary: "moonshot/kimi-k2.6" } }, }, models: { mode: "merge", providers: { moonshot: { baseUrl: "https://api.moonshot.ai/v1", apiKey: "${MOONSHOT_API_KEY}", api: "openai-completions", models: [{ id: "kimi-k2.6", name: "Kimi K2.6" }], }, }, },}Kimi coding
Kimi Coding Moonshot AI के Anthropic-compatible endpoint का उपयोग करता है:
- Provider:
kimi - Auth:
KIMI_API_KEY - उदाहरण मॉडल:
kimi/kimi-for-coding
{ env: { KIMI_API_KEY: "sk-..." }, agents: { defaults: { model: { primary: "kimi/kimi-for-coding" } }, },}लेगेसी kimi/kimi-code और kimi/k2p5 compatibility model ids के रूप में स्वीकार किए जाते हैं और Kimi के स्थिर API मॉडल id में normalize होते हैं।
Volcano Engine (Doubao)
Volcano Engine (火山引擎) चीन में Doubao और अन्य मॉडलों तक पहुंच प्रदान करता है।
- Provider:
volcengine(coding:volcengine-plan) - Auth:
VOLCANO_ENGINE_API_KEY - उदाहरण मॉडल:
volcengine-plan/ark-code-latest - CLI:
openclaw onboard --auth-choice volcengine-api-key
{ agents: { defaults: { model: { primary: "volcengine-plan/ark-code-latest" } }, },}ऑनबोर्डिंग डिफ़ॉल्ट रूप से coding surface का उपयोग करती है, लेकिन सामान्य volcengine/* catalog उसी समय रजिस्टर हो जाता है।
ऑनबोर्डिंग/कॉन्फ़िगर मॉडल पिकर में, Volcengine auth विकल्प volcengine/* और volcengine-plan/* दोनों पंक्तियों को प्राथमिकता देता है। अगर वे मॉडल अभी तक लोड नहीं हुए हैं, तो OpenClaw खाली provider-स्कोप्ड पिकर दिखाने के बजाय अनफ़िल्टर्ड कैटलॉग पर वापस जाता है।
मानक मॉडल
volcengine/doubao-seed-1-8-251228(Doubao Seed 1.8)volcengine/doubao-seed-code-preview-251028volcengine/kimi-k2-5-260127(Kimi K2.5)volcengine/glm-4-7-251222(GLM 4.7)volcengine/deepseek-v3-2-251201(DeepSeek V3.2 128K)
कोडिंग मॉडल (volcengine-plan)
volcengine-plan/ark-code-latestvolcengine-plan/doubao-seed-codevolcengine-plan/kimi-k2.5volcengine-plan/kimi-k2-thinkingvolcengine-plan/glm-4.7
BytePlus (अंतरराष्ट्रीय)
BytePlus ARK अंतरराष्ट्रीय उपयोगकर्ताओं के लिए Volcano Engine जैसे ही मॉडल तक पहुंच देता है।
- Provider:
byteplus(कोडिंग:byteplus-plan) - Auth:
BYTEPLUS_API_KEY - उदाहरण मॉडल:
byteplus-plan/ark-code-latest - CLI:
openclaw onboard --auth-choice byteplus-api-key
{ agents: { defaults: { model: { primary: "byteplus-plan/ark-code-latest" } }, },}ऑनबोर्डिंग डिफ़ॉल्ट रूप से कोडिंग सतह का उपयोग करती है, लेकिन सामान्य byteplus/* कैटलॉग भी उसी समय पंजीकृत होता है।
ऑनबोर्डिंग/कॉन्फ़िगर मॉडल पिकर में, BytePlus auth विकल्प byteplus/* और byteplus-plan/* दोनों पंक्तियों को प्राथमिकता देता है। अगर वे मॉडल अभी तक लोड नहीं हुए हैं, तो OpenClaw खाली provider-स्कोप्ड पिकर दिखाने के बजाय अनफ़िल्टर्ड कैटलॉग पर वापस जाता है।
मानक मॉडल
byteplus/seed-1-8-251228(Seed 1.8)byteplus/kimi-k2-5-260127(Kimi K2.5)byteplus/glm-4-7-251222(GLM 4.7)
कोडिंग मॉडल (byteplus-plan)
byteplus-plan/ark-code-latestbyteplus-plan/doubao-seed-codebyteplus-plan/kimi-k2.5byteplus-plan/kimi-k2-thinkingbyteplus-plan/glm-4.7
Synthetic
Synthetic synthetic provider के पीछे Anthropic-संगत मॉडल उपलब्ध कराता है:
- Provider:
synthetic - Auth:
SYNTHETIC_API_KEY - उदाहरण मॉडल:
synthetic/hf:MiniMaxAI/MiniMax-M2.5 - CLI:
openclaw onboard --auth-choice synthetic-api-key
{ agents: { defaults: { model: { primary: "synthetic/hf:MiniMaxAI/MiniMax-M2.5" } }, }, models: { mode: "merge", providers: { synthetic: { baseUrl: "https://api.synthetic.new/anthropic", apiKey: "${SYNTHETIC_API_KEY}", api: "anthropic-messages", models: [{ id: "hf:MiniMaxAI/MiniMax-M2.5", name: "MiniMax M2.5" }], }, }, },}MiniMax
MiniMax को models.providers के जरिए कॉन्फ़िगर किया जाता है क्योंकि यह कस्टम endpoints का उपयोग करता है:
- MiniMax OAuth (Global):
--auth-choice minimax-global-oauth - MiniMax OAuth (CN):
--auth-choice minimax-cn-oauth - MiniMax API key (Global):
--auth-choice minimax-global-api - MiniMax API key (CN):
--auth-choice minimax-cn-api - Auth:
minimaxके लिएMINIMAX_API_KEY;minimax-portalके लिएMINIMAX_OAUTH_TOKENयाMINIMAX_API_KEY
सेटअप विवरण, मॉडल विकल्पों और कॉन्फ़िग स्निपेट के लिए /providers/minimax देखें।
Plugin-स्वामित्व वाली क्षमता विभाजन:
- टेक्स्ट/चैट डिफ़ॉल्ट
minimax/MiniMax-M3पर रहते हैं - इमेज जनरेशन
minimax/image-01याminimax-portal/image-01है - इमेज समझना दोनों MiniMax auth पथों पर Plugin-स्वामित्व वाला
MiniMax-VL-01है - वेब खोज provider id
minimaxपर रहती है
LM Studio
LM Studio एक bundled provider Plugin के रूप में शिप होता है, जो native API का उपयोग करता है:
- Provider:
lmstudio - Auth:
LM_API_TOKEN - डिफ़ॉल्ट inference base URL:
http://localhost:1234/v1
फिर एक मॉडल सेट करें (http://localhost:1234/api/v1/models द्वारा लौटाए गए IDs में से किसी एक से बदलें):
{ agents: { defaults: { model: { primary: "lmstudio/openai/gpt-oss-20b" } }, },}OpenClaw खोज + auto-load के लिए LM Studio के native /api/v1/models और /api/v1/models/load का उपयोग करता है, और डिफ़ॉल्ट रूप से inference के लिए /v1/chat/completions का। अगर आप चाहते हैं कि LM Studio JIT loading, TTL, और auto-evict मॉडल lifecycle का स्वामित्व लें, तो models.providers.lmstudio.params.preload: false सेट करें। सेटअप और troubleshooting के लिए /providers/lmstudio देखें।
Ollama
Ollama एक bundled provider Plugin के रूप में शिप होता है और Ollama के native API का उपयोग करता है:
- Provider:
ollama - Auth: आवश्यक नहीं (local server)
- उदाहरण मॉडल:
ollama/llama3.3 - इंस्टॉलेशन: https://ollama.com/download
# Install Ollama, then pull a model:ollama pull llama3.3{ agents: { defaults: { model: { primary: "ollama/llama3.3" } }, },}जब आप OLLAMA_API_KEY के साथ opt in करते हैं, तो Ollama को स्थानीय रूप से http://127.0.0.1:11434 पर detect किया जाता है, और bundled provider Plugin Ollama को सीधे openclaw onboard और मॉडल पिकर में जोड़ देता है। ऑनबोर्डिंग, cloud/local mode, और कस्टम कॉन्फ़िगरेशन के लिए /providers/ollama देखें।
vLLM
vLLM local/self-hosted OpenAI-संगत सर्वरों के लिए bundled provider Plugin के रूप में शिप होता है:
- Provider:
vllm - Auth: वैकल्पिक (आपके server पर निर्भर)
- डिफ़ॉल्ट base URL:
http://127.0.0.1:8000/v1
स्थानीय रूप से auto-discovery में opt in करने के लिए (अगर आपका server auth लागू नहीं करता, तो कोई भी value काम करती है):
export VLLM_API_KEY="vllm-local"फिर एक मॉडल सेट करें (/v1/models द्वारा लौटाए गए IDs में से किसी एक से बदलें):
{ agents: { defaults: { model: { primary: "vllm/your-model-id" } }, },}विवरण के लिए /providers/vllm देखें।
SGLang
SGLang तेज self-hosted OpenAI-संगत सर्वरों के लिए bundled provider Plugin के रूप में शिप होता है:
- Provider:
sglang - Auth: वैकल्पिक (आपके server पर निर्भर)
- डिफ़ॉल्ट base URL:
http://127.0.0.1:30000/v1
स्थानीय रूप से auto-discovery में opt in करने के लिए (अगर आपका server auth लागू नहीं करता है, तो कोई भी value काम करती है):
export SGLANG_API_KEY="sglang-local"फिर एक मॉडल सेट करें (/v1/models द्वारा लौटाए गए IDs में से किसी एक से बदलें):
{ agents: { defaults: { model: { primary: "sglang/your-model-id" } }, },}विवरण के लिए /providers/sglang देखें।
Local proxies (LM Studio, vLLM, LiteLLM, आदि)
उदाहरण (OpenAI-संगत):
{ agents: { defaults: { model: { primary: "lmstudio/my-local-model" }, models: { "lmstudio/my-local-model": { alias: "Local" } }, }, }, models: { providers: { lmstudio: { baseUrl: "http://localhost:1234/v1", apiKey: "${LM_API_TOKEN}", api: "openai-completions", timeoutSeconds: 300, models: [ { id: "my-local-model", name: "Local Model", reasoning: false, input: ["text"], cost: { input: 0, output: 0, cacheRead: 0, cacheWrite: 0 }, contextWindow: 200000, maxTokens: 8192, }, ], }, }, },}डिफ़ॉल्ट वैकल्पिक फ़ील्ड
कस्टम providers के लिए, reasoning, input, cost, contextWindow, और maxTokens वैकल्पिक हैं। छोड़े जाने पर, OpenClaw डिफ़ॉल्ट रूप से ये मान उपयोग करता है:
reasoning: falseinput: ["text"]cost: { input: 0, output: 0, cacheRead: 0, cacheWrite: 0 }contextWindow: 200000maxTokens: 8192
अनुशंसित: ऐसे स्पष्ट मान सेट करें जो आपकी proxy/model सीमाओं से मेल खाते हों।
Proxy-route shaping rules
- non-native endpoints (कोई भी non-empty
baseUrlजिसका hostapi.openai.comनहीं है) परapi: "openai-completions"के लिए, OpenClaw असमर्थितdeveloperभूमिकाओं के लिए provider 400 errors से बचने हेतुcompat.supportsDeveloperRole: falseबाध्य करता है। - Proxy-style OpenAI-संगत routes native OpenAI-only request shaping को भी छोड़ देते हैं: कोई
service_tierनहीं, कोई Responsesstoreनहीं, कोई Completionsstoreनहीं, कोई prompt-cache hints नहीं, कोई OpenAI reasoning-compat payload shaping नहीं, और कोई hidden OpenClaw attribution headers नहीं। - vendor-specific fields की जरूरत वाले OpenAI-संगत Completions proxies के लिए, outbound request body में अतिरिक्त JSON merge करने हेतु
agents.defaults.models["provider/model"].params.extra_body(याextraBody) सेट करें। - vLLM chat-template controls के लिए,
agents.defaults.models["provider/model"].params.chat_template_kwargsसेट करें। bundled vLLM Plugin session thinking level बंद होने परvllm/nemotron-3-*के लिए अपने-आपenable_thinking: falseऔरforce_nonempty_content: trueभेजता है। - धीमे local models या remote LAN/tailnet hosts के लिए,
models.providers.<id>.timeoutSecondsसेट करें। यह connect, headers, body streaming, और कुल guarded-fetch abort सहित provider model HTTP request handling को बढ़ाता है, पूरे agent runtime timeout को बढ़ाए बिना। अगरagents.defaults.timeoutSecondsया run-specific timeout कम है, तो वह ceiling भी बढ़ाएं; provider timeouts पूरे run को extend नहीं कर सकते। - Model provider HTTP calls configured provider
baseUrlhostname के लिए ही198.18.0.0/15औरfc00::/7में Surge, Clash, और sing-box fake-IP DNS answers की अनुमति देते हैं। Custom/local provider endpoints guarded model requests के लिए ठीक उसी configuredscheme://host:portorigin पर भी भरोसा करते हैं, जिसमें loopback, LAN, और tailnet hosts शामिल हैं। यह कोई नया config option नहीं है; आपका configuredbaseUrlकेवल उस origin के लिए request policy को extend करता है। Fake-IP hostname allowance और exact-origin trust स्वतंत्र mechanisms हैं। अन्य private, loopback, link-local, metadata destinations, और अलग ports के लिए अब भी explicitmodels.providers.<id>.request.allowPrivateNetwork: trueopt-in चाहिए। exact-origin trust से opt out करने के लिएmodels.providers.<id>.request.allowPrivateNetwork: falseसेट करें। - अगर
baseUrlखाली/छोड़ा गया है, तो OpenClaw डिफ़ॉल्ट OpenAI behavior रखता है (जोapi.openai.comपर resolve होता है)। - सुरक्षा के लिए, explicit
compat.supportsDeveloperRole: trueभी non-nativeopenai-completionsendpoints पर override हो जाता है। - non-direct endpoints (canonical
anthropicके अलावा कोई भी provider, या ऐसा custommodels.providers.anthropic.baseUrlजिसका host publicapi.anthropic.comendpoint नहीं है) परapi: "anthropic-messages"के लिए, OpenClawclaude-code-20250219,interleaved-thinking-2025-05-14, और OAuth markers जैसे implicit Anthropic beta headers दबा देता है, ताकि custom Anthropic-संगत proxies unsupported beta flags को reject न करें। अगर आपके proxy को specific beta features चाहिए, तोmodels.providers.<id>.headers["anthropic-beta"]स्पष्ट रूप से सेट करें।
CLI उदाहरण
openclaw onboard --auth-choice opencode-zenopenclaw models set opencode/claude-opus-4-6openclaw models listयह भी देखें: पूरे कॉन्फ़िगरेशन उदाहरणों के लिए Configuration।
संबंधित
- Configuration reference - मॉडल config keys
- Model failover - fallback chains और retry behavior
- Models - मॉडल configuration और aliases
- Providers - प्रति-provider setup guides