Concepts and configuration

मॉडल प्रदाता

LLM/model providers के लिए संदर्भ (WhatsApp/Telegram जैसे chat channels नहीं)। model चयन नियमों के लिए, Models देखें।

त्वरित नियम

Model refs और CLI helpers
  • Model refs provider/model का उपयोग करते हैं (उदाहरण: opencode/claude-opus-4-6)।
  • सेट होने पर agents.defaults.models allowlist की तरह काम करता है।
  • CLI helpers: openclaw onboard, openclaw models list, openclaw models set <provider/model>
  • models.providers.*.contextWindow / contextTokens / maxTokens provider-स्तर के defaults सेट करते हैं; models.providers.*.models[].contextWindow / contextTokens / maxTokens उन्हें प्रति model override करते हैं।
  • Fallback नियम, cooldown probes, और session-override persistence: Model failover
Provider auth जोड़ने से आपका primary model नहीं बदलता

जब आप किसी provider को जोड़ते या reauth करते हैं, तो openclaw configure मौजूदा agents.defaults.model.primary को सुरक्षित रखता है। openclaw models auth login भी ऐसा ही करता है, जब तक आप --set-default पास न करें। Provider plugins अपने auth config patch में अब भी recommended default model लौटा सकते हैं, लेकिन जब primary model पहले से मौजूद हो, तो OpenClaw इसे "इस model को उपलब्ध कराएं" के रूप में मानता है, "मौजूदा primary model को बदलें" के रूप में नहीं।

Default model को जानबूझकर बदलने के लिए, openclaw models set <provider/model> या openclaw models auth login --provider <id> --set-default का उपयोग करें।

OpenAI provider/runtime विभाजन

OpenAI-family routes prefix-specific हैं:

  • openai/<model> default रूप से agent turns के लिए native Codex app-server harness का उपयोग करता है। यह सामान्य ChatGPT/Codex subscription setup है।
  • legacy Codex model refs legacy config हैं जिन्हें doctor openai/<model> में फिर से लिखता है।
  • openai/<model> और provider/model agentRuntime.id: "openclaw" explicit API-key या compatibility routes के लिए OpenClaw के built-in runtime का उपयोग करते हैं।

OpenAI और Codex harness देखें। अगर provider/runtime विभाजन भ्रमित कर रहा है, तो पहले Agent runtimes पढ़ें।

Plugin auto-enable वही boundary follow करता है: openai/* agent refs default route के लिए Codex plugin enable करते हैं, और explicit provider/model agentRuntime.id: "codex" या legacy codex/<model> refs को भी इसकी आवश्यकता होती है।

GPT-5.5 default रूप से openai/gpt-5.5 पर native Codex app-server harness के माध्यम से उपलब्ध है, और OpenClaw runtime के माध्यम से तब उपलब्ध है जब provider/model runtime policy स्पष्ट रूप से openclaw चुनती है।

CLI runtimes

CLI runtimes वही विभाजन उपयोग करते हैं: anthropic/claude-* या google/gemini-* जैसे canonical model refs चुनें, फिर जब आपको local CLI backend चाहिए हो, तो provider/model runtime policy को claude-cli या google-gemini-cli पर सेट करें।

Legacy claude-cli/* और google-gemini-cli/* refs वापस canonical provider refs में migrate होते हैं, runtime अलग से recorded रहता है। Legacy codex-cli/* refs openai/* में migrate होते हैं और Codex app-server route का उपयोग करते हैं; OpenClaw अब bundled Codex CLI backend नहीं रखता।

Plugin-owned provider behavior

अधिकांश provider-specific logic provider plugins (registerProvider(...)) में रहता है, जबकि OpenClaw generic inference loop रखता है। Plugins onboarding, model catalogs, auth env-var mapping, transport/config normalization, tool-schema cleanup, failover classification, OAuth refresh, usage reporting, thinking/reasoning profiles, और बहुत कुछ own करते हैं।

provider-SDK hooks और bundled-plugin examples की पूरी सूची Provider plugins में है। जिस provider को पूरी तरह custom request executor चाहिए, वह एक अलग, गहरा extension surface है।

API key rotation

Key sources और priority

कई keys इस तरह configure करें:

  • OPENCLAW_LIVE_&lt;PROVIDER&gt;_KEY (single live override, सबसे उच्च priority)
  • &lt;PROVIDER&gt;_API_KEYS (comma या semicolon list)
  • &lt;PROVIDER&gt;_API_KEY (primary key)
  • &lt;PROVIDER&gt;_API_KEY_* (numbered list, जैसे &lt;PROVIDER&gt;_API_KEY_1)

Google providers के लिए, GOOGLE_API_KEY भी fallback के रूप में शामिल है। Key selection order priority को सुरक्षित रखता है और values को deduplicate करता है।

Rotation कब शुरू होता है
  • Requests को अगली key के साथ केवल rate-limit responses पर retry किया जाता है (उदाहरण के लिए 429, rate_limit, quota, resource exhausted, Too many concurrent requests, ThrottlingException, concurrency limit reached, workers_ai ... quota limit exceeded, या periodic usage-limit messages)।
  • Non-rate-limit failures तुरंत fail होते हैं; कोई key rotation attempt नहीं किया जाता।
  • जब सभी candidate keys fail हो जाती हैं, तो अंतिम error last attempt से लौटाया जाता है।

Official provider plugins

Official provider plugins अपनी model catalog rows publish करते हैं। इन providers को किसी models.providers model entries की आवश्यकता नहीं होती; provider plugin enable करें, auth सेट करें, और model चुनें। models.providers का उपयोग केवल explicit custom providers या timeouts जैसी narrow request settings के लिए करें।

OpenAI

  • Provider: openai
  • Auth: OPENAI_API_KEY
  • Optional rotation: OPENAI_API_KEYS, OPENAI_API_KEY_1, OPENAI_API_KEY_2, साथ में OPENCLAW_LIVE_OPENAI_KEY (single override)
  • Example models: openai/gpt-5.5, openai/gpt-5.4-mini
  • अगर कोई specific install या API key अलग तरह से behave करती है, तो openclaw models list --provider openai से account/model availability verify करें।
  • CLI: openclaw onboard --auth-choice openai-api-key
  • Default transport auto है; OpenClaw transport choice को shared model runtime में pass करता है।
  • प्रति model override करें agents.defaults.models["openai/<model>"].params.transport के जरिए ("sse", "websocket", या "auto")
  • OpenAI priority processing agents.defaults.models["openai/<model>"].params.serviceTier के जरिए enable की जा सकती है
  • /fast और params.fastMode direct openai/* Responses requests को api.openai.com पर service_tier=priority से map करते हैं
  • जब shared /fast toggle की जगह explicit tier चाहिए हो, तो params.serviceTier का उपयोग करें
  • Hidden OpenClaw attribution headers (originator, version, User-Agent) केवल api.openai.com पर native OpenAI traffic पर लागू होते हैं, generic OpenAI-compatible proxies पर नहीं
  • Native OpenAI routes Responses store, prompt-cache hints, और OpenAI reasoning-compat payload shaping भी बनाए रखते हैं; proxy routes ऐसा नहीं करते
  • openai/gpt-5.3-codex-spark ChatGPT/Codex OAuth subscription auth के माध्यम से उपलब्ध है जब आपका signed-in account इसे expose करता है; OpenClaw अब भी इस model के लिए direct OpenAI API-key और Azure API-key routes को suppress करता है क्योंकि वे transports इसे reject करते हैं
json5
{  agents: { defaults: { model: { primary: "openai/gpt-5.5" } } },}

Anthropic

  • Provider: anthropic
  • Auth: ANTHROPIC_API_KEY
  • Optional rotation: ANTHROPIC_API_KEYS, ANTHROPIC_API_KEY_1, ANTHROPIC_API_KEY_2, साथ में OPENCLAW_LIVE_ANTHROPIC_KEY (single override)
  • Example model: anthropic/claude-opus-4-6
  • CLI: openclaw onboard --auth-choice apiKey
  • Direct public Anthropic requests shared /fast toggle और params.fastMode support करते हैं, जिसमें api.anthropic.com पर भेजा गया API-key और OAuth-authenticated traffic शामिल है; OpenClaw इसे Anthropic service_tier (auto बनाम standard_only) से map करता है
  • Preferred Claude CLI config model ref को canonical रखता है और CLI backend को अलग से चुनता है: anthropic/claude-opus-4-8 के साथ model-scoped agentRuntime.id: "claude-cli"। Legacy claude-cli/claude-opus-4-7 refs compatibility के लिए अब भी काम करते हैं।
json5
{  agents: { defaults: { model: { primary: "anthropic/claude-opus-4-6" } } },}

OpenAI ChatGPT/Codex OAuth

  • Provider: openai
  • Auth: OAuth (ChatGPT)
  • Legacy OpenAI Codex model ref: openai/gpt-5.5
  • Native Codex app-server harness ref: openai/gpt-5.5
  • Native Codex app-server harness docs: Codex harness
  • Legacy model refs: codex/gpt-*
  • Plugin boundary: openai/* OpenAI plugin load करता है; native Codex app-server plugin Codex harness runtime द्वारा चुना जाता है।
  • CLI: openclaw onboard --auth-choice openai या openclaw models auth login --provider openai
  • Default transport auto है (WebSocket-first, SSE fallback)
  • प्रति OpenAI Codex model override करें agents.defaults.models["openai/<model>"].params.transport के जरिए ("sse", "websocket", या "auto")
  • params.serviceTier native Codex Responses requests (chatgpt.com/backend-api) पर भी forward किया जाता है
  • Hidden OpenClaw attribution headers (originator, version, User-Agent) केवल chatgpt.com/backend-api पर native Codex traffic पर attached होते हैं, generic OpenAI-compatible proxies पर नहीं
  • Direct openai/* जैसा वही /fast toggle और params.fastMode config share करता है; OpenClaw इसे service_tier=priority से map करता है
  • openai/gpt-5.5 Codex catalog native contextWindow = 400000 और default runtime contextTokens = 272000 का उपयोग करता है; runtime cap को models.providers.openai.models[].contextTokens से override करें
  • Policy note: OpenAI Codex OAuth OpenClaw जैसे external tools/workflows के लिए स्पष्ट रूप से supported है।
  • Common subscription plus native Codex runtime route के लिए, openai auth से sign in करें और openai/gpt-5.5 configure करें; OpenAI agent turns default रूप से Codex चुनते हैं।
  • Provider/model agentRuntime.id: "openclaw" का उपयोग केवल तब करें जब आपको built-in OpenClaw route चाहिए; अन्यथा openai/gpt-5.5 को default Codex harness पर रखें।
  • legacy Codex GPT refs legacy state हैं, live provider route नहीं। नए agent config के लिए native Codex runtime पर openai/gpt-5.5 का उपयोग करें, और पुराने legacy Codex model refs को canonical openai/* refs में migrate करने के लिए openclaw doctor --fix चलाएं।
json5
{  plugins: { entries: { codex: { enabled: true } } },  agents: {    defaults: {      model: { primary: "openai/gpt-5.5" },    },  },}
json5
{  models: {    providers: {      openai: {        models: [{ id: "gpt-5.5", contextTokens: 160000 }],      },    },  },}

अन्य subscription-style hosted options

OpenCode

  • Auth: OPENCODE_API_KEY (या OPENCODE_ZEN_API_KEY)
  • Zen runtime provider: opencode
  • Go runtime provider: opencode-go
  • Example models: opencode/claude-opus-4-6, opencode-go/kimi-k2.6
  • CLI: openclaw onboard --auth-choice opencode-zen या openclaw onboard --auth-choice opencode-go
json5
{  agents: { defaults: { model: { primary: "opencode/claude-opus-4-6" } } },}

Google Gemini (API key)

  • प्रदाता: google
  • प्रमाणीकरण: GEMINI_API_KEY
  • वैकल्पिक रोटेशन: GEMINI_API_KEYS, GEMINI_API_KEY_1, GEMINI_API_KEY_2, GOOGLE_API_KEY फ़ॉलबैक, और OPENCLAW_LIVE_GEMINI_KEY (एकल ओवरराइड)
  • उदाहरण मॉडल: google/gemini-3.1-pro-preview, google/gemini-3-flash-preview
  • संगतता: google/gemini-3.1-flash-preview का उपयोग करने वाला लेगेसी OpenClaw कॉन्फ़िग google/gemini-3-flash-preview में सामान्यीकृत किया जाता है
  • उपनाम: google/gemini-3.1-pro स्वीकार किया जाता है और Google के लाइव Gemini API id, google/gemini-3.1-pro-preview, में सामान्यीकृत किया जाता है
  • CLI: openclaw onboard --auth-choice gemini-api-key
  • सोच: /think adaptive Google dynamic thinking का उपयोग करता है। Gemini 3/3.1 एक निश्चित thinkingLevel छोड़ते हैं; Gemini 2.5 thinkingBudget: -1 भेजता है।
  • सीधे Gemini रन agents.defaults.models["google/<model>"].params.cachedContent (या लेगेसी cached_content) भी स्वीकार करते हैं, ताकि प्रदाता-नेटिव cachedContents/... हैंडल आगे भेजा जा सके; Gemini कैश हिट OpenClaw cacheRead के रूप में दिखते हैं

Google Vertex और Gemini CLI

  • प्रदाता: google-vertex, google-gemini-cli
  • प्रमाणीकरण: Vertex gcloud ADC का उपयोग करता है; Gemini CLI अपने OAuth फ़्लो का उपयोग करता है

Gemini CLI OAuth बंडल किए गए google Plugin के हिस्से के रूप में शिप किया जाता है।

  • Gemini CLI इंस्टॉल करें

    brew

    bash
    brew install gemini-cli

    npm

    bash
    npm install -g @google/gemini-cli
  • Plugin सक्षम करें

    bash
    openclaw plugins enable google
  • लॉग इन करें

    bash
    openclaw models auth login --provider google-gemini-cli --set-default

    डिफ़ॉल्ट मॉडल: google-gemini-cli/gemini-3-flash-preview। आप openclaw.json में क्लाइंट id या सीक्रेट पेस्ट नहीं करते। CLI लॉगिन फ़्लो Gateway होस्ट पर auth प्रोफ़ाइलों में टोकन स्टोर करता है।

  • प्रोजेक्ट सेट करें (यदि आवश्यक हो)

    यदि लॉगिन के बाद अनुरोध विफल हों, तो Gateway होस्ट पर GOOGLE_CLOUD_PROJECT या GOOGLE_CLOUD_PROJECT_ID सेट करें।

  • Gemini CLI डिफ़ॉल्ट रूप से stream-json का उपयोग करता है। OpenClaw assistant stream संदेश पढ़ता है और stats.cached को cacheRead में सामान्यीकृत करता है; लेगेसी --output-format json ओवरराइड अब भी response से उत्तर टेक्स्ट पढ़ते हैं।

    Z.AI (GLM)

    • प्रदाता: zai
    • प्रमाणीकरण: ZAI_API_KEY
    • उदाहरण मॉडल: zai/glm-5.2
    • CLI: openclaw onboard --auth-choice zai-api-key
      • मॉडल refs canonical zai/* प्रदाता ID का उपयोग करते हैं।
      • zai-api-key मिलते-जुलते Z.AI endpoint को अपने आप पहचानता है; zai-coding-global, zai-coding-cn, zai-global, और zai-cn किसी विशिष्ट सतह को बाध्य करते हैं

    Vercel AI Gateway

    • प्रदाता: vercel-ai-gateway
    • प्रमाणीकरण: AI_GATEWAY_API_KEY
    • उदाहरण मॉडल: vercel-ai-gateway/anthropic/claude-opus-4.6, vercel-ai-gateway/moonshotai/kimi-k2.6
    • CLI: openclaw onboard --auth-choice ai-gateway-api-key

    अन्य बंडल किए गए प्रदाता Plugin

    प्रदाता Id प्रमाणीकरण env उदाहरण मॉडल
    BytePlus byteplus / byteplus-plan BYTEPLUS_API_KEY byteplus-plan/ark-code-latest
    Cohere cohere COHERE_API_KEY cohere/command-a-03-2025
    GitHub Copilot github-copilot COPILOT_GITHUB_TOKEN / GH_TOKEN / GITHUB_TOKEN -
    Hugging Face Inference huggingface HUGGINGFACE_HUB_TOKEN या HF_TOKEN huggingface/deepseek-ai/DeepSeek-R1
    MiniMax minimax / minimax-portal MINIMAX_API_KEY / MINIMAX_OAUTH_TOKEN minimax/MiniMax-M3
    Mistral mistral MISTRAL_API_KEY mistral/mistral-large-latest
    Moonshot moonshot MOONSHOT_API_KEY moonshot/kimi-k2.6
    NVIDIA nvidia NVIDIA_API_KEY nvidia/nvidia/nemotron-3-ultra-550b-a55b
    NovitaAI novita NOVITA_API_KEY novita/deepseek/deepseek-v3-0324
    Ollama Cloud ollama-cloud OLLAMA_API_KEY ollama-cloud/kimi-k2.6
    OpenRouter openrouter OpenRouter OAuth या OPENROUTER_API_KEY openrouter/auto
    Qwen OAuth qwen-oauth QWEN_API_KEY qwen-oauth/qwen3.5-plus
    Together together TOGETHER_API_KEY together/meta-llama/Llama-3.3-70B-Instruct-Turbo
    Venice venice VENICE_API_KEY -
    Vercel AI Gateway vercel-ai-gateway AI_GATEWAY_API_KEY vercel-ai-gateway/anthropic/claude-opus-4.6
    Volcano Engine (Doubao) volcengine / volcengine-plan VOLCANO_ENGINE_API_KEY volcengine-plan/ark-code-latest
    xAI xai SuperGrok/X Premium OAuth या XAI_API_KEY xai/grok-4.3
    Xiaomi xiaomi / xiaomi-token-plan XIAOMI_API_KEY / XIAOMI_TOKEN_PLAN_API_KEY xiaomi/mimo-v2-flash / xiaomi-token-plan/mimo-v2.5-pro

    जानने योग्य विचित्रताएं

    OpenRouter

    अपने app-attribution headers और Anthropic cache_control markers केवल सत्यापित openrouter.ai routes पर लागू करता है। DeepSeek, Moonshot, और ZAI refs OpenRouter-प्रबंधित prompt caching के लिए cache-TTL योग्य हैं, लेकिन Anthropic cache markers प्राप्त नहीं करते। proxy-शैली OpenAI-compatible पथ के रूप में, यह native-OpenAI-only shaping (serviceTier, Responses store, prompt-cache hints, OpenAI reasoning-compat) छोड़ देता है। Gemini-backed refs केवल proxy-Gemini thought-signature sanitation बनाए रखते हैं।

    Kilo Gateway

    Gemini-backed refs वही proxy-Gemini sanitation पथ अपनाते हैं; kilocode/kilo/auto और अन्य proxy-reasoning-unsupported refs proxy reasoning injection छोड़ देते हैं।

    MiniMax

    API-key onboarding स्पष्ट M3 और M2.7 chat model definitions लिखता है; image understanding Plugin-स्वामित्व वाले MiniMax-VL-01 media provider पर रहता है।

    NVIDIA

    मॉडल ids nvidia/<vendor>/<model> namespace का उपयोग करते हैं (उदाहरण के लिए nvidia/moonshotai/kimi-k2.5 के साथ nvidia/nvidia/nemotron-...); pickers literal <provider>/<model-id> composition को बनाए रखते हैं, जबकि API को भेजी जाने वाली canonical key single-prefixed रहती है।

    xAI

    xAI Responses पथ का उपयोग करता है। अनुशंसित पथ SuperGrok/X Premium OAuth है; API keys अब भी XAI_API_KEY या Plugin config के माध्यम से काम करती हैं, और Grok web_search API-key fallback से पहले वही auth profile फिर से उपयोग करता है। grok-4.3 बंडल किया गया default chat model है, और grok-build-0.1 build/coding-focused कार्य के लिए चुना जा सकता है। /fast या params.fastMode: true grok-3, grok-3-mini, grok-4, और grok-4-0709 को उनके *-fast variants में rewrite करता है। tool_stream डिफ़ॉल्ट रूप से चालू है; agents.defaults.models["xai/<model>"].params.tool_stream=false से अक्षम करें।

    models.providers के माध्यम से प्रदाता (custom/base URL)

    custom providers या OpenAI/Anthropic-compatible proxies जोड़ने के लिए models.providers (या models.json) का उपयोग करें।

    नीचे दिए गए कई बंडल किए गए प्रदाता Plugin पहले से ही default catalog प्रकाशित करते हैं। स्पष्ट models.providers.<id> entries केवल तब उपयोग करें जब आप default base URL, headers, या model list को override करना चाहते हों।

    Gateway मॉडल क्षमता जांचें स्पष्ट models.providers.<id>.models[] मेटाडेटा भी पढ़ती हैं। यदि कोई कस्टम या प्रॉक्सी मॉडल इमेज स्वीकार करता है, तो उस मॉडल पर input: ["text", "image"] सेट करें ताकि WebChat और node-origin अटैचमेंट पथ इमेज को केवल-टेक्स्ट मीडिया refs के बजाय नेटिव मॉडल इनपुट के रूप में पास करें।

    agents.defaults.models["provider/model"] केवल एजेंटों के लिए मॉडल दृश्यता, aliases, और प्रति-मॉडल मेटाडेटा नियंत्रित करता है। यह अपने आप नया runtime मॉडल रजिस्टर नहीं करता। कस्टम provider मॉडल के लिए, कम से कम मिलते-जुलते id के साथ models.providers.<provider>.models[] भी जोड़ें।

    Moonshot AI (Kimi)

    ऑनबोर्डिंग से पहले @openclaw/moonshot-provider इंस्टॉल करें। स्पष्ट models.providers.moonshot प्रविष्टि केवल तब जोड़ें जब आपको base URL या मॉडल मेटाडेटा ओवरराइड करना हो:

    • Provider: moonshot
    • Auth: MOONSHOT_API_KEY
    • उदाहरण मॉडल: moonshot/kimi-k2.6
    • CLI: openclaw onboard --auth-choice moonshot-api-key या openclaw onboard --auth-choice moonshot-api-key-cn

    Kimi K2 मॉडल IDs:

    • moonshot/kimi-k2.6
    • moonshot/kimi-k2.7-code
    • moonshot/kimi-k2.5
    • moonshot/kimi-k2-thinking
    • moonshot/kimi-k2-thinking-turbo
    • moonshot/kimi-k2-turbo
    json5
    {  agents: {    defaults: { model: { primary: "moonshot/kimi-k2.6" } },  },  models: {    mode: "merge",    providers: {      moonshot: {        baseUrl: "https://api.moonshot.ai/v1",        apiKey: "${MOONSHOT_API_KEY}",        api: "openai-completions",        models: [{ id: "kimi-k2.6", name: "Kimi K2.6" }],      },    },  },}

    Kimi coding

    Kimi Coding Moonshot AI के Anthropic-compatible endpoint का उपयोग करता है:

    • Provider: kimi
    • Auth: KIMI_API_KEY
    • उदाहरण मॉडल: kimi/kimi-for-coding
    json5
    {  env: { KIMI_API_KEY: "sk-..." },  agents: {    defaults: { model: { primary: "kimi/kimi-for-coding" } },  },}

    लेगेसी kimi/kimi-code और kimi/k2p5 compatibility model ids के रूप में स्वीकार किए जाते हैं और Kimi के स्थिर API मॉडल id में normalize होते हैं।

    Volcano Engine (Doubao)

    Volcano Engine (火山引擎) चीन में Doubao और अन्य मॉडलों तक पहुंच प्रदान करता है।

    • Provider: volcengine (coding: volcengine-plan)
    • Auth: VOLCANO_ENGINE_API_KEY
    • उदाहरण मॉडल: volcengine-plan/ark-code-latest
    • CLI: openclaw onboard --auth-choice volcengine-api-key
    json5
    {  agents: {    defaults: { model: { primary: "volcengine-plan/ark-code-latest" } },  },}

    ऑनबोर्डिंग डिफ़ॉल्ट रूप से coding surface का उपयोग करती है, लेकिन सामान्य volcengine/* catalog उसी समय रजिस्टर हो जाता है।

    ऑनबोर्डिंग/कॉन्फ़िगर मॉडल पिकर में, Volcengine auth विकल्प volcengine/* और volcengine-plan/* दोनों पंक्तियों को प्राथमिकता देता है। अगर वे मॉडल अभी तक लोड नहीं हुए हैं, तो OpenClaw खाली provider-स्कोप्ड पिकर दिखाने के बजाय अनफ़िल्टर्ड कैटलॉग पर वापस जाता है।

    मानक मॉडल

    • volcengine/doubao-seed-1-8-251228 (Doubao Seed 1.8)
    • volcengine/doubao-seed-code-preview-251028
    • volcengine/kimi-k2-5-260127 (Kimi K2.5)
    • volcengine/glm-4-7-251222 (GLM 4.7)
    • volcengine/deepseek-v3-2-251201 (DeepSeek V3.2 128K)

    कोडिंग मॉडल (volcengine-plan)

    • volcengine-plan/ark-code-latest
    • volcengine-plan/doubao-seed-code
    • volcengine-plan/kimi-k2.5
    • volcengine-plan/kimi-k2-thinking
    • volcengine-plan/glm-4.7

    BytePlus (अंतरराष्ट्रीय)

    BytePlus ARK अंतरराष्ट्रीय उपयोगकर्ताओं के लिए Volcano Engine जैसे ही मॉडल तक पहुंच देता है।

    • Provider: byteplus (कोडिंग: byteplus-plan)
    • Auth: BYTEPLUS_API_KEY
    • उदाहरण मॉडल: byteplus-plan/ark-code-latest
    • CLI: openclaw onboard --auth-choice byteplus-api-key
    json5
    {  agents: {    defaults: { model: { primary: "byteplus-plan/ark-code-latest" } },  },}

    ऑनबोर्डिंग डिफ़ॉल्ट रूप से कोडिंग सतह का उपयोग करती है, लेकिन सामान्य byteplus/* कैटलॉग भी उसी समय पंजीकृत होता है।

    ऑनबोर्डिंग/कॉन्फ़िगर मॉडल पिकर में, BytePlus auth विकल्प byteplus/* और byteplus-plan/* दोनों पंक्तियों को प्राथमिकता देता है। अगर वे मॉडल अभी तक लोड नहीं हुए हैं, तो OpenClaw खाली provider-स्कोप्ड पिकर दिखाने के बजाय अनफ़िल्टर्ड कैटलॉग पर वापस जाता है।

    मानक मॉडल

    • byteplus/seed-1-8-251228 (Seed 1.8)
    • byteplus/kimi-k2-5-260127 (Kimi K2.5)
    • byteplus/glm-4-7-251222 (GLM 4.7)

    कोडिंग मॉडल (byteplus-plan)

    • byteplus-plan/ark-code-latest
    • byteplus-plan/doubao-seed-code
    • byteplus-plan/kimi-k2.5
    • byteplus-plan/kimi-k2-thinking
    • byteplus-plan/glm-4.7

    Synthetic

    Synthetic synthetic provider के पीछे Anthropic-संगत मॉडल उपलब्ध कराता है:

    • Provider: synthetic
    • Auth: SYNTHETIC_API_KEY
    • उदाहरण मॉडल: synthetic/hf:MiniMaxAI/MiniMax-M2.5
    • CLI: openclaw onboard --auth-choice synthetic-api-key
    json5
    {  agents: {    defaults: { model: { primary: "synthetic/hf:MiniMaxAI/MiniMax-M2.5" } },  },  models: {    mode: "merge",    providers: {      synthetic: {        baseUrl: "https://api.synthetic.new/anthropic",        apiKey: "${SYNTHETIC_API_KEY}",        api: "anthropic-messages",        models: [{ id: "hf:MiniMaxAI/MiniMax-M2.5", name: "MiniMax M2.5" }],      },    },  },}

    MiniMax

    MiniMax को models.providers के जरिए कॉन्फ़िगर किया जाता है क्योंकि यह कस्टम endpoints का उपयोग करता है:

    • MiniMax OAuth (Global): --auth-choice minimax-global-oauth
    • MiniMax OAuth (CN): --auth-choice minimax-cn-oauth
    • MiniMax API key (Global): --auth-choice minimax-global-api
    • MiniMax API key (CN): --auth-choice minimax-cn-api
    • Auth: minimax के लिए MINIMAX_API_KEY; minimax-portal के लिए MINIMAX_OAUTH_TOKEN या MINIMAX_API_KEY

    सेटअप विवरण, मॉडल विकल्पों और कॉन्फ़िग स्निपेट के लिए /providers/minimax देखें।

    Plugin-स्वामित्व वाली क्षमता विभाजन:

    • टेक्स्ट/चैट डिफ़ॉल्ट minimax/MiniMax-M3 पर रहते हैं
    • इमेज जनरेशन minimax/image-01 या minimax-portal/image-01 है
    • इमेज समझना दोनों MiniMax auth पथों पर Plugin-स्वामित्व वाला MiniMax-VL-01 है
    • वेब खोज provider id minimax पर रहती है

    LM Studio

    LM Studio एक bundled provider Plugin के रूप में शिप होता है, जो native API का उपयोग करता है:

    • Provider: lmstudio
    • Auth: LM_API_TOKEN
    • डिफ़ॉल्ट inference base URL: http://localhost:1234/v1

    फिर एक मॉडल सेट करें (http://localhost:1234/api/v1/models द्वारा लौटाए गए IDs में से किसी एक से बदलें):

    json5
    {  agents: {    defaults: { model: { primary: "lmstudio/openai/gpt-oss-20b" } },  },}

    OpenClaw खोज + auto-load के लिए LM Studio के native /api/v1/models और /api/v1/models/load का उपयोग करता है, और डिफ़ॉल्ट रूप से inference के लिए /v1/chat/completions का। अगर आप चाहते हैं कि LM Studio JIT loading, TTL, और auto-evict मॉडल lifecycle का स्वामित्व लें, तो models.providers.lmstudio.params.preload: false सेट करें। सेटअप और troubleshooting के लिए /providers/lmstudio देखें।

    Ollama

    Ollama एक bundled provider Plugin के रूप में शिप होता है और Ollama के native API का उपयोग करता है:

    • Provider: ollama
    • Auth: आवश्यक नहीं (local server)
    • उदाहरण मॉडल: ollama/llama3.3
    • इंस्टॉलेशन: https://ollama.com/download
    bash
    # Install Ollama, then pull a model:ollama pull llama3.3
    json5
    {  agents: {    defaults: { model: { primary: "ollama/llama3.3" } },  },}

    जब आप OLLAMA_API_KEY के साथ opt in करते हैं, तो Ollama को स्थानीय रूप से http://127.0.0.1:11434 पर detect किया जाता है, और bundled provider Plugin Ollama को सीधे openclaw onboard और मॉडल पिकर में जोड़ देता है। ऑनबोर्डिंग, cloud/local mode, और कस्टम कॉन्फ़िगरेशन के लिए /providers/ollama देखें।

    vLLM

    vLLM local/self-hosted OpenAI-संगत सर्वरों के लिए bundled provider Plugin के रूप में शिप होता है:

    • Provider: vllm
    • Auth: वैकल्पिक (आपके server पर निर्भर)
    • डिफ़ॉल्ट base URL: http://127.0.0.1:8000/v1

    स्थानीय रूप से auto-discovery में opt in करने के लिए (अगर आपका server auth लागू नहीं करता, तो कोई भी value काम करती है):

    bash
    export VLLM_API_KEY="vllm-local"

    फिर एक मॉडल सेट करें (/v1/models द्वारा लौटाए गए IDs में से किसी एक से बदलें):

    json5
    {  agents: {    defaults: { model: { primary: "vllm/your-model-id" } },  },}

    विवरण के लिए /providers/vllm देखें।

    SGLang

    SGLang तेज self-hosted OpenAI-संगत सर्वरों के लिए bundled provider Plugin के रूप में शिप होता है:

    • Provider: sglang
    • Auth: वैकल्पिक (आपके server पर निर्भर)
    • डिफ़ॉल्ट base URL: http://127.0.0.1:30000/v1

    स्थानीय रूप से auto-discovery में opt in करने के लिए (अगर आपका server auth लागू नहीं करता है, तो कोई भी value काम करती है):

    bash
    export SGLANG_API_KEY="sglang-local"

    फिर एक मॉडल सेट करें (/v1/models द्वारा लौटाए गए IDs में से किसी एक से बदलें):

    json5
    {  agents: {    defaults: { model: { primary: "sglang/your-model-id" } },  },}

    विवरण के लिए /providers/sglang देखें।

    Local proxies (LM Studio, vLLM, LiteLLM, आदि)

    उदाहरण (OpenAI-संगत):

    json5
    {  agents: {    defaults: {      model: { primary: "lmstudio/my-local-model" },      models: { "lmstudio/my-local-model": { alias: "Local" } },    },  },  models: {    providers: {      lmstudio: {        baseUrl: "http://localhost:1234/v1",        apiKey: "${LM_API_TOKEN}",        api: "openai-completions",        timeoutSeconds: 300,        models: [          {            id: "my-local-model",            name: "Local Model",            reasoning: false,            input: ["text"],            cost: { input: 0, output: 0, cacheRead: 0, cacheWrite: 0 },            contextWindow: 200000,            maxTokens: 8192,          },        ],      },    },  },}
    डिफ़ॉल्ट वैकल्पिक फ़ील्ड

    कस्टम providers के लिए, reasoning, input, cost, contextWindow, और maxTokens वैकल्पिक हैं। छोड़े जाने पर, OpenClaw डिफ़ॉल्ट रूप से ये मान उपयोग करता है:

    • reasoning: false
    • input: ["text"]
    • cost: { input: 0, output: 0, cacheRead: 0, cacheWrite: 0 }
    • contextWindow: 200000
    • maxTokens: 8192

    अनुशंसित: ऐसे स्पष्ट मान सेट करें जो आपकी proxy/model सीमाओं से मेल खाते हों।

    Proxy-route shaping rules
    • non-native endpoints (कोई भी non-empty baseUrl जिसका host api.openai.com नहीं है) पर api: "openai-completions" के लिए, OpenClaw असमर्थित developer भूमिकाओं के लिए provider 400 errors से बचने हेतु compat.supportsDeveloperRole: false बाध्य करता है।
    • Proxy-style OpenAI-संगत routes native OpenAI-only request shaping को भी छोड़ देते हैं: कोई service_tier नहीं, कोई Responses store नहीं, कोई Completions store नहीं, कोई prompt-cache hints नहीं, कोई OpenAI reasoning-compat payload shaping नहीं, और कोई hidden OpenClaw attribution headers नहीं।
    • vendor-specific fields की जरूरत वाले OpenAI-संगत Completions proxies के लिए, outbound request body में अतिरिक्त JSON merge करने हेतु agents.defaults.models["provider/model"].params.extra_body (या extraBody) सेट करें।
    • vLLM chat-template controls के लिए, agents.defaults.models["provider/model"].params.chat_template_kwargs सेट करें। bundled vLLM Plugin session thinking level बंद होने पर vllm/nemotron-3-* के लिए अपने-आप enable_thinking: false और force_nonempty_content: true भेजता है।
    • धीमे local models या remote LAN/tailnet hosts के लिए, models.providers.<id>.timeoutSeconds सेट करें। यह connect, headers, body streaming, और कुल guarded-fetch abort सहित provider model HTTP request handling को बढ़ाता है, पूरे agent runtime timeout को बढ़ाए बिना। अगर agents.defaults.timeoutSeconds या run-specific timeout कम है, तो वह ceiling भी बढ़ाएं; provider timeouts पूरे run को extend नहीं कर सकते।
    • Model provider HTTP calls configured provider baseUrl hostname के लिए ही 198.18.0.0/15 और fc00::/7 में Surge, Clash, और sing-box fake-IP DNS answers की अनुमति देते हैं। Custom/local provider endpoints guarded model requests के लिए ठीक उसी configured scheme://host:port origin पर भी भरोसा करते हैं, जिसमें loopback, LAN, और tailnet hosts शामिल हैं। यह कोई नया config option नहीं है; आपका configured baseUrl केवल उस origin के लिए request policy को extend करता है। Fake-IP hostname allowance और exact-origin trust स्वतंत्र mechanisms हैं। अन्य private, loopback, link-local, metadata destinations, और अलग ports के लिए अब भी explicit models.providers.<id>.request.allowPrivateNetwork: true opt-in चाहिए। exact-origin trust से opt out करने के लिए models.providers.<id>.request.allowPrivateNetwork: false सेट करें।
    • अगर baseUrl खाली/छोड़ा गया है, तो OpenClaw डिफ़ॉल्ट OpenAI behavior रखता है (जो api.openai.com पर resolve होता है)।
    • सुरक्षा के लिए, explicit compat.supportsDeveloperRole: true भी non-native openai-completions endpoints पर override हो जाता है।
    • non-direct endpoints (canonical anthropic के अलावा कोई भी provider, या ऐसा custom models.providers.anthropic.baseUrl जिसका host public api.anthropic.com endpoint नहीं है) पर api: "anthropic-messages" के लिए, OpenClaw claude-code-20250219, interleaved-thinking-2025-05-14, और OAuth markers जैसे implicit Anthropic beta headers दबा देता है, ताकि custom Anthropic-संगत proxies unsupported beta flags को reject न करें। अगर आपके proxy को specific beta features चाहिए, तो models.providers.<id>.headers["anthropic-beta"] स्पष्ट रूप से सेट करें।

    CLI उदाहरण

    bash
    openclaw onboard --auth-choice opencode-zenopenclaw models set opencode/claude-opus-4-6openclaw models list

    यह भी देखें: पूरे कॉन्फ़िगरेशन उदाहरणों के लिए Configuration

    संबंधित

    Was this useful?
    On this page

    On this page