Довідка для постачальників LLM/моделей (не каналів чату, як-от WhatsApp/Telegram). Правила вибору моделей див. у Моделі.Documentation Index
Fetch the complete documentation index at: https://docs.openclaw.ai/llms.txt
Use this file to discover all available pages before exploring further.
Короткі правила
Посилання на моделі та помічники CLI
Посилання на моделі та помічники CLI
- Посилання на моделі використовують
provider/model(приклад:opencode/claude-opus-4-6). agents.defaults.modelsдіє як allowlist, коли задано.- Помічники CLI:
openclaw onboard,openclaw models list,openclaw models set <provider/model>. models.providers.*.contextWindow/contextTokens/maxTokensзадають типові значення на рівні постачальника;models.providers.*.models[].contextWindow/contextTokens/maxTokensперевизначають їх для окремої моделі.- Правила резервного перемикання, перевірки cooldown і збереження перевизначень сеансу: Резервне перемикання моделей.
Додавання автентифікації постачальника не змінює вашу основну модель
Додавання автентифікації постачальника не змінює вашу основну модель
openclaw configure зберігає наявне agents.defaults.model.primary, коли ви додаєте або повторно автентифікуєте постачальника. openclaw models auth login робить те саме, якщо не передати --set-default. Plugin постачальника все ще може повернути рекомендовану типову модель у своєму патчі конфігурації автентифікації, але OpenClaw трактує це як «зробити цю модель доступною», коли основна модель уже існує, а не як «замінити поточну основну модель».Щоб навмисно перемкнути типову модель, використайте openclaw models set <provider/model> або openclaw models auth login --provider <id> --set-default.Розділення постачальника й runtime OpenAI
Розділення постачальника й runtime OpenAI
Маршрути сімейства OpenAI залежать від префікса:
openai/<model>типово використовує нативний harness сервера застосунку Codex для кроків агента. Це звичайне налаштування підписки ChatGPT/Codex.openai-codex/<model>— це застаріла конфігурація, яку doctor переписує наopenai/<model>.openai/<model>плюс provider/modelagentRuntime.id: "pi"використовує PI для явних маршрутів API-ключа або сумісності.
openai/* вмикають Plugin Codex для типового маршруту, а явні provider/model agentRuntime.id: "codex" або застарілі посилання codex/<model> також потребують його.GPT-5.5 типово доступна через нативний harness сервера застосунку Codex на openai/gpt-5.5, а через PI лише тоді, коли політика runtime provider/model явно вибирає pi.Runtime CLI
Runtime CLI
Runtime CLI використовують те саме розділення: виберіть канонічні посилання на моделі, як-от
anthropic/claude-*, google/gemini-* або openai/gpt-*, а потім задайте політику runtime provider/model як claude-cli, google-gemini-cli або codex-cli, коли потрібен локальний бекенд CLI.Застарілі посилання claude-cli/*, google-gemini-cli/* і codex-cli/* мігрують назад до канонічних посилань постачальника з runtime, записаним окремо.Поведінка постачальника, якою володіє Plugin
Більшість специфічної для постачальника логіки живе в Plugin постачальника (registerProvider(...)), тоді як OpenClaw зберігає загальний цикл інференсу. Plugin володіють onboarding, каталогами моделей, зіставленням env-var автентифікації, нормалізацією транспорту/конфігурації, очищенням tool-schema, класифікацією failover, оновленням OAuth, звітуванням про використання, профілями thinking/reasoning тощо.
Повний список хуків provider-SDK і приклади вбудованих Plugin наведено в Plugin постачальників. Постачальник, якому потрібен повністю власний виконавець запитів, є окремою, глибшою поверхнею розширення.
Поведінка runner, якою володіє постачальник, живе на явних хуках постачальника, як-от політика replay, нормалізація tool-schema, обгортання stream і помічники транспорту/запитів. Застарілий статичний набір
ProviderPlugin.capabilities призначений лише для сумісності й більше не читається спільною логікою runner.Ротація API-ключів
Джерела ключів і пріоритет
Джерела ключів і пріоритет
Налаштуйте кілька ключів через:
OPENCLAW_LIVE_<PROVIDER>_KEY(одне live-перевизначення, найвищий пріоритет)<PROVIDER>_API_KEYS(список через кому або крапку з комою)<PROVIDER>_API_KEY(основний ключ)<PROVIDER>_API_KEY_*(нумерований список, напр.<PROVIDER>_API_KEY_1)
GOOGLE_API_KEY також включено як fallback. Порядок вибору ключів зберігає пріоритет і усуває дублікати значень.Коли спрацьовує ротація
Коли спрацьовує ротація
- Запити повторюються з наступним ключем лише на відповідях про rate-limit (наприклад,
429,rate_limit,quota,resource exhausted,Too many concurrent requests,ThrottlingException,concurrency limit reached,workers_ai ... quota limit exceededабо періодичні повідомлення про ліміт використання). - Збої, не пов’язані з rate-limit, одразу завершуються помилкою; ротація ключів не виконується.
- Коли всі ключі-кандидати зазнають невдачі, фінальна помилка повертається з останньої спроби.
Вбудовані постачальники (каталог pi-ai)
OpenClaw постачається з каталогом pi-ai. Ці постачальники не потребують конфігураціїmodels.providers; просто задайте автентифікацію та виберіть модель.
OpenAI
- Постачальник:
openai - Автентифікація:
OPENAI_API_KEY - Опціональна ротація:
OPENAI_API_KEYS,OPENAI_API_KEY_1,OPENAI_API_KEY_2, плюсOPENCLAW_LIVE_OPENAI_KEY(одне перевизначення) - Приклади моделей:
openai/gpt-5.5,openai/gpt-5.4-mini - Перевірте доступність облікового запису/моделі за допомогою
openclaw models list --provider openai, якщо конкретне встановлення або API-ключ поводиться інакше. - CLI:
openclaw onboard --auth-choice openai-api-key - Типовий транспорт —
auto; OpenClaw передає вибір транспорту до pi-ai. - Перевизначення для окремої моделі через
agents.defaults.models["openai/<model>"].params.transport("sse","websocket"або"auto") - Пріоритетну обробку OpenAI можна ввімкнути через
agents.defaults.models["openai/<model>"].params.serviceTier /fastіparams.fastModeзіставляють прямі запити Responsesopenai/*зservice_tier=priorityнаapi.openai.com- Використовуйте
params.serviceTier, коли потрібен явний tier замість спільного перемикача/fast - Приховані заголовки атрибуції OpenClaw (
originator,version,User-Agent) застосовуються лише до нативного трафіку OpenAI доapi.openai.com, а не до загальних OpenAI-сумісних проксі - Нативні маршрути OpenAI також зберігають Responses
store, підказки prompt-cache і формування payload для сумісності з reasoning OpenAI; маршрути проксі — ні openai/gpt-5.3-codex-sparkнавмисно приховано в OpenClaw, оскільки live-запити OpenAI API відхиляють його, а поточний каталог Codex не експонує його
Anthropic
- Постачальник:
anthropic - Автентифікація:
ANTHROPIC_API_KEY - Опціональна ротація:
ANTHROPIC_API_KEYS,ANTHROPIC_API_KEY_1,ANTHROPIC_API_KEY_2, плюсOPENCLAW_LIVE_ANTHROPIC_KEY(одне перевизначення) - Приклад моделі:
anthropic/claude-opus-4-6 - CLI:
openclaw onboard --auth-choice apiKey - Прямі публічні запити Anthropic підтримують спільний перемикач
/fastіparams.fastMode, включно з трафіком, автентифікованим API-ключем і OAuth, надісланим доapi.anthropic.com; OpenClaw зіставляє це з Anthropicservice_tier(autoпротиstandard_only) - Бажана конфігурація Claude CLI зберігає посилання на модель канонічним і вибирає CLI
бекенд окремо:
anthropic/claude-opus-4-7з model-scopedagentRuntime.id: "claude-cli". Застарілі посиланняclaude-cli/claude-opus-4-7усе ще працюють для сумісності.
Співробітники Anthropic повідомили нам, що використання Claude CLI у стилі OpenClaw знову дозволено, тому OpenClaw трактує повторне використання Claude CLI та використання
claude -p як санкціоновані для цієї інтеграції, якщо Anthropic не опублікує нову політику. setup-token Anthropic залишається доступним як підтримуваний шлях токена OpenClaw, але OpenClaw тепер віддає перевагу повторному використанню Claude CLI та claude -p, коли вони доступні.OpenAI Codex OAuth
- Постачальник:
openai-codex - Автентифікація: OAuth (ChatGPT)
- Застаріле посилання на модель PI:
openai-codex/gpt-5.5 - Посилання нативного harness сервера застосунку Codex:
openai/gpt-5.5 - Документація нативного harness сервера застосунку Codex: harness Codex
- Застарілі посилання на моделі:
codex/gpt-* - Межа Plugin:
openai-codex/*завантажує Plugin OpenAI; нативний Plugin сервера застосунку Codex вибирається лише runtime harness Codex або застарілими посиланнямиcodex/*. - CLI:
openclaw onboard --auth-choice openai-codexабоopenclaw models auth login --provider openai-codex - Типовий транспорт —
auto(спочатку WebSocket, SSE як fallback) - Перевизначення для окремої моделі PI через
agents.defaults.models["openai-codex/<model>"].params.transport("sse","websocket"або"auto") params.serviceTierтакож передається в нативних запитах Codex Responses (chatgpt.com/backend-api)- Приховані заголовки атрибуції OpenClaw (
originator,version,User-Agent) додаються лише до нативного трафіку Codex доchatgpt.com/backend-api, а не до загальних OpenAI-сумісних проксі - Використовує ту саму конфігурацію перемикача
/fastіparams.fastMode, що й пряміopenai/*; OpenClaw зіставляє це зservice_tier=priority openai-codex/gpt-5.5використовує нативні для каталогу CodexcontextWindow = 400000і типовий runtimecontextTokens = 272000; перевизначте обмеження runtime за допомогоюmodels.providers.openai-codex.models[].contextTokens- Примітка щодо політики: OpenAI Codex OAuth явно підтримується для зовнішніх інструментів/робочих процесів, як-от OpenClaw.
- Для поширеного маршруту з підпискою плюс нативним runtime Codex увійдіть з автентифікацією
openai-codex, але налаштуйтеopenai/gpt-5.5; кроки агента OpenAI типово вибирають Codex. - Використовуйте provider/model
agentRuntime.id: "pi"лише тоді, коли потрібен маршрут сумісності через PI; інакше залишайтеopenai/gpt-5.5на типовому harness Codex. - Старіші посилання
openai-codex/gpt-5.1*,openai-codex/gpt-5.2*іopenai-codex/gpt-5.3*приховано, оскільки облікові записи ChatGPT/Codex OAuth відхиляють їх; натомість використовуйтеopenai-codex/gpt-5.5або нативний маршрут runtime Codex.
Інші розміщені варіанти в стилі підписки
Моделі GLM
Z.AI Coding Plan або загальні API-ендпоїнти.
MiniMax
MiniMax Coding Plan OAuth або доступ за API-ключем.
Qwen Cloud
Поверхня постачальника Qwen Cloud плюс зіставлення ендпоїнтів Alibaba DashScope і Coding Plan.
OpenCode
- Автентифікація:
OPENCODE_API_KEY(абоOPENCODE_ZEN_API_KEY) - Постачальник runtime Zen:
opencode - Постачальник runtime Go:
opencode-go - Приклади моделей:
opencode/claude-opus-4-6,opencode-go/kimi-k2.6 - CLI:
openclaw onboard --auth-choice opencode-zenабоopenclaw onboard --auth-choice opencode-go
Google Gemini (API-ключ)
- Провайдер:
google - Автентифікація:
GEMINI_API_KEY - Необов’язкова ротація:
GEMINI_API_KEYS,GEMINI_API_KEY_1,GEMINI_API_KEY_2, резервнийGOOGLE_API_KEYіOPENCLAW_LIVE_GEMINI_KEY(одинарне перевизначення) - Приклади моделей:
google/gemini-3.1-pro-preview,google/gemini-3-flash-preview - Сумісність: застаріла конфігурація OpenClaw, що використовує
google/gemini-3.1-flash-preview, нормалізується доgoogle/gemini-3-flash-preview - Псевдонім:
google/gemini-3.1-proприймається й нормалізується до live ID API Gemini від Google,google/gemini-3.1-pro-preview - CLI:
openclaw onboard --auth-choice gemini-api-key - Мислення:
/think adaptiveвикористовує динамічне мислення Google. Gemini 3/3.1 не вказують фіксованийthinkingLevel; Gemini 2.5 надсилаєthinkingBudget: -1. - Прямі запуски Gemini також приймають
agents.defaults.models["google/<model>"].params.cachedContent(або застарілийcached_content), щоб передати нативний для провайдера дескрипторcachedContents/...; влучання кешу Gemini відображаються як OpenClawcacheRead
Google Vertex і Gemini CLI
- Провайдери:
google-vertex,google-gemini-cli - Автентифікація: Vertex використовує gcloud ADC; Gemini CLI використовує свій потік OAuth
google.
Увійдіть
google-gemini-cli/gemini-3-flash-preview. Ви не вставляєте ідентифікатор клієнта чи секрет у openclaw.json. Потік входу CLI зберігає токени в профілях автентифікації на хості Gateway.response; використання повертається до stats, а stats.cached нормалізується в OpenClaw cacheRead.
Z.AI (GLM)
- Провайдер:
zai - Автентифікація:
ZAI_API_KEY - Приклад моделі:
zai/glm-5.1 - CLI:
openclaw onboard --auth-choice zai-api-key- Псевдоніми:
z.ai/*іz-ai/*нормалізуються доzai/* zai-api-keyавтоматично визначає відповідну кінцеву точку Z.AI;zai-coding-global,zai-coding-cn,zai-globalіzai-cnпримусово задають конкретну поверхню
- Псевдоніми:
Vercel AI Gateway
- Провайдер:
vercel-ai-gateway - Автентифікація:
AI_GATEWAY_API_KEY - Приклади моделей:
vercel-ai-gateway/anthropic/claude-opus-4.6,vercel-ai-gateway/moonshotai/kimi-k2.6 - CLI:
openclaw onboard --auth-choice ai-gateway-api-key
Kilo Gateway
- Провайдер:
kilocode - Автентифікація:
KILOCODE_API_KEY - Приклад моделі:
kilocode/kilo/auto - CLI:
openclaw onboard --auth-choice kilocode-api-key - Базова URL-адреса:
https://api.kilo.ai/api/gateway/ - Статичний резервний каталог постачає
kilocode/kilo/auto; live-виявленняhttps://api.kilo.ai/api/gateway/modelsможе додатково розширити каталог часу виконання. - Точна upstream-маршрутизація за
kilocode/kilo/autoналежить Kilo Gateway, а не жорстко закодована в OpenClaw.
Інші вбудовані Plugin провайдерів
| Постачальник | ID | Змінна середовища автентифікації | Приклад моделі |
|---|---|---|---|
| BytePlus | byteplus / byteplus-plan | BYTEPLUS_API_KEY | byteplus-plan/ark-code-latest |
| Cerebras | cerebras | CEREBRAS_API_KEY | cerebras/zai-glm-4.7 |
| Cloudflare AI Gateway | cloudflare-ai-gateway | CLOUDFLARE_AI_GATEWAY_API_KEY | - |
| DeepInfra | deepinfra | DEEPINFRA_API_KEY | deepinfra/deepseek-ai/DeepSeek-V3.2 |
| DeepSeek | deepseek | DEEPSEEK_API_KEY | deepseek/deepseek-v4-flash |
| GitHub Copilot | github-copilot | COPILOT_GITHUB_TOKEN / GH_TOKEN / GITHUB_TOKEN | - |
| Groq | groq | GROQ_API_KEY | - |
| Hugging Face Inference | huggingface | HUGGINGFACE_HUB_TOKEN or HF_TOKEN | huggingface/deepseek-ai/DeepSeek-R1 |
| Kilo Gateway | kilocode | KILOCODE_API_KEY | kilocode/kilo/auto |
| Kimi Coding | kimi | KIMI_API_KEY or KIMICODE_API_KEY | kimi/kimi-for-coding |
| MiniMax | minimax / minimax-portal | MINIMAX_API_KEY / MINIMAX_OAUTH_TOKEN | minimax/MiniMax-M2.7 |
| Mistral | mistral | MISTRAL_API_KEY | mistral/mistral-large-latest |
| Moonshot | moonshot | MOONSHOT_API_KEY | moonshot/kimi-k2.6 |
| NVIDIA | nvidia | NVIDIA_API_KEY | nvidia/nvidia/nemotron-3-super-120b-a12b |
| OpenRouter | openrouter | OPENROUTER_API_KEY | openrouter/auto |
| Qianfan | qianfan | QIANFAN_API_KEY | qianfan/deepseek-v3.2 |
| Qwen Cloud | qwen | QWEN_API_KEY / MODELSTUDIO_API_KEY / DASHSCOPE_API_KEY | qwen/qwen3.5-plus |
| StepFun | stepfun / stepfun-plan | STEPFUN_API_KEY | stepfun/step-3.5-flash |
| Together | together | TOGETHER_API_KEY | together/moonshotai/Kimi-K2.5 |
| Venice | venice | VENICE_API_KEY | - |
| Vercel AI Gateway | vercel-ai-gateway | AI_GATEWAY_API_KEY | vercel-ai-gateway/anthropic/claude-opus-4.6 |
| Volcano Engine (Doubao) | volcengine / volcengine-plan | VOLCANO_ENGINE_API_KEY | volcengine-plan/ark-code-latest |
| xAI | xai | XAI_API_KEY | xai/grok-4.3 |
| Xiaomi | xiaomi | XIAOMI_API_KEY | xiaomi/mimo-v2-flash |
Особливості, які варто знати
OpenRouter
OpenRouter
Застосовує свої заголовки атрибуції застосунку та маркери Anthropic
cache_control лише на перевірених маршрутах openrouter.ai. Посилання DeepSeek, Moonshot і ZAI придатні для cache-TTL у кешуванні підказок, керованому OpenRouter, але не отримують маркерів кешу Anthropic. Як проксі-подібний OpenAI-сумісний шлях, він пропускає формування, призначене лише для нативного OpenAI (serviceTier, Responses store, підказки кешу підказок, сумісність міркування OpenAI). Посилання на базі Gemini зберігають лише санітизацію сигнатур думок proxy-Gemini.Kilo Gateway
Kilo Gateway
Посилання на базі Gemini проходять тим самим шляхом санітизації proxy-Gemini;
kilocode/kilo/auto та інші посилання, що не підтримують проксі-міркування, пропускають інʼєкцію проксі-міркування.MiniMax
MiniMax
Налаштування з API-ключем записує явні текстові визначення чат-моделей M2.7; розуміння зображень залишається на медіапостачальнику
MiniMax-VL-01, яким володіє плагін.NVIDIA
NVIDIA
ID моделей використовують простір імен
nvidia/<vendor>/<model> (наприклад, nvidia/nvidia/nemotron-... поряд із nvidia/moonshotai/kimi-k2.5); засоби вибору зберігають буквальну композицію <provider>/<model-id>, тоді як канонічний ключ, надісланий до API, залишається з одним префіксом.xAI
xAI
Використовує шлях xAI Responses.
grok-4.3 є вбудованою стандартною чат-моделлю. /fast або params.fastMode: true переписує grok-3, grok-3-mini, grok-4 і grok-4-0709 на їхні варіанти *-fast. tool_stream увімкнено за замовчуванням; вимкніть через agents.defaults.models["xai/<model>"].params.tool_stream=false.Cerebras
Cerebras
Постачається як вбудований плагін постачальника
cerebras. GLM використовує zai-glm-4.7; OpenAI-сумісна базова URL-адреса: https://api.cerebras.ai/v1.Постачальники через models.providers (власна/базова URL-адреса)
Використовуйте models.providers (або models.json), щоб додати власних постачальників або OpenAI/Anthropic-сумісні проксі.
Багато з наведених нижче вбудованих плагінів постачальників уже публікують стандартний каталог. Використовуйте явні записи models.providers.<id> лише тоді, коли потрібно перевизначити стандартну базову URL-адресу, заголовки або список моделей.
Перевірки можливостей моделей Gateway також читають явні метадані models.providers.<id>.models[]. Якщо власна або проксі-модель приймає зображення, задайте input: ["text", "image"] для цієї моделі, щоб WebChat і шляхи вкладень, що походять із вузла, передавали зображення як нативні вхідні дані моделі, а не як текстові медіапосилання.
agents.defaults.models["provider/model"] керує лише видимістю моделей, псевдонімами та метаданими окремих моделей для агентів. Він сам собою не реєструє нову runtime-модель. Для моделей власного постачальника також додайте models.providers.<provider>.models[] принаймні з відповідним id.
Moonshot AI (Kimi)
Moonshot постачається як вбудований плагін постачальника. За замовчуванням використовуйте вбудованого постачальника й додавайте явний записmodels.providers.moonshot лише тоді, коли потрібно перевизначити базову URL-адресу або метадані моделі:
- Постачальник:
moonshot - Автентифікація:
MOONSHOT_API_KEY - Приклад моделі:
moonshot/kimi-k2.6 - CLI:
openclaw onboard --auth-choice moonshot-api-keyoropenclaw onboard --auth-choice moonshot-api-key-cn
moonshot/kimi-k2.6moonshot/kimi-k2.5moonshot/kimi-k2-thinkingmoonshot/kimi-k2-thinking-turbomoonshot/kimi-k2-turbo
Kimi coding
Kimi Coding використовує сумісну з Anthropic кінцеву точку Moonshot AI:- Постачальник:
kimi - Автентифікація:
KIMI_API_KEY - Приклад моделі:
kimi/kimi-for-coding
kimi/kimi-code і kimi/k2p5 досі приймаються як ідентифікатори моделей для сумісності й нормалізуються до стабільного ідентифікатора моделі API Kimi.
Volcano Engine (Doubao)
Volcano Engine (火山引擎) надає доступ до Doubao та інших моделей у Китаї.- Постачальник:
volcengine(для кодування:volcengine-plan) - Автентифікація:
VOLCANO_ENGINE_API_KEY - Приклад моделі:
volcengine-plan/ark-code-latest - CLI:
openclaw onboard --auth-choice volcengine-api-key
volcengine/* реєструється одночасно.
У засобах вибору моделей для онбордингу/налаштування варіант автентифікації Volcengine надає перевагу рядкам volcengine/* і volcengine-plan/*. Якщо ці моделі ще не завантажено, OpenClaw повертається до нефільтрованого каталогу замість показу порожнього засобу вибору, обмеженого постачальником.
- Standard models
- Coding models (volcengine-plan)
volcengine/doubao-seed-1-8-251228(Doubao Seed 1.8)volcengine/doubao-seed-code-preview-251028volcengine/kimi-k2-5-260127(Kimi K2.5)volcengine/glm-4-7-251222(GLM 4.7)volcengine/deepseek-v3-2-251201(DeepSeek V3.2 128K)
BytePlus (International)
BytePlus ARK надає міжнародним користувачам доступ до тих самих моделей, що й Volcano Engine.- Постачальник:
byteplus(для кодування:byteplus-plan) - Автентифікація:
BYTEPLUS_API_KEY - Приклад моделі:
byteplus-plan/ark-code-latest - CLI:
openclaw onboard --auth-choice byteplus-api-key
byteplus/* реєструється одночасно.
У засобах вибору моделей для онбордингу/налаштування варіант автентифікації BytePlus надає перевагу рядкам byteplus/* і byteplus-plan/*. Якщо ці моделі ще не завантажено, OpenClaw повертається до нефільтрованого каталогу замість показу порожнього засобу вибору, обмеженого постачальником.
- Standard models
- Coding models (byteplus-plan)
byteplus/seed-1-8-251228(Seed 1.8)byteplus/kimi-k2-5-260127(Kimi K2.5)byteplus/glm-4-7-251222(GLM 4.7)
Synthetic
Synthetic надає сумісні з Anthropic моделі через постачальникаsynthetic:
- Постачальник:
synthetic - Автентифікація:
SYNTHETIC_API_KEY - Приклад моделі:
synthetic/hf:MiniMaxAI/MiniMax-M2.5 - CLI:
openclaw onboard --auth-choice synthetic-api-key
MiniMax
MiniMax налаштовується черезmodels.providers, оскільки використовує власні кінцеві точки:
- MiniMax OAuth (глобально):
--auth-choice minimax-global-oauth - MiniMax OAuth (CN):
--auth-choice minimax-cn-oauth - API-ключ MiniMax (глобально):
--auth-choice minimax-global-api - API-ключ MiniMax (CN):
--auth-choice minimax-cn-api - Автентифікація:
MINIMAX_API_KEYдляminimax;MINIMAX_OAUTH_TOKENабоMINIMAX_API_KEYдляminimax-portal
На сумісному з Anthropic потоковому шляху MiniMax OpenClaw вимикає thinking за замовчуванням, якщо ви явно його не задасте, а
/fast on переписує MiniMax-M2.7 на MiniMax-M2.7-highspeed.- Типові налаштування тексту/чату залишаються на
minimax/MiniMax-M2.7 - Генерація зображень — це
minimax/image-01абоminimax-portal/image-01 - Розуміння зображень належить Plugin:
MiniMax-VL-01на обох шляхах автентифікації MiniMax - Вебпошук залишається на ідентифікаторі постачальника
minimax
LM Studio
LM Studio постачається як вбудований Plugin постачальника, що використовує нативний API:- Постачальник:
lmstudio - Автентифікація:
LM_API_TOKEN - Типова базова URL-адреса інференсу:
http://localhost:1234/v1
http://localhost:1234/api/v1/models):
/api/v1/models і /api/v1/models/load LM Studio для виявлення та автоматичного завантаження, а для інференсу за замовчуванням — /v1/chat/completions. Якщо ви хочете, щоб JIT-завантаження, TTL і автоматичне витіснення LM Studio керували життєвим циклом моделі, задайте models.providers.lmstudio.params.preload: false. Див. /providers/lmstudio для налаштування та усунення несправностей.
Ollama
Ollama постачається як вбудований Plugin постачальника й використовує нативний API Ollama:- Постачальник:
ollama - Автентифікація: не потрібна (локальний сервер)
- Приклад моделі:
ollama/llama3.3 - Встановлення: https://ollama.com/download
http://127.0.0.1:11434, коли ви вмикаєте її через OLLAMA_API_KEY, а вбудований Plugin постачальника додає Ollama безпосередньо до openclaw onboard і засобу вибору моделей. Див. /providers/ollama для онбордингу, хмарного/локального режиму та власної конфігурації.
vLLM
vLLM постачається як вбудований Plugin постачальника для локальних/самостійно розміщених сумісних з OpenAI серверів:- Постачальник:
vllm - Автентифікація: необов’язкова (залежить від вашого сервера)
- Типова базова URL-адреса:
http://127.0.0.1:8000/v1
/v1/models):
SGLang
SGLang постачається як вбудований Plugin постачальника для швидких самостійно розміщених сумісних з OpenAI серверів:- Постачальник:
sglang - Автентифікація: необов’язкова (залежить від вашого сервера)
- Типова базова URL-адреса:
http://127.0.0.1:30000/v1
/v1/models):
Локальні проксі (LM Studio, vLLM, LiteLLM тощо)
Приклад (сумісний з OpenAI):Default optional fields
Default optional fields
Для власних постачальників
reasoning, input, cost, contextWindow і maxTokens є необов’язковими. Якщо їх пропущено, OpenClaw за замовчуванням використовує:reasoning: falseinput: ["text"]cost: { input: 0, output: 0, cacheRead: 0, cacheWrite: 0 }contextWindow: 200000maxTokens: 8192
Proxy-route shaping rules
Proxy-route shaping rules
- Для
api: "openai-completions"на ненативних кінцевих точках (будь-яка непорожняbaseUrl, хост якої не єapi.openai.com) OpenClaw примусово встановлюєcompat.supportsDeveloperRole: false, щоб уникнути помилок постачальника 400 для непідтримуваних ролейdeveloper. - Маршрути сумісних з OpenAI проксі також пропускають нативне формування запитів, специфічне лише для OpenAI: без
service_tier, без Responsesstore, без Completionsstore, без підказок prompt-cache, без формування payload для сумісності reasoning OpenAI і без прихованих заголовків атрибуції OpenClaw. - Для сумісних з OpenAI проксі Completions, яким потрібні специфічні для постачальника поля, задайте
agents.defaults.models["provider/model"].params.extra_body(абоextraBody), щоб об’єднати додатковий JSON із вихідним тілом запиту. - Для елементів керування chat-template vLLM задайте
agents.defaults.models["provider/model"].params.chat_template_kwargs. Вбудований Plugin vLLM автоматично надсилаєenable_thinking: falseіforce_nonempty_content: trueдляvllm/nemotron-3-*, коли рівень thinking сеансу вимкнено. - Для повільних локальних моделей або віддалених LAN/tailnet-хостів задайте
models.providers.<id>.timeoutSeconds. Це розширює обробку HTTP-запитів до моделей постачальника, включно з підключенням, заголовками, потоковою передачею тіла та загальним перериванням guarded-fetch, не збільшуючи загальний тайм-аут виконання агента. - HTTP-виклики постачальника моделей дозволяють fake-IP DNS-відповіді Surge, Clash і sing-box у
198.18.0.0/15іfc00::/7лише для налаштованого імені хостаbaseUrlпостачальника. Інші приватні, loopback, link-local і metadata-призначення все одно потребують явного ввімкненняmodels.providers.<id>.request.allowPrivateNetwork: true. - Якщо
baseUrlпорожній або пропущений, OpenClaw зберігає типову поведінку OpenAI (яка розв’язується доapi.openai.com). - Для безпеки явне
compat.supportsDeveloperRole: trueусе одно перевизначається на ненативних кінцевих точкахopenai-completions. - Для
api: "anthropic-messages"на непрямих кінцевих точках (будь-який постачальник, окрім канонічногоanthropic, або власнийmodels.providers.anthropic.baseUrl, хост якого не є публічною кінцевою точкоюapi.anthropic.com) OpenClaw приглушує неявні beta-заголовки Anthropic, такі якclaude-code-20250219,interleaved-thinking-2025-05-14і OAuth-маркери, щоб власні сумісні з Anthropic проксі не відхиляли непідтримувані beta-прапорці. Явно задайтеmodels.providers.<id>.headers["anthropic-beta"], якщо вашому проксі потрібні конкретні beta-функції.
Приклади CLI
Пов’язане
- Довідник конфігурації - ключі конфігурації моделей
- Відмовостійкість моделей - fallback-ланцюги та поведінка повторних спроб
- Моделі - конфігурація моделей і псевдоніми
- Постачальники - посібники з налаштування для кожного постачальника