Referenz für LLM-/Modell-Provider (nicht Chat-Kanäle wie WhatsApp/Telegram). Regeln zur Modellauswahl finden Sie unter Modelle.Documentation Index
Fetch the complete documentation index at: https://docs.openclaw.ai/llms.txt
Use this file to discover all available pages before exploring further.
Kurzregeln
Modell-Refs und CLI-Hilfsbefehle
Modell-Refs und CLI-Hilfsbefehle
- Modell-Refs verwenden
provider/model(Beispiel:opencode/claude-opus-4-6). agents.defaults.modelsdient als Allowlist, wenn es gesetzt ist.- CLI-Hilfsbefehle:
openclaw onboard,openclaw models list,openclaw models set <provider/model>. models.providers.*.contextWindow/contextTokens/maxTokenslegen Standardwerte auf Provider-Ebene fest;models.providers.*.models[].contextWindow/contextTokens/maxTokensüberschreiben sie pro Modell.- Fallback-Regeln, Cooldown-Probes und Persistenz von Sitzungs-Overrides: Modell-Failover.
Das Hinzufügen von Provider-Auth ändert Ihr primäres Modell nicht
Das Hinzufügen von Provider-Auth ändert Ihr primäres Modell nicht
openclaw configure behält ein vorhandenes agents.defaults.model.primary bei, wenn Sie einen Provider hinzufügen oder erneut authentifizieren. openclaw models auth login verhält sich genauso, sofern Sie nicht --set-default übergeben. Provider-Plugins können weiterhin ein empfohlenes Standardmodell in ihrem Auth-Konfigurationspatch zurückgeben, aber OpenClaw behandelt dies als „dieses Modell verfügbar machen“, wenn bereits ein primäres Modell existiert, nicht als „das aktuelle primäre Modell ersetzen“.Um das Standardmodell bewusst zu wechseln, verwenden Sie openclaw models set <provider/model> oder openclaw models auth login --provider <id> --set-default.OpenAI-Provider-/Runtime-Trennung
OpenAI-Provider-/Runtime-Trennung
Routen der OpenAI-Familie sind präfixspezifisch:
openai/<model>verwendet standardmäßig das native Codex-App-Server-Harness für Agent-Turns. Dies ist die übliche Einrichtung für ChatGPT-/Codex-Abonnements.openai-codex/<model>ist Legacy-Konfiguration, die doctor zuopenai/<model>umschreibt.openai/<model>plus Provider-/Modell-agentRuntime.id: "pi"verwendet PI für explizite API-Key- oder Kompatibilitätsrouten.
openai/*-Agent-Refs aktivieren das Codex-Plugin für die Standardroute, und explizite Provider-/Modell-agentRuntime.id: "codex"- oder Legacy-codex/<model>-Refs benötigen es ebenfalls.GPT-5.5 ist standardmäßig über das native Codex-App-Server-Harness unter openai/gpt-5.5 verfügbar und über PI nur dann, wenn die Provider-/Modell-Runtime-Richtlinie explizit pi auswählt.CLI-Runtimes
CLI-Runtimes
CLI-Runtimes verwenden dieselbe Trennung: Wählen Sie kanonische Modell-Refs wie
anthropic/claude-*, google/gemini-* oder openai/gpt-*, und setzen Sie dann die Provider-/Modell-Runtime-Richtlinie auf claude-cli, google-gemini-cli oder codex-cli, wenn Sie ein lokales CLI-Backend verwenden möchten.Legacy-Refs claude-cli/*, google-gemini-cli/* und codex-cli/* werden zurück zu kanonischen Provider-Refs migriert, wobei die Runtime separat erfasst wird.Plugin-eigenes Provider-Verhalten
Der Großteil der Provider-spezifischen Logik lebt in Provider-Plugins (registerProvider(...)), während OpenClaw die generische Inferenzschleife beibehält. Plugins besitzen Onboarding, Modellkataloge, Auth-Env-Var-Mapping, Transport-/Konfigurationsnormalisierung, Tool-Schema-Bereinigung, Failover-Klassifizierung, OAuth-Aktualisierung, Nutzungsberichte, Denk-/Reasoning-Profile und mehr.
Die vollständige Liste der Provider-SDK-Hooks und Beispiele für gebündelte Plugins finden Sie unter Provider-Plugins. Ein Provider, der einen vollständig benutzerdefinierten Request-Executor benötigt, ist eine separate, tiefere Erweiterungsfläche.
Provider-eigenes Runner-Verhalten lebt auf expliziten Provider-Hooks wie Replay-Richtlinie, Tool-Schema-Normalisierung, Stream-Wrapping und Transport-/Request-Hilfsfunktionen. Die Legacy-Static-Bag
ProviderPlugin.capabilities dient nur der Kompatibilität und wird von der gemeinsamen Runner-Logik nicht mehr gelesen.API-Key-Rotation
Key-Quellen und Priorität
Key-Quellen und Priorität
Konfigurieren Sie mehrere Keys über:
OPENCLAW_LIVE_<PROVIDER>_KEY(einzelner Live-Override, höchste Priorität)<PROVIDER>_API_KEYS(durch Komma oder Semikolon getrennte Liste)<PROVIDER>_API_KEY(primärer Key)<PROVIDER>_API_KEY_*(nummerierte Liste, z. B.<PROVIDER>_API_KEY_1)
GOOGLE_API_KEY ebenfalls als Fallback einbezogen. Die Auswahlreihenfolge der Keys behält die Priorität bei und dedupliziert Werte.Wann Rotation greift
Wann Rotation greift
- Requests werden nur bei Rate-Limit-Antworten mit dem nächsten Key erneut versucht (zum Beispiel
429,rate_limit,quota,resource exhausted,Too many concurrent requests,ThrottlingException,concurrency limit reached,workers_ai ... quota limit exceededoder periodische Nutzungslimitmeldungen). - Fehler ohne Rate-Limit schlagen sofort fehl; es wird keine Key-Rotation versucht.
- Wenn alle Kandidaten-Keys fehlschlagen, wird der abschließende Fehler aus dem letzten Versuch zurückgegeben.
Integrierte Provider (pi-ai-Katalog)
OpenClaw wird mit dem pi-ai-Katalog ausgeliefert. Diese Provider benötigen keinemodels.providers-Konfiguration; setzen Sie einfach Auth und wählen Sie ein Modell.
OpenAI
- Provider:
openai - Auth:
OPENAI_API_KEY - Optionale Rotation:
OPENAI_API_KEYS,OPENAI_API_KEY_1,OPENAI_API_KEY_2plusOPENCLAW_LIVE_OPENAI_KEY(einzelner Override) - Beispielmodelle:
openai/gpt-5.5,openai/gpt-5.4-mini - Prüfen Sie die Verfügbarkeit von Konto/Modell mit
openclaw models list --provider openai, wenn eine bestimmte Installation oder ein API-Key sich anders verhält. - CLI:
openclaw onboard --auth-choice openai-api-key - Der Standardtransport ist
auto; OpenClaw übergibt die Transportauswahl an pi-ai. - Override pro Modell über
agents.defaults.models["openai/<model>"].params.transport("sse","websocket"oder"auto") - OpenAI Priority Processing kann über
agents.defaults.models["openai/<model>"].params.serviceTieraktiviert werden /fastundparams.fastModeordnen direkteopenai/*-Responses-Requestsservice_tier=priorityaufapi.openai.comzu- Verwenden Sie
params.serviceTier, wenn Sie statt des gemeinsamen/fast-Toggles eine explizite Stufe wünschen - Verborgene OpenClaw-Attributionsheader (
originator,version,User-Agent) gelten nur für nativen OpenAI-Traffic zuapi.openai.com, nicht für generische OpenAI-kompatible Proxys - Native OpenAI-Routen behalten außerdem Responses
store, Prompt-Cache-Hinweise und OpenAI-Reasoning-kompatible Payload-Formung bei; Proxy-Routen tun dies nicht openai/gpt-5.3-codex-sparkwird in OpenClaw absichtlich unterdrückt, weil Live-OpenAI-API-Requests es ablehnen und der aktuelle Codex-Katalog es nicht bereitstellt
Anthropic
- Provider:
anthropic - Auth:
ANTHROPIC_API_KEY - Optionale Rotation:
ANTHROPIC_API_KEYS,ANTHROPIC_API_KEY_1,ANTHROPIC_API_KEY_2plusOPENCLAW_LIVE_ANTHROPIC_KEY(einzelner Override) - Beispielmodell:
anthropic/claude-opus-4-6 - CLI:
openclaw onboard --auth-choice apiKey - Direkte öffentliche Anthropic-Requests unterstützen den gemeinsamen
/fast-Toggle undparams.fastMode, einschließlich API-Key- und OAuth-authentifiziertem Traffic, der anapi.anthropic.comgesendet wird; OpenClaw ordnet dies Anthropicservice_tierzu (autovsstandard_only) - Die bevorzugte Claude-CLI-Konfiguration hält die Modell-Ref kanonisch und wählt das CLI-
Backend separat aus:
anthropic/claude-opus-4-7mit modellgebundenemagentRuntime.id: "claude-cli". Legacy-claude-cli/claude-opus-4-7-Refs funktionieren aus Kompatibilitätsgründen weiterhin.
Anthropic-Mitarbeiter haben uns mitgeteilt, dass OpenClaw-artige Claude-CLI-Nutzung wieder erlaubt ist, daher behandelt OpenClaw die Wiederverwendung der Claude CLI und die Nutzung von
claude -p als für diese Integration genehmigt, sofern Anthropic keine neue Richtlinie veröffentlicht. Anthropic setup-token bleibt als unterstützter OpenClaw-Token-Pfad verfügbar, aber OpenClaw bevorzugt jetzt die Wiederverwendung der Claude CLI und claude -p, wenn verfügbar.OpenAI Codex OAuth
- Provider:
openai-codex - Auth: OAuth (ChatGPT)
- Legacy-PI-Modell-Ref:
openai-codex/gpt-5.5 - Native Codex-App-Server-Harness-Ref:
openai/gpt-5.5 - Dokumentation zum nativen Codex-App-Server-Harness: Codex-Harness
- Legacy-Modell-Refs:
codex/gpt-* - Plugin-Grenze:
openai-codex/*lädt das OpenAI-Plugin; das native Codex-App-Server-Plugin wird nur durch die Codex-Harness-Runtime oder Legacy-codex/*-Refs ausgewählt. - CLI:
openclaw onboard --auth-choice openai-codexoderopenclaw models auth login --provider openai-codex - Der Standardtransport ist
auto(WebSocket zuerst, SSE-Fallback) - Override pro PI-Modell über
agents.defaults.models["openai-codex/<model>"].params.transport("sse","websocket"oder"auto") params.serviceTierwird außerdem bei nativen Codex-Responses-Requests (chatgpt.com/backend-api) weitergeleitet- Verborgene OpenClaw-Attributionsheader (
originator,version,User-Agent) werden nur bei nativem Codex-Traffic zuchatgpt.com/backend-apiangehängt, nicht bei generischen OpenAI-kompatiblen Proxys - Teilt denselben
/fast-Toggle und dieselbeparams.fastMode-Konfiguration wie direkteopenai/*; OpenClaw ordnet diesservice_tier=priorityzu openai-codex/gpt-5.5verwendet das nativecontextWindow = 400000des Codex-Katalogs und die Standard-RuntimecontextTokens = 272000; überschreiben Sie die Runtime-Obergrenze mitmodels.providers.openai-codex.models[].contextTokens- Richtlinienhinweis: OpenAI Codex OAuth wird ausdrücklich für externe Tools/Workflows wie OpenClaw unterstützt.
- Für die gängige Route aus Abonnement plus nativer Codex-Runtime melden Sie sich mit
openai-codex-Auth an, konfigurieren aberopenai/gpt-5.5; OpenAI-Agent-Turns wählen standardmäßig Codex aus. - Verwenden Sie Provider-/Modell-
agentRuntime.id: "pi"nur, wenn Sie eine Kompatibilitätsroute über PI wünschen; andernfalls belassen Sieopenai/gpt-5.5auf dem standardmäßigen Codex-Harness. - Ältere
openai-codex/gpt-5.1*-,openai-codex/gpt-5.2*- undopenai-codex/gpt-5.3*-Refs werden unterdrückt, weil ChatGPT-/Codex-OAuth-Konten sie ablehnen; verwenden Sie stattdessenopenai-codex/gpt-5.5oder die native Codex-Runtime-Route.
Weitere gehostete Optionen im Abonnement-Stil
GLM-Modelle
Z.AI Coding Plan oder allgemeine API-Endpunkte.
MiniMax
MiniMax Coding Plan OAuth oder API-Key-Zugriff.
Qwen Cloud
Qwen Cloud-Provider-Oberfläche plus Alibaba DashScope und Endpunktzuordnung für Coding Plan.
OpenCode
- Auth:
OPENCODE_API_KEY(oderOPENCODE_ZEN_API_KEY) - Zen-Runtime-Provider:
opencode - Go-Runtime-Provider:
opencode-go - Beispielmodelle:
opencode/claude-opus-4-6,opencode-go/kimi-k2.6 - CLI:
openclaw onboard --auth-choice opencode-zenoderopenclaw onboard --auth-choice opencode-go
Google Gemini (API-Key)
- Provider:
google - Authentifizierung:
GEMINI_API_KEY - Optionale Rotation:
GEMINI_API_KEYS,GEMINI_API_KEY_1,GEMINI_API_KEY_2,GOOGLE_API_KEY-Fallback undOPENCLAW_LIVE_GEMINI_KEY(einzelne Überschreibung) - Beispielmodelle:
google/gemini-3.1-pro-preview,google/gemini-3-flash-preview - Kompatibilität: Die ältere OpenClaw-Konfiguration mit
google/gemini-3.1-flash-previewwird zugoogle/gemini-3-flash-previewnormalisiert - Alias:
google/gemini-3.1-prowird akzeptiert und zu Googles Live-Gemini-API-IDgoogle/gemini-3.1-pro-previewnormalisiert - CLI:
openclaw onboard --auth-choice gemini-api-key - Denken:
/think adaptiveverwendet Googles dynamisches Denken. Gemini 3/3.1 lassen ein festesthinkingLevelweg; Gemini 2.5 sendetthinkingBudget: -1. - Direkte Gemini-Ausführungen akzeptieren auch
agents.defaults.models["google/<model>"].params.cachedContent(oder das älterecached_content), um ein Provider-nativescachedContents/...-Handle weiterzuleiten; Gemini-Cachetreffer erscheinen als OpenClawcacheRead
Google Vertex und Gemini CLI
- Provider:
google-vertex,google-gemini-cli - Authentifizierung: Vertex verwendet gcloud ADC; Gemini CLI verwendet seinen OAuth-Ablauf
google-Plugins ausgeliefert.
Anmelden
google-gemini-cli/gemini-3-flash-preview. Sie fügen keine Client-ID und kein Secret in openclaw.json ein. Der CLI-Anmeldeablauf speichert Tokens in Auth-Profilen auf dem Gateway-Host.response geparst; die Nutzung greift ersatzweise auf stats zurück, wobei stats.cached in OpenClaw cacheRead normalisiert wird.
Z.AI (GLM)
- Provider:
zai - Authentifizierung:
ZAI_API_KEY - Beispielmodell:
zai/glm-5.1 - CLI:
openclaw onboard --auth-choice zai-api-key- Aliasse:
z.ai/*undz-ai/*werden zuzai/*normalisiert zai-api-keyerkennt den passenden Z.AI-Endpunkt automatisch;zai-coding-global,zai-coding-cn,zai-globalundzai-cnerzwingen eine bestimmte Oberfläche
- Aliasse:
Vercel AI Gateway
- Provider:
vercel-ai-gateway - Authentifizierung:
AI_GATEWAY_API_KEY - Beispielmodelle:
vercel-ai-gateway/anthropic/claude-opus-4.6,vercel-ai-gateway/moonshotai/kimi-k2.6 - CLI:
openclaw onboard --auth-choice ai-gateway-api-key
Kilo Gateway
- Provider:
kilocode - Authentifizierung:
KILOCODE_API_KEY - Beispielmodell:
kilocode/kilo/auto - CLI:
openclaw onboard --auth-choice kilocode-api-key - Basis-URL:
https://api.kilo.ai/api/gateway/ - Der statische Fallback-Katalog liefert
kilocode/kilo/autoaus; die Live-Erkennung überhttps://api.kilo.ai/api/gateway/modelskann den Laufzeitkatalog weiter erweitern. - Das exakte Upstream-Routing hinter
kilocode/kilo/autoliegt bei Kilo Gateway und ist nicht in OpenClaw fest codiert.
Andere gebündelte Provider-Plugins
| Provider | ID | Auth-Env | Beispielmodell |
|---|---|---|---|
| BytePlus | byteplus / byteplus-plan | BYTEPLUS_API_KEY | byteplus-plan/ark-code-latest |
| Cerebras | cerebras | CEREBRAS_API_KEY | cerebras/zai-glm-4.7 |
| Cloudflare AI Gateway | cloudflare-ai-gateway | CLOUDFLARE_AI_GATEWAY_API_KEY | - |
| DeepInfra | deepinfra | DEEPINFRA_API_KEY | deepinfra/deepseek-ai/DeepSeek-V3.2 |
| DeepSeek | deepseek | DEEPSEEK_API_KEY | deepseek/deepseek-v4-flash |
| GitHub Copilot | github-copilot | COPILOT_GITHUB_TOKEN / GH_TOKEN / GITHUB_TOKEN | - |
| Groq | groq | GROQ_API_KEY | - |
| Hugging Face Inference | huggingface | HUGGINGFACE_HUB_TOKEN oder HF_TOKEN | huggingface/deepseek-ai/DeepSeek-R1 |
| Kilo Gateway | kilocode | KILOCODE_API_KEY | kilocode/kilo/auto |
| Kimi Coding | kimi | KIMI_API_KEY oder KIMICODE_API_KEY | kimi/kimi-for-coding |
| MiniMax | minimax / minimax-portal | MINIMAX_API_KEY / MINIMAX_OAUTH_TOKEN | minimax/MiniMax-M2.7 |
| Mistral | mistral | MISTRAL_API_KEY | mistral/mistral-large-latest |
| Moonshot | moonshot | MOONSHOT_API_KEY | moonshot/kimi-k2.6 |
| NVIDIA | nvidia | NVIDIA_API_KEY | nvidia/nvidia/nemotron-3-super-120b-a12b |
| OpenRouter | openrouter | OPENROUTER_API_KEY | openrouter/auto |
| Qianfan | qianfan | QIANFAN_API_KEY | qianfan/deepseek-v3.2 |
| Qwen Cloud | qwen | QWEN_API_KEY / MODELSTUDIO_API_KEY / DASHSCOPE_API_KEY | qwen/qwen3.5-plus |
| StepFun | stepfun / stepfun-plan | STEPFUN_API_KEY | stepfun/step-3.5-flash |
| Together | together | TOGETHER_API_KEY | together/moonshotai/Kimi-K2.5 |
| Venice | venice | VENICE_API_KEY | - |
| Vercel AI Gateway | vercel-ai-gateway | AI_GATEWAY_API_KEY | vercel-ai-gateway/anthropic/claude-opus-4.6 |
| Volcano Engine (Doubao) | volcengine / volcengine-plan | VOLCANO_ENGINE_API_KEY | volcengine-plan/ark-code-latest |
| xAI | xai | XAI_API_KEY | xai/grok-4.3 |
| Xiaomi | xiaomi | XIAOMI_API_KEY | xiaomi/mimo-v2-flash |
Wissenswerte Besonderheiten
OpenRouter
OpenRouter
Wendet seine App-Attributions-Header und Anthropic-
cache_control-Marker nur auf verifizierten openrouter.ai-Routen an. DeepSeek-, Moonshot- und ZAI-Referenzen sind für von OpenRouter verwaltetes Prompt-Caching mit Cache-TTL geeignet, erhalten aber keine Anthropic-Cache-Marker. Als proxyartiger OpenAI-kompatibler Pfad überspringt er nur für natives OpenAI geltende Formanpassungen (serviceTier, Responses store, Prompt-Cache-Hinweise, OpenAI-Reasoning-Kompatibilität). Gemini-gestützte Referenzen behalten nur die proxybezogene Gemini-Bereinigung von Thought-Signatures bei.Kilo Gateway
Kilo Gateway
Gemini-gestützte Referenzen folgen demselben proxybezogenen Gemini-Bereinigungspfad;
kilocode/kilo/auto und andere Referenzen ohne Proxy-Reasoning-Unterstützung überspringen die Proxy-Reasoning-Injektion.MiniMax
MiniMax
Das API-Key-Onboarding schreibt explizite reine Textdefinitionen für M2.7-Chatmodelle; Bildverständnis bleibt beim Plugin-eigenen Medien-Provider
MiniMax-VL-01.NVIDIA
NVIDIA
Modell-IDs verwenden einen Namespace
nvidia/<vendor>/<model> (zum Beispiel nvidia/nvidia/nemotron-... neben nvidia/moonshotai/kimi-k2.5); Picker bewahren die wörtliche Zusammensetzung <provider>/<model-id>, während der kanonische an die API gesendete Schlüssel einfach präfixiert bleibt.xAI
xAI
Verwendet den xAI-Responses-Pfad.
grok-4.3 ist das gebündelte Standard-Chatmodell. /fast oder params.fastMode: true schreibt grok-3, grok-3-mini, grok-4 und grok-4-0709 auf ihre *-fast-Varianten um. tool_stream ist standardmäßig aktiviert; deaktivieren Sie es über agents.defaults.models["xai/<model>"].params.tool_stream=false.Cerebras
Cerebras
Wird als gebündeltes
cerebras-Provider-Plugin ausgeliefert. GLM verwendet zai-glm-4.7; die OpenAI-kompatible Basis-URL ist https://api.cerebras.ai/v1.Provider über models.providers (benutzerdefiniert/Basis-URL)
Verwenden Sie models.providers (oder models.json), um benutzerdefinierte Provider oder OpenAI-/Anthropic-kompatible Proxys hinzuzufügen.
Viele der unten aufgeführten gebündelten Provider-Plugins veröffentlichen bereits einen Standardkatalog. Verwenden Sie explizite models.providers.<id>-Einträge nur, wenn Sie die standardmäßige Basis-URL, Header oder Modellliste überschreiben möchten.
Gateway-Modellfähigkeitsprüfungen lesen auch explizite models.providers.<id>.models[]-Metadaten. Wenn ein benutzerdefiniertes oder Proxy-Modell Bilder akzeptiert, setzen Sie bei diesem Modell input: ["text", "image"], damit WebChat- und von Nodes ausgehende Anhangspfade Bilder als native Modelleingaben statt als reine Text-Medienreferenzen übergeben.
agents.defaults.models["provider/model"] steuert nur Modellsichtbarkeit, Aliase und modellbezogene Metadaten für Agenten. Es registriert allein kein neues Laufzeitmodell. Fügen Sie für benutzerdefinierte Provider-Modelle außerdem models.providers.<provider>.models[] mit mindestens der passenden id hinzu.
Moonshot AI (Kimi)
Moonshot wird als gebündeltes Provider-Plugin ausgeliefert. Verwenden Sie standardmäßig den integrierten Provider und fügen Sie nur dann einen explizitenmodels.providers.moonshot-Eintrag hinzu, wenn Sie die Basis-URL oder Modellmetadaten überschreiben müssen:
- Provider:
moonshot - Auth:
MOONSHOT_API_KEY - Beispielmodell:
moonshot/kimi-k2.6 - CLI:
openclaw onboard --auth-choice moonshot-api-keyoderopenclaw onboard --auth-choice moonshot-api-key-cn
moonshot/kimi-k2.6moonshot/kimi-k2.5moonshot/kimi-k2-thinkingmoonshot/kimi-k2-thinking-turbomoonshot/kimi-k2-turbo
Kimi Coding
Kimi Coding verwendet den Anthropic-kompatiblen Endpunkt von Moonshot AI:- Provider:
kimi - Authentifizierung:
KIMI_API_KEY - Beispielmodell:
kimi/kimi-for-coding
kimi/kimi-code und kimi/k2p5 werden weiterhin als Kompatibilitätsmodell-IDs akzeptiert und auf Kimis stabile API-Modell-ID normalisiert.
Volcano Engine (Doubao)
Volcano Engine (火山引擎) bietet Zugriff auf Doubao und andere Modelle in China.- Provider:
volcengine(Coding:volcengine-plan) - Authentifizierung:
VOLCANO_ENGINE_API_KEY - Beispielmodell:
volcengine-plan/ark-code-latest - CLI:
openclaw onboard --auth-choice volcengine-api-key
volcengine/*-Katalog wird gleichzeitig registriert.
In den Modellauswahlen für Onboarding/Konfiguration bevorzugt die Volcengine-Authentifizierungsoption sowohl volcengine/*- als auch volcengine-plan/*-Zeilen. Wenn diese Modelle noch nicht geladen sind, fällt OpenClaw auf den ungefilterten Katalog zurück, statt eine leere Provider-bezogene Auswahl anzuzeigen.
- Standardmodelle
- Coding-Modelle (volcengine-plan)
volcengine/doubao-seed-1-8-251228(Doubao Seed 1.8)volcengine/doubao-seed-code-preview-251028volcengine/kimi-k2-5-260127(Kimi K2.5)volcengine/glm-4-7-251222(GLM 4.7)volcengine/deepseek-v3-2-251201(DeepSeek V3.2 128K)
BytePlus (International)
BytePlus ARK bietet internationalen Benutzern Zugriff auf dieselben Modelle wie Volcano Engine.- Provider:
byteplus(Coding:byteplus-plan) - Authentifizierung:
BYTEPLUS_API_KEY - Beispielmodell:
byteplus-plan/ark-code-latest - CLI:
openclaw onboard --auth-choice byteplus-api-key
byteplus/*-Katalog wird gleichzeitig registriert.
In den Modellauswahlen für Onboarding/Konfiguration bevorzugt die BytePlus-Authentifizierungsoption sowohl byteplus/*- als auch byteplus-plan/*-Zeilen. Wenn diese Modelle noch nicht geladen sind, fällt OpenClaw auf den ungefilterten Katalog zurück, statt eine leere Provider-bezogene Auswahl anzuzeigen.
- Standardmodelle
- Coding-Modelle (byteplus-plan)
byteplus/seed-1-8-251228(Seed 1.8)byteplus/kimi-k2-5-260127(Kimi K2.5)byteplus/glm-4-7-251222(GLM 4.7)
Synthetic
Synthetic stellt Anthropic-kompatible Modelle hinter dem Providersynthetic bereit:
- Provider:
synthetic - Authentifizierung:
SYNTHETIC_API_KEY - Beispielmodell:
synthetic/hf:MiniMaxAI/MiniMax-M2.5 - CLI:
openclaw onboard --auth-choice synthetic-api-key
MiniMax
MiniMax wird übermodels.providers konfiguriert, da es benutzerdefinierte Endpunkte verwendet:
- MiniMax OAuth (Global):
--auth-choice minimax-global-oauth - MiniMax OAuth (CN):
--auth-choice minimax-cn-oauth - MiniMax API-Schlüssel (Global):
--auth-choice minimax-global-api - MiniMax API-Schlüssel (CN):
--auth-choice minimax-cn-api - Authentifizierung:
MINIMAX_API_KEYfürminimax;MINIMAX_OAUTH_TOKENoderMINIMAX_API_KEYfürminimax-portal
Auf MiniMaxs Anthropic-kompatiblem Streaming-Pfad deaktiviert OpenClaw Thinking standardmäßig, sofern Sie es nicht explizit festlegen, und
/fast on schreibt MiniMax-M2.7 in MiniMax-M2.7-highspeed um.- Text-/Chat-Standards bleiben auf
minimax/MiniMax-M2.7 - Bilderzeugung ist
minimax/image-01oderminimax-portal/image-01 - Bildverständnis ist Plugin-eigenes
MiniMax-VL-01auf beiden MiniMax-Authentifizierungspfaden - Websuche bleibt auf der Provider-ID
minimax
LM Studio
LM Studio wird als gebündeltes Provider-Plugin ausgeliefert, das die native API verwendet:- Provider:
lmstudio - Authentifizierung:
LM_API_TOKEN - Standard-Basis-URL für Inferenz:
http://localhost:1234/v1
http://localhost:1234/api/v1/models zurückgegeben werden):
/api/v1/models und /api/v1/models/load für Erkennung + automatisches Laden, standardmäßig mit /v1/chat/completions für Inferenz. Wenn Sie möchten, dass LM Studio JIT-Laden, TTL und automatische Entfernung den Modelllebenszyklus besitzen, setzen Sie models.providers.lmstudio.params.preload: false. Siehe /providers/lmstudio für Einrichtung und Fehlerbehebung.
Ollama
Ollama wird als gebündeltes Provider-Plugin ausgeliefert und verwendet Ollamas native API:- Provider:
ollama - Authentifizierung: Nicht erforderlich (lokaler Server)
- Beispielmodell:
ollama/llama3.3 - Installation: https://ollama.com/download
http://127.0.0.1:11434 erkannt, wenn Sie sich mit OLLAMA_API_KEY dafür entscheiden, und das gebündelte Provider-Plugin fügt Ollama direkt zu openclaw onboard und der Modellauswahl hinzu. Siehe /providers/ollama für Onboarding, Cloud-/lokalen Modus und benutzerdefinierte Konfiguration.
vLLM
vLLM wird als gebündeltes Provider-Plugin für lokale/selbst gehostete OpenAI-kompatible Server ausgeliefert:- Provider:
vllm - Authentifizierung: Optional (abhängig von Ihrem Server)
- Standard-Basis-URL:
http://127.0.0.1:8000/v1
/v1/models zurückgegeben werden):
SGLang
SGLang wird als gebündeltes Provider-Plugin für schnelle selbst gehostete OpenAI-kompatible Server ausgeliefert:- Provider:
sglang - Authentifizierung: Optional (abhängig von Ihrem Server)
- Standard-Basis-URL:
http://127.0.0.1:30000/v1
/v1/models zurückgegeben werden):
Lokale Proxys (LM Studio, vLLM, LiteLLM usw.)
Beispiel (OpenAI-kompatibel):Optionale Standardfelder
Optionale Standardfelder
Für benutzerdefinierte Provider sind
reasoning, input, cost, contextWindow und maxTokens optional. Wenn sie ausgelassen werden, verwendet OpenClaw standardmäßig:reasoning: falseinput: ["text"]cost: { input: 0, output: 0, cacheRead: 0, cacheWrite: 0 }contextWindow: 200000maxTokens: 8192
Regeln zur Proxy-Routen-Formung
Regeln zur Proxy-Routen-Formung
- Für
api: "openai-completions"auf nicht-nativen Endpunkten (jede nicht leerebaseUrl, deren Host nichtapi.openai.comist) erzwingt OpenClawcompat.supportsDeveloperRole: false, um Provider-400-Fehler wegen nicht unterstützterdeveloper-Rollen zu vermeiden. - OpenAI-kompatible Routen im Proxy-Stil überspringen außerdem native, nur für OpenAI geltende Anfrageformung: kein
service_tier, kein Responses-store, kein Completions-store, keine Prompt-Cache-Hinweise, keine OpenAI-Reasoning-Kompatibilitäts-Payload-Formung und keine versteckten OpenClaw-Zuordnungsheader. - Für OpenAI-kompatible Completions-Proxys, die anbieterspezifische Felder benötigen, setzen Sie
agents.defaults.models["provider/model"].params.extra_body(oderextraBody), um zusätzliches JSON in den ausgehenden Anfrage-Body zusammenzuführen. - Für vLLM-Chat-Template-Steuerungen setzen Sie
agents.defaults.models["provider/model"].params.chat_template_kwargs. Das gebündelte vLLM-Plugin sendet automatischenable_thinking: falseundforce_nonempty_content: truefürvllm/nemotron-3-*, wenn das Thinking-Level der Sitzung ausgeschaltet ist. - Für langsame lokale Modelle oder entfernte LAN-/Tailnet-Hosts setzen Sie
models.providers.<id>.timeoutSeconds. Dies erweitert die HTTP-Anfrageverarbeitung des Provider-Modells, einschließlich Verbindung, Headern, Body-Streaming und dem gesamten guarded-fetch-Abbruch, ohne das gesamte Agent-Laufzeit-Timeout zu erhöhen. - HTTP-Aufrufe von Modell-Providern erlauben Surge-, Clash- und sing-box-Fake-IP-DNS-Antworten in
198.18.0.0/15undfc00::/7nur für den konfigurierten Provider-baseUrl-Hostnamen. Andere private, Loopback-, Link-Local- und Metadaten-Ziele erfordern weiterhin eine explizitemodels.providers.<id>.request.allowPrivateNetwork: true-Aktivierung. - Wenn
baseUrlleer ist oder ausgelassen wird, behält OpenClaw das Standardverhalten von OpenAI bei (das zuapi.openai.comauflöst). - Aus Sicherheitsgründen wird ein explizites
compat.supportsDeveloperRole: trueauf nicht-nativenopenai-completions-Endpunkten weiterhin überschrieben. - Für
api: "anthropic-messages"auf nicht-direkten Endpunkten (jeder Provider außer dem kanonischenanthropicoder eine benutzerdefiniertemodels.providers.anthropic.baseUrl, deren Host kein öffentlicherapi.anthropic.com-Endpunkt ist) unterdrückt OpenClaw implizite Anthropic-Beta-Header wieclaude-code-20250219,interleaved-thinking-2025-05-14und OAuth-Marker, damit benutzerdefinierte Anthropic-kompatible Proxys nicht unterstützte Beta-Flags nicht ablehnen. Setzen Siemodels.providers.<id>.headers["anthropic-beta"]explizit, wenn Ihr Proxy bestimmte Beta-Funktionen benötigt.
CLI-Beispiele
Verwandte Themen
- Konfigurationsreferenz - Modellkonfigurationsschlüssel
- Modell-Failover - Fallback-Ketten und Wiederholungsverhalten
- Modelle - Modellkonfiguration und Aliase
- Provider - Einrichtungshandbücher pro Provider