inferrs kann lokale Modelle hinter einer OpenAI-kompatiblenDocumentation Index
Fetch the complete documentation index at: https://docs.openclaw.ai/llms.txt
Use this file to discover all available pages before exploring further.
/v1-API bereitstellen. OpenClaw funktioniert mit inferrs über den generischen openai-completions-Pfad.
| Eigenschaft | Wert |
|---|---|
| Provider-ID | inferrs (benutzerdefiniert; unter models.providers.inferrs konfigurieren) |
| Plugin | keines — inferrs ist kein gebündeltes OpenClaw-Provider-Plugin |
| Auth-Umgebungsvariable | Optional. Jeder Wert funktioniert, wenn Ihr inferrs-Server keine Authentifizierung hat |
| API | OpenAI-kompatibel (openai-completions) |
| Empfohlene Basis-URL | http://127.0.0.1:8080/v1 (oder dort, wo Ihr inferrs-Server läuft) |
inferrs sollte derzeit am besten als benutzerdefiniertes, selbst gehostetes OpenAI-kompatibles Backend behandelt werden, nicht als dediziertes OpenClaw-Provider-Plugin. Sie konfigurieren es über models.providers.inferrs und nicht über ein Auswahl-Flag beim Onboarding. Wenn Sie ein echtes gebündeltes Plugin mit automatischer Erkennung benötigen, siehe SGLang oder vLLM.Erste Schritte
Vollständiges Konfigurationsbeispiel
Dieses Beispiel verwendet Gemma 4 auf einem lokaleninferrs-Server.
Start bei Bedarf
Inferrs kann auch von OpenClaw nur dann gestartet werden, wenn eininferrs/...-Modell
ausgewählt ist. Fügen Sie localService demselben Provider-Eintrag hinzu:
command muss absolut sein. Verwenden Sie which inferrs auf dem Gateway-Host und tragen Sie diesen
Pfad in die Konfiguration ein. Die vollständige Feldreferenz finden Sie unter
Lokale Modelldienste.
Erweiterte Konfiguration
Warum requiresStringContent wichtig ist
Warum requiresStringContent wichtig ist
Einige OpenClaw fasst reine Text-Content-Parts vor dem Senden der Anfrage zu einfachen Zeichenketten zusammen.
inferrs-Chat-Completions-Routen akzeptieren nur stringbasierte
messages[].content, keine strukturierten Content-Part-Arrays.Hinweis zu Gemma und Tool-Schema
Hinweis zu Gemma und Tool-Schema
Einige aktuelle Kombinationen aus Dadurch wird die Tool-Schema-Oberfläche von OpenClaw für das Modell deaktiviert und die Prompt-
Belastung für strengere lokale Backends kann reduziert werden.Wenn sehr kleine direkte Anfragen weiterhin funktionieren, normale OpenClaw-Agent-Turns jedoch
innerhalb von
inferrs und Gemma akzeptieren kleine direkte
/v1/chat/completions-Anfragen, schlagen aber weiterhin bei vollständigen OpenClaw-Agent-Runtime-
Turns fehl.Wenn das geschieht, versuchen Sie zuerst Folgendes:inferrs abstürzen, liegt das verbleibende Problem in der Regel am Upstream-Modell-
oder Serververhalten und nicht an der Transportschicht von OpenClaw.Manueller Smoke-Test
Manueller Smoke-Test
Testen Sie nach der Konfiguration beide Ebenen:Wenn der erste Befehl funktioniert, der zweite jedoch fehlschlägt, prüfen Sie den Abschnitt zur Fehlerbehebung unten.
Proxy-artiges Verhalten
Proxy-artiges Verhalten
inferrs wird als Proxy-artiges OpenAI-kompatibles /v1-Backend behandelt, nicht als
nativer OpenAI-Endpunkt.- Native, nur für OpenAI geltende Anfrageformung wird hier nicht angewendet
- Kein
service_tier, kein Responses-store, keine Prompt-Cache-Hinweise und keine OpenAI-Reasoning-Kompatibilitäts-Payload-Formung - Verborgene OpenClaw-Attributions-Header (
originator,version,User-Agent) werden bei benutzerdefinierteninferrs-Basis-URLs nicht eingefügt
Fehlerbehebung
curl /v1/models schlägt fehl
curl /v1/models schlägt fehl
inferrs läuft nicht, ist nicht erreichbar oder ist nicht an den erwarteten
Host/Port gebunden. Stellen Sie sicher, dass der Server gestartet ist und auf der von Ihnen
konfigurierten Adresse lauscht.messages[].content erwartet eine Zeichenkette
messages[].content erwartet eine Zeichenkette
Setzen Sie
compat.requiresStringContent: true im Modelleintrag. Details finden Sie im
Abschnitt zu requiresStringContent oben.Direkte /v1/chat/completions-Aufrufe funktionieren, aber openclaw infer model run schlägt fehl
Direkte /v1/chat/completions-Aufrufe funktionieren, aber openclaw infer model run schlägt fehl
Versuchen Sie,
compat.supportsTools: false zu setzen, um die Tool-Schema-Oberfläche zu deaktivieren.
Siehe den Hinweis zum Gemma-Tool-Schema oben.inferrs stürzt bei größeren Agent-Turns weiterhin ab
inferrs stürzt bei größeren Agent-Turns weiterhin ab
Wenn OpenClaw keine Schemafehler mehr erhält,
inferrs bei größeren
Agent-Turns aber weiterhin abstürzt, behandeln Sie dies als Upstream-inferrs- oder Modellbeschränkung. Reduzieren Sie
die Prompt-Belastung oder wechseln Sie zu einem anderen lokalen Backend oder Modell.Verwandte Themen
Lokale Modelle
OpenClaw mit lokalen Modellservern ausführen.
Lokale Modelldienste
Lokale Modellserver bei Bedarf für konfigurierte Provider starten.
Gateway-Fehlerbehebung
Debugging lokaler OpenAI-kompatibler Backends, die Probes bestehen, aber bei Agent-Läufen fehlschlagen.
Modellauswahl
Überblick über alle Provider, Modellreferenzen und Failover-Verhalten.