inferrs 可以透過與 OpenAI 相容的Documentation Index
Fetch the complete documentation index at: https://docs.openclaw.ai/llms.txt
Use this file to discover all available pages before exploring further.
/v1 API 提供本機模型。OpenClaw 可透過通用的 openai-completions 路徑與 inferrs 搭配使用。
| 屬性 | 值 |
|---|---|
| 提供者 ID | inferrs(自訂;在 models.providers.inferrs 下設定) |
| Plugin | 無 — inferrs 不是 OpenClaw 內建的提供者 Plugin |
| 驗證環境變數 | 選用。如果你的 inferrs 伺服器沒有驗證,任何值都可以使用 |
| API | 與 OpenAI 相容(openai-completions) |
| 建議基礎 URL | http://127.0.0.1:8080/v1(或你的 inferrs 伺服器所在位置) |
開始使用
完整設定範例
此範例在本機inferrs 伺服器上使用 Gemma 4。
隨需啟動
OpenClaw 也可以只在選取inferrs/... 模型時啟動 Inferrs。將 localService 加入同一個提供者項目:
command 必須是絕對路徑。在 Gateway 主機上使用 which inferrs,並將該路徑放入設定。完整欄位參考請參閱本機模型服務。
進階設定
Why requiresStringContent matters
Why requiresStringContent matters
有些 OpenClaw 會在傳送請求前,將純文字內容片段攤平成一般字串。
inferrs Chat Completions 路由只接受字串形式的 messages[].content,不接受結構化的內容片段陣列。Gemma and tool-schema caveat
Gemma and tool-schema caveat
某些目前的 這會停用該模型的 OpenClaw 工具結構描述介面,並可降低較嚴格本機後端的提示壓力。如果極小型直接請求仍可運作,但一般 OpenClaw 代理程式回合持續在
inferrs + Gemma 組合可接受小型直接 /v1/chat/completions 請求,但仍會在完整的 OpenClaw 代理程式執行階段回合中失敗。如果發生這種情況,請先嘗試:inferrs 內部當機,剩餘問題通常是上游模型/伺服器行為,而不是 OpenClaw 的傳輸層。Manual smoke test
Manual smoke test
設定完成後,測試兩個層級:如果第一個命令可運作但第二個失敗,請檢查下方的疑難排解章節。
Proxy-style behavior
Proxy-style behavior
inferrs 會被視為代理風格的 OpenAI 相容 /v1 後端,而不是原生 OpenAI 端點。- 原生 OpenAI 專用的請求塑形不適用於此
- 沒有
service_tier、沒有 Responsesstore、沒有提示快取提示,也沒有 OpenAI reasoning 相容酬載塑形 - 隱藏的 OpenClaw 歸因標頭(
originator、version、User-Agent)不會注入到自訂inferrs基礎 URL
疑難排解
curl /v1/models fails
curl /v1/models fails
inferrs 未執行、無法連線,或未繫結到預期的主機/連接埠。請確認伺服器已啟動,並正在你設定的位址上監聽。messages[].content expected a string
messages[].content expected a string
在模型項目中設定
compat.requiresStringContent: true。詳細資訊請參閱上方的 requiresStringContent 章節。Direct /v1/chat/completions calls pass but openclaw infer model run fails
Direct /v1/chat/completions calls pass but openclaw infer model run fails
嘗試設定
compat.supportsTools: false 以停用工具結構描述介面。請參閱上方的 Gemma 工具結構描述注意事項。inferrs still crashes on larger agent turns
inferrs still crashes on larger agent turns
如果 OpenClaw 不再收到結構描述錯誤,但
inferrs 仍在較大的代理程式回合中當機,請將其視為上游 inferrs 或模型限制。降低提示壓力,或切換到不同的本機後端或模型。相關
Local models
使用本機模型伺服器執行 OpenClaw。
Local model services
依設定提供者的需求啟動本機模型伺服器。
Gateway troubleshooting
偵錯通過探測但代理程式執行失敗的本機 OpenAI 相容後端。
Model selection
所有提供者、模型參照和容錯移轉行為的概觀。