快速开始

本地模型服务

models.providers.<id>.localService 让 OpenClaw 按需启动由提供商拥有的本地模型服务器。它是提供商级配置：当选定模型属于该提供商时，OpenClaw 会探测服务；如果端点不可用，就启动进程，等待就绪，然后发送模型请求。

适用于不适合全天运行的高成本本地服务器，或只要选择模型就应拉起后端的手动设置。

工作原理

模型请求解析到已配置的提供商。
如果该提供商有 localService，OpenClaw 会探测 healthUrl。
如果探测成功，OpenClaw 使用现有服务器。
如果探测失败，OpenClaw 使用 args 启动 command。
OpenClaw 轮询就绪状态，直到 readyTimeoutMs 过期。
模型请求通过正常的提供商传输发送。
如果进程由 OpenClaw 启动，并且 idleStopMs 为正数，则最后一个正在处理的请求空闲达到该时长后，进程会停止。

OpenClaw 不会为此安装 launchd、systemd、Docker 或守护进程。该服务器是第一个需要它的 OpenClaw 进程的子进程。

配置结构

json5

{  models: {    providers: {      local: {        baseUrl: "http://127.0.0.1:8000/v1",        apiKey: "local-model",        api: "openai-completions",        timeoutSeconds: 300,        localService: {          command: "/absolute/path/to/server",          args: ["--host", "127.0.0.1", "--port", "8000"],          cwd: "/absolute/path/to/working-dir",          env: { LOCAL_MODEL_CACHE: "/absolute/path/to/cache" },          healthUrl: "http://127.0.0.1:8000/v1/models",          readyTimeoutMs: 180000,          idleStopMs: 0,        },        models: [          {            id: "my-local-model",            name: "My Local Model",            reasoning: false,            input: ["text"],            cost: { input: 0, output: 0, cacheRead: 0, cacheWrite: 0 },            contextWindow: 131072,            maxTokens: 8192,          },        ],      },    },  },}

字段

command：可执行文件的绝对路径。不使用 shell 查找。
args：进程参数。不应用 shell 展开、管道、通配、或引用规则。
cwd：进程的可选工作目录。
env：可选环境变量，会覆盖合并到 OpenClaw 进程环境。
healthUrl：就绪 URL。如果省略，OpenClaw 会在 baseUrl 后追加 /models，因此 http://127.0.0.1:8000/v1 会变为 http://127.0.0.1:8000/v1/models。
readyTimeoutMs：启动就绪截止时间。默认值：120000。
idleStopMs：OpenClaw 启动的进程的空闲关闭延迟。0 或省略会让进程保持运行，直到 OpenClaw 退出。

Inferrs 示例

Inferrs 是一个自定义的、与 OpenAI 兼容的 /v1 后端，因此同一个本地服务 API 可用于 inferrs 提供商条目。

json5

{  agents: {    defaults: {      model: { primary: "inferrs/google/gemma-4-E2B-it" },    },  },  models: {    mode: "merge",    providers: {      inferrs: {        baseUrl: "http://127.0.0.1:8080/v1",        apiKey: "inferrs-local",        api: "openai-completions",        timeoutSeconds: 300,        localService: {          command: "/opt/homebrew/bin/inferrs",          args: [            "serve",            "google/gemma-4-E2B-it",            "--host",            "127.0.0.1",            "--port",            "8080",            "--device",            "metal",          ],          healthUrl: "http://127.0.0.1:8080/v1/models",          readyTimeoutMs: 180000,          idleStopMs: 0,        },        models: [          {            id: "google/gemma-4-E2B-it",            name: "Gemma 4 E2B (inferrs)",            reasoning: false,            input: ["text"],            cost: { input: 0, output: 0, cacheRead: 0, cacheWrite: 0 },            contextWindow: 131072,            maxTokens: 4096,            compat: {              requiresStringContent: true,            },          },        ],      },    },  },}

将 command 替换为运行 OpenClaw 的机器上 which inferrs 的结果。

ds4 示例

完整设置、上下文大小指导和验证命令，请参阅 ds4。

json5

{  models: {    providers: {      ds4: {        baseUrl: "http://127.0.0.1:18000/v1",        apiKey: "ds4-local",        api: "openai-completions",        timeoutSeconds: 300,        localService: {          command: "&lt;DS4_DIR&gt;/ds4-server",          args: [            "--model",            "&lt;DS4_DIR&gt;/ds4flash.gguf",            "--host",            "127.0.0.1",            "--port",            "18000",            "--ctx",            "32768",            "--tokens",            "128",          ],          cwd: "&lt;DS4_DIR&gt;",          healthUrl: "http://127.0.0.1:18000/v1/models",          readyTimeoutMs: 300000,          idleStopMs: 0,        },        models: [],      },    },  },}

运行说明

一个 OpenClaw 进程管理它启动的子进程。另一个看到同一健康 URL 已可用的 OpenClaw 进程会复用它，但不会接管它。
启动会按提供商命令和参数集串行化，因此并发请求不会为同一配置生成重复服务器。
活跃的流式响应会持有租约；空闲关闭会等到响应正文处理完成。
对较慢的本地提供商使用 timeoutSeconds，这样冷启动和长时间生成不会触发默认模型请求超时。
如果你的服务器在 /v1/models 之外的位置暴露就绪状态，请使用显式 healthUrl。

本地模型服务

工作原理

配置结构

字段

Inferrs 示例

ds4 示例

运行说明

相关内容

On this page

Molty