智能体式循环是智能体完整的“真实”运行:接收 → 上下文组装 → 模型推理 → 工具执行 → 流式回复 → 持久化。它是权威路径,会把一条消息转化为操作和最终回复, 同时保持会话状态一致。 在 OpenClaw 中,一个循环是每个会话一次的单个串行运行,会在模型思考、调用工具并流式输出时发出生命周期和流事件。本文说明这个真实循环如何端到端串接。Documentation Index
Fetch the complete documentation index at: https://docs.openclaw.ai/llms.txt
Use this file to discover all available pages before exploring further.
入口点
- Gateway 网关 RPC:
agent和agent.wait。 - CLI:
agent命令。
工作原理(高层)
agentRPC 会校验参数,解析会话(sessionKey/sessionId),持久化会话元数据,并立即返回{ runId, acceptedAt }。agentCommand运行智能体:- 解析模型 + thinking/verbose/trace 默认值
- 加载 Skills 快照
- 调用
runEmbeddedPiAgent(pi-agent-core 运行时) - 如果嵌入式循环没有发出生命周期 end/error,则发出 lifecycle end/error
runEmbeddedPiAgent:- 通过每会话 + 全局队列串行化运行
- 解析模型 + 凭证配置文件,并构建 Pi 会话
- 订阅 Pi 事件并流式传输助手/工具增量
- 强制超时 -> 超过则中止运行
- 对 Codex app-server 轮次,在终止事件前如果一个已接受轮次停止产出 app-server 进度,则中止它
- 返回载荷 + 用量元数据
subscribeEmbeddedPiSession将 pi-agent-core 事件桥接到 OpenClawagent流:- 工具事件 =>
stream: "tool" - 助手增量 =>
stream: "assistant" - 生命周期事件 =>
stream: "lifecycle"(phase: "start" | "end" | "error")
- 工具事件 =>
agent.wait使用waitForAgentRun:- 等待
runId的 lifecycle end/error - 返回
{ status: ok|error|timeout, startedAt, endedAt, error? }
- 等待
排队 + 并发
- 运行按会话键(会话通道)串行化,并且可选地经过全局通道。
- 这可以防止工具/会话竞争,并保持会话历史一致。
- 消息渠道可以选择队列模式(collect/steer/followup),这些模式会送入这套通道系统。 参见 命令队列。
- 转录写入也会受到会话文件上的会话写入锁保护。该锁感知进程并基于文件,因此可以捕获绕过进程内队列或来自其他进程的写入方。会话转录写入方最多等待
session.writeLock.acquireTimeoutMs,之后才会报告会话繁忙;默认值为60000ms。 - 会话写入锁默认不可重入。如果某个辅助函数有意在保留一个逻辑写入方的同时嵌套获取同一把锁,它必须通过
allowReentrant: true显式选择启用。
会话 + 工作区准备
- 解析并创建工作区;沙箱隔离的运行可能会重定向到沙箱工作区根目录。
- 加载 Skills(或从快照复用),并注入到环境变量和提示词中。
- 解析启动/上下文文件,并注入到系统提示词报告中。
- 获取会话写入锁;在流式传输前打开并准备
SessionManager。之后任何转录重写、压缩或截断路径,都必须在打开或修改转录文件前获取同一把锁。
提示词组装 + 系统提示词
- 系统提示词由 OpenClaw 的基础提示词、Skills 提示词、启动上下文和每次运行的覆盖项构建。
- 会强制执行模型特定限制和压缩预留 token。
- 参见系统提示词,了解模型会看到什么。
钩子点(你可以拦截的位置)
OpenClaw 有两个钩子系统:- 内部钩子(Gateway 网关钩子):面向命令和生命周期事件的事件驱动脚本。
- 插件钩子:智能体/工具生命周期和 Gateway 网关流水线中的扩展点。
内部钩子(Gateway 网关钩子)
agent:bootstrap:在系统提示词最终确定前构建启动文件时运行。 用它来添加/移除启动上下文文件。- 命令钩子:
/new、/reset、/stop和其他命令事件(参见钩子文档)。
插件钩子(智能体 + Gateway 网关生命周期)
这些在智能体循环或 Gateway 网关流水线内运行:before_model_resolve:在会话前运行(没有messages),用于在模型解析前确定性地覆盖提供商/模型。before_prompt_build:在会话加载后运行(带有messages),用于在提交提示词前注入prependContext、systemPrompt、prependSystemContext或appendSystemContext。对每轮动态文本使用prependContext,对应该位于系统提示词空间的稳定指引用 system-context 字段。before_agent_start:旧版兼容钩子,可能在任一阶段运行;优先使用上面的显式钩子。before_agent_reply:在内联操作之后、LLM 调用之前运行,让插件接管该轮并返回合成回复,或完全静默该轮。agent_end:在完成后检查最终消息列表和运行元数据。before_compaction/after_compaction:观察或标注压缩周期。before_tool_call/after_tool_call:拦截工具参数/结果。before_install:检查内置扫描发现,并可选地阻止 Skills 或插件安装。tool_result_persist:在工具结果写入 OpenClaw 所属的会话转录前同步转换它们。message_received/message_sending/message_sent:入站 + 出站消息钩子。session_start/session_end:会话生命周期边界。gateway_start/gateway_stop:Gateway 网关生命周期事件。
before_tool_call:{ block: true }是终止性的,会停止较低优先级处理程序。before_tool_call:{ block: false }是无操作,不会清除之前的阻止。before_install:{ block: true }是终止性的,会停止较低优先级处理程序。before_install:{ block: false }是无操作,不会清除之前的阻止。message_sending:{ cancel: true }是终止性的,会停止较低优先级处理程序。message_sending:{ cancel: false }是无操作,不会清除之前的取消。
流式传输 + 部分回复
- 助手增量从 pi-agent-core 流式传输,并作为
assistant事件发出。 - 分块流式传输可以在
text_end或message_end上发出部分回复。 - 推理流可以作为单独的流发出,也可以作为分块回复发出。
- 参见流式传输了解分块和分块回复行为。
工具执行 + 消息工具
- 工具 start/update/end 事件会在
tool流上发出。 - 工具结果会在记录/发出前按大小和图片载荷进行清理。
- 会跟踪消息工具发送,以抑制重复的助手确认。
回复塑形 + 抑制
- 最终载荷由以下内容组装:
- 助手文本(以及可选推理)
- 内联工具摘要(当 verbose + 允许时)
- 模型出错时的助手错误文本
- 精确的静默 token
NO_REPLY/no_reply会从出站 载荷中过滤掉。 - 消息工具重复项会从最终载荷列表中移除。
- 如果没有剩余可渲染载荷且某个工具出错,则会发出回退工具错误回复 (除非某个消息工具已经发送了用户可见回复)。
压缩 + 重试
- 自动压缩会发出
compaction流事件,并且可以触发重试。 - 重试时,内存缓冲区和工具摘要会被重置,以避免重复输出。
- 参见压缩了解压缩流水线。
事件流(当前)
lifecycle:由subscribeEmbeddedPiSession发出(也由agentCommand作为回退发出)assistant:来自 pi-agent-core 的流式增量tool:来自 pi-agent-core 的流式工具事件
聊天渠道处理
- 助手增量会缓冲为聊天
delta消息。 - 在 lifecycle end/error 上发出聊天
final。
超时
agent.wait默认值:30s(仅等待)。timeoutMs参数会覆盖。- 智能体运行时:
agents.defaults.timeoutSeconds默认 172800s(48 小时);由runEmbeddedPiAgent中止计时器强制执行。 - Cron 运行时:隔离智能体轮次的
timeoutSeconds由 cron 拥有。调度器在执行开始时启动该计时器,在配置的截止时间中止底层运行,然后在记录超时前运行有界清理,避免过期子会话让通道一直卡住。 - 会话活跃度诊断:启用诊断后,
diagnostics.stuckSessionWarnMs会将没有观测到回复、工具、状态、分块或 ACP 进度的长时间processing会话分类。活跃的嵌入式运行、模型调用和工具调用报告为session.long_running;没有最近进度的活跃工作报告为session.stalled;session.stuck保留给没有活跃工作的过期会话簿记。过期会话簿记会立即释放受影响的会话通道;停滞的嵌入式运行只有在更长的无进度窗口之后才会被中止并排空(至少 10 分钟且为告警阈值的 5 倍),这样排队工作可以恢复,而不会切断只是较慢的运行。重复的session.stuck诊断会在会话保持不变时退避。 - 模型空闲超时:如果在空闲窗口之前没有响应分块到达,OpenClaw 会中止模型请求。
models.providers.<id>.timeoutSeconds会为缓慢的本地/自托管提供商延长这个空闲看门狗;否则 OpenClaw 会在已配置时使用agents.defaults.timeoutSeconds,默认上限为 120s。没有显式模型或智能体超时的 cron 触发运行会禁用空闲看门狗,并依赖 cron 外层超时。 - 提供商 HTTP 请求超时:
models.providers.<id>.timeoutSeconds适用于该提供商的模型 HTTP fetch,包括连接、头部、正文、SDK 请求超时、总 guarded-fetch 中止处理和模型流空闲看门狗。对 Ollama 等缓慢的本地/自托管提供商,应先使用它,再提高整个智能体运行时超时。
可能提前结束的位置
- 智能体超时(中止)
- AbortSignal(取消)
- Gateway 网关断开连接或 RPC 超时
agent.wait超时(仅等待,不会停止智能体)