快速开始

并行专家通道

Status: active
Edit source

并行专门通道让一个 Gateway 网关可以将不同聊天或房间路由到 不同智能体,同时保持用户体验快速。诀窍是把并行性视为一种稀缺资源设计问题, 而不只是“更多智能体”。

基本原则

只有在减少对真正瓶颈的争用时,专门通道才会提升吞吐量:

  • 会话锁:一次只能有一个运行改变给定会话。
  • 全局模型容量:所有可见聊天运行仍然共享提供商限制。
  • 工具容量:shell、浏览器、网络和仓库工作可能比模型轮次本身更慢。
  • 上下文预算:长转录会让之后每个轮次都更慢、更不聚焦。
  • 所有权不明确:重复做同一项工作的智能体会浪费容量。

OpenClaw 已经按会话序列化运行,并通过命令队列 限制全局并行度。专门通道在此之上增加策略:哪个智能体拥有哪项工作、 什么留在聊天里,以及什么变成后台工作。

推荐推出方式

阶段 1:通道契约 + 后台重型工作

在每个通道的工作区和系统提示中给它一份书面契约:

  • 目的:这个通道负责的工作。
  • 非目标:它应该移交而不是尝试处理的工作。
  • 聊天预算:快速回答留在聊天中;长任务应简短确认, 然后在后台子智能体或任务中运行。
  • 移交规则:当另一个通道拥有该工作时,说明应该交到哪里, 并提供一份紧凑的移交摘要。
  • 工具风险规则:优先使用能完成工作的最小工具范围。

这是成本最低的阶段,并能解决大多数堵塞:一个编码任务不再让研究通道变得迟缓, 每个聊天也能保持自己的上下文干净。

阶段 2:优先级和并发控制

围绕每个通道的业务价值调整队列和模型容量:

json5
{  agents: {    defaults: {      maxConcurrent: 4,      subagents: { maxConcurrent: 8, delegationMode: "prefer" },    },  },  messages: {    queue: {      mode: "collect",      debounceMs: 1000,      cap: 20,      drop: "summarize",    },  },}

将直接/个人聊天和生产运维智能体用于高优先级工作。当系统繁忙时, 让研究、起草和批量编码转入后台任务。

阶段 3:协调器 / 流量控制器

一旦多个通道处于活跃状态,就添加一个小型协调器模式:

  • 跟踪活跃的通道任务和所有者。
  • 检测跨群组的重复请求。
  • 在通道之间路由移交摘要。
  • 只呈现阻塞项、已完成结果,以及必须由人类做出的决策。

不要从这里开始。没有通道契约的协调器只是在协调混乱。

最小通道契约模板

md
# Lane contract ## Owns - <job this lane is responsible for> ## Does not own - <work to hand off> ## Chat budget - Answer quick questions directly.- For multi-step, slow, or tool-heavy work: acknowledge briefly, spawn/background  the work, then return the result when complete. ## Handoff If another lane owns the request, reply with: - target lane- objective- relevant context- exact next action ## Tool posture Use the smallest tool surface that can complete the task. Avoid broad shell ornetwork work unless this lane explicitly owns it.

相关内容

Was this useful?