OpenClaw 有两个独立的流式传输层:Documentation Index
Fetch the complete documentation index at: https://docs.openclaw.ai/llms.txt
Use this file to discover all available pages before exploring further.
- 分块流式传输(渠道): 在助手写入时发出已完成的 块。这些是普通渠道消息(不是 token 增量)。
- 预览流式传输(Telegram/Discord/Slack): 在生成期间更新临时的 预览消息。
分块流式传输(渠道消息)
分块流式传输会在助手输出可用时,以较粗的分块发送输出。text_delta/events:模型流事件(对于非流式传输模型可能较稀疏)。chunker:EmbeddedBlockChunker,应用最小/最大边界 + 断点偏好。channel send:实际出站消息(块回复)。
agents.defaults.blockStreamingDefault:"on"/"off"(默认关闭)。- 渠道覆盖项:
*.blockStreaming(以及按账号的变体),用于按渠道强制设为"on"/"off"。 agents.defaults.blockStreamingBreak:"text_end"或"message_end"。agents.defaults.blockStreamingChunk:{ minChars, maxChars, breakPreference? }。agents.defaults.blockStreamingCoalesce:{ minChars?, maxChars?, idleMs? }(发送前合并已流式传输的块)。- 渠道硬上限:
*.textChunkLimit(例如channels.whatsapp.textChunkLimit)。 - 渠道分块模式:
*.chunkMode(默认length,newline会在按长度分块前先按空行(段落边界)拆分)。 - Discord 软上限:
channels.discord.maxLinesPerMessage(默认 17),会拆分过高的回复以避免 UI 裁切。
text_end:只要分块器发出块就流式传输;在每个text_end时刷新。message_end:等待助手消息完成,然后刷新缓冲的输出。
maxChars,message_end 仍会使用分块器,因此它可以在末尾发出多个分块。
使用分块流式传输进行媒体递送
MEDIA: 指令是普通的递送元数据。当分块流式传输提前发送媒体块时,OpenClaw 会记住该轮次的递送。如果最终助手载荷重复了相同的媒体 URL,最终递送会移除重复媒体,而不是再次发送附件。
完全重复的最终载荷会被抑制。如果最终载荷在已流式传输的媒体周围添加了不同文本,OpenClaw 仍会发送新文本,同时保持媒体只递送一次。这可以防止在 Telegram 等渠道上出现重复语音备注或文件,例如智能体在流式传输期间发出 MEDIA:,而提供商也在完成的回复中包含它时。
分块算法(低/高边界)
块分块由EmbeddedBlockChunker 实现:
- 低边界: 缓冲区 >=
minChars前不发出(除非强制)。 - 高边界: 优先在
maxChars之前拆分;如果强制,则在maxChars处拆分。 - 断点偏好:
paragraph→newline→sentence→whitespace→ 硬断点。 - 代码围栏: 永不在围栏内部拆分;当在
maxChars处强制拆分时,会关闭 + 重新打开围栏以保持 Markdown 有效。
maxChars 会被限制到渠道的 textChunkLimit,因此你无法超过每个渠道的上限。
合并(合并已流式传输的块)
启用分块流式传输时,OpenClaw 可以在发送前 合并连续的块分块。这可以减少“单行刷屏”,同时仍提供渐进式输出。- 合并会等待 空闲间隔(
idleMs)后再刷新。 - 缓冲区受
maxChars限制,超过时会刷新。 minChars会防止过小片段在累积足够文本前发送(最终刷新始终会发送剩余文本)。- 连接符派生自
blockStreamingChunk.breakPreference(paragraph→\n\n,newline→\n,sentence→ 空格)。 - 可通过
*.blockStreamingCoalesce使用渠道覆盖项(包括按账号配置)。 - 除非覆盖,Signal/Slack/Discord 的默认合并
minChars会提升到 1500。
块之间的拟人化节奏
启用分块流式传输时,你可以在块回复之间(第一个块之后)添加 随机暂停。这会让多气泡回复感觉更自然。- 配置:
agents.defaults.humanDelay(通过agents.list[].humanDelay按智能体覆盖)。 - 模式:
off(默认)、natural(800–2500ms)、custom(minMs/maxMs)。 - 仅适用于 块回复,不适用于最终回复或工具摘要。
“流式传输分块或全部内容”
这对应于:- 流式传输分块:
blockStreamingDefault: "on"+blockStreamingBreak: "text_end"(边生成边发出)。非 Telegram 渠道还需要*.blockStreaming: true。 - 在末尾流式传输全部内容:
blockStreamingBreak: "message_end"(刷新一次,如果非常长则可能刷新多个分块)。 - 不进行分块流式传输:
blockStreamingDefault: "off"(仅最终回复)。
*.blockStreaming 设为 true,否则分块流式传输为 关闭。渠道可以在没有块回复的情况下流式传输实时预览(channels.<channel>.streaming)。
配置位置提醒:blockStreaming* 默认值位于 agents.defaults 下,而不是根配置。
预览流式传输模式
规范键:channels.<channel>.streaming
模式:
off:禁用预览流式传输。partial:单个预览,会被最新文本替换。block:以分块/追加步骤更新预览。progress:生成期间显示进度/状态预览,完成时给出最终答案。
streaming.mode: "block" 是一种预览流式传输模式,适用于 Discord 和 Telegram 等支持编辑的渠道。它不会在那里启用渠道块递送。需要普通块回复时,请使用 streaming.block.enabled 或旧版 blockStreaming 渠道键。Microsoft Teams 是例外:它没有草稿预览块传输,因此 streaming.mode: "block" 会映射到 Teams 块递送,而不是原生 partial/progress 流式传输。
渠道映射
| 渠道 | off | partial | block | progress |
|---|---|---|---|---|
| Telegram | ✅ | ✅ | ✅ | 可编辑的进度草稿 |
| Discord | ✅ | ✅ | ✅ | 可编辑的进度草稿 |
| Slack | ✅ | ✅ | ✅ | ✅ |
| Mattermost | ✅ | ✅ | ✅ | ✅ |
| MS Teams | ✅ | ✅ | ✅ | 原生进度流 |
- 当
channels.slack.streaming.mode="partial"时,channels.slack.streaming.nativeTransport会切换 Slack 原生流式传输 API 调用(默认:true)。 - Slack 原生流式传输和 Slack 助手线程状态需要一个回复线程目标。顶级私信不会显示这种线程式预览,但它们仍可使用 Slack 草稿预览帖子和编辑。
- Telegram:旧版
streamMode和标量/布尔streaming值会被 Doctor/配置兼容路径检测并迁移到streaming.mode。 - Discord:
streamMode+ 布尔streaming会自动迁移到streaming枚举。 - Slack:
streamMode会自动迁移到streaming.mode;布尔streaming会自动迁移到streaming.mode加streaming.nativeTransport;旧版nativeStreaming会自动迁移到streaming.nativeTransport。
运行时行为
Telegram:- 在私信和群组/主题中使用
sendMessage+editMessageText预览更新。 - 当预览已可见约一分钟时,会发送新的最终消息,而不是就地编辑,然后清理预览,以便 Telegram 的时间戳反映回复完成时间。
- 当明确启用 Telegram 分块流式传输时,会跳过预览流式传输(以避免双重流式传输)。
/reasoning stream可以将推理写入临时预览,该预览会在最终递送后删除。
- 使用发送 + 编辑预览消息。
block模式使用草稿分块(draftChunk)。- 当明确启用 Discord 分块流式传输时,会跳过预览流式传输。
- 最终媒体、错误和显式回复载荷会取消待处理预览且不刷新新的草稿,然后使用普通递送。
- 可用时,
partial可以使用 Slack 原生流式传输(chat.startStream/append/stop)。 block使用追加式草稿预览。progress使用状态预览文本,然后给出最终答案。- 没有回复线程的顶级私信会使用草稿预览帖子和编辑,而不是 Slack 原生流式传输。
- 原生和草稿预览流式传输会抑制该轮次的块回复,因此 Slack 回复只通过一个递送路径进行流式传输。
- 最终媒体/错误载荷和进度最终结果不会创建一次性草稿消息;只有能够编辑预览的文本/块最终结果才会刷新待处理草稿文本。
- 将思考、工具活动和部分回复文本流式传输到单个草稿预览帖子中,在最终答案可以安全发送时就地完成。
- 如果预览帖子已被删除或在完成时不可用,则回退为发送新的最终帖子。
- 最终媒体/错误载荷会在普通递送前取消待处理预览更新,而不是刷新临时预览帖子。
- 当最终文本可以复用预览事件时,草稿预览会就地完成。
- 仅媒体、错误和回复目标不匹配的最终结果会在普通递送前取消待处理预览更新;已可见的过期预览会被撤回。
工具进度预览更新
预览流式传输还可以包含 工具进度 更新,即“正在搜索网页”、“正在读取文件”或“正在调用工具”等短状态行,它们会在工具运行时、最终回复之前显示在同一条预览消息中。这会让多步骤工具轮次在第一个思考预览和最终答案之间保持视觉上的活跃,而不是静默。 支持的表面:- 默认情况下,当预览流式传输处于活动状态时,Discord、Slack、Telegram 和 Matrix 会将工具进度流式传输到实时预览编辑中。Microsoft Teams 在个人聊天中使用其原生进度流。
- Telegram 自
v2026.4.22起已发布并启用了工具进度预览更新;保持启用可保留该已发布行为。 - Mattermost 已经将工具活动折叠到其单个草稿预览帖子中(见上文)。
- 工具进度编辑遵循活动的预览流式传输模式;当预览流式传输为
off或分块流式传输已接管消息时会跳过。在 Telegram 上,streaming.mode: "off"表示仅最终结果:通用进度闲聊也会被抑制,而不是作为独立状态消息递送;审批提示、媒体载荷和错误仍会正常路由。 - 若要保留预览流式传输但隐藏工具进度行,请将该渠道的
streaming.preview.toolProgress设为false。若要在隐藏命令/执行文本的同时保持工具进度行可见,请将streaming.preview.commandText设为"status",或将streaming.progress.commandText设为"status";默认值为"raw",以保留已发布行为。此策略由使用 OpenClaw 紧凑进度渲染器的草稿/进度渠道共享,包括 Discord、Matrix、Microsoft Teams、Mattermost、Slack 草稿预览和 Telegram。若要完全禁用预览编辑,请将streaming.mode设为off。 - Telegram 选定引用回复是一个例外:当
replyToMode不是"off"且存在选定引用文本时,OpenClaw 会跳过该轮次的答案预览流,因此无法渲染工具进度预览行。没有选定引用文本的当前消息回复仍会保留预览流式传输。详情请参阅 Telegram 渠道文档。
channels.discord、channels.matrix、channels.msteams、channels.mattermost,或 Slack 草稿预览。对于进度草稿模式,将相同策略放在 streaming.progress 下: