Streaming + fragmentación
OpenClaw tiene dos capas de streaming separadas:- Streaming por bloques (canales): emite bloques completados a medida que el asistente escribe. Estos son mensajes normales del canal (no deltas de tokens).
- Streaming de vista previa (Telegram/Discord/Slack): actualiza un mensaje de vista previa temporal mientras se genera.
Streaming por bloques (mensajes del canal)
El streaming por bloques envía la salida del asistente en fragmentos amplios a medida que está disponible.text_delta/events: eventos del stream del modelo (pueden ser escasos en modelos sin streaming).chunker:EmbeddedBlockChunkerque aplica límites mínimos/máximos + preferencia de corte.channel send: mensajes salientes reales (respuestas por bloques).
agents.defaults.blockStreamingDefault:"on"/"off"(on/off) (desactivado por defecto).- Anulaciones por canal:
*.blockStreaming(y variantes por cuenta) para forzar"on"/"off"por canal. agents.defaults.blockStreamingBreak:"text_end"o"message_end".agents.defaults.blockStreamingChunk:{ minChars, maxChars, breakPreference? }.agents.defaults.blockStreamingCoalesce:{ minChars?, maxChars?, idleMs? }(fusiona bloques transmitidos antes del envío).- Límite estricto del canal:
*.textChunkLimit(por ejemplo,channels.whatsapp.textChunkLimit). - Modo de fragmentación del canal:
*.chunkMode(lengthpor defecto,newlinedivide en líneas en blanco (límites de párrafo) antes de fragmentar por longitud). - Límite flexible de Discord:
channels.discord.maxLinesPerMessage(17 por defecto) divide respuestas altas para evitar recortes en la UI.
text_end: transmite bloques en cuanto el chunker los emite; vacía en cadatext_end.message_end: espera a que termine el mensaje del asistente y luego vacía la salida almacenada.
message_end sigue usando el chunker si el texto almacenado supera maxChars, por lo que puede emitir varios fragmentos al final.
Algoritmo de fragmentación (límites inferior/superior)
La fragmentación por bloques se implementa conEmbeddedBlockChunker:
- Límite inferior: no emite hasta que el búfer sea >=
minChars(salvo que se fuerce). - Límite superior: prefiere cortes antes de
maxChars; si se fuerza, corta enmaxChars. - Preferencia de corte:
paragraph→newline→sentence→whitespace→ corte forzado. - Bloques de código: nunca divide dentro de bloques delimitados; cuando se fuerza en
maxChars, cierra y vuelve a abrir el bloque para mantener Markdown válido.
maxChars se limita al textChunkLimit del canal, así que no puedes superar los límites por canal.
Coalescencia (fusionar bloques transmitidos)
Cuando el streaming por bloques está habilitado, OpenClaw puede fusionar fragmentos de bloques consecutivos antes de enviarlos. Esto reduce el “spam de una sola línea” y aun así proporciona salida progresiva.- La coalescencia espera intervalos de inactividad (
idleMs) antes de vaciar. - Los búferes están limitados por
maxCharsy se vaciarán si lo superan. minCharsevita que se envíen fragmentos diminutos hasta que se acumule suficiente texto (el vaciado final siempre envía el texto restante).- El separador se deriva de
blockStreamingChunk.breakPreference(paragraph→\n\n,newline→\n,sentence→ espacio). - Las anulaciones por canal están disponibles mediante
*.blockStreamingCoalesce(incluidas las configuraciones por cuenta). - El valor predeterminado de coalescencia para
minCharsse eleva a 1500 para Signal/Slack/Discord, salvo que se anule.
Ritmo más humano entre bloques
Cuando el streaming por bloques está habilitado, puedes añadir una pausa aleatoria entre respuestas por bloques (después del primer bloque). Esto hace que las respuestas en varias burbujas se sientan más naturales.- Configuración:
agents.defaults.humanDelay(anulable por agente medianteagents.list[].humanDelay). - Modos:
off(predeterminado),natural(800–2500ms),custom(minMs/maxMs). - Se aplica solo a las respuestas por bloques, no a las respuestas finales ni a los resúmenes de herramientas.
”Transmitir fragmentos o todo”
Esto corresponde a:- Transmitir fragmentos:
blockStreamingDefault: "on"+blockStreamingBreak: "text_end"(emitir sobre la marcha). Los canales que no son Telegram también necesitan*.blockStreaming: true. - Transmitir todo al final:
blockStreamingBreak: "message_end"(vaciar una vez, posiblemente en varios fragmentos si es muy largo). - Sin streaming por bloques:
blockStreamingDefault: "off"(solo respuesta final).
*.blockStreaming se establezca explícitamente en true. Los canales pueden transmitir una vista previa en vivo
(channels.<channel>.streaming) sin respuestas por bloques.
Recordatorio de ubicación de la configuración: los valores predeterminados blockStreaming* están en
agents.defaults, no en la configuración raíz.
Modos de streaming de vista previa
Clave canónica:channels.<channel>.streaming
Modos:
off: desactiva el streaming de vista previa.partial: una sola vista previa que se reemplaza con el texto más reciente.block: la vista previa se actualiza en pasos fragmentados/anexados.progress: vista previa de progreso/estado durante la generación, respuesta final al completarse.
Mapeo por canal
| Canal | off | partial | block | progress |
|---|---|---|---|---|
| Telegram | ✅ | ✅ | ✅ | se asigna a partial |
| Discord | ✅ | ✅ | ✅ | se asigna a partial |
| Slack | ✅ | ✅ | ✅ | ✅ |
channels.slack.streaming.nativeTransportalterna las llamadas a la API de streaming nativa de Slack cuandochannels.slack.streaming.mode="partial"(predeterminado:true).- El streaming nativo de Slack y el estado del hilo del asistente de Slack requieren un destino de hilo de respuesta; los mensajes directos de nivel superior no muestran esa vista previa estilo hilo.
- Telegram:
streamMode+ booleanostreamingmigran automáticamente al enumstreaming. - Discord:
streamMode+ booleanostreamingmigran automáticamente al enumstreaming. - Slack:
streamModemigra automáticamente astreaming.mode; el booleanostreamingmigra automáticamente astreaming.modemásstreaming.nativeTransport; el valor heredadonativeStreamingmigra automáticamente astreaming.nativeTransport.
Comportamiento en tiempo de ejecución
Telegram:- Usa actualizaciones de vista previa con
sendMessage+editMessageTexten mensajes directos y grupos/temas. - El streaming de vista previa se omite cuando el streaming por bloques de Telegram está habilitado explícitamente (para evitar streaming doble).
/reasoning streampuede escribir el razonamiento en la vista previa.
- Usa mensajes de vista previa de envío + edición.
- El modo
blockusa fragmentación de borrador (draftChunk). - El streaming de vista previa se omite cuando el streaming por bloques de Discord está habilitado explícitamente.
partialpuede usar el streaming nativo de Slack (chat.startStream/append/stop) cuando está disponible.blockusa vistas previas de borrador con estilo de anexado.progressusa texto de vista previa de estado y luego la respuesta final.