Messages and delivery

Streaming e suddivisione in blocchi

OpenClaw ha due livelli di streaming separati:

Streaming a blocchi (canali): emette blocchi completati mentre l'assistente scrive. Sono normali messaggi di canale (non delta di token).
Streaming di anteprima (Telegram/Discord/Slack): aggiorna un messaggio di anteprima temporaneo durante la generazione.

Oggi non esiste vero streaming di delta di token verso i messaggi di canale. Lo streaming di anteprima è basato sui messaggi (invio + modifiche/aggiunte).

Streaming a blocchi (messaggi di canale)

Lo streaming a blocchi invia l'output dell'assistente in blocchi grossolani man mano che diventa disponibile.

Code

Model output  └─ text_delta/events       ├─ (blockStreamingBreak=text_end)       │    └─ chunker emits blocks as buffer grows       └─ (blockStreamingBreak=message_end)            └─ chunker flushes at message_end                   └─ channel send (block replies)

Legenda:

text_delta/events: eventi di stream del modello (possono essere sparsi per i modelli non in streaming).
chunker: EmbeddedBlockChunker che applica limiti min/max + preferenza di interruzione.
channel send: messaggi in uscita effettivi (risposte a blocchi).

Controlli:

agents.defaults.blockStreamingDefault: "on"/"off" (predefinito disattivato).
Override dei canali: *.blockStreaming (e varianti per account) per forzare "on"/"off" per canale.
agents.defaults.blockStreamingBreak: "text_end" o "message_end".
agents.defaults.blockStreamingChunk: { minChars, maxChars, breakPreference? }.
agents.defaults.blockStreamingCoalesce: { minChars?, maxChars?, idleMs? } (unisce i blocchi in streaming prima dell'invio).
Limite massimo rigido del canale: *.textChunkLimit (ad es. channels.whatsapp.textChunkLimit).
Modalità di suddivisione del canale: *.chunkMode (length predefinito, newline divide sulle righe vuote (limiti di paragrafo) prima della suddivisione per lunghezza).
Limite morbido di Discord: channels.discord.maxLinesPerMessage (predefinito 17) divide le risposte alte per evitare tagli nell'interfaccia utente.

Semantica dei limiti:

text_end: trasmette i blocchi appena il chunker li emette; svuota a ogni text_end.
message_end: attende la fine del messaggio dell'assistente, poi svuota l'output in buffer.

message_end usa comunque il chunker se il testo in buffer supera maxChars, quindi può emettere più blocchi alla fine.

Consegna di media con streaming a blocchi

I media in streaming devono usare campi di payload strutturati come mediaUrl o mediaUrls; il testo in streaming non viene interpretato come comando di allegato. Quando lo streaming a blocchi invia media in anticipo, OpenClaw ricorda quella consegna per il turno. Se il payload finale dell'assistente ripete lo stesso URL media, la consegna finale rimuove il media duplicato invece di inviare di nuovo l'allegato.

I payload finali duplicati esatti vengono soppressi. Se il payload finale aggiunge testo distinto attorno a media già trasmessi in streaming, OpenClaw invia comunque il nuovo testo mantenendo una singola consegna del media. Questo evita note vocali o file duplicati su canali come Telegram.

Algoritmo di suddivisione (limiti basso/alto)

La suddivisione in blocchi è implementata da EmbeddedBlockChunker:

Limite basso: non emette finché il buffer >= minChars (salvo forzatura).
Limite alto: preferisce dividere prima di maxChars; se forzato, divide a maxChars.
Preferenza di interruzione: paragraph → newline → sentence → whitespace → interruzione rigida.
Blocchi di codice: non divide mai all'interno dei blocchi; quando forza a maxChars, chiude + riapre il blocco per mantenere Markdown valido.

maxChars viene limitato al textChunkLimit del canale, quindi non puoi superare i limiti per canale.

Coalescenza (unione dei blocchi in streaming)

Quando lo streaming a blocchi è abilitato, OpenClaw può unire blocchi consecutivi prima di inviarli. Questo riduce lo "spam di singole righe" pur fornendo un output progressivo.

La coalescenza attende intervalli di inattività (idleMs) prima dello svuotamento.
I buffer sono limitati da maxChars e vengono svuotati se lo superano.
minChars impedisce l'invio di frammenti minuscoli finché non si accumula abbastanza testo (lo svuotamento finale invia sempre il testo rimanente).
Il separatore è derivato da blockStreamingChunk.breakPreference (paragraph → \n\n, newline → \n, sentence → spazio).
Gli override dei canali sono disponibili tramite *.blockStreamingCoalesce (incluse le configurazioni per account).
Il minChars predefinito della coalescenza viene aumentato a 1500 per Signal/Slack/Discord salvo override.

Cadenza simile a quella umana tra blocchi

Quando lo streaming a blocchi è abilitato, puoi aggiungere una pausa casuale tra le risposte a blocchi (dopo il primo blocco). Questo rende le risposte a più bolle più naturali.

Configurazione: agents.defaults.humanDelay (override per agente tramite agents.list[].humanDelay).
Modalità: off (predefinita), natural (800-2500 ms), custom (minMs/maxMs).
Si applica solo alle risposte a blocchi, non alle risposte finali o ai riepiloghi degli strumenti.

"Trasmettere blocchi o tutto"

Questo corrisponde a:

Trasmettere blocchi: blockStreamingDefault: "on" + blockStreamingBreak: "text_end" (emetti man mano). Anche i canali non Telegram richiedono *.blockStreaming: true.
Trasmettere tutto alla fine: blockStreamingBreak: "message_end" (svuota una volta, possibilmente in più blocchi se molto lungo).
Nessuno streaming a blocchi: blockStreamingDefault: "off" (solo risposta finale).

Nota sul canale: lo streaming a blocchi è disattivato salvo che *.blockStreaming sia impostato esplicitamente su true. I canali possono trasmettere un'anteprima live (channels.<channel>.streaming) senza risposte a blocchi.

Promemoria sulla posizione della configurazione: i valori predefiniti blockStreaming* si trovano sotto agents.defaults, non nella configurazione radice.

Modalità di streaming di anteprima

Chiave canonica: channels.<channel>.streaming

Modalità:

off: disabilita lo streaming di anteprima.
partial: singola anteprima sostituita con il testo più recente.
block: aggiornamenti dell'anteprima in passaggi suddivisi/aggiunti.
progress: anteprima di progresso/stato durante la generazione, risposta finale al completamento.

streaming.mode: "block" è una modalità di streaming di anteprima per canali modificabili come Discord e Telegram. Non abilita lì la consegna a blocchi del canale. Usa streaming.block.enabled o la chiave di canale legacy blockStreaming quando vuoi normali risposte a blocchi. Microsoft Teams è l'eccezione: non ha un trasporto a blocchi per anteprime bozza, quindi streaming.mode: "block" viene mappato alla consegna a blocchi di Teams invece dello streaming parziale/di progresso nativo.

Mappatura dei canali

Canale	`off`	`partial`	`block`	`progress`
Telegram	✅	✅	✅	bozza di progresso modificabile
Discord	✅	✅	✅	bozza di progresso modificabile
Slack	✅	✅	✅	✅
Mattermost	✅	✅	✅	✅
MS Teams	✅	✅	✅	stream di progresso nativo

Solo Slack:

channels.slack.streaming.nativeTransport attiva/disattiva le chiamate API di streaming native di Slack quando channels.slack.streaming.mode="partial" (predefinito: true).
Lo streaming nativo di Slack e lo stato del thread dell'assistente Slack richiedono una destinazione di thread di risposta. I DM di primo livello non mostrano quell'anteprima in stile thread, ma possono comunque usare post di anteprima bozza e modifiche di Slack.

Migrazione delle chiavi legacy:

Telegram: i valori legacy streamMode e scalari/booleani streaming vengono rilevati e migrati dai percorsi di compatibilità doctor/config a streaming.mode.
Discord: streamMode + streaming booleano restano alias runtime per l'enum streaming; esegui openclaw doctor --fix per riscrivere la configurazione persistita.
Slack: streamMode resta un alias runtime per streaming.mode; streaming booleano resta un alias runtime per streaming.mode più streaming.nativeTransport; nativeStreaming legacy resta un alias runtime per streaming.nativeTransport. Esegui openclaw doctor --fix per riscrivere la configurazione persistita.

Comportamento runtime

Telegram:

Usa sendMessage + aggiornamenti di anteprima editMessageText in DM e gruppi/topic.
Le anteprime iniziali brevi sono ancora sottoposte a debounce per l'esperienza utente delle notifiche push, ma Telegram ora le materializza dopo un ritardo limitato, così le esecuzioni attive non restano visivamente silenziose.
Il testo finale modifica l'anteprima attiva sul posto; i finali lunghi riutilizzano quel messaggio per il primo blocco e inviano solo i blocchi rimanenti.
La modalità block ruota l'anteprima in un nuovo messaggio a streaming.preview.chunk.maxChars (predefinito 800, limitato al limite di modifica di Telegram di 4096); le altre modalità fanno crescere una sola anteprima fino a 4096 caratteri.
La modalità progress mantiene il progresso degli strumenti in una bozza di stato modificabile, materializza l'etichetta di stato quando lo streaming della risposta è attivo ma non è ancora disponibile alcuna riga di strumento, cancella quella bozza al completamento e invia la risposta finale tramite la consegna normale.
Se la modifica finale fallisce prima della conferma del testo completato, OpenClaw usa la consegna finale normale e ripulisce l'anteprima obsoleta.
Lo streaming di anteprima viene saltato quando lo streaming a blocchi di Telegram è esplicitamente abilitato (per evitare doppio streaming).
/reasoning stream può scrivere il ragionamento in un'anteprima transitoria che viene eliminata dopo la consegna finale.

Discord:

Usa invio + modifica dei messaggi di anteprima.
La modalità block usa la suddivisione della bozza (draftChunk).
Lo streaming di anteprima viene saltato quando lo streaming a blocchi di Discord è esplicitamente abilitato.
I payload finali di media, errore e risposta esplicita annullano le anteprime in sospeso senza svuotare una nuova bozza, poi usano la consegna normale.

Slack:

partial può usare lo streaming nativo di Slack (chat.startStream/append/stop) quando disponibile.
block usa anteprime bozza in stile aggiunta.
progress usa testo di anteprima di stato, poi la risposta finale.
I DM di primo livello senza un thread di risposta usano post di anteprima bozza e modifiche invece dello streaming nativo di Slack.
Lo streaming di anteprima nativo e bozza sopprime le risposte a blocchi per quel turno, quindi una risposta Slack viene trasmessa da un solo percorso di consegna.
I payload finali di media/errore e i finali di progresso non creano messaggi bozza temporanei; solo i finali di testo/blocco che possono modificare l'anteprima svuotano il testo bozza in sospeso.

Mattermost:

Trasmette pensiero, attività degli strumenti e testo parziale della risposta in un singolo post di anteprima bozza che viene finalizzato sul posto quando la risposta finale può essere inviata in modo sicuro.
Ripiega sull'invio di un nuovo post finale se il post di anteprima è stato eliminato o è altrimenti non disponibile al momento della finalizzazione.
I payload finali di media/errore annullano gli aggiornamenti di anteprima in sospeso prima della consegna normale invece di svuotare un post di anteprima temporaneo.

Matrix:

Le anteprime bozza vengono finalizzate sul posto quando il testo finale può riutilizzare l'evento di anteprima.
I finali solo media, errore e con mancata corrispondenza del target di risposta annullano gli aggiornamenti di anteprima in sospeso prima della consegna normale; un'anteprima obsoleta già visibile viene rimossa.

Aggiornamenti dell'anteprima del progresso degli strumenti

Lo streaming di anteprima può includere anche aggiornamenti di progresso degli strumenti: brevi righe di stato come "ricerca sul web", "lettura file" o "chiamata strumento" che appaiono nello stesso messaggio di anteprima mentre gli strumenti sono in esecuzione, prima della risposta finale. In modalità app-server di Codex, i messaggi di preambolo/commento di Codex usano questo stesso percorso di anteprima, quindi brevi note di progresso come "Sto controllando..." possono essere trasmesse nella bozza modificabile senza diventare parte della risposta finale. Questo mantiene visivamente attivi i turni con strumenti a più passaggi invece che silenziosi tra la prima anteprima del pensiero e la risposta finale.

Gli strumenti a lunga esecuzione possono emettere progresso tipizzato prima di restituire. Per esempio, web_fetch arma un timer di cinque secondi quando si avvia: se il recupero è ancora in sospeso, l'anteprima può mostrare Fetching page content...; se il recupero termina o viene annullato prima di allora, non viene emessa alcuna riga di progresso. Il risultato finale successivo dello strumento viene comunque consegnato normalmente al modello.

Superfici supportate:

Discord, Slack, Telegram e Matrix trasmettono per impostazione predefinita gli aggiornamenti di avanzamento degli strumenti e del preambolo di Codex nella modifica dell'anteprima live quando lo streaming dell'anteprima è attivo. Microsoft Teams usa il proprio flusso di avanzamento nativo nelle chat personali.
Telegram include gli aggiornamenti di anteprima dell'avanzamento degli strumenti abilitati sin da v2026.4.22; mantenerli abilitati preserva quel comportamento rilasciato.
Mattermost integra già l'attività degli strumenti nel suo singolo post di anteprima della bozza (vedi sopra).
Le modifiche dell'avanzamento degli strumenti seguono la modalità di streaming dell'anteprima attiva; vengono saltate quando lo streaming dell'anteprima è off o quando lo streaming a blocchi ha preso il controllo del messaggio. Su Telegram, streaming.mode: "off" è solo finale: anche il rumore di avanzamento generico viene soppresso invece di essere consegnato come messaggi di stato autonomi, mentre le richieste di approvazione, i payload multimediali e gli errori continuano a essere instradati normalmente.
Per mantenere lo streaming dell'anteprima ma nascondere le righe di avanzamento degli strumenti, imposta streaming.preview.toolProgress su false per quel canale. Per mantenere visibili le righe di avanzamento degli strumenti nascondendo al tempo stesso il testo di comando/esecuzione, imposta streaming.preview.commandText su "status" oppure streaming.progress.commandText su "status"; il valore predefinito è "raw" per preservare il comportamento rilasciato. Questa policy è condivisa dai canali bozza/avanzamento che usano il renderer di avanzamento compatto di OpenClaw, inclusi Discord, Matrix, Microsoft Teams, Mattermost, le anteprime bozza di Slack e Telegram. Per disabilitare del tutto le modifiche dell'anteprima, imposta streaming.mode su off.
Le risposte con citazione selezionata di Telegram sono un'eccezione: quando replyToMode non è "off" ed è presente testo di citazione selezionato, OpenClaw salta lo stream di anteprima della risposta per quel turno, quindi le righe di anteprima dell'avanzamento degli strumenti non possono essere renderizzate. Le risposte al messaggio corrente senza testo di citazione selezionato mantengono comunque lo streaming dell'anteprima. Consulta la documentazione del canale Telegram per i dettagli.

Corsia di avanzamento del commento

Oltre all'avanzamento degli strumenti, il renderer di avanzamento compatto può mostrare un'altra corsia nella bozza:

streaming.progress.commentary — renderizza il commento pre-strumento del modello (💬) — una breve narrazione del tipo "Controllerò… poi…" — intervallata alle righe degli strumenti nella bozza di avanzamento.

json

{  "channels": {    "discord": {      "streaming": { "mode": "progress", "progress": { "commentary": true } }    }  }}

Mantieni visibili le righe di avanzamento ma nascondi il testo raw di comando/esecuzione:

json

{  "channels": {    "telegram": {      "streaming": {        "mode": "partial",        "preview": {          "toolProgress": true,          "commandText": "status"        }      }    }  }}

Usa la stessa forma sotto un'altra chiave di canale di avanzamento compatto, per esempio channels.discord, channels.matrix, channels.msteams, channels.mattermost o le anteprime bozza di Slack. Per la modalità bozza di avanzamento, inserisci la stessa policy sotto streaming.progress:

json

{  "channels": {    "telegram": {      "streaming": {        "mode": "progress",        "progress": {          "toolProgress": true,          "commandText": "status"        }      }    }  }}

Correlati

Refactor del ciclo di vita dei messaggi - progettazione condivisa di anteprima, modifica, streaming e finalizzazione di destinazione
Bozze di avanzamento - messaggi visibili di lavoro in corso che si aggiornano durante i turni lunghi
Messaggi - ciclo di vita e consegna dei messaggi
Riprova - comportamento di riprova in caso di errore di consegna
Canali - supporto dello streaming per canale

Was this useful?

Streaming e suddivisione in blocchi

Streaming a blocchi (messaggi di canale)

Consegna di media con streaming a blocchi

Algoritmo di suddivisione (limiti basso/alto)

Coalescenza (unione dei blocchi in streaming)

Cadenza simile a quella umana tra blocchi

"Trasmettere blocchi o tutto"

Modalità di streaming di anteprima

Mappatura dei canali

Comportamento runtime

Aggiornamenti dell'anteprima del progresso degli strumenti

Corsia di avanzamento del commento

Correlati

On this page

Molty