스트리밍 및 청크 분할

OpenClaw에는 두 개의 별도 스트리밍 계층이 있습니다.

블록 스트리밍(채널): 어시스턴트가 작성하는 동안 완료된 블록을 내보냅니다. 이는 일반 채널 메시지입니다(토큰 델타가 아님).
미리보기 스트리밍(Telegram/Discord/Slack): 생성 중에 임시 미리보기 메시지를 업데이트합니다.

현재 채널 메시지에는 진정한 토큰 델타 스트리밍이 없습니다. 미리보기 스트리밍은 메시지 기반입니다(전송 + 편집/추가).

블록 스트리밍(채널 메시지)

블록 스트리밍은 어시스턴트 출력을 사용할 수 있게 되는 대로 굵직한 청크 단위로 보냅니다.

Model output
  └─ text_delta/events
       ├─ (blockStreamingBreak=text_end)
       │    └─ chunker emits blocks as buffer grows
       └─ (blockStreamingBreak=message_end)
            └─ chunker flushes at message_end
                   └─ channel send (block replies)

범례:

text_delta/events: 모델 스트림 이벤트입니다(비스트리밍 모델에서는 드물 수 있음).
chunker: 최소/최대 경계와 분할 선호도를 적용하는 EmbeddedBlockChunker입니다.
channel send: 실제 발신 메시지입니다(블록 답장).

제어 항목:

agents.defaults.blockStreamingDefault: "on"/"off"(기본값 꺼짐).
채널 재정의: 채널별로 "on"/"off"를 강제하는 *.blockStreaming(및 계정별 변형).
agents.defaults.blockStreamingBreak: "text_end" 또는 "message_end".
agents.defaults.blockStreamingChunk: { minChars, maxChars, breakPreference? }.
agents.defaults.blockStreamingCoalesce: { minChars?, maxChars?, idleMs? }(전송 전 스트리밍된 블록 병합).
채널 하드 상한: *.textChunkLimit(예: channels.whatsapp.textChunkLimit).
채널 청크 모드: *.chunkMode(기본값은 length, newline은 길이 청킹 전에 빈 줄(문단 경계)에서 분할).
Discord 소프트 상한: channels.discord.maxLinesPerMessage(기본값 17)는 UI 잘림을 피하기 위해 긴 답장을 분할합니다.

경계 의미:

text_end: 청커가 내보내는 즉시 블록을 스트리밍하며, 각 text_end에서 플러시합니다.
message_end: 어시스턴트 메시지가 끝날 때까지 기다린 다음 버퍼링된 출력을 플러시합니다.

버퍼링된 텍스트가 maxChars를 초과하면 message_end도 청커를 사용하므로, 마지막에 여러 청크를 내보낼 수 있습니다.

블록 스트리밍을 통한 미디어 전달

MEDIA: 지시문은 일반 전달 메타데이터입니다. 블록 스트리밍이 미디어 블록을 일찍 보내면 OpenClaw는 해당 턴의 전달을 기억합니다. 최종 어시스턴트 페이로드가 동일한 미디어 URL을 반복하면, 최종 전달은 첨부 파일을 다시 보내는 대신 중복 미디어를 제거합니다. 완전히 중복되는 최종 페이로드는 억제됩니다. 최종 페이로드가 이미 스트리밍된 미디어 주변에 구별되는 텍스트를 추가하면, OpenClaw는 미디어는 한 번만 전달되도록 유지하면서 새 텍스트를 계속 보냅니다. 이는 에이전트가 스트리밍 중 MEDIA:를 내보내고 공급자가 완료된 답장에도 이를 포함할 때 Telegram 같은 채널에서 음성 메모나 파일이 중복되는 것을 방지합니다.

청킹 알고리즘(낮은/높은 경계)

블록 청킹은 EmbeddedBlockChunker로 구현됩니다.

낮은 경계: 버퍼 >= minChars가 될 때까지 내보내지 않습니다(강제된 경우 제외).
높은 경계: maxChars 전에 분할하는 것을 선호합니다. 강제된 경우 maxChars에서 분할합니다.
분할 선호도: paragraph → newline → sentence → whitespace → 하드 분할.
코드 펜스: 펜스 내부에서는 절대 분할하지 않습니다. maxChars에서 강제될 때는 Markdown이 유효하도록 펜스를 닫았다가 다시 엽니다.

maxChars는 채널 textChunkLimit로 제한되므로 채널별 상한을 초과할 수 없습니다.

병합(스트리밍된 블록 병합)

블록 스트리밍이 활성화되면 OpenClaw는 내보내기 전에 연속된 블록 청크를 병합할 수 있습니다. 이를 통해 점진적 출력을 제공하면서도 “한 줄 스팸”을 줄일 수 있습니다.

병합은 플러시하기 전에 유휴 간격(idleMs)을 기다립니다.
버퍼는 maxChars로 제한되며 이를 초과하면 플러시됩니다.
minChars는 충분한 텍스트가 누적될 때까지 아주 작은 조각이 전송되지 않게 합니다(최종 플러시는 항상 남은 텍스트를 보냄).
조이너는 blockStreamingChunk.breakPreference에서 파생됩니다(paragraph → \n\n, newline → \n, sentence → 공백).
채널 재정의는 *.blockStreamingCoalesce를 통해 사용할 수 있습니다(계정별 설정 포함).
기본 병합 minChars는 재정의하지 않는 한 Signal/Slack/Discord에서 1500으로 높아집니다.

블록 사이의 사람 같은 페이싱

블록 스트리밍이 활성화되면 블록 답장 사이(첫 번째 블록 이후)에 무작위 일시 중지를 추가할 수 있습니다. 이렇게 하면 여러 말풍선으로 된 응답이 더 자연스럽게 느껴집니다.

설정: agents.defaults.humanDelay(에이전트별로 agents.list[].humanDelay를 통해 재정의).
모드: off(기본값), natural(800-2500ms), custom(minMs/maxMs).
블록 답장에만 적용되며, 최종 답장이나 도구 요약에는 적용되지 않습니다.

”청크 스트리밍 또는 전체 스트리밍”

이는 다음에 매핑됩니다.

청크 스트리밍: blockStreamingDefault: "on" + blockStreamingBreak: "text_end"(진행하면서 내보냄). Telegram이 아닌 채널에는 *.blockStreaming: true도 필요합니다.
마지막에 전체 스트리밍: blockStreamingBreak: "message_end"(한 번 플러시하며, 매우 길면 여러 청크일 수 있음).
블록 스트리밍 없음: blockStreamingDefault: "off"(최종 답장만).

채널 참고: *.blockStreaming이 명시적으로 true로 설정되지 않으면 블록 스트리밍은 꺼져 있습니다. 채널은 블록 답장 없이 실시간 미리보기(channels.<channel>.streaming)를 스트리밍할 수 있습니다. 설정 위치 알림: blockStreaming* 기본값은 루트 설정이 아니라 agents.defaults 아래에 있습니다.

미리보기 스트리밍 모드

정식 키: channels.<channel>.streaming 모드:

off: 미리보기 스트리밍을 비활성화합니다.
partial: 최신 텍스트로 대체되는 단일 미리보기입니다.
block: 청크/추가 단계로 미리보기가 업데이트됩니다.
progress: 생성 중 진행 상황/상태 미리보기, 완료 시 최종 답변입니다.

streaming.mode: "block"은 Discord 및 Telegram처럼 편집 가능한 채널을 위한 미리보기 스트리밍 모드입니다. 이것이 해당 채널에서 채널 블록 전달을 활성화하지는 않습니다. 일반 블록 답장을 원하면 streaming.block.enabled 또는 레거시 blockStreaming 채널 키를 사용하세요. Microsoft Teams는 예외입니다. 초안 미리보기 블록 전송이 없으므로, streaming.mode: "block"은 네이티브 부분/진행 상황 스트리밍 대신 Teams 블록 전달에 매핑됩니다.

채널 매핑

채널	`off`	`partial`	`block`	`progress`
Telegram	✅	✅	✅	편집 가능한 진행 상황 초안
Discord	✅	✅	✅	편집 가능한 진행 상황 초안
Slack	✅	✅	✅	✅
Mattermost	✅	✅	✅	✅
MS Teams	✅	✅	✅	네이티브 진행 상황 스트림

Slack 전용:

channels.slack.streaming.nativeTransport는 channels.slack.streaming.mode="partial"일 때 Slack 네이티브 스트리밍 API 호출을 전환합니다(기본값: true).
Slack 네이티브 스트리밍과 Slack 어시스턴트 스레드 상태에는 답장 스레드 대상이 필요합니다. 최상위 DM에는 해당 스레드 스타일 미리보기가 표시되지 않지만, Slack 초안 미리보기 게시물과 편집은 계속 사용할 수 있습니다.

레거시 키 마이그레이션:

Telegram: 레거시 streamMode와 스칼라/불리언 streaming 값은 doctor/config 호환성 경로에서 감지되어 streaming.mode로 마이그레이션됩니다.
Discord: streamMode + 불리언 streaming은 streaming 열거형의 런타임 별칭으로 유지됩니다. 유지된 설정을 다시 쓰려면 openclaw doctor --fix를 실행하세요.
Slack: streamMode는 streaming.mode의 런타임 별칭으로 유지됩니다. 불리언 streaming은 streaming.mode와 streaming.nativeTransport의 런타임 별칭으로 유지됩니다. 레거시 nativeStreaming은 streaming.nativeTransport의 런타임 별칭으로 유지됩니다. 유지된 설정을 다시 쓰려면 openclaw doctor --fix를 실행하세요.

런타임 동작

Telegram:

DM과 그룹/토픽 전반에서 sendMessage + editMessageText 미리보기 업데이트를 사용합니다.
최종 텍스트는 활성 미리보기를 제자리에서 편집합니다. 긴 최종 답변은 첫 번째 청크에 해당 메시지를 재사용하고 남은 청크만 보냅니다.
progress 모드는 편집 가능한 상태 초안에 도구 진행 상황을 유지하고, 완료 시 해당 초안을 지운 뒤 정상 전달을 통해 최종 답변을 보냅니다.
완료된 텍스트가 확인되기 전에 최종 편집이 실패하면 OpenClaw는 정상 최종 전달을 사용하고 오래된 미리보기를 정리합니다.
Telegram 블록 스트리밍이 명시적으로 활성화되어 있으면 이중 스트리밍을 피하기 위해 미리보기 스트리밍을 건너뜁니다.
/reasoning stream은 최종 전달 후 삭제되는 임시 미리보기에 추론을 쓸 수 있습니다.

Discord:

전송 + 편집 미리보기 메시지를 사용합니다.
block 모드는 초안 청킹(draftChunk)을 사용합니다.
Discord 블록 스트리밍이 명시적으로 활성화되어 있으면 미리보기 스트리밍을 건너뜁니다.
최종 미디어, 오류, 명시적 답장 페이로드는 새 초안을 플러시하지 않고 대기 중인 미리보기를 취소한 다음 정상 전달을 사용합니다.

Slack:

partial은 사용 가능한 경우 Slack 네이티브 스트리밍(chat.startStream/append/stop)을 사용할 수 있습니다.
block은 추가 방식 초안 미리보기를 사용합니다.
progress는 상태 미리보기 텍스트를 사용한 다음 최종 답변을 사용합니다.
답장 스레드가 없는 최상위 DM은 Slack 네이티브 스트리밍 대신 초안 미리보기 게시물과 편집을 사용합니다.
네이티브 및 초안 미리보기 스트리밍은 해당 턴의 블록 답장을 억제하므로 Slack 답장은 하나의 전달 경로로만 스트리밍됩니다.
최종 미디어/오류 페이로드와 진행 상황 최종 답변은 일회용 초안 메시지를 만들지 않습니다. 미리보기를 편집할 수 있는 텍스트/블록 최종 답변만 대기 중인 초안 텍스트를 플러시합니다.

Mattermost:

생각, 도구 활동, 부분 답장 텍스트를 단일 초안 미리보기 게시물로 스트리밍하고, 최종 답변을 보내도 안전할 때 제자리에서 최종화합니다.
최종화 시점에 미리보기 게시물이 삭제되었거나 사용할 수 없으면 새 최종 게시물을 보내는 방식으로 폴백합니다.
최종 미디어/오류 페이로드는 임시 미리보기 게시물을 플러시하는 대신 정상 전달 전에 대기 중인 미리보기 업데이트를 취소합니다.

Matrix:

최종 텍스트가 미리보기 이벤트를 재사용할 수 있으면 초안 미리보기가 제자리에서 최종화됩니다.
미디어 전용, 오류, 답장 대상 불일치 최종 답변은 정상 전달 전에 대기 중인 미리보기 업데이트를 취소합니다. 이미 보이는 오래된 미리보기는 삭제 처리됩니다.

도구 진행 상황 미리보기 업데이트

미리보기 스트리밍에는 도구가 실행되는 동안 최종 답장보다 앞서 같은 미리보기 메시지에 표시되는 “웹 검색 중”, “파일 읽는 중”, “도구 호출 중” 같은 짧은 상태 줄인 도구 진행 상황 업데이트도 포함될 수 있습니다. 이렇게 하면 여러 단계의 도구 턴이 첫 생각 미리보기와 최종 답변 사이에서 조용히 멈춰 있는 대신 시각적으로 살아 있게 됩니다. 지원되는 표면:

Discord, Slack, Telegram, Matrix는 미리보기 스트리밍이 활성화되어 있을 때 기본적으로 도구 진행 상황을 실시간 미리보기 편집에 스트리밍합니다. Microsoft Teams는 개인 채팅에서 네이티브 진행 상황 스트림을 사용합니다.
Telegram은 v2026.4.22부터 도구 진행 상황 미리보기 업데이트가 활성화된 상태로 제공되었습니다. 이를 계속 활성화해 두면 이미 릴리스된 동작이 유지됩니다.
Mattermost는 이미 도구 활동을 단일 초안 미리보기 게시물에 접어 넣습니다(위 참조).
도구 진행 상황 편집은 활성 미리보기 스트리밍 모드를 따릅니다. 미리보기 스트리밍이 off이거나 블록 스트리밍이 메시지를 이어받은 경우에는 건너뜁니다. Telegram에서 streaming.mode: "off"는 최종 메시지만 전송합니다. 일반 진행 상황 메시지도 독립 상태 메시지로 전달되지 않고 억제되며, 승인 프롬프트, 미디어 페이로드, 오류는 계속 정상적으로 라우팅됩니다.
미리보기 스트리밍은 유지하되 도구 진행 상황 줄을 숨기려면 해당 채널의 streaming.preview.toolProgress를 false로 설정하세요. 명령/실행 텍스트는 숨기면서 도구 진행 상황 줄을 계속 표시하려면 streaming.preview.commandText를 "status"로 설정하거나 streaming.progress.commandText를 "status"로 설정하세요. 기본값은 릴리스된 동작을 유지하기 위해 "raw"입니다. 이 정책은 Discord, Matrix, Microsoft Teams, Mattermost, Slack 초안 미리보기, Telegram을 포함해 OpenClaw의 간결한 진행 상황 렌더러를 사용하는 초안/진행 상황 채널이 공유합니다. 미리보기 편집을 완전히 비활성화하려면 streaming.mode를 off로 설정하세요.
Telegram의 선택된 인용 답장은 예외입니다. replyToMode가 "off"가 아니고 선택된 인용 텍스트가 있으면, OpenClaw는 해당 턴의 답변 미리보기 스트림을 건너뛰므로 도구 진행 상황 미리보기 줄을 렌더링할 수 없습니다. 선택된 인용 텍스트가 없는 현재 메시지 답장은 여전히 미리보기 스트리밍을 유지합니다. 자세한 내용은 Telegram 채널 문서를 참조하세요.

진행 상황 줄은 표시하되 원시 명령/실행 텍스트는 숨깁니다.

{
  "channels": {
    "telegram": {
      "streaming": {
        "mode": "partial",
        "preview": {
          "toolProgress": true,
          "commandText": "status"
        }
      }
    }
  }
}

다른 간결한 진행 상황 채널 키 아래에서도 같은 구조를 사용하세요. 예를 들어 channels.discord, channels.matrix, channels.msteams, channels.mattermost 또는 Slack 초안 미리보기에서 사용할 수 있습니다. 진행 상황 초안 모드의 경우 같은 정책을 streaming.progress 아래에 둡니다.

{
  "channels": {
    "telegram": {
      "streaming": {
        "mode": "progress",
        "progress": {
          "toolProgress": true,
          "commandText": "status"
        }
      }
    }
  }
}

Fundamentals

Sessions and memory

Multi-agent

Messages and delivery

스트리밍 및 청크 분할

블록 스트리밍(채널 메시지)

블록 스트리밍을 통한 미디어 전달

청킹 알고리즘(낮은/높은 경계)

병합(스트리밍된 블록 병합)

블록 사이의 사람 같은 페이싱

”청크 스트리밍 또는 전체 스트리밍”

미리보기 스트리밍 모드

채널 매핑

런타임 동작

도구 진행 상황 미리보기 업데이트

관련 항목

Fundamentals

Sessions and memory

Multi-agent

Messages and delivery

Documentation Index

​블록 스트리밍(채널 메시지)

​블록 스트리밍을 통한 미디어 전달

​청킹 알고리즘(낮은/높은 경계)

​병합(스트리밍된 블록 병합)

​블록 사이의 사람 같은 페이싱

​”청크 스트리밍 또는 전체 스트리밍”

​미리보기 스트리밍 모드

​채널 매핑

​런타임 동작

​도구 진행 상황 미리보기 업데이트

​관련 항목

블록 스트리밍(채널 메시지)

블록 스트리밍을 통한 미디어 전달

청킹 알고리즘(낮은/높은 경계)

병합(스트리밍된 블록 병합)

블록 사이의 사람 같은 페이싱

”청크 스트리밍 또는 전체 스트리밍”

미리보기 스트리밍 모드

채널 매핑

런타임 동작

도구 진행 상황 미리보기 업데이트

관련 항목