메인 콘텐츠로 건너뛰기

Documentation Index

Fetch the complete documentation index at: https://docs.openclaw.ai/llms.txt

Use this file to discover all available pages before exploring further.

OpenClaw는 다음 영역 전반에서 세션을 처음부터 끝까지 관리합니다.
  • 세션 라우팅(인바운드 메시지가 sessionKey에 매핑되는 방식)
  • 세션 저장소(sessions.json)와 추적하는 항목
  • 트랜스크립트 지속성(*.jsonl)과 그 구조
  • 트랜스크립트 위생(실행 전 공급자별 수정)
  • 컨텍스트 제한(컨텍스트 창과 추적 토큰)
  • Compaction(수동 및 자동 Compaction)과 Compaction 전 작업을 연결할 위치
  • 무음 하우스키핑(사용자에게 보이는 출력을 만들면 안 되는 메모리 쓰기)
먼저 더 높은 수준의 개요를 보려면 다음부터 시작하세요.

신뢰할 수 있는 원본: Gateway

OpenClaw는 세션 상태를 소유하는 단일 Gateway 프로세스를 중심으로 설계되었습니다.
  • UI(macOS 앱, 웹 Control UI, TUI)는 세션 목록과 토큰 수를 Gateway에 질의해야 합니다.
  • 원격 모드에서는 세션 파일이 원격 호스트에 있습니다. “로컬 Mac 파일 확인”은 Gateway가 사용하는 내용을 반영하지 않습니다.

두 가지 지속성 계층

OpenClaw는 세션을 두 계층에 지속합니다.
  1. 세션 저장소(sessions.json)
    • 키/값 맵: sessionKey -> SessionEntry
    • 작고, 변경 가능하며, 편집해도 안전함(또는 항목 삭제 가능)
    • 세션 메타데이터(현재 세션 ID, 마지막 활동, 토글, 토큰 카운터 등)를 추적
  2. 트랜스크립트(<sessionId>.jsonl)
    • 트리 구조의 append-only 트랜스크립트(항목에는 id + parentId가 있음)
    • 실제 대화 + 도구 호출 + Compaction 요약을 저장
    • 이후 턴의 모델 컨텍스트를 다시 빌드하는 데 사용
    • 활성 트랜스크립트가 체크포인트 크기 상한을 초과하면 대형 Compaction 전 디버그 체크포인트를 건너뛰어, 두 번째 거대한 .checkpoint.*.jsonl 복사본을 피합니다.
Gateway 히스토리 리더는 표면이 임의의 과거 접근을 명시적으로 필요로 하지 않는 한 전체 트랜스크립트를 메모리에 구체화하지 않아야 합니다. 첫 페이지 히스토리, 임베디드 채팅 히스토리, 재시작 복구, 토큰/사용량 확인은 경계가 있는 tail 읽기를 사용합니다. 전체 트랜스크립트 스캔은 비동기 트랜스크립트 인덱스를 거치며, 이 인덱스는 파일 경로와 mtimeMs/size로 캐시되고 동시 리더 간에 공유됩니다.

디스크 위치

Gateway 호스트에서 에이전트별 위치:
  • 저장소: ~/.openclaw/agents/<agentId>/sessions/sessions.json
  • 트랜스크립트: ~/.openclaw/agents/<agentId>/sessions/<sessionId>.jsonl
    • Telegram 토픽 세션: .../<sessionId>-topic-<threadId>.jsonl
OpenClaw는 이를 src/config/sessions.ts를 통해 확인합니다.

저장소 유지 관리 및 디스크 제어

세션 지속성에는 sessions.json, 트랜스크립트 아티팩트, trajectory 사이드카에 대한 자동 유지 관리 제어(session.maintenance)가 있습니다.
  • mode: warn(기본값) 또는 enforce
  • pruneAfter: 오래된 항목의 나이 기준(기본값 30d)
  • maxEntries: sessions.json의 항목 상한(기본값 500)
  • resetArchiveRetention: *.reset.<timestamp> 트랜스크립트 아카이브의 보존 기간(기본값: pruneAfter와 동일, false는 정리 비활성화)
  • maxDiskBytes: 선택적 세션 디렉터리 예산
  • highWaterBytes: 정리 후 선택적 목표값(기본값은 maxDiskBytes80%)
일반 Gateway 쓰기는 런타임 파일 잠금을 잡지 않고 프로세스 내 변경을 직렬화하는 저장소별 세션 writer를 통과합니다. 핫 경로 패치 헬퍼는 해당 writer 슬롯을 보유하는 동안 검증된 변경 가능 캐시를 빌리므로, 큰 sessions.json 파일을 모든 메타데이터 업데이트마다 복제하거나 다시 읽지 않습니다. 런타임 코드는 updateSessionStore(...) 또는 updateSessionStoreEntry(...)를 선호해야 합니다. 직접 전체 저장소를 저장하는 방식은 호환성 및 오프라인 유지 관리 도구용입니다. Gateway에 연결할 수 있으면 dry-run이 아닌 openclaw sessions cleanupopenclaw agents delete는 저장소 변경을 Gateway에 위임하여 정리가 같은 writer 큐에 합류하게 합니다. --store <path>는 직접 파일 유지 관리를 위한 명시적 오프라인 복구 경로입니다. maxEntries 정리는 프로덕션 크기의 상한에 대해 여전히 배치 처리되므로, 다음 high-water 정리가 이를 다시 줄여 쓰기 전까지 저장소가 구성된 상한을 잠시 초과할 수 있습니다. 세션 저장소 읽기는 Gateway 시작 중 항목을 정리하거나 상한을 적용하지 않습니다. 정리에는 쓰기 또는 openclaw sessions cleanup --enforce를 사용하세요. openclaw sessions cleanup --enforce는 디스크 예산이 구성되지 않은 경우에도 구성된 상한을 즉시 적용하고 오래된 참조되지 않는 트랜스크립트, 체크포인트, trajectory 아티팩트를 정리합니다. 유지 관리는 그룹 세션 및 스레드 범위 채팅 세션 같은 내구성 있는 외부 대화 포인터를 유지하지만, cron, 후크, Heartbeat, ACP, 하위 에이전트용 합성 런타임 항목은 구성된 나이, 개수 또는 디스크 예산을 초과하면 여전히 제거될 수 있습니다. OpenClaw는 더 이상 Gateway 쓰기 중 자동 sessions.json.bak.* 순환 백업을 만들지 않습니다. 레거시 session.maintenance.rotateBytes 키는 무시되며 openclaw doctor --fix는 이전 구성에서 이를 제거합니다. 트랜스크립트 변경은 트랜스크립트 파일의 세션 쓰기 잠금을 사용합니다. 잠금 획득은 busy-session 오류를 표시하기 전에 최대 session.writeLock.acquireTimeoutMs까지 대기합니다. 기본값은 60000 ms입니다. 합법적인 준비, 정리, Compaction 또는 트랜스크립트 미러 작업이 느린 머신에서 더 오래 경합하는 경우에만 이 값을 높이세요. 오래된 잠금 감지와 최대 보유 경고는 별도의 정책으로 유지됩니다. 디스크 예산 정리의 강제 순서(mode: "enforce"):
  1. 가장 오래된 보관된 아티팩트, 고아 트랜스크립트 또는 고아 trajectory 아티팩트를 먼저 제거합니다.
  2. 그래도 목표를 초과하면 가장 오래된 세션 항목과 해당 트랜스크립트/trajectory 파일을 제거합니다.
  3. 사용량이 highWaterBytes 이하가 될 때까지 계속합니다.
mode: "warn"에서 OpenClaw는 잠재적 제거를 보고하지만 저장소/파일을 변경하지 않습니다. 필요할 때 유지 관리를 실행합니다.
openclaw sessions cleanup --dry-run
openclaw sessions cleanup --enforce

Cron 세션과 실행 로그

격리된 cron 실행도 세션 항목/트랜스크립트를 만들며, 전용 보존 제어가 있습니다.
  • cron.sessionRetention(기본값 24h)은 세션 저장소에서 오래된 격리 cron 실행 세션을 정리합니다(false는 비활성화).
  • cron.runLog.maxBytes + cron.runLog.keepLines~/.openclaw/cron/runs/<jobId>.jsonl 파일을 정리합니다(기본값: 2_000_000바이트 및 2000줄).
cron이 새 격리 실행 세션을 강제로 생성할 때는 새 행을 쓰기 전에 이전 cron:<jobId> 세션 항목을 정리합니다. thinking/fast/verbose 설정, 레이블, 명시적 사용자 선택 모델/auth 오버라이드 같은 안전한 선호 사항은 유지합니다. 채널/그룹 라우팅, 전송 또는 큐 정책, 권한 상승, 출처, ACP 런타임 바인딩 같은 주변 대화 컨텍스트는 삭제하여 새 격리 실행이 이전 실행의 오래된 전달 또는 런타임 권한을 상속하지 못하게 합니다.

세션 키(sessionKey)

sessionKey는 사용자가 _어떤 대화 버킷_에 있는지(라우팅 + 격리)를 식별합니다. 일반적인 패턴:
  • 기본/직접 채팅(에이전트별): agent:<agentId>:<mainKey>(기본값 main)
  • 그룹: agent:<agentId>:<channel>:group:<id>
  • 룸/채널(Discord/Slack): agent:<agentId>:<channel>:channel:<id> 또는 ...:room:<id>
  • Cron: cron:<job.id>
  • Webhook: hook:<uuid>(오버라이드하지 않은 경우)
정식 규칙은 /concepts/session에 문서화되어 있습니다.

세션 ID(sessionId)

sessionKey는 현재 sessionId(대화를 이어가는 트랜스크립트 파일)를 가리킵니다. 경험칙:
  • 재설정(/new, /reset)은 해당 sessionKey에 대해 새 sessionId를 만듭니다.
  • 일일 재설정(기본값은 Gateway 호스트의 로컬 시간 오전 4:00)은 재설정 경계 이후 다음 메시지에서 새 sessionId를 만듭니다.
  • 유휴 만료(session.reset.idleMinutes 또는 레거시 session.idleMinutes)는 유휴 창 이후 메시지가 도착하면 새 sessionId를 만듭니다. 일일 + 유휴가 모두 구성된 경우 먼저 만료되는 쪽이 적용됩니다.
  • 시스템 이벤트(Heartbeat, cron wakeup, exec 알림, Gateway 장부 관리)는 세션 행을 변경할 수 있지만 일일/유휴 재설정 freshness를 연장하지 않습니다. 재설정 롤오버는 새 프롬프트가 빌드되기 전에 이전 세션의 대기 중인 시스템 이벤트 알림을 버립니다.
  • 부모 포크 정책은 스레드 또는 하위 에이전트 포크를 만들 때 PI의 활성 브랜치를 사용합니다. 해당 브랜치가 너무 크면 OpenClaw는 실패하거나 사용할 수 없는 히스토리를 상속하는 대신 격리된 컨텍스트로 자식을 시작합니다. 크기 정책은 자동입니다. 레거시 session.parentForkMaxTokens 구성은 openclaw doctor --fix로 제거됩니다.
구현 세부 정보: 이 결정은 src/auto-reply/reply/session.tsinitSessionState()에서 이루어집니다.

세션 저장소 스키마(sessions.json)

저장소의 값 타입은 src/config/sessions.tsSessionEntry입니다. 주요 필드(전체 목록은 아님):
  • sessionId: 현재 트랜스크립트 ID(sessionFile이 설정되지 않은 한 파일 이름은 여기서 파생됨)
  • sessionStartedAt: 현재 sessionId의 시작 타임스탬프. 일일 재설정 freshness는 이를 사용합니다. 레거시 행은 JSONL 세션 헤더에서 이를 파생할 수 있습니다.
  • lastInteractionAt: 마지막 실제 사용자/채널 상호작용 타임스탬프. 유휴 재설정 freshness는 이를 사용하므로 Heartbeat, cron, exec 이벤트가 세션을 계속 활성 상태로 유지하지 않습니다. 이 필드가 없는 레거시 행은 복구된 세션 시작 시간으로 fallback하여 유휴 freshness를 판단합니다.
  • updatedAt: 마지막 저장소 행 변경 타임스탬프이며, 목록화, 정리, 장부 관리에 사용됩니다. 일일/유휴 재설정 freshness의 권한 있는 값은 아닙니다.
  • sessionFile: 선택적 명시 트랜스크립트 경로 오버라이드
  • chatType: direct | group | room(UI 및 전송 정책에 도움)
  • provider, subject, room, space, displayName: 그룹/채널 레이블링용 메타데이터
  • 토글:
    • thinkingLevel, verboseLevel, reasoningLevel, elevatedLevel
    • sendPolicy(세션별 오버라이드)
  • 모델 선택:
    • providerOverride, modelOverride, authProfileOverride
  • 토큰 카운터(최선 노력 / 공급자 의존):
    • inputTokens, outputTokens, totalTokens, contextTokens
  • compactionCount: 이 세션 키에 대해 자동 Compaction이 완료된 횟수
  • memoryFlushAt: 마지막 Compaction 전 메모리 플러시의 타임스탬프
  • memoryFlushCompactionCount: 마지막 플러시가 실행됐을 때의 Compaction 횟수
저장소는 편집해도 안전하지만 Gateway가 권한을 가집니다. 세션 실행 중 항목을 다시 쓰거나 다시 채울 수 있습니다.

트랜스크립트 구조(*.jsonl)

트랜스크립트는 @earendil-works/pi-coding-agentSessionManager가 관리합니다. 파일은 JSONL입니다.
  • 첫 줄: 세션 헤더(type: "session", id, cwd, timestamp, 선택적 parentSession 포함)
  • 이후: id + parentId가 있는 세션 항목(트리)
주목할 만한 항목 타입:
  • message: 사용자/assistant/toolResult 메시지
  • custom_message: 모델 컨텍스트에 들어가는 확장 주입 메시지(UI에서 숨길 수 있음)
  • custom: 모델 컨텍스트에 들어가지 않는 확장 상태
  • compaction: firstKeptEntryIdtokensBefore가 있는 지속된 Compaction 요약
  • branch_summary: 트리 브랜치를 탐색할 때 지속되는 요약
OpenClaw는 의도적으로 트랜스크립트를 “수정”하지 않습니다. Gateway는 SessionManager를 사용해 이를 읽고 씁니다.

컨텍스트 창과 추적 토큰

중요한 개념은 두 가지입니다.
  1. 모델 컨텍스트 창: 모델별 하드 상한(모델이 볼 수 있는 토큰)
  2. 세션 저장소 카운터: sessions.json에 기록되는 롤링 통계(/status 및 대시보드에 사용)
제한을 조정하는 경우:
  • 컨텍스트 창은 모델 카탈로그에서 가져옵니다(구성으로 오버라이드 가능).
  • 저장소의 contextTokens는 런타임 추정/보고 값입니다. 엄격한 보장으로 취급하지 마세요.
자세한 내용은 /token-use를 참고하세요.

Compaction: 정의

Compaction은 이전 대화를 트랜스크립트의 지속된 compaction 항목으로 요약하고 최근 메시지는 그대로 유지합니다. Compaction 이후, 이후 턴에서 보이는 내용:
  • Compaction 요약
  • firstKeptEntryId 이후의 메시지
Compaction은 영구적입니다(세션 가지치기와 달리). /concepts/session-pruning을 참조하세요.

Compaction 청크 경계와 도구 페어링

OpenClaw가 긴 트랜스크립트를 Compaction 청크로 분할할 때, assistant 도구 호출을 일치하는 toolResult 항목과 함께 유지합니다.
  • 토큰 비율 분할 지점이 도구 호출과 그 결과 사이에 놓이면, OpenClaw는 쌍을 분리하는 대신 경계를 assistant 도구 호출 메시지로 이동합니다.
  • 후행 도구 결과 블록 때문에 청크가 목표치를 초과하게 되는 경우, OpenClaw는 해당 보류 중인 도구 블록을 보존하고 요약되지 않은 꼬리 부분을 그대로 유지합니다.
  • 중단된/오류 도구 호출 블록은 보류 중인 분할을 열린 상태로 유지하지 않습니다.

자동 Compaction이 발생하는 시점(Pi 런타임)

임베디드 Pi 에이전트에서 자동 Compaction은 두 가지 경우에 트리거됩니다.
  1. 오버플로 복구: 모델이 컨텍스트 오버플로 오류 (request_too_large, context length exceeded, input exceeds the maximum number of tokens, input token count exceeds the maximum number of input tokens, input is too long for the model, ollama error: context length exceeded 및 유사한 제공자 형식 변형)를 반환함 → compact → 재시도.
  2. 임계값 유지 관리: 성공적인 턴 이후, 다음 조건일 때:
contextTokens > contextWindow - reserveTokens 여기서:
  • contextWindow는 모델의 컨텍스트 창입니다.
  • reserveTokens는 프롬프트 + 다음 모델 출력을 위해 예약된 여유 공간입니다.
이는 Pi 런타임 의미 체계입니다(OpenClaw는 이벤트를 소비하지만, 언제 compact할지는 Pi가 결정합니다). 또한 agents.defaults.compaction.maxActiveTranscriptBytes가 설정되어 있고 활성 트랜스크립트 파일이 해당 크기에 도달하면, OpenClaw는 다음 실행을 열기 전에 사전 로컬 Compaction을 트리거할 수 있습니다. 이는 원시 아카이브가 아니라 로컬 재개 비용을 위한 파일 크기 가드입니다. OpenClaw는 여전히 일반적인 의미 기반 Compaction을 실행하며, compact된 요약이 새 후속 트랜스크립트가 될 수 있도록 truncateAfterCompaction이 필요합니다. 임베디드 Pi 실행의 경우 agents.defaults.compaction.midTurnPrecheck.enabled: true는 선택적 도구 루프 가드를 추가합니다. 도구 결과가 추가된 뒤 다음 모델 호출 전에, OpenClaw는 턴 시작 시 사용하는 동일한 사전 예산 로직으로 프롬프트 압력을 추정합니다. 컨텍스트가 더 이상 맞지 않으면, 가드는 Pi의 transformContext 훅 내부에서 compact하지 않습니다. 대신 구조화된 턴 중간 사전 확인 신호를 발생시키고, 현재 프롬프트 제출을 중지한 다음, 외부 실행 루프가 기존 복구 경로를 사용하게 합니다. 충분한 경우 과도한 도구 결과를 잘라내거나, 구성된 Compaction 모드를 트리거하고 재시도합니다. 이 옵션은 기본적으로 비활성화되어 있으며, 제공자 기반 safeguard Compaction을 포함해 defaultsafeguard Compaction 모드 모두에서 동작합니다. 이는 maxActiveTranscriptBytes와 독립적입니다. 바이트 크기 가드는 턴이 열리기 전에 실행되는 반면, 턴 중간 사전 확인은 새 도구 결과가 추가된 뒤 임베디드 Pi 도구 루프에서 나중에 실행됩니다.

Compaction 설정(reserveTokens, keepRecentTokens)

Pi의 Compaction 설정은 Pi 설정에 있습니다.
{
  compaction: {
    enabled: true,
    reserveTokens: 16384,
    keepRecentTokens: 20000,
  },
}
OpenClaw는 임베디드 실행에 대해 안전 하한도 적용합니다.
  • compaction.reserveTokens < reserveTokensFloor이면 OpenClaw가 이를 올립니다.
  • 기본 하한은 20000 토큰입니다.
  • 하한을 비활성화하려면 agents.defaults.compaction.reserveTokensFloor: 0을 설정합니다.
  • 이미 더 높다면 OpenClaw는 그대로 둡니다.
  • 수동 /compact는 명시적인 agents.defaults.compaction.keepRecentTokens를 따르며 Pi의 최근 꼬리 절단 지점을 유지합니다. 명시적인 유지 예산이 없으면, 수동 Compaction은 하드 체크포인트로 남고 재구성된 컨텍스트는 새 요약에서 시작합니다.
  • 새 도구 결과 이후와 다음 모델 호출 전에 선택적 도구 루프 사전 확인을 실행하려면 agents.defaults.compaction.midTurnPrecheck.enabled: true를 설정합니다. 이는 트리거일 뿐이며, 요약 생성은 계속 구성된 Compaction 경로를 사용합니다. 이는 턴 시작 활성 트랜스크립트 바이트 크기 가드인 maxActiveTranscriptBytes와 독립적입니다.
  • 활성 트랜스크립트가 커졌을 때 턴 전에 로컬 Compaction을 실행하려면 agents.defaults.compaction.maxActiveTranscriptBytes를 바이트 값 또는 "20mb" 같은 문자열로 설정합니다. 이 가드는 truncateAfterCompaction도 활성화된 경우에만 활성화됩니다. 비활성화하려면 설정하지 않거나 0으로 설정합니다.
  • agents.defaults.compaction.truncateAfterCompaction이 활성화되면, OpenClaw는 Compaction 이후 활성 트랜스크립트를 compact된 후속 JSONL로 회전합니다. 이전 전체 트랜스크립트는 제자리에서 다시 쓰이지 않고, 아카이브된 상태로 남아 Compaction 체크포인트에서 연결됩니다.
이유: Compaction이 불가피해지기 전에 여러 턴의 “정리 작업”(예: 메모리 쓰기)을 위한 충분한 여유 공간을 남기기 위해서입니다. 구현: src/agents/pi-settings.tsensurePiCompactionReserveTokens() (src/agents/pi-embedded-runner.ts에서 호출됨).

플러그형 Compaction 제공자

Plugin은 Plugin API의 registerCompactionProvider()를 통해 Compaction 제공자를 등록할 수 있습니다. agents.defaults.compaction.provider가 등록된 제공자 ID로 설정되면, safeguard 확장은 내장 summarizeInStages 파이프라인 대신 해당 제공자에게 요약을 위임합니다.
  • provider: 등록된 Compaction 제공자 Plugin의 ID입니다. 기본 LLM 요약을 사용하려면 설정하지 않은 상태로 둡니다.
  • provider를 설정하면 mode: "safeguard"가 강제됩니다.
  • 제공자는 내장 경로와 동일한 Compaction 지침 및 식별자 보존 정책을 받습니다.
  • safeguard는 제공자 출력 이후에도 최근 턴 및 분할 턴 접미사 컨텍스트를 보존합니다.
  • 내장 safeguard 요약은 이전 전체 요약을 그대로 보존하는 대신, 새 메시지와 함께 이전 요약을 다시 정제합니다.
  • Safeguard 모드는 기본적으로 요약 품질 감사를 활성화합니다. 잘못된 출력에 대한 재시도 동작을 건너뛰려면 qualityGuard.enabled: false를 설정합니다.
  • 제공자가 실패하거나 빈 결과를 반환하면, OpenClaw는 자동으로 내장 LLM 요약으로 대체합니다.
  • 중단/타임아웃 신호는 호출자 취소를 존중하기 위해 다시 던져집니다(삼키지 않음).
소스: src/plugins/compaction-provider.ts, src/agents/pi-hooks/compaction-safeguard.ts.

사용자에게 표시되는 표면

다음을 통해 Compaction과 세션 상태를 관찰할 수 있습니다.
  • /status(모든 채팅 세션에서)
  • openclaw status(CLI)
  • openclaw sessions / sessions --json
  • Gateway 로그(pnpm gateway:watch 또는 openclaw logs --follow): embedded run auto-compaction start + complete
  • 상세 모드: 🧹 Auto-compaction complete + Compaction 횟수

조용한 정리 작업(NO_REPLY)

OpenClaw는 사용자가 중간 출력을 보지 않아야 하는 백그라운드 작업을 위해 “조용한” 턴을 지원합니다. 규칙:
  • assistant는 “사용자에게 응답을 전달하지 않음”을 나타내기 위해 정확한 무음 토큰 NO_REPLY / no_reply로 출력을 시작합니다.
  • OpenClaw는 전달 계층에서 이를 제거/억제합니다.
  • 정확한 무음 토큰 억제는 대소문자를 구분하지 않으므로, 전체 페이로드가 무음 토큰뿐이면 NO_REPLYno_reply가 모두 해당됩니다.
  • 이는 진정한 백그라운드/전달 없음 턴 전용입니다. 일반적인 실행 가능한 사용자 요청을 위한 지름길이 아닙니다.
2026.1.10부터 OpenClaw는 부분 청크가 NO_REPLY로 시작할 때 초안/입력 중 스트리밍도 억제하므로, 조용한 작업이 턴 중간에 부분 출력을 누출하지 않습니다.

Compaction 전 “메모리 플러시”(구현됨)

목표: 자동 Compaction이 발생하기 전에 지속 상태를 디스크(예: 에이전트 작업 영역의 memory/YYYY-MM-DD.md)에 쓰는 조용한 에이전트 턴을 실행하여, Compaction이 중요한 컨텍스트를 지울 수 없도록 합니다. OpenClaw는 사전 임계값 플러시 접근 방식을 사용합니다.
  1. 세션 컨텍스트 사용량을 모니터링합니다.
  2. Pi의 Compaction 임계값보다 낮은 “소프트 임계값”을 넘으면, 에이전트에 조용한 “지금 메모리 쓰기” 지시를 실행합니다.
  3. 사용자가 아무것도 보지 않도록 정확한 무음 토큰 NO_REPLY / no_reply를 사용합니다.
설정(agents.defaults.compaction.memoryFlush):
  • enabled(기본값: true)
  • model(플러시 턴에 대한 선택적 정확한 제공자/모델 재정의, 예: ollama/qwen3:8b)
  • softThresholdTokens(기본값: 4000)
  • prompt(플러시 턴의 사용자 메시지)
  • systemPrompt(플러시 턴에 추가되는 추가 시스템 프롬프트)
참고:
  • 기본 프롬프트/시스템 프롬프트에는 전달을 억제하기 위한 NO_REPLY 힌트가 포함됩니다.
  • model이 설정되면, 플러시 턴은 활성 세션 대체 체인을 상속하지 않고 해당 모델을 사용하므로, 로컬 전용 정리 작업이 유료 대화 모델로 조용히 대체되지 않습니다.
  • 플러시는 Compaction 주기마다 한 번 실행됩니다(sessions.json에서 추적됨).
  • 플러시는 임베디드 Pi 세션에서만 실행됩니다(CLI 백엔드는 이를 건너뜁니다).
  • 세션 작업 영역이 읽기 전용(workspaceAccess: "ro" 또는 "none")이면 플러시는 건너뜁니다.
  • 작업 영역 파일 레이아웃과 쓰기 패턴은 메모리를 참조하세요.
Pi도 확장 API에서 session_before_compact 훅을 노출하지만, 현재 OpenClaw의 플러시 로직은 Gateway 쪽에 있습니다.

문제 해결 체크리스트

  • 세션 키가 잘못되었나요? /concepts/session부터 시작하고 /statussessionKey를 확인하세요.
  • 스토어와 트랜스크립트가 일치하지 않나요? openclaw status에서 Gateway 호스트와 스토어 경로를 확인하세요.
  • Compaction이 과도하게 발생하나요? 확인할 항목:
    • 모델 컨텍스트 창(너무 작음)
    • Compaction 설정(reserveTokens가 모델 창에 비해 너무 높으면 Compaction이 더 일찍 발생할 수 있음)
    • 도구 결과 비대화: 세션 가지치기를 활성화/조정
  • 조용한 턴이 누출되나요? 응답이 NO_REPLY(대소문자 구분 없는 정확한 토큰)로 시작하는지, 그리고 스트리밍 억제 수정이 포함된 빌드를 사용 중인지 확인하세요.

관련