Pi 통합 아키텍처
이 문서는 OpenClaw가 AI 에이전트 기능을 구동하기 위해 pi-coding-agent 및 그 형제 패키지(pi-ai, pi-agent-core, pi-tui)와 어떻게 통합되는지 설명합니다.
개요
OpenClaw는 Pi SDK를 사용해 메시징 gateway 아키텍처 안에 AI 코딩 에이전트를 임베드합니다. Pi를 하위 프로세스로 생성하거나 RPC 모드를 사용하는 대신, OpenClaw는createAgentSession()을 통해 Pi의 AgentSession을 직접 import하고 인스턴스화합니다. 이 임베디드 접근 방식은 다음을 제공합니다.
- 세션 수명 주기 및 이벤트 처리에 대한 완전한 제어
- 사용자 지정 도구 주입(메시징, 샌드박스, 채널별 작업)
- 채널/컨텍스트별 시스템 프롬프트 사용자 지정
- 브랜칭/compaction 지원이 포함된 세션 영속성
- failover를 포함한 다중 계정 auth profile 순환
- provider에 독립적인 모델 전환
패키지 종속성
| Package | 용도 |
|---|---|
pi-ai | 핵심 LLM 추상화: Model, streamSimple, 메시지 타입, provider API |
pi-agent-core | 에이전트 루프, 도구 실행, AgentMessage 타입 |
pi-coding-agent | 고수준 SDK: createAgentSession, SessionManager, AuthStorage, ModelRegistry, 내장 도구 |
pi-tui | 터미널 UI 컴포넌트(OpenClaw의 로컬 TUI 모드에서 사용) |
파일 구조
src/agents/tools 아래가 아니라 plugin 소유 확장
디렉터리에 위치합니다. 예를 들면 다음과 같습니다.
- Discord plugin 작업 런타임 파일
- Slack plugin 작업 런타임 파일
- Telegram plugin 작업 런타임 파일
- WhatsApp plugin 작업 런타임 파일
핵심 통합 흐름
1. 임베디드 에이전트 실행
메인 진입점은pi-embedded-runner/run.ts의 runEmbeddedPiAgent()입니다.
2. 세션 생성
runEmbeddedPiAgent()가 호출하는 runEmbeddedAttempt() 내부에서 Pi SDK가 사용됩니다.
3. 이벤트 구독
subscribeEmbeddedPiSession()은 Pi의 AgentSession 이벤트를 구독합니다.
message_start/message_end/message_update(스트리밍 텍스트/thinking)tool_execution_start/tool_execution_update/tool_execution_endturn_start/turn_endagent_start/agent_endauto_compaction_start/auto_compaction_end
4. 프롬프팅
설정 후 세션에 프롬프트가 전달됩니다.images를 통해 전달합니다. 이전 기록 턴을 다시 스캔해
이미지 payload를 재주입하지는 않습니다.
도구 아키텍처
도구 파이프라인
- 기본 도구: Pi의
codingTools(read,bash,edit,write) - 사용자 지정 대체: OpenClaw는
bash를exec/process로 대체하고, 샌드박스용read/edit/write를 사용자 지정함 - OpenClaw 도구: 메시징, browser, canvas, sessions, cron, gateway 등
- 채널 도구: Discord/Telegram/Slack/WhatsApp 전용 작업 도구
- 정책 필터링: 도구가 profile, provider, agent, 그룹, 샌드박스 정책에 따라 필터링됨
- 스키마 정규화: Gemini/OpenAI 특이사항에 맞게 스키마 정리
- AbortSignal 래핑: 도구가 abort signal을 준수하도록 래핑
도구 정의 어댑터
pi-agent-core의AgentTool은 pi-coding-agent의 ToolDefinition과 execute 시그니처가 다릅니다. pi-tool-definition-adapter.ts의 어댑터가 이를 연결합니다.
도구 분리 전략
splitSdkTools()는 모든 도구를 customTools로 전달합니다.
시스템 프롬프트 구성
시스템 프롬프트는buildAgentSystemPrompt() (system-prompt.ts)에서 빌드됩니다. Tooling, Tool Call Style, Safety guardrails, OpenClaw CLI 참조, Skills, Docs, Workspace, Sandbox, Messaging, Reply Tags, Voice, Silent Replies, Heartbeats, Runtime metadata, 그리고 활성화된 경우 Memory와 Reactions, 선택적 컨텍스트 파일 및 추가 시스템 프롬프트 내용을 포함하는 전체 프롬프트를 조립합니다. 하위 에이전트에 사용되는 최소 프롬프트 모드에서는 섹션이 잘립니다.
프롬프트는 세션 생성 후 applySystemPromptOverrideToSession()을 통해 적용됩니다.
세션 관리
세션 파일
세션은 트리 구조(id/parentId 연결)를 가진 JSONL 파일입니다. Pi의SessionManager가 영속성을 처리합니다.
guardSessionManager()로 감쌉니다.
세션 캐싱
session-manager-cache.ts는 반복적인 파일 파싱을 피하기 위해 SessionManager 인스턴스를 캐싱합니다.
기록 제한
limitHistoryTurns()는 채널 유형(DM vs 그룹)에 따라 대화 기록을 잘라냅니다.
Compaction
컨텍스트 오버플로 시 자동 compaction이 트리거됩니다. 일반적인 오버플로 시그니처는request_too_large, context length exceeded, input exceeds the maximum number of tokens, input token count exceeds the maximum number of input tokens, input is too long for the model, ollama error: context length exceeded입니다. compactEmbeddedPiSessionDirect()가 수동
compaction을 처리합니다.
인증 및 모델 해석
Auth profile
OpenClaw는 provider별 여러 API key가 포함된 auth profile 저장소를 유지합니다.모델 해석
Failover
구성되어 있을 때FailoverError가 모델 fallback을 트리거합니다.
Pi 확장
OpenClaw는 특수 동작을 위해 사용자 지정 Pi 확장을 로드합니다.Compaction Safeguard
src/agents/pi-hooks/compaction-safeguard.ts는 적응형 토큰 예산 책정과 도구 실패 및 파일 작업 요약을 포함한 compaction 가드레일을 추가합니다.
컨텍스트 정리
src/agents/pi-hooks/context-pruning.ts는 캐시 TTL 기반 컨텍스트 정리를 구현합니다.
스트리밍 및 블록 응답
블록 청킹
EmbeddedBlockChunker는 스트리밍 텍스트를 개별 응답 블록으로 관리합니다.
Thinking/최종 태그 제거
스트리밍 출력은<think>/<thinking> 블록을 제거하고 <final> 내용을 추출하도록 처리됩니다.
응답 directive
[[media:url]], [[voice]], [[reply:id]] 같은 응답 directive가 파싱 및 추출됩니다.
오류 처리
오류 분류
pi-embedded-helpers.ts는 적절한 처리를 위해 오류를 분류합니다.
Thinking 수준 fallback
thinking 수준이 지원되지 않으면 fallback이 적용됩니다.샌드박스 통합
샌드박스 모드가 활성화되면 도구와 경로가 제한됩니다.Provider별 처리
Anthropic
- 거부 마법 문자열 제거
- 연속 역할에 대한 턴 검증
- Claude Code 파라미터 호환성
Google/Gemini
- plugin 소유 도구 스키마 정리
OpenAI
- Codex 모델용
apply_patch도구 - thinking 수준 강등 처리
TUI 통합
OpenClaw는 Pi-tui 컴포넌트를 직접 사용하는 로컬 TUI 모드도 제공합니다.Pi CLI와의 주요 차이점
| 측면 | Pi CLI | OpenClaw Embedded |
|---|---|---|
| 호출 방식 | pi 명령 / RPC | createAgentSession()를 통한 SDK |
| 도구 | 기본 코딩 도구 | 사용자 지정 OpenClaw 도구 모음 |
| 시스템 프롬프트 | AGENTS.md + 프롬프트 | 채널/컨텍스트별 동적 프롬프트 |
| 세션 저장소 | ~/.pi/agent/sessions/ | ~/.openclaw/agents/<agentId>/sessions/ (또는 $OPENCLAW_STATE_DIR/agents/<agentId>/sessions/) |
| 인증 | 단일 자격 증명 | 순환을 포함한 다중 profile |
| 확장 | 디스크에서 로드 | 프로그래밍 방식 + 디스크 경로 |
| 이벤트 처리 | TUI 렌더링 | 콜백 기반 (onBlockReply 등) |
향후 고려 사항
잠재적 재작업이 가능한 영역:- 도구 시그니처 정렬: 현재는 pi-agent-core와 pi-coding-agent 시그니처 사이를 어댑트하고 있음
- Session manager 래핑:
guardSessionManager는 안전성을 더하지만 복잡성도 증가시킴 - 확장 로딩: Pi의
ResourceLoader를 더 직접적으로 사용할 수 있음 - 스트리밍 핸들러 복잡성:
subscribeEmbeddedPiSession가 많이 커졌음 - Provider 특이사항: Pi가 잠재적으로 처리할 수 있을 정도로 많은 provider별 코드 경로가 존재함
테스트
Pi 통합 커버리지는 다음 테스트 모음에 걸쳐 있습니다.src/agents/pi-*.test.tssrc/agents/pi-auth-json.test.tssrc/agents/pi-embedded-*.test.tssrc/agents/pi-embedded-helpers*.test.tssrc/agents/pi-embedded-runner*.test.tssrc/agents/pi-embedded-runner/**/*.test.tssrc/agents/pi-embedded-subscribe*.test.tssrc/agents/pi-tools*.test.tssrc/agents/pi-tool-definition-adapter*.test.tssrc/agents/pi-settings.test.tssrc/agents/pi-hooks/**/*.test.ts
src/agents/pi-embedded-runner-extraparams.live.test.ts(OPENCLAW_LIVE_TEST=1로 활성화)