Architecture de l’intégration Pi
Ce document décrit comment OpenClaw s’intègre à pi-coding-agent et à ses packages frères (pi-ai, pi-agent-core, pi-tui) pour alimenter ses capacités d’agent IA.
Vue d’ensemble
OpenClaw utilise le SDK pi pour intégrer un agent de codage IA dans son architecture de passerelle de messagerie. Au lieu de lancer pi comme sous-processus ou d’utiliser le mode RPC, OpenClaw importe et instancie directementAgentSession de pi via createAgentSession(). Cette approche embarquée offre :
- Contrôle complet sur le cycle de vie des sessions et la gestion des événements
- Injection d’outils personnalisés (messagerie, sandbox, actions spécifiques au canal)
- Personnalisation du prompt système par canal/contexte
- Persistance des sessions avec prise en charge des branches/de la compaction
- Rotation multi-comptes des profils d’authentification avec basculement
- Changement de modèle indépendant du fournisseur
Dépendances de package
| Package | Rôle |
|---|---|
pi-ai | Abstractions LLM de base : Model, streamSimple, types de message, API de fournisseur |
pi-agent-core | Boucle d’agent, exécution d’outils, types AgentMessage |
pi-coding-agent | SDK de haut niveau : createAgentSession, SessionManager, AuthStorage, ModelRegistry, outils intégrés |
pi-tui | Composants d’interface terminal (utilisés dans le mode TUI local d’OpenClaw) |
Structure des fichiers
src/agents/tools, par exemple :
- les fichiers runtime d’actions du plugin Discord
- le fichier runtime d’actions du plugin Slack
- le fichier runtime d’actions du plugin Telegram
- le fichier runtime d’actions du plugin WhatsApp
Flux d’intégration principal
1. Exécuter un agent embarqué
Le point d’entrée principal estrunEmbeddedPiAgent() dans pi-embedded-runner/run.ts :
2. Création de session
À l’intérieur derunEmbeddedAttempt() (appelé par runEmbeddedPiAgent()), le SDK pi est utilisé :
3. Abonnement aux événements
subscribeEmbeddedPiSession() s’abonne aux événements AgentSession de pi :
message_start/message_end/message_update(texte/réflexion en streaming)tool_execution_start/tool_execution_update/tool_execution_endturn_start/turn_endagent_start/agent_endauto_compaction_start/auto_compaction_end
4. Prompting
Après la configuration, un prompt est envoyé à la session :images pour ce tour uniquement. Il ne réanalyse pas les anciens tours d’historique
pour réinjecter les charges utiles d’image.
Architecture des outils
Pipeline des outils
- Outils de base :
codingToolsde pi (read, bash, edit, write) - Remplacements personnalisés : OpenClaw remplace bash par
exec/process, personnalise read/edit/write pour la sandbox - Outils OpenClaw : messagerie, navigateur, canvas, sessions, cron, gateway, etc.
- Outils de canal : outils d’action spécifiques à Discord/Telegram/Slack/WhatsApp
- Filtrage par politique : outils filtrés selon les politiques de profil, fournisseur, agent, groupe, sandbox
- Normalisation des schémas : schémas nettoyés pour les particularités Gemini/OpenAI
- Enveloppement AbortSignal : outils enveloppés pour respecter les signaux d’abandon
Adaptateur de définition d’outil
LeAgentTool de pi-agent-core a une signature execute différente de celle de ToolDefinition de pi-coding-agent. L’adaptateur dans pi-tool-definition-adapter.ts fait le pont :
Stratégie de séparation des outils
splitSdkTools() transmet tous les outils via customTools :
Construction du prompt système
Le prompt système est construit dansbuildAgentSystemPrompt() (system-prompt.ts). Il assemble un prompt complet avec des sections comprenant l’outillage, le style d’appel d’outil, les garde-fous de sécurité, la référence CLI OpenClaw, les Skills, la documentation, l’espace de travail, la sandbox, la messagerie, les balises de réponse, la voix, les réponses silencieuses, les heartbeats, les métadonnées runtime, ainsi que Memory et Reactions lorsqu’ils sont activés, et éventuellement des fichiers de contexte et du contenu de prompt système supplémentaire. Les sections sont réduites pour le mode de prompt minimal utilisé par les sous-agents.
Le prompt est appliqué après la création de la session via applySystemPromptOverrideToSession() :
Gestion des sessions
Fichiers de session
Les sessions sont des fichiers JSONL avec une structure en arbre (liaison id/parentId). LeSessionManager de Pi gère la persistance :
guardSessionManager() pour la sécurité des résultats d’outils.
Mise en cache des sessions
session-manager-cache.ts met en cache les instances SessionManager pour éviter des analyses répétées de fichiers :
Limitation de l’historique
limitHistoryTurns() réduit l’historique des conversations selon le type de canal (DM vs groupe).
Compaction
La compaction automatique se déclenche en cas de débordement du contexte. Les signatures courantes de débordement incluentrequest_too_large, context length exceeded, input exceeds the maximum number of tokens, input token count exceeds the maximum number of input tokens, input is too long for the model, et ollama error: context length exceeded. compactEmbeddedPiSessionDirect() gère la
compaction manuelle :
Authentification et résolution de modèle
Profils d’authentification
OpenClaw maintient un stockage de profils d’authentification avec plusieurs clés API par fournisseur :Résolution de modèle
Basculement
FailoverError déclenche le repli de modèle lorsqu’il est configuré :
Extensions Pi
OpenClaw charge des extensions pi personnalisées pour des comportements spécialisés :Garde-fou de compaction
src/agents/pi-hooks/compaction-safeguard.ts ajoute des garde-fous à la compaction, notamment une budgétisation adaptative des tokens ainsi que des résumés des échecs d’outils et des opérations sur les fichiers :
Élagage du contexte
src/agents/pi-hooks/context-pruning.ts implémente un élagage du contexte basé sur le cache-TTL :
Streaming et réponses par blocs
Fragmentation en blocs
EmbeddedBlockChunker gère le streaming de texte en blocs de réponse distincts :
Suppression des balises Thinking/Final
La sortie en streaming est traitée pour supprimer les blocs<think>/<thinking> et extraire le contenu <final> :
Directives de réponse
Les directives de réponse comme[[media:url]], [[voice]], [[reply:id]] sont analysées et extraites :
Gestion des erreurs
Classification des erreurs
pi-embedded-helpers.ts classe les erreurs pour un traitement approprié :
Secours du niveau de réflexion
Si un niveau de réflexion n’est pas pris en charge, un niveau de secours est utilisé :Intégration sandbox
Lorsque le mode sandbox est activé, les outils et les chemins sont contraints :Gestion spécifique aux fournisseurs
Anthropic
- Nettoyage de la chaîne magique de refus
- Validation de tour pour les rôles consécutifs
- Validation stricte en amont des paramètres d’outil Pi
Google/Gemini
- Assainissement du schéma d’outil propriétaire du plugin
OpenAI
- Outil
apply_patchpour les modèles Codex - Gestion de la dégradation du niveau de réflexion
Intégration TUI
OpenClaw dispose également d’un mode TUI local qui utilise directement les composants pi-tui :Différences clés par rapport à la CLI Pi
| Aspect | CLI Pi | OpenClaw embarqué |
|---|---|---|
| Invocation | commande pi / RPC | SDK via createAgentSession() |
| Outils | Outils de codage par défaut | Suite d’outils OpenClaw personnalisée |
| Prompt système | AGENTS.md + prompts | Dynamique par canal/contexte |
| Stockage de session | ~/.pi/agent/sessions/ | ~/.openclaw/agents/<agentId>/sessions/ (ou $OPENCLAW_STATE_DIR/agents/<agentId>/sessions/) |
| Auth | Identifiant unique | Multi-profils avec rotation |
| Extensions | Chargées depuis le disque | Programmatique + chemins disque |
| Gestion d’événements | Rendu TUI | Basée sur callbacks (onBlockReply, etc.) |
Considérations futures
Domaines potentiellement à retravailler :- Alignement des signatures d’outils : adaptation actuelle entre les signatures pi-agent-core et pi-coding-agent
- Enveloppement du gestionnaire de session :
guardSessionManagerajoute de la sécurité mais augmente la complexité - Chargement des extensions : pourrait utiliser
ResourceLoaderde pi plus directement - Complexité du gestionnaire de streaming :
subscribeEmbeddedPiSessiona beaucoup grossi - Particularités des fournisseurs : de nombreux chemins de code spécifiques aux fournisseurs que pi pourrait potentiellement gérer
Tests
La couverture d’intégration Pi s’étend à ces suites :src/agents/pi-*.test.tssrc/agents/pi-auth-json.test.tssrc/agents/pi-embedded-*.test.tssrc/agents/pi-embedded-helpers*.test.tssrc/agents/pi-embedded-runner*.test.tssrc/agents/pi-embedded-runner/**/*.test.tssrc/agents/pi-embedded-subscribe*.test.tssrc/agents/pi-tools*.test.tssrc/agents/pi-tool-definition-adapter*.test.tssrc/agents/pi-settings.test.tssrc/agents/pi-hooks/**/*.test.ts
src/agents/pi-embedded-runner-extraparams.live.test.ts(activerOPENCLAW_LIVE_TEST=1)