Gateway
Protocole Gateway
Le protocole WS du Gateway est le plan de contrôle + transport de nœud unique pour OpenClaw. Tous les clients (CLI, interface web, application macOS, nœuds iOS/Android, nœuds sans interface) se connectent par WebSocket et déclarent leur rôle + leur portée au moment de l’établissement de liaison.
Transport
- WebSocket, trames texte avec charges utiles JSON.
- La première trame doit être une requête
connect. - Les trames avant connexion sont plafonnées à 64 KiB. Après un établissement de liaison réussi, les clients
doivent respecter les limites
hello-ok.policy.maxPayloadethello-ok.policy.maxBufferedBytes. Avec les diagnostics activés, les trames entrantes surdimensionnées et les tampons sortants lents émettent des événementspayload.largeavant que le gateway ferme ou abandonne la trame concernée. Ces événements conservent les tailles, limites, surfaces et codes de raison sûrs. Ils ne conservent pas le corps du message, le contenu des pièces jointes, le corps brut de la trame, les jetons, les cookies ni les valeurs secrètes.
Établissement de liaison (connect)
Gateway → Client (défi avant connexion) :
{ "type": "event", "event": "connect.challenge", "payload": { "nonce": "…", "ts": 1737264000000 }}Client → Gateway :
{ "type": "req", "id": "…", "method": "connect", "params": { "minProtocol": 3, "maxProtocol": 4, "client": { "id": "cli", "version": "1.2.3", "platform": "macos", "mode": "operator" }, "role": "operator", "scopes": ["operator.read", "operator.write"], "caps": [], "commands": [], "permissions": {}, "auth": { "token": "…" }, "locale": "en-US", "userAgent": "openclaw-cli/1.2.3", "device": { "id": "device_fingerprint", "publicKey": "…", "signature": "…", "signedAt": 1737264000000, "nonce": "…" } }}Gateway → Client :
{ "type": "res", "id": "…", "ok": true, "payload": { "type": "hello-ok", "protocol": 4, "server": { "version": "…", "connId": "…" }, "features": { "methods": ["…"], "events": ["…"] }, "snapshot": { "…": "…" }, "auth": { "role": "operator", "scopes": ["operator.read", "operator.write"] }, "policy": { "maxPayload": 26214400, "maxBufferedBytes": 52428800, "tickIntervalMs": 15000 } }}Pendant que le Gateway termine encore le démarrage de ses sidecars, la requête connect peut
renvoyer une erreur UNAVAILABLE réessayable avec details.reason défini sur
"startup-sidecars" et retryAfterMs. Les clients doivent réessayer cette réponse
dans leur budget global de connexion au lieu de la présenter comme un échec terminal
d’établissement de liaison.
server, features, snapshot et policy sont tous requis par le schéma
(packages/gateway-protocol/src/schema/frames.ts). auth est également requis et indique
le rôle et les portées négociés. pluginSurfaceUrls est facultatif et associe les noms de surfaces
de plugin, comme canvas, à des URL hébergées à portée limitée.
Les URL de surfaces de plugin à portée limitée peuvent expirer. Les nœuds peuvent appeler
node.pluginSurface.refresh avec { "surface": "canvas" } pour recevoir une nouvelle
entrée dans pluginSurfaceUrls. La refactorisation expérimentale du plugin Canvas ne
prend pas en charge le chemin de compatibilité obsolète canvasHostUrl, canvasCapability ou
node.canvas.capability.refresh ; les clients natifs et gateways actuels doivent utiliser les surfaces de plugin.
Lorsqu’aucun jeton d’appareil n’est émis, hello-ok.auth indique les autorisations négociées
sans champs de jeton :
{ "auth": { "role": "operator", "scopes": ["operator.read", "operator.write"] }}Les clients backend de confiance dans le même processus (client.id: "gateway-client",
client.mode: "backend") peuvent omettre device sur les connexions directes en local loopback lorsqu’ils
s’authentifient avec le jeton/mot de passe partagé du gateway. Ce chemin est réservé
aux RPC internes du plan de contrôle et empêche les bases de référence CLI/appareil obsolètes de
bloquer le travail backend local, comme les mises à jour de sessions de sous-agents. Les clients distants,
les clients d’origine navigateur, les clients nœuds et les clients explicites avec jeton d’appareil/identité d’appareil
utilisent toujours les vérifications normales d’association et de montée en portée.
Lorsqu’un jeton d’appareil est émis, hello-ok inclut aussi :
{ "auth": { "deviceToken": "…", "role": "operator", "scopes": ["operator.read", "operator.write"] }}L’amorçage intégré par QR/code de configuration est un nouveau chemin de transfert mobile. Une connexion réussie avec code de configuration de base renvoie un jeton de nœud principal plus un jeton opérateur borné :
{ "auth": { "deviceToken": "…", "role": "node", "scopes": [], "deviceTokens": [ { "deviceToken": "…", "role": "operator", "scopes": ["operator.approvals", "operator.read", "operator.talk.secrets", "operator.write"] } ] }}Le transfert opérateur est volontairement borné afin que l’intégration par QR puisse démarrer la
boucle opérateur mobile et terminer la configuration native sans accorder de portées de
mutation d’association ni operator.admin. Il inclut operator.talk.secrets afin que le
client natif puisse lire la configuration Talk dont il a besoin après l’amorçage. L’accès plus large
à l’association et à l’administration nécessite un flux séparé d’association opérateur approuvée ou de jeton.
Les clients ne doivent persister
hello-ok.auth.deviceTokens que
lorsque la connexion a utilisé une authentification d’amorçage sur un transport de confiance, comme wss:// ou
une association loopback/locale.
Exemple de nœud
{ "type": "req", "id": "…", "method": "connect", "params": { "minProtocol": 3, "maxProtocol": 4, "client": { "id": "ios-node", "version": "1.2.3", "platform": "ios", "mode": "node" }, "role": "node", "scopes": [], "caps": ["camera", "canvas", "screen", "location", "voice"], "commands": ["camera.snap", "canvas.navigate", "screen.record", "location.get"], "permissions": { "camera.capture": true, "screen.record": false }, "auth": { "token": "…" }, "locale": "en-US", "userAgent": "openclaw-ios/1.2.3", "device": { "id": "device_fingerprint", "publicKey": "…", "signature": "…", "signedAt": 1737264000000, "nonce": "…" } }}Tramage
- Requête :
{type:"req", id, method, params} - Réponse :
{type:"res", id, ok, payload|error} - Événement :
{type:"event", event, payload, seq?, stateVersion?}
Les méthodes avec effets de bord nécessitent des clés d’idempotence (voir le schéma).
Rôles + portées
Pour le modèle complet des portées opérateur, les vérifications au moment de l’approbation et la sémantique des secrets partagés, consultez Portées opérateur.
Rôles
operator= client du plan de contrôle (CLI/interface utilisateur/automatisation).node= hôte de capacité (camera/screen/canvas/system.run).
Portées (opérateur)
Portées courantes :
operator.readoperator.writeoperator.adminoperator.approvalsoperator.pairingoperator.talk.secrets
talk.config avec includeSecrets: true nécessite operator.talk.secrets
(ou operator.admin).
Lorsque les secrets sont inclus, les clients doivent lire l’identifiant actif du fournisseur Talk
depuis talk.resolved.config.apiKey ; talk.providers.<id>.apiKey
conserve la forme source et peut être un objet SecretRef ou une chaîne caviardée.
Les méthodes RPC Gateway enregistrées par un plugin peuvent demander leur propre portée opérateur, mais
les préfixes d’administration principaux réservés (config.*, exec.approvals.*, wizard.*,
update.*) se résolvent toujours en operator.admin.
La portée de méthode n’est que le premier garde-fou. Certaines commandes slash atteintes via
chat.send appliquent en plus des vérifications plus strictes au niveau de la commande. Par exemple, les écritures persistantes
/config set et /config unset nécessitent operator.admin.
node.pair.approve possède aussi une vérification de portée supplémentaire au moment de l’approbation, en plus de la
portée de méthode de base :
- requêtes sans commande :
operator.pairing - requêtes avec commandes de nœud non-exec :
operator.pairing+operator.write - requêtes qui incluent
system.run,system.run.prepareousystem.which:operator.pairing+operator.admin
Capacités/commandes/autorisations (nœud)
Les nœuds déclarent leurs revendications de capacité au moment de la connexion :
caps: catégories de capacité de haut niveau commecamera,canvas,screen,location,voiceettalk.commands: liste d’autorisation de commandes pour l’invocation.permissions: bascules granulaires (par exemplescreen.record,camera.capture).
Le Gateway traite celles-ci comme des revendications et applique des listes d’autorisation côté serveur.
Présence
system-presencerenvoie des entrées indexées par identité d’appareil.- Les entrées de présence incluent
deviceId,rolesetscopesafin que les interfaces puissent afficher une seule ligne par appareil même lorsqu’il se connecte à la fois comme opérateur et comme nœud. node.listinclut les champs facultatifslastSeenAtMsetlastSeenReason. Les nœuds connectés indiquent leur heure de connexion actuelle commelastSeenAtMsavec la raisonconnect; les nœuds associés peuvent également signaler une présence d’arrière-plan durable lorsqu’un événement de nœud de confiance met à jour leurs métadonnées d’association.
Événement de nœud vivant en arrière-plan
Les nœuds peuvent appeler node.event avec event: "node.presence.alive" pour enregistrer qu’un nœud associé était
vivant pendant un réveil en arrière-plan sans le marquer comme connecté.
{ "event": "node.presence.alive", "payloadJSON": "{\"trigger\":\"silent_push\",\"sentAtMs\":1737264000000,\"displayName\":\"Peter's iPhone\",\"version\":\"2026.4.28\",\"platform\":\"iOS 18.4.0\",\"deviceFamily\":\"iPhone\",\"modelIdentifier\":\"iPhone17,1\",\"pushTransport\":\"relay\"}"}trigger est une énumération fermée : background, silent_push, bg_app_refresh,
significant_location, manual ou connect. Les chaînes de déclencheur inconnues sont normalisées en
background par le gateway avant la persistance. L’événement n’est durable que pour les sessions d’appareil de nœud
authentifiées ; les sessions sans appareil ou non associées renvoient handled: false.
Les gateways qui réussissent renvoient un résultat structuré :
{ "ok": true, "event": "node.presence.alive", "handled": true, "reason": "persisted"}Les gateways plus anciens peuvent encore renvoyer { "ok": true } pour node.event ; les clients doivent traiter cela comme un
RPC accusé de réception, et non comme une persistance durable de présence.
Délimitation de portée des événements de diffusion
Les événements de diffusion WebSocket poussés par le serveur sont filtrés par portée afin que les sessions limitées à l’association ou réservées aux nœuds ne reçoivent pas passivement le contenu de session.
- Trames de chat, d’agent et de résultats d’outils (y compris les événements
agentdiffusés en continu et les résultats d’appels d’outils) nécessitent au moinsoperator.read. Les sessions sansoperator.readignorent entièrement ces trames. - Diffusions
plugin.*définies par les plugins sont limitées àoperator.writeouoperator.admin, selon la façon dont le plugin les a enregistrées. - Événements d’état et de transport (
heartbeat,presence,tick, cycle de vie connexion/déconnexion, etc.) restent sans restriction afin que la santé du transport reste observable par chaque session authentifiée. - Familles d’événements de diffusion inconnues sont filtrées par portée par défaut (échec fermé), sauf si un gestionnaire enregistré les assouplit explicitement.
Chaque connexion client conserve son propre numéro de séquence par client afin que les diffusions préservent un ordre monotone sur ce socket, même lorsque différents clients voient différents sous-ensembles du flux d’événements filtrés par portée.
Familles courantes de méthodes RPC
La surface WS publique est plus large que les exemples d’établissement de liaison/authentification ci-dessus. Il ne s’agit
pas d’un export généré — hello-ok.features.methods est une liste de découverte prudente
construite à partir de src/gateway/server-methods-list.ts plus les exports de méthodes de plugins/canaux chargés.
Traitez-la comme de la découverte de fonctionnalités, et non comme une énumération complète de
src/gateway/server-methods/*.ts.
Système et identité
healthrenvoie l’instantané d’état de santé du Gateway mis en cache ou fraîchement sondé.diagnostics.stabilityrenvoie l’enregistreur de stabilité diagnostique borné récent. Il conserve les métadonnées opérationnelles telles que les noms d’événements, les nombres, les tailles en octets, les relevés de mémoire, l’état de la file/session, les noms de canaux/Plugins et les identifiants de session. Il ne conserve pas le texte de chat, les corps de webhooks, les sorties d’outils, les corps bruts de requête ou de réponse, les tokens, les cookies ni les valeurs secrètes. La portée de lecture opérateur est requise.statusrenvoie le résumé du Gateway de type/status; les champs sensibles ne sont inclus que pour les clients opérateurs à portée administrateur.gateway.identity.getrenvoie l’identité de l’appareil Gateway utilisée par les flux de relais et d’appairage.system-presencerenvoie l’instantané de présence actuel pour les appareils opérateur/Node connectés.system-eventajoute un événement système et peut mettre à jour/diffuser le contexte de présence.last-heartbeatrenvoie le dernier événement Heartbeat persisté.set-heartbeatsactive ou désactive le traitement Heartbeat sur le Gateway.
Modèles et utilisation
models.listrenvoie le catalogue de modèles autorisé à l’exécution. Passez{ "view": "configured" }pour des modèles configurés adaptés au sélecteur (agents.defaults.modelsd’abord, puismodels.providers.*.models), ou{ "view": "all" }pour le catalogue complet.usage.statusrenvoie les fenêtres d’utilisation fournisseur et les résumés de quota restant.usage.costrenvoie les résumés agrégés des coûts d’utilisation pour une plage de dates. PassezagentIdpour un agent, ouagentScope: "all"pour agréger les agents configurés.doctor.memory.statusrenvoie l’état de préparation de la mémoire vectorielle / des embeddings mis en cache pour l’espace de travail de l’agent par défaut actif. Passez{ "probe": true }ou{ "deep": true }uniquement lorsque l’appelant souhaite explicitement un ping en direct du fournisseur d’embeddings. Les clients compatibles Dreaming peuvent aussi passer{ "agentId": "agent-id" }pour limiter les statistiques du magasin Dreaming à un espace de travail d’agent sélectionné ; omettreagentIdconserve le repli sur l’agent par défaut et agrège les espaces de travail Dreaming configurés.doctor.memory.dreamDiary,doctor.memory.backfillDreamDiary,doctor.memory.resetDreamDiary,doctor.memory.resetGroundedShortTerm,doctor.memory.repairDreamingArtifactsetdoctor.memory.dedupeDreamDiaryacceptent des paramètres facultatifs{ "agentId": "agent-id" }pour les vues/actions Dreaming de l’agent sélectionné. LorsqueagentIdest omis, ils opèrent sur l’espace de travail de l’agent par défaut configuré.doctor.memory.remHarnessrenvoie un aperçu borné, en lecture seule, du harnais REM pour les clients de plan de contrôle distant. Il peut inclure des chemins d’espace de travail, des extraits de mémoire, du Markdown ancré rendu et des candidats à la promotion profonde ; les appelants ont donc besoin deoperator.read.sessions.usagerenvoie les résumés d’utilisation par session. PassezagentIdpour un agent, ouagentScope: "all"pour lister ensemble les agents configurés.sessions.usage.timeseriesrenvoie l’utilisation en série temporelle pour une session.sessions.usage.logsrenvoie les entrées de journal d’utilisation pour une session.
Canaux et assistants de connexion
channels.statusrenvoie les résumés d’état des canaux/Plugins intégrés + groupés.channels.logoutdéconnecte un canal/compte spécifique lorsque le canal prend en charge la déconnexion.web.login.startdémarre un flux de connexion QR/web pour le fournisseur de canal web actuel compatible QR.web.login.waitattend la fin de ce flux de connexion QR/web et démarre le canal en cas de réussite.push.testenvoie une notification push APNs de test à un Node iOS enregistré.voicewake.getrenvoie les déclencheurs de mot de réveil stockés.voicewake.setmet à jour les déclencheurs de mot de réveil et diffuse la modification.
Messagerie et journaux
sendest le RPC de livraison sortante directe pour les envois ciblés par canal/compte/fil en dehors de l’exécuteur de chat.logs.tailrenvoie la fin du fichier journal Gateway configuré avec des contrôles de curseur/limite et d’octets maximaux.
Talk et TTS
talk.catalogrenvoie le catalogue Talk fournisseur en lecture seule pour la parole, la transcription en streaming et la voix en temps réel. Il inclut les identifiants canoniques de fournisseurs, les alias de registre, les libellés, l’état configuré, un résultatreadyfacultatif au niveau du groupe, les identifiants de modèles/voix exposés, les modes canoniques, les transports, les stratégies de cerveau et les indicateurs audio/capacité temps réel sans renvoyer les secrets fournisseur ni modifier la config globale. Les Gateways actuels définissentreadyaprès application de la sélection de fournisseur à l’exécution ; les clients doivent traiter son absence comme non vérifiée pour la compatibilité avec les Gateways plus anciens.talk.configrenvoie la charge utile de config Talk effective ;includeSecretsrequiertoperator.talk.secrets(ouoperator.admin).talk.session.createcrée une session Talk détenue par le Gateway pourrealtime/gateway-relay,transcription/gateway-relayoustt-tts/managed-room. Pourstt-tts/managed-room, les appelantsoperator.writequi passentsessionKeydoivent aussi passerspawnedBypour une visibilité de clé de session limitée ; la création non limitée desessionKeyetbrain: "direct-tools"requièrentoperator.admin.talk.session.joinvalide un token de session managed-room, émet les événementssession.readyousession.replacedselon les besoins, et renvoie les métadonnées de salle/session ainsi que les événements Talk récents sans le token en clair ni le hachage de token stocké.talk.session.appendAudioajoute de l’audio d’entrée PCM en base64 aux sessions de relais temps réel et de transcription détenues par le Gateway.talk.session.startTurn,talk.session.endTurnettalk.session.cancelTurnpilotent le cycle de vie des tours managed-room avec rejet des tours obsolètes avant l’effacement de l’état.talk.session.cancelOutputarrête la sortie audio de l’assistant, principalement pour l’interruption VAD-gated dans les sessions de relais Gateway.talk.session.submitToolResulttermine un appel d’outil fournisseur émis par une session de relais temps réel détenue par le Gateway. Passezoptions: { willContinue: true }pour une sortie d’outil intermédiaire lorsqu’un résultat final suivra, ouoptions: { suppressResponse: true }lorsque le résultat d’outil doit satisfaire l’appel fournisseur sans démarrer une autre réponse d’assistant temps réel.talk.session.steerenvoie un contrôle vocal d’exécution active dans une session Talk adossée à un agent et détenue par le Gateway. Il accepte{ sessionId, text, mode? }, oùmodevautstatus,steer,canceloufollowup; le mode omis est classé à partir du texte parlé.talk.session.closeferme une session de relais, de transcription ou managed-room détenue par le Gateway et émet des événements Talk terminaux.talk.modedéfinit/diffuse l’état actuel du mode Talk pour les clients WebChat/Control UI.talk.client.createcrée une session fournisseur temps réel détenue par le client avecwebrtcouprovider-websocket, tandis que le Gateway détient la config, les identifiants, les instructions et la politique d’outils.talk.client.toolCallpermet aux transports temps réel détenus par le client de transférer les appels d’outils fournisseur vers la politique du Gateway. Le premier outil pris en charge estopenclaw_agent_consult; les clients reçoivent un identifiant d’exécution et attendent les événements normaux du cycle de vie du chat avant de soumettre le résultat d’outil propre au fournisseur.talk.client.steerenvoie le contrôle vocal d’exécution active pour les transports temps réel détenus par le client. Le Gateway résout l’exécution intégrée active depuissessionKeyet renvoie un résultat structuré accepté/rejeté au lieu d’abandonner silencieusement le pilotage.talk.eventest le canal d’événements Talk unique pour les adaptateurs temps réel, transcription, STT/TTS, managed-room, téléphonie et réunion.talk.speaksynthétise la parole via le fournisseur de parole Talk actif.tts.statusrenvoie l’état d’activation TTS, le fournisseur actif, les fournisseurs de repli et l’état de config des fournisseurs.tts.providersrenvoie l’inventaire visible des fournisseurs TTS.tts.enableettts.disableactivent ou désactivent l’état des préférences TTS.tts.setProvidermet à jour le fournisseur TTS préféré.tts.convertexécute une conversion ponctuelle texte-vers-parole.
Secrets, config, mise à jour et assistant
secrets.reloadrésout à nouveau les SecretRefs actifs et remplace l’état des secrets d’exécution uniquement en cas de réussite complète.secrets.resolverésout les affectations de secrets ciblées par commande pour un ensemble commande/cible spécifique.config.getrenvoie l’instantané de config actuel et son hachage.config.setécrit une charge utile de config validée.config.patchfusionne une mise à jour partielle de config. Le remplacement destructeur de tableau requiert le chemin affecté dansreplacePaths; les tableaux imbriqués sous des entrées de tableau utilisent des chemins[]tels queagents.list[].skills.config.applyvalide + remplace la charge utile complète de config.config.schemarenvoie la charge utile de schéma de config en direct utilisée par Control UI et les outils CLI : schéma,uiHints, version et métadonnées de génération, y compris les métadonnées de schéma Plugin + canal lorsque l’environnement d’exécution peut les charger. Le schéma inclut les métadonnées de champtitle/descriptiondérivées des mêmes libellés et textes d’aide utilisés par l’UI, y compris les branches d’objets imbriqués, de jokers, d’éléments de tableau et de compositionanyOf/oneOf/allOflorsqu’une documentation de champ correspondante existe.config.schema.lookuprenvoie une charge utile de recherche limitée à un chemin pour un chemin de config : chemin normalisé, nœud de schéma superficiel, indice correspondant +hintPath,reloadKindfacultatif et résumés des enfants immédiats pour l’exploration UI/CLI.reloadKindest l’un derestart,hotounoneet reflète le planificateur de rechargement de config du Gateway pour le chemin demandé. Les nœuds de schéma de recherche conservent les docs destinées à l’utilisateur et les champs de validation courants (title,description,type,enum,const,format,pattern, bornes numériques/chaîne/tableau/objet et indicateurs commeadditionalProperties,deprecated,readOnly,writeOnly). Les résumés d’enfants exposentkey,pathnormalisé,type,required,hasChildren,reloadKindfacultatif, ainsi que lehint/hintPathcorrespondant.update.runexécute le flux de mise à jour du Gateway et planifie un redémarrage uniquement lorsque la mise à jour elle-même a réussi ; les appelants avec une session peuvent inclurecontinuationMessageafin que le démarrage reprenne un tour d’agent de suivi via la file de continuation de redémarrage. Les mises à jour du gestionnaire de paquets et les mises à jour supervisées de git-checkout depuis le plan de contrôle utilisent un transfert de service géré détaché au lieu de remplacer l’arborescence du paquet ou de modifier la sortie checkout/build dans le Gateway en direct. Un transfert démarré renvoieok: trueavecresult.reason: "managed-service-handoff-started"ethandoff.status: "started"; les transferts indisponibles ou échoués renvoientok: falseavecmanaged-service-handoff-unavailableoumanaged-service-handoff-failed, ainsi quehandoff.commandlorsqu’une mise à jour shell manuelle est requise. Un transfert indisponible signifie qu’OpenClaw ne dispose pas d’une frontière de superviseur sûre ou d’une identité de service durable, commeOPENCLAW_SYSTEMD_UNITpour systemd. Pendant un transfert démarré, la sentinelle de redémarrage peut brièvement signalerstats.reason: "restart-health-pending"; la continuation est différée jusqu’à ce que la CLI vérifie le Gateway redémarré et écrive la sentinelle finaleok.update.statusactualise et renvoie la dernière sentinelle de redémarrage de mise à jour, y compris la version exécutée après redémarrage lorsqu’elle est disponible.wizard.start,wizard.next,wizard.statusetwizard.cancelexposent l’assistant d’onboarding via WS RPC.
Assistants pour agents et espaces de travail
agents.listrenvoie les entrées d’agents configurées, y compris le modèle effectif et les métadonnées d’exécution.agents.create,agents.updateetagents.deletegèrent les enregistrements d’agents et le câblage de l’espace de travail.agents.files.list,agents.files.getetagents.files.setgèrent les fichiers d’espace de travail d’amorçage exposés pour un agent.tasks.list,tasks.getettasks.cancelexposent le registre des tâches du Gateway aux clients SDK et opérateur.artifacts.list,artifacts.getetartifacts.downloadexposent les résumés d’artefacts dérivés des transcriptions et les téléchargements pour une portée explicitesessionKey,runIdoutaskId. Les requêtes de run et de tâche résolvent la session propriétaire côté serveur et ne renvoient que les médias de transcription dont la provenance correspond ; les sources d’URL non sûres ou locales renvoient des téléchargements non pris en charge au lieu d’être récupérées côté serveur.environments.listetenvironments.statusexposent la découverte en lecture seule des environnements locaux au Gateway et des environnements de nœud pour les clients SDK.agent.identity.getrenvoie l’identité d’assistant effective pour un agent ou une session.agent.waitattend la fin d’un run et renvoie l’instantané terminal lorsqu’il est disponible.
Contrôle de session
sessions.listrenvoie l’index de session actuel, y compris les métadonnéesagentRuntimepar ligne lorsqu’un backend d’exécution d’agent est configuré.sessions.subscribeetsessions.unsubscribeactivent ou désactivent les abonnements aux événements de changement de session pour le client WS actuel.sessions.messages.subscribeetsessions.messages.unsubscribeactivent ou désactivent les abonnements aux événements de transcription/message pour une session.sessions.previewrenvoie des aperçus de transcription bornés pour des clés de session spécifiques.sessions.describerenvoie une ligne de session du Gateway pour une clé de session exacte.sessions.resolverésout ou canonise une cible de session.sessions.createcrée une nouvelle entrée de session.sessions.sendenvoie un message dans une session existante.sessions.steerest la variante d’interruption et d’orientation pour une session active.sessions.abortinterrompt le travail actif pour une session. Un appelant peut transmettrekeyavec unrunIdfacultatif, ou transmettre uniquementrunIdpour les runs actifs que le Gateway peut résoudre vers une session.sessions.patchmet à jour les métadonnées/remplacements de session et signale le modèle canonique résolu ainsi que l’agentRuntimeeffectif.sessions.reset,sessions.deleteetsessions.compacteffectuent la maintenance de session.sessions.getrenvoie la ligne de session stockée complète.- L’exécution du chat utilise toujours
chat.history,chat.send,chat.abortetchat.inject.chat.historyest normalisé pour l’affichage des clients UI : les balises de directive en ligne sont retirées du texte visible, les charges utiles XML d’appels d’outil en texte brut (y compris<tool_call>...</tool_call>,<function_call>...</function_call>,<tool_calls>...</tool_calls>,<function_calls>...</function_calls>et les blocs d’appels d’outil tronqués) ainsi que les jetons de contrôle de modèle ASCII/pleine chasse ayant fuité sont retirés, les lignes d’assistant composées uniquement de jetons silencieux telles que les valeurs exactesNO_REPLY/no_replysont omises, et les lignes trop volumineuses peuvent être remplacées par des espaces réservés. chat.message.getest le lecteur additif, borné et en message complet pour une seule entrée de transcription visible. Les clients transmettentsessionKey, unagentIdfacultatif lorsque la sélection de session est limitée à l’agent, ainsi qu’unmessageIdde transcription précédemment exposé viachat.history, et le Gateway renvoie la même projection normalisée pour l’affichage sans le plafond de troncature de l’historique léger lorsque l’entrée stockée est encore disponible et n’est pas trop volumineuse.chat.sendaccepte unfastMode: "auto"sur un seul tour afin d’utiliser le mode rapide pour les appels de modèle démarrés avant le seuil automatique, puis de lancer les appels ultérieurs de nouvelle tentative, de fallback, de résultat d’outil ou de continuation sans mode rapide. Le seuil est de 60 secondes par défaut et peut être configuré par modèle avecagents.defaults.models["<provider>/<model>"].params.fastAutoOnSeconds. Un appelantchat.sendpeut transmettrefastAutoOnSecondssur un seul tour pour remplacer le seuil de cette requête.
Appairage d’appareils et jetons d’appareil
device.pair.listrenvoie les appareils appairés en attente et approuvés.device.pair.setupCodecrée un code de configuration mobile et, par défaut, une URL de données QR PNG. Il requiertoperator.adminet est intentionnellement omis de la découverte annoncée. Le résultat inclutsetupCode,qrDataUrlfacultatif,gatewayUrl, l’étiquette non secrèteautheturlSource.device.pair.approve,device.pair.rejectetdevice.pair.removegèrent les enregistrements d’appairage d’appareils.device.token.rotateeffectue la rotation d’un jeton d’appareil appairé dans les limites de son rôle approuvé et de la portée de l’appelant.device.token.revokerévoque un jeton d’appareil appairé dans les limites de son rôle approuvé et de la portée de l’appelant.
Le code de configuration embarque un identifiant d’amorçage à courte durée de vie. Les clients ne doivent pas le journaliser ni le conserver au-delà du flux d’appairage.
Appairage de nœuds, invocation et travail en attente
node.pair.request,node.pair.list,node.pair.approve,node.pair.reject,node.pair.removeetnode.pair.verifycouvrent l’appairage de nœuds et la vérification d’amorçage.node.listetnode.describerenvoient l’état des nœuds connus/connectés.node.renamemet à jour l’étiquette d’un nœud appairé.node.invoketransmet une commande à un nœud connecté.node.invoke.resultrenvoie le résultat d’une requête d’invocation.node.eventtransporte les événements issus des nœuds vers le gateway.node.pending.pulletnode.pending.acksont les API de file d’attente des nœuds connectés.node.pending.enqueueetnode.pending.draingèrent le travail durable en attente pour les nœuds hors ligne/déconnectés.
Familles d’approbation
exec.approval.request,exec.approval.get,exec.approval.listetexec.approval.resolvecouvrent les demandes d’approbation exec ponctuelles ainsi que la recherche/relecture des approbations en attente.exec.approval.waitDecisionattend une approbation exec en attente et renvoie la décision finale (ounullen cas de délai d’attente).exec.approvals.getetexec.approvals.setgèrent les instantanés de politique d’approbation exec du gateway.exec.approvals.node.getetexec.approvals.node.setgèrent la politique d’approbation exec locale au nœud via des commandes de relais de nœud.plugin.approval.request,plugin.approval.list,plugin.approval.waitDecisionetplugin.approval.resolvecouvrent les flux d’approbation définis par les plugins.
Automatisation, Skills et outils
- Automatisation :
wakeplanifie une injection de texte de réveil immédiate ou au prochain Heartbeat ;cron.get,cron.list,cron.status,cron.add,cron.update,cron.remove,cron.run,cron.runsgèrent le travail planifié. cron.runreste un RPC de type mise en file d’attente pour les runs manuels. Les clients qui ont besoin d’une sémantique d’achèvement doivent lire lerunIdrenvoyé et interrogercron.runs.cron.runsaccepte un filtrerunIdnon vide facultatif afin que les clients puissent suivre un run manuel mis en file d’attente sans entrer en concurrence avec d’autres entrées d’historique pour la même tâche.- Skills et outils :
commands.list,skills.*,tools.catalog,tools.effective,tools.invoke.
Familles d’événements courantes
chat: mises à jour de chat UI telles quechat.injectet autres événements de chat limités à la transcription. Dans la version 4 du protocole, les charges utiles delta portentdeltaText;messagereste l’instantané cumulatif de l’assistant. Les remplacements qui ne sont pas des préfixes définissentreplace=trueet utilisentdeltaTextcomme texte de remplacement.session.message,session.operationetsession.tool: mises à jour de transcription, d’opération de session en cours et de flux d’événements pour une session abonnée.sessions.changed: l’index ou les métadonnées de session ont changé.presence: mises à jour d’instantané de présence système.tick: événement périodique de keepalive / vivacité.health: mise à jour d’instantané de santé du gateway.heartbeat: mise à jour du flux d’événements Heartbeat.cron: événement de changement de run/tâche Cron.shutdown: notification d’arrêt du gateway.node.pair.requested/node.pair.resolved: cycle de vie de l’appairage de nœuds.node.invoke.request: diffusion d’une requête d’invocation de nœud.device.pair.requested/device.pair.resolved: cycle de vie d’appareil appairé.voicewake.changed: la configuration du déclencheur par mot d’activation a changé.exec.approval.requested/exec.approval.resolved: cycle de vie de l’approbation exec.plugin.approval.requested/plugin.approval.resolved: cycle de vie de l’approbation de plugin.
Méthodes d’assistance des nœuds
- Les nœuds peuvent appeler
skills.binspour récupérer la liste actuelle des exécutables de Skills pour les vérifications d’autorisation automatique.
RPC du registre des tâches
Les clients opérateur peuvent inspecter et annuler les enregistrements de tâches en arrière-plan du Gateway via les RPC du registre des tâches. Ces méthodes renvoient des résumés de tâches assainis, pas l’état brut de l’exécution.
tasks.listrequiertoperator.read.- Paramètres :
statusfacultatif ("queued","running","completed","failed","cancelled"ou"timed_out") ou un tableau de ces statuts,agentIdfacultatif,sessionKeyfacultatif,limitfacultatif de1à500, et chaînecursorfacultative. - Résultat :
{ "tasks": TaskSummary[], "nextCursor"?: string }.
- Paramètres :
tasks.getrequiertoperator.read.- Paramètres :
{ "taskId": string }. - Résultat :
{ "task": TaskSummary }. - Les identifiants de tâche manquants renvoient la forme d’erreur introuvable du Gateway.
- Paramètres :
tasks.cancelrequiertoperator.write.- Paramètres :
{ "taskId": string, "reason"?: string }. - Résultat :
{ "found": boolean, "cancelled": boolean, "reason"?: string, "task"?: TaskSummary }. foundindique si le registre contenait une tâche correspondante.cancelledindique si l’exécution a accepté ou enregistré l’annulation.
- Paramètres :
TaskSummary inclut id, status et des métadonnées facultatives telles que kind, runtime, title, agentId, sessionKey, childSessionKey, ownerKey, runId, taskId, flowId, parentTaskId, sourceId, les horodatages, la progression, le résumé terminal et le texte d’erreur assaini. agentId identifie l’agent qui exécute la tâche ; sessionKey et ownerKey préservent le contexte du demandeur et du contrôle.
Méthodes d’assistance opérateur
- Les opérateurs peuvent appeler
commands.list(operator.read) pour récupérer l’inventaire des commandes d’exécution d’un agent.agentIdest facultatif ; omettez-le pour lire l’espace de travail de l’agent par défaut.scopecontrôle la surface ciblée par lenameprincipal :textrenvoie le jeton principal de commande texte sans le/initialnativeet le chemin par défautbothrenvoient les noms natifs tenant compte du fournisseur lorsqu’ils sont disponibles
textAliasescontient les alias slash exacts tels que/modelet/m.nativeNamecontient le nom de commande natif tenant compte du fournisseur lorsqu’il existe.providerest facultatif et n’affecte que le nommage natif ainsi que la disponibilité des commandes Plugin natives.includeArgs=falseomet les métadonnées d’arguments sérialisées de la réponse.
- Les opérateurs peuvent appeler
tools.catalog(operator.read) pour récupérer le catalogue des outils d’exécution d’un agent. La réponse inclut les outils groupés et les métadonnées de provenance :source:coreoupluginpluginId: propriétaire du Plugin lorsquesource="plugin"optional: indique si un outil Plugin est facultatif
- Les opérateurs peuvent appeler
tools.effective(operator.read) pour récupérer l’inventaire des outils effectifs à l’exécution pour une session.sessionKeyest requis.- Le Gateway déduit le contexte d’exécution fiable côté serveur à partir de la session au lieu d’accepter un contexte d’authentification ou de livraison fourni par l’appelant.
- La réponse est une projection dérivée côté serveur et limitée à la session de l’inventaire actif, incluant les outils du cœur, des Plugins, des canaux et des serveurs MCP déjà découverts.
tools.effectiveest en lecture seule pour MCP : il peut projeter un catalogue MCP de session déjà chaud via la politique d’outils finale, mais il ne crée pas d’environnements d’exécution MCP, ne connecte pas de transports et n’émet pastools/list. Si aucun catalogue chaud correspondant n’existe, la réponse peut inclure une notification telle quemcp-not-yet-connected,mcp-not-yet-listedoumcp-stale-catalog.- Les entrées d’outils effectifs utilisent
source="core",source="plugin",source="channel"ousource="mcp".
- Les opérateurs peuvent appeler
tools.invoke(operator.write) pour invoquer un outil disponible via le même chemin de politique Gateway que/tools/invoke.nameest requis.args,sessionKey,agentId,confirmetidempotencyKeysont facultatifs.- Si
sessionKeyetagentIdsont tous deux présents, l’agent de session résolu doit correspondre àagentId. - Les wrappers cœur réservés au propriétaire, tels que
cron,gatewayetnodes, exigent une identité propriétaire/administrateur (operator.admin), même si la méthodetools.invokeelle-même estoperator.write. - La réponse est une enveloppe destinée au SDK avec les champs
ok,toolName,outputfacultatif eterrortypé. Les refus d’approbation ou de politique renvoientok:falsedans la charge utile au lieu de contourner le pipeline de politique d’outils du Gateway.
- Les opérateurs peuvent appeler
skills.status(operator.read) pour récupérer l’inventaire visible des Skills pour un agent.agentIdest facultatif ; omettez-le pour lire l’espace de travail de l’agent par défaut.- La réponse inclut l’éligibilité, les exigences manquantes, les vérifications de configuration et les options d’installation assainies sans exposer de valeurs secrètes brutes.
- Les opérateurs peuvent appeler
skills.searchetskills.detail(operator.read) pour les métadonnées de découverte ClawHub. - Les opérateurs peuvent appeler
skills.upload.begin,skills.upload.chunketskills.upload.commit(operator.admin) pour préparer une archive de Skills privée avant de l’installer. Il s’agit d’un chemin d’envoi administrateur séparé pour les clients de confiance, et non du flux normal d’installation de Skills ClawHub ; il est désactivé par défaut sauf siskills.install.allowUploadedArchivesest activé.skills.upload.begin({ kind: "skill-archive", slug, sizeBytes, sha256?, force?, idempotencyKey? })crée un envoi lié à ce slug et à cette valeur force.skills.upload.chunk({ uploadId, offset, dataBase64 })ajoute des octets au décalage décodé exact.skills.upload.commit({ uploadId, sha256? })vérifie la taille finale et le SHA-256. Le commit ne fait que finaliser l’envoi ; il n’installe pas le Skill.- Les archives de Skills téléversées sont des archives zip contenant une racine
SKILL.md. Le nom du répertoire interne de l’archive ne sélectionne jamais la cible d’installation.
- Les opérateurs peuvent appeler
skills.install(operator.admin) selon trois modes :- Mode ClawHub :
{ source: "clawhub", slug, version?, force? }installe un dossier de Skills dans le répertoireskills/de l’espace de travail de l’agent par défaut. - Mode envoi :
{ source: "upload", uploadId, slug, force?, sha256?, timeoutMs? }installe un envoi validé dans le répertoireskills/<slug>de l’espace de travail de l’agent par défaut. Le slug et la valeur force doivent correspondre à la requêteskills.upload.begind’origine. Ce mode est rejeté sauf siskills.install.allowUploadedArchivesest activé. Le paramètre n’affecte pas les installations ClawHub. - Mode installateur Gateway :
{ name, installId, timeoutMs? }exécute une actionmetadata.openclaw.installdéclarée sur l’hôte Gateway. Les anciens clients peuvent encore envoyerdangerouslyForceUnsafeInstall; ce champ est obsolète, accepté uniquement pour la compatibilité du protocole et ignoré. Utilisezsecurity.installPolicypour les décisions d’installation appartenant à l’opérateur.
- Mode ClawHub :
- Les opérateurs peuvent appeler
skills.update(operator.admin) selon deux modes :- Le mode ClawHub met à jour un slug suivi ou toutes les installations ClawHub suivies dans l’espace de travail de l’agent par défaut.
- Le mode configuration corrige les valeurs
skills.entries.<skillKey>telles queenabled,apiKeyetenv.
Vues de models.list
models.list accepte un paramètre view facultatif :
- Omis ou
"default": comportement d’exécution actuel. Siagents.defaults.modelsest configuré, la réponse est le catalogue autorisé, incluant les modèles découverts dynamiquement pour les entréesprovider/*. Sinon, la réponse est le catalogue Gateway complet. "configured": comportement dimensionné pour les sélecteurs. Siagents.defaults.modelsest configuré, il reste prioritaire, incluant la découverte limitée au fournisseur pour les entréesprovider/*. Sans liste d’autorisation, la réponse utilise les entrées explicitesmodels.providers.*.models, avec repli vers le catalogue complet uniquement lorsqu’aucune ligne de modèle configurée n’existe."all": catalogue Gateway complet, en contournantagents.defaults.models. Utilisez cette option pour les diagnostics et les interfaces de découverte, pas pour les sélecteurs de modèles normaux.
Approbations exec
- Lorsqu’une requête exec nécessite une approbation, le Gateway diffuse
exec.approval.requested. - Les clients opérateurs résolvent la demande en appelant
exec.approval.resolve(nécessite la portéeoperator.approvals). - Pour
host=node,exec.approval.requestdoit incluresystemRunPlan(argv/cwd/rawCommand/métadonnées de session canoniques). Les requêtes sanssystemRunPlansont rejetées. - Après approbation, les appels transférés
node.invoke system.runréutilisent cesystemRunPlancanonique comme contexte de commande/cwd/session faisant autorité. - Si un appelant modifie
command,rawCommand,cwd,agentIdousessionKeyentre la préparation et le transfert final approuvé desystem.run, le Gateway rejette l’exécution au lieu de faire confiance à la charge utile modifiée.
Repli de livraison de l’agent
- Les requêtes
agentpeuvent incluredeliver=truepour demander une livraison sortante. bestEffortDeliver=falseconserve un comportement strict : les cibles de livraison non résolues ou uniquement internes renvoientINVALID_REQUEST.bestEffortDeliver=trueautorise le repli vers une exécution limitée à la session lorsqu’aucune route livrable externe ne peut être résolue (par exemple les sessions internes/webchat ou les configurations multicanales ambiguës).- Les résultats finaux
agentpeuvent inclureresult.deliveryStatuslorsqu’une livraison a été demandée, avec les mêmes statutssent,suppressed,partial_failedetfailedque ceux documentés pouropenclaw agent --json --deliver.
Versionnement
PROTOCOL_VERSIONse trouve danspackages/gateway-protocol/src/version.ts.- Les clients envoient
minProtocol+maxProtocol; le serveur rejette les plages qui n’incluent pas son protocole actuel. Les clients et serveurs actuels exigent le protocole v4. - Les schémas + modèles sont générés à partir de définitions TypeBox :
pnpm protocol:genpnpm protocol:gen:swiftpnpm protocol:check
Constantes client
Le client de référence dans src/gateway/client.ts utilise ces valeurs par défaut. Les valeurs sont stables sur l’ensemble du protocole v4 et constituent la base attendue pour les clients tiers.
| Constante | Valeur par défaut | Source |
|---|---|---|
PROTOCOL_VERSION |
4 |
packages/gateway-protocol/src/version.ts |
MIN_CLIENT_PROTOCOL_VERSION |
4 |
packages/gateway-protocol/src/version.ts |
| Délai d’expiration de requête (par RPC) | 30_000 ms |
src/gateway/client.ts (requestTimeoutMs) |
| Délai d’expiration préauthentification / défi de connexion | 15_000 ms |
src/gateway/handshake-timeouts.ts (config/env peut augmenter le budget serveur/client associé) |
| Backoff de reconnexion initial | 1_000 ms |
src/gateway/client.ts (backoffMs) |
| Backoff de reconnexion maximal | 30_000 ms |
src/gateway/client.ts (scheduleReconnect) |
| Limite de nouvelle tentative rapide après fermeture du jeton d’appareil | 250 ms |
src/gateway/client.ts |
Délai de grâce force-stop avant terminate() |
250 ms |
FORCE_STOP_TERMINATE_GRACE_MS |
Délai d’expiration par défaut de stopAndWait() |
1_000 ms |
STOP_AND_WAIT_TIMEOUT_MS |
Intervalle de tick par défaut (avant hello-ok) |
30_000 ms |
src/gateway/client.ts |
| Fermeture sur délai d’expiration de tick | code 4000 lorsque le silence dépasse tickIntervalMs * 2 |
src/gateway/client.ts |
MAX_PAYLOAD_BYTES |
25 * 1024 * 1024 (25 Mo) |
src/gateway/server-constants.ts |
Le serveur annonce les valeurs effectives policy.tickIntervalMs, policy.maxPayload et policy.maxBufferedBytes dans hello-ok ; les clients doivent respecter ces valeurs plutôt que les valeurs par défaut d’avant handshake.
Auth
- L’authentification Gateway par secret partagé utilise
connect.params.auth.tokenouconnect.params.auth.password, selon le mode d’authentification configuré. - Les modes portant une identité comme Tailscale Serve
(
gateway.auth.allowTailscale: true) ougateway.auth.mode: "trusted-proxy"hors local loopback satisfont le contrôle d’authentification de connexion à partir des en-têtes de requête plutôt que deconnect.params.auth.*. - Le mode d’entrée privée
gateway.auth.mode: "none"ignore entièrement l’authentification de connexion par secret partagé ; n’exposez pas ce mode sur une entrée publique/non fiable. - Après l’appairage, le Gateway émet un jeton d’appareil limité au rôle de
connexion + aux portées. Il est renvoyé dans
hello-ok.auth.deviceTokenet doit être conservé par le client pour les futures connexions. - Les clients doivent conserver le
hello-ok.auth.deviceTokenprincipal après toute connexion réussie. - Une reconnexion avec ce jeton d’appareil stocké doit aussi réutiliser l’ensemble de portées approuvé stocké pour ce jeton. Cela préserve l’accès lecture/sonde/statut déjà accordé et évite de réduire silencieusement les reconnexions à une portée implicite plus étroite réservée à l’administration.
- Assemblage de l’authentification de connexion côté client (
selectConnectAuthdanssrc/gateway/client.ts) :auth.passwordest orthogonal et est toujours transmis lorsqu’il est défini.auth.tokenest renseigné par ordre de priorité : jeton partagé explicite d’abord, puis undeviceTokenexplicite, puis un jeton par appareil stocké (indexé pardeviceId+role).auth.bootstrapTokenest envoyé uniquement lorsqu’aucun des éléments ci-dessus n’a résolu unauth.token. Un jeton partagé ou tout jeton d’appareil résolu le supprime.- La promotion automatique d’un jeton d’appareil stocké lors de la nouvelle
tentative ponctuelle
AUTH_TOKEN_MISMATCHest limitée aux points de terminaison fiables uniquement : loopback, ouwss://avec untlsFingerprintépinglé. Unwss://public sans épinglage n’est pas admissible.
- L’amorçage intégré par code de configuration renvoie le
hello-ok.auth.deviceTokendu nœud principal ainsi qu’un jeton opérateur borné danshello-ok.auth.deviceTokenspour un transfert mobile fiable. Le jeton opérateur inclutoperator.talk.secretspour les lectures de configuration Talk natives, mais exclut les portées de mutation d’appairage etoperator.admin. - Pendant qu’un amorçage par code de configuration hors référence attend une
approbation, les détails
PAIRING_REQUIREDincluentrecommendedNextStep: "wait_then_retry",retryable: trueetpauseReconnect: false. Les clients doivent continuer à se reconnecter avec le même jeton d’amorçage jusqu’à ce que la demande soit approuvée ou que le jeton devienne invalide. - Conservez
hello-ok.auth.deviceTokensuniquement lorsque la connexion a utilisé l’authentification d’amorçage sur un transport fiable commewss://ou un appairage loopback/local. - Si un client fournit un
deviceTokenexplicite ou desscopesexplicites, l’ensemble de portées demandé par cet appelant reste l’autorité ; les portées mises en cache ne sont réutilisées que lorsque le client réutilise le jeton par appareil stocké. - Les jetons d’appareil peuvent être alternés/révoqués via
device.token.rotateetdevice.token.revoke(nécessite la portéeoperator.pairing). L’alternance ou la révocation d’un nœud ou d’un autre rôle non opérateur nécessite aussioperator.admin. device.token.rotaterenvoie des métadonnées d’alternance. Il renvoie en écho le jeton porteur de remplacement uniquement pour les appels du même appareil déjà authentifiés avec ce jeton d’appareil, afin que les clients à jeton seul puissent conserver leur remplacement avant de se reconnecter. Les alternances partagées/admin ne renvoient pas le jeton porteur en écho.- L’émission, l’alternance et la révocation des jetons restent bornées à l’ensemble de rôles approuvé enregistré dans l’entrée d’appairage de cet appareil ; la mutation de jeton ne peut pas étendre ni cibler un rôle d’appareil que l’approbation d’appairage n’a jamais accordé.
- Pour les sessions par jeton d’appareil appairé, la gestion des appareils est
limitée à soi-même sauf si l’appelant possède aussi
operator.admin: les appelants non administrateurs ne peuvent gérer que le jeton opérateur pour leur propre entrée d’appareil. La gestion des jetons de nœud et autres jetons non opérateur est réservée à l’administration, même pour le propre appareil de l’appelant. device.token.rotateetdevice.token.revokevérifient aussi l’ensemble de portées du jeton opérateur cible par rapport aux portées de session actuelles de l’appelant. Les appelants non administrateurs ne peuvent pas alterner ni révoquer un jeton opérateur plus large que celui qu’ils détiennent déjà.- Les échecs d’authentification incluent
error.details.codeainsi que des indications de récupération :error.details.canRetryWithDeviceToken(booléen)error.details.recommendedNextStep(retry_with_device_token,update_auth_configuration,update_auth_credentials,wait_then_retry,review_auth_configuration)
- Comportement du client pour
AUTH_TOKEN_MISMATCH:- Les clients fiables peuvent tenter une nouvelle tentative bornée avec un jeton par appareil mis en cache.
- Si cette nouvelle tentative échoue, les clients doivent arrêter les boucles de reconnexion automatiques et afficher des indications d’action pour l’opérateur.
AUTH_SCOPE_MISMATCHsignifie que le jeton d’appareil a été reconnu mais ne couvre pas le rôle/les portées demandés. Les clients ne doivent pas présenter cela comme un mauvais jeton ; invitez l’opérateur à réappairer ou à approuver le contrat de portée plus étroit/plus large.
Identité d’appareil + appairage
- Les nœuds doivent inclure une identité d’appareil stable (
device.id) dérivée de l’empreinte d’une paire de clés. - Les Gateways émettent des jetons par appareil + rôle.
- Les approbations d’appairage sont requises pour les nouveaux ID d’appareil, sauf si l’approbation automatique locale est activée.
- L’approbation automatique de l’appairage est centrée sur les connexions directes local loopback.
- OpenClaw possède aussi un chemin étroit d’auto-connexion backend/local au conteneur pour les flux d’assistance fiables par secret partagé.
- Les connexions tailnet ou LAN sur le même hôte sont toujours traitées comme distantes pour l’appairage et nécessitent une approbation.
- Les clients WS incluent normalement l’identité
devicependantconnect(opérateur + nœud). Les seules exceptions opérateur sans appareil sont les chemins de confiance explicites :gateway.controlUi.allowInsecureAuth=truepour la compatibilité HTTP non sécurisée limitée à localhost.- authentification Control UI opérateur réussie avec
gateway.auth.mode: "trusted-proxy". gateway.controlUi.dangerouslyDisableDeviceAuth=true(procédure d’urgence, dégradation de sécurité sévère).- RPC backend
gateway-clienten direct-loopback sur le chemin d’assistance interne réservé.
- Omettre l’identité d’appareil a des conséquences sur les portées. Lorsqu’une
connexion opérateur sans appareil est autorisée via un chemin de confiance
explicite, OpenClaw efface quand même les portées autodéclarées vers un
ensemble vide, sauf si ce chemin possède une exception nommée de préservation
des portées. Les méthodes protégées par portée échouent alors avec
missing scope. gateway.controlUi.dangerouslyDisableDeviceAuth=trueest un chemin de préservation des portées d’urgence pour Control UI. Il n’accorde pas de portées à des clients WebSocket backend personnalisés ou de forme CLI arbitraires.- Le chemin d’assistance backend réservé en direct-loopback
gateway-clientpréserve les portées uniquement pour les RPC internes du plan de contrôle local ; les ID backend personnalisés ne bénéficient pas de cette exception. - Toutes les connexions doivent signer le nonce
connect.challengefourni par le serveur.
Diagnostics de migration de l’authentification d’appareil
Pour les anciens clients qui utilisent encore le comportement de signature
antérieur au défi, connect renvoie désormais des codes de détail
DEVICE_AUTH_* sous error.details.code avec un error.details.reason stable.
Échecs de migration courants :
| Message | details.code | details.reason | Signification |
|---|---|---|---|
device nonce required |
DEVICE_AUTH_NONCE_REQUIRED |
device-nonce-missing |
Le client a omis device.nonce (ou l’a envoyé vide). |
device nonce mismatch |
DEVICE_AUTH_NONCE_MISMATCH |
device-nonce-mismatch |
Le client a signé avec un nonce obsolète/erroné. |
device signature invalid |
DEVICE_AUTH_SIGNATURE_INVALID |
device-signature |
La charge utile de signature ne correspond pas à la charge utile v2. |
device signature expired |
DEVICE_AUTH_SIGNATURE_EXPIRED |
device-signature-stale |
L’horodatage signé est en dehors du décalage autorisé. |
device identity mismatch |
DEVICE_AUTH_DEVICE_ID_MISMATCH |
device-id-mismatch |
device.id ne correspond pas à l’empreinte de clé publique. |
device public key invalid |
DEVICE_AUTH_PUBLIC_KEY_INVALID |
device-public-key |
Le format/la canonicalisation de la clé publique a échoué. |
Cible de migration :
- Attendez toujours
connect.challenge. - Signez la charge utile v2 qui inclut le nonce serveur.
- Envoyez le même nonce dans
connect.params.device.nonce. - La charge utile de signature préférée est
v3, qui lieplatformetdeviceFamilyen plus des champs device/client/role/scopes/token/nonce. - Les signatures héritées
v2restent acceptées pour la compatibilité, mais l’épinglage des métadonnées d’appareil appairé contrôle toujours la politique de commande lors de la reconnexion.
TLS + épinglage
- TLS est pris en charge pour les connexions WS.
- Les clients peuvent éventuellement épingler l’empreinte du certificat Gateway
(voir la configuration
gateway.tlsainsi quegateway.remote.tlsFingerprintou le CLI--tls-fingerprint).
Portée
Ce protocole expose l’API Gateway complète (statut, canaux, modèles, chat,
agent, sessions, nœuds, approbations, etc.). La surface exacte est définie par
les schémas TypeBox dans packages/gateway-protocol/src/schema.ts.