Gateway
Dépannage
Cette page est le runbook approfondi. Commencez par /help/troubleshooting si vous voulez d’abord le flux de triage rapide.
Échelle de commandes
Exécutez-les d’abord, dans cet ordre :
openclaw statusopenclaw gateway statusopenclaw logs --followopenclaw doctoropenclaw channels status --probeSignaux attendus en bon état :
openclaw gateway statusafficheRuntime: running,Connectivity probe: oket une ligneCapability: ....openclaw doctorne signale aucun problème bloquant de configuration ou de service.openclaw channels status --probeaffiche l’état de transport en direct par compte et, lorsque c’est pris en charge, les résultats de sonde/audit tels queworksouaudit ok.
Après une mise à jour
Utilisez ceci lorsqu’une mise à jour se termine mais que le Gateway est arrêté, que les canaux sont vides ou que les appels de modèle commencent à échouer avec des 401.
openclaw status --allopenclaw update status --jsonopenclaw gateway status --deepopenclaw doctor --fixopenclaw gateway restartRecherchez :
Update restartdansopenclaw status/openclaw status --all. Les transferts en attente ou échoués incluent la prochaine commande à exécuter.plugin load failed: dependency tree corrupted; run openclaw doctor --fixsous Canaux. Cela signifie que la configuration du canal existe toujours, mais que l’enregistrement du Plugin a échoué avant que le canal puisse se charger.- Des 401 de fournisseur après une nouvelle authentification.
openclaw doctor --fixvérifie les anciennes copies d’auth OAuth par agent et les supprime afin que tous les agents résolvent le profil partagé actuel.
Installations split brain et garde de configuration plus récente
Utilisez ceci lorsqu’un service de gateway s’arrête de manière inattendue après une mise à jour, ou lorsque les journaux indiquent qu’un binaire openclaw est plus ancien que la version qui a écrit openclaw.json en dernier.
OpenClaw marque les écritures de configuration avec meta.lastTouchedVersion. Les commandes en lecture seule peuvent toujours inspecter une configuration écrite par un OpenClaw plus récent, mais les mutations de processus et de service refusent de continuer depuis un binaire plus ancien. Les actions bloquées incluent le démarrage, l’arrêt, le redémarrage, la désinstallation du service gateway, la réinstallation forcée du service, le démarrage du gateway en mode service et le nettoyage de port gateway --force.
which openclawopenclaw --versionopenclaw gateway status --deepopenclaw config get meta.lastTouchedVersionFix PATH
Corrigez PATH afin que openclaw pointe vers l’installation la plus récente, puis relancez l’action.
Reinstall the gateway service
Réinstallez le service gateway prévu depuis l’installation la plus récente :
openclaw gateway install --forceopenclaw gateway restartRemove stale wrappers
Supprimez les entrées obsolètes de paquet système ou d’ancien wrapper qui pointent encore vers un ancien binaire openclaw.
Incompatibilité de protocole après rollback
Utilisez ceci lorsque les journaux continuent d’afficher protocol mismatch après une rétrogradation ou un retour arrière d’OpenClaw. Cela signifie qu’un ancien Gateway est en cours d’exécution, mais qu’un processus client local plus récent tente encore de se reconnecter avec une plage de protocoles que l’ancien Gateway ne sait pas gérer.
openclaw --versionwhich -a openclawopenclaw gateway status --deepopenclaw doctor --deepopenclaw logs --followRecherchez :
protocol mismatch ... client=... v<version> min=<n> max=<n> expected=<n>dans les journaux du Gateway.Established clients:dansopenclaw gateway status --deepouGateway clientsdansopenclaw doctor --deep. Cela liste les clients TCP actifs connectés au port du Gateway, y compris les PID et les lignes de commande lorsque le système d’exploitation le permet.- Un processus client dont la ligne de commande pointe vers l’installation ou le wrapper OpenClaw plus récent depuis lequel vous avez effectué le rollback.
Correction :
- Arrêtez ou redémarrez le processus client OpenClaw obsolète indiqué par
gateway status --deep. - Redémarrez les applications ou wrappers qui intègrent OpenClaw, comme les tableaux de bord locaux, les éditeurs, les assistants de serveur d’application ou les shells
openclaw logs --followde longue durée. - Relancez
openclaw gateway status --deepouopenclaw doctor --deepet confirmez que le PID client obsolète a disparu.
Ne faites pas accepter à un ancien Gateway un protocole plus récent incompatible. Les montées de version du protocole protègent le contrat filaire ; la récupération après rollback est un problème de nettoyage de processus/version.
Lien symbolique de Skill ignoré comme échappement de chemin
Utilisez ceci lorsque les journaux incluent :
Skipping escaped skill path outside its configured root: ... reason=symlink-escapeOpenClaw traite chaque racine de skill comme une frontière de confinement. Un lien symbolique sous
~/.agents/skills, <workspace>/.agents/skills, <workspace>/skills ou
~/.openclaw/skills est ignoré lorsque sa cible réelle se résout en dehors de cette racine,
sauf si la cible est explicitement approuvée.
Inspectez le lien :
ls -l ~/.agents/skills/<name>realpath ~/.agents/skills/<name>openclaw config get skills.loadSi la cible est intentionnelle, configurez à la fois la racine directe du skill et la cible de lien symbolique autorisée :
{ skills: { load: { extraDirs: ["~/Projects/manager/skills"], allowSymlinkTargets: ["~/Projects/manager/skills"], }, },}Démarrez ensuite une nouvelle session ou attendez que l’observateur de Skills se rafraîchisse. Redémarrez le gateway si le processus en cours est antérieur au changement de configuration.
N’utilisez pas de cibles larges comme ~, / ou un dossier de projet synchronisé entier.
Gardez allowSymlinkTargets limité à la racine réelle de skills qui contient les répertoires
SKILL.md approuvés.
Si Skill Workshop apply doit aussi écrire via ces chemins de skills d’espace de travail liés symboliquement
et approuvés, activez skills.workshop.allowSymlinkTargetWrites. Gardez-le
désactivé pour les racines de skills partagées en lecture seule.
Liens connexes :
Utilisation supplémentaire Anthropic 429 requise pour un contexte long
Utilisez ceci lorsque les journaux/erreurs incluent : HTTP 429: rate_limit_error: Extra usage is required for long context requests.
openclaw logs --followopenclaw models statusopenclaw config get agents.defaults.modelsRecherchez :
- Le modèle Anthropic sélectionné est un modèle Claude 4.x 1M compatible GA, ou le modèle a l’ancien
params.context1m: true. - L’identifiant Anthropic actuel n’est pas éligible à l’utilisation de contexte long.
- Les requêtes échouent uniquement sur les longues sessions/exécutions de modèle qui nécessitent le chemin de contexte 1M.
Options de correction :
Use a standard context window
Passez à un modèle avec fenêtre de contexte standard, ou supprimez l’ancien context1m de l’ancienne
configuration de modèle qui n’est pas compatible GA pour le contexte 1M.
Use an eligible credential
Utilisez un identifiant Anthropic éligible aux requêtes de contexte long, ou passez à une clé API Anthropic.
Configure fallback models
Configurez des modèles de secours afin que les exécutions continuent lorsque les requêtes Anthropic à contexte long sont rejetées.
Liens connexes :
Réponses 403 bloquées en amont
Utilisez ceci lorsqu’un fournisseur LLM en amont renvoie un 403 générique tel que
Your request was blocked.
Ne supposez pas qu’il s’agit toujours d’un problème de configuration OpenClaw. La réponse peut provenir d’une couche de sécurité en amont comme un CDN, un WAF, une règle de gestion des bots ou un proxy inverse devant un endpoint compatible OpenAI.
openclaw statusopenclaw gateway statusopenclaw logs --followRecherchez :
- plusieurs modèles sous le même fournisseur échouant de la même manière
- du HTML ou un texte de sécurité générique au lieu d’une erreur normale d’API fournisseur
- des événements de sécurité côté fournisseur au même moment que la requête
- une minuscule sonde directe
curlqui réussit alors que les requêtes normales de forme SDK échouent
Corrigez d’abord le filtrage côté fournisseur lorsque les éléments indiquent un blocage WAF/CDN. Préférez une règle d’autorisation ou d’exclusion à portée étroite pour le chemin d’API qu’OpenClaw utilise, et évitez de désactiver la protection pour tout le site.
Liens connexes :
Le backend local compatible OpenAI réussit les sondes directes mais les exécutions d’agent échouent
Utilisez ceci lorsque :
curl ... /v1/modelsfonctionne- de minuscules appels directs
/v1/chat/completionsfonctionnent - les exécutions de modèle OpenClaw échouent uniquement lors de tours d’agent normaux
curl http://127.0.0.1:1234/v1/modelscurl http://127.0.0.1:1234/v1/chat/completions \ -H 'content-type: application/json' \ -d '{"model":"<id>","messages":[{"role":"user","content":"hi"}],"stream":false}'openclaw infer model run --model <provider/model> --prompt "hi" --jsonopenclaw logs --followRecherchez :
- les minuscules appels directs réussissent, mais les exécutions OpenClaw échouent uniquement sur des prompts plus grands
- des erreurs
model_not_foundou 404 alors que l’appel direct/v1/chat/completionsfonctionne avec le même identifiant de modèle nu - des erreurs backend indiquant que
messages[].contentattend une chaîne - des avertissements intermittents
incomplete turn detected ... stopReason=stop payloads=0avec un backend local compatible OpenAI - des plantages backend qui apparaissent uniquement avec des nombres de tokens de prompt plus élevés ou des prompts complets du runtime d’agent
Common signatures
model_not_foundavec un serveur local de style MLX/vLLM → vérifiez quebaseUrlinclut/v1, queapivaut"openai-completions"pour les backends/v1/chat/completions, et quemodels.providers.<provider>.models[].idest l’identifiant local nu du fournisseur. Sélectionnez-le avec le préfixe fournisseur une seule fois, par exemplemlx/mlx-community/Qwen3-30B-A3B-6bit; gardez l’entrée de catalogue commemlx-community/Qwen3-30B-A3B-6bit.messages[...].content: invalid type: sequence, expected a string→ le backend rejette les parties de contenu Chat Completions structurées. Correction : définissezmodels.providers.<provider>.models[].compat.requiresStringContent: true.validation.keysou des clés de message autorisées comme["role","content"]→ le backend rejette les métadonnées de relecture de style OpenAI sur les messages Chat Completions. Correction : définissezmodels.providers.<provider>.models[].compat.strictMessageKeys: true.incomplete turn detected ... stopReason=stop payloads=0→ le backend a terminé la requête Chat Completions mais n’a renvoyé aucun texte assistant visible par l’utilisateur pour ce tour. OpenClaw réessaie une fois les tours vides compatibles OpenAI sûrs à rejouer ; les échecs persistants signifient généralement que le backend émet du contenu vide/non textuel ou supprime le texte de réponse finale.- les minuscules requêtes directes réussissent, mais les exécutions d’agent OpenClaw échouent avec des plantages backend/modèle (par exemple Gemma sur certaines versions
inferrs) → le transport OpenClaw est probablement déjà correct ; le backend échoue sur la forme plus grande du prompt de runtime d’agent. - les échecs diminuent après la désactivation des outils mais ne disparaissent pas → les schémas d’outils faisaient partie de la pression, mais le problème restant reste une capacité de modèle/serveur en amont ou un bogue backend.
Fix options
- Définissez
compat.requiresStringContent: truepour les backends Chat Completions n’acceptant que les chaînes. - Définissez
compat.strictMessageKeys: truepour les backends Chat Completions stricts qui n’acceptent queroleetcontentsur chaque message. - Définissez
compat.supportsTools: falsepour les modèles/backends qui ne peuvent pas gérer de manière fiable la surface de schéma d’outils d’OpenClaw. - Réduisez la pression du prompt lorsque c’est possible : amorçage d’espace de travail plus petit, historique de session plus court, modèle local plus léger ou backend avec une meilleure prise en charge du contexte long.
- Si les minuscules requêtes directes continuent de réussir alors que les tours d’agent OpenClaw plantent toujours dans le backend, traitez cela comme une limitation du serveur/modèle en amont et ouvrez-y une reproduction avec la forme de payload acceptée.
Liens connexes :
Aucune réponse
Si les canaux sont actifs mais que rien ne répond, vérifiez le routage et la politique avant de reconnecter quoi que ce soit.
openclaw statusopenclaw channels status --probeopenclaw pairing list --channel <channel> [--account <id>]openclaw config get channelsopenclaw logs --followRecherchez :
- Appairage en attente pour les expéditeurs de messages privés.
- Filtrage des mentions de groupe (
requireMention,mentionPatterns). - Incompatibilités de liste d’autorisation de canal/groupe.
Signatures courantes :
drop guild message (mention required→ message de groupe ignoré jusqu’à mention.pairing request→ l’expéditeur doit être approuvé.blocked/allowlist→ l’expéditeur/le canal a été filtré par la politique.
Connexe :
Connectivité de l’interface de contrôle du tableau de bord
Lorsque le tableau de bord/l’interface de contrôle ne se connecte pas, validez l’URL, le mode d’authentification et les hypothèses de contexte sécurisé.
openclaw gateway statusopenclaw statusopenclaw logs --followopenclaw doctoropenclaw gateway status --jsonRecherchez :
- URL de sonde et URL du tableau de bord correctes.
- Incompatibilité de mode d’authentification/jeton entre le client et le Gateway.
- Utilisation de HTTP quand l’identité de l’appareil est requise.
Si un navigateur local ne peut pas se connecter à 127.0.0.1:18789 après une mise à jour, commencez par
rétablir le service Gateway local et confirmez qu’il sert le tableau de bord :
openclaw gateway restartlsof -i :18789curl http://127.0.0.1:18789Si curl renvoie du HTML OpenClaw, le Gateway fonctionne et le problème restant
est probablement le cache du navigateur, un ancien lien profond ou un état d’onglet obsolète. Ouvrez
http://127.0.0.1:18789 directement et naviguez depuis le tableau de bord. Si le redémarrage
ne laisse pas le service en cours d’exécution, exécutez openclaw gateway start et revérifiez
openclaw gateway status.
Connect / auth signatures
device identity required→ contexte non sécurisé ou authentification d’appareil manquante.origin not allowed→ l’Origindu navigateur n’est pas dansgateway.controlUi.allowedOrigins(ou vous vous connectez depuis une origine de navigateur non loopback sans liste d’autorisation explicite).device nonce required/device nonce mismatch→ le client ne termine pas le flux d’authentification d’appareil basé sur le défi (connect.challenge+device.nonce).device signature invalid/device signature expired→ le client a signé la mauvaise charge utile (ou un horodatage obsolète) pour la négociation actuelle.AUTH_TOKEN_MISMATCHaveccanRetryWithDeviceToken=true→ le client peut effectuer une nouvelle tentative de confiance avec le jeton d’appareil mis en cache.- Cette nouvelle tentative avec jeton mis en cache réutilise l’ensemble des portées mises en cache stocké avec le jeton d’appareil appairé. Les appelants avec
deviceTokenexplicite /scopesexplicites conservent plutôt leur ensemble de portées demandé. AUTH_SCOPE_MISMATCH→ le jeton d’appareil a été reconnu, mais ses portées approuvées ne couvrent pas cette demande de connexion ; réappairez ou approuvez le contrat de portée demandé au lieu de faire tourner un jeton Gateway partagé.- En dehors de ce chemin de nouvelle tentative, la priorité de l’authentification de connexion est d’abord le jeton/mot de passe partagé explicite, puis le
deviceTokenexplicite, puis le jeton d’appareil stocké, puis le jeton d’amorçage. - Sur le chemin asynchrone de l’interface de contrôle Tailscale Serve, les tentatives échouées pour le même
{scope, ip}sont sérialisées avant que le limiteur enregistre l’échec. Deux mauvaises nouvelles tentatives concurrentes depuis le même client peuvent donc afficherretry laterà la deuxième tentative au lieu de deux simples incompatibilités. too many failed authentication attempts (retry later)depuis un client loopback d’origine navigateur → des échecs répétés depuis cette mêmeOriginnormalisée sont temporairement verrouillés ; une autre origine localhost utilise un compartiment distinct.unauthorizedrépété après cette nouvelle tentative → dérive du jeton partagé/jeton d’appareil ; actualisez la configuration du jeton et réapprouvez/faites tourner le jeton d’appareil si nécessaire.gateway connect failed:→ cible hôte/port/url incorrecte.
Carte rapide des codes de détail d’authentification
Utilisez error.details.code de la réponse connect échouée pour choisir l’action suivante :
| Code de détail | Signification | Action recommandée |
|---|---|---|
AUTH_TOKEN_MISSING |
Le client n’a pas envoyé un jeton partagé requis. | Collez/définissez le jeton dans le client et réessayez. Pour les chemins du tableau de bord : openclaw config get gateway.auth.token, puis collez-le dans les paramètres de l’interface de contrôle. |
AUTH_TOKEN_MISMATCH |
Le jeton partagé ne correspondait pas au jeton d’authentification du Gateway. | Si canRetryWithDeviceToken=true, autorisez une nouvelle tentative de confiance. Les nouvelles tentatives avec jeton mis en cache réutilisent les portées approuvées stockées ; les appelants avec deviceToken / scopes explicites conservent les portées demandées. En cas d’échec persistant, exécutez la liste de contrôle de récupération de dérive de jeton. |
AUTH_DEVICE_TOKEN_MISMATCH |
Le jeton par appareil mis en cache est obsolète ou révoqué. | Faites tourner/réapprouvez le jeton d’appareil avec la CLI des appareils, puis reconnectez-vous. |
AUTH_SCOPE_MISMATCH |
Le jeton d’appareil est valide, mais son rôle/ses portées approuvés ne couvrent pas cette demande de connexion. | Réappairez l’appareil ou approuvez le contrat de portée demandé ; ne traitez pas cela comme une dérive du jeton partagé. |
PAIRING_REQUIRED |
L’identité de l’appareil doit être approuvée. Vérifiez error.details.reason pour not-paired, scope-upgrade, role-upgrade ou metadata-upgrade, et utilisez requestId / remediationHint lorsqu’ils sont présents. |
Approuvez la demande en attente : openclaw devices list, puis openclaw devices approve <requestId>. Les mises à niveau de portée/rôle utilisent le même flux après examen de l’accès demandé. |
Vérification de migration de l’authentification d’appareil v2 :
openclaw --versionopenclaw doctoropenclaw gateway statusSi les journaux affichent des erreurs de nonce/signature, mettez à jour le client qui se connecte et vérifiez-le :
Wait for connect.challenge
Le client attend le connect.challenge émis par le Gateway.
Sign the payload
Le client signe la charge utile liée au défi.
Send the device nonce
Le client envoie connect.params.device.nonce avec le même nonce de défi.
Si openclaw devices rotate / revoke / remove est refusé de manière inattendue :
- les sessions de jeton d’appareil appairé ne peuvent gérer que leur propre appareil, sauf si l’appelant dispose aussi de
operator.admin openclaw devices rotate --scope ...ne peut demander que les portées d’opérateur que la session appelante possède déjà
Connexe :
- Configuration (modes d’authentification Gateway)
- Interface de contrôle
- Appareils
- Accès à distance
- Authentification par proxy de confiance
Service Gateway non exécuté
Utilisez ceci lorsque le service est installé mais que le processus ne reste pas actif.
openclaw gateway statusopenclaw statusopenclaw logs --followopenclaw doctoropenclaw gateway status --deep # also scan system-level servicesRecherchez :
Runtime: stoppedavec des indices de sortie.- Incompatibilité de configuration du service (
Config (cli)contreConfig (service)). - Conflits de port/écouteur.
- Installations launchd/systemd/schtasks supplémentaires lorsque
--deepest utilisé. - Indices de nettoyage
Other gateway-like services detected (best effort).
Common signatures
Gateway start blocked: set gateway.mode=localouexisting config is missing gateway.mode→ le mode Gateway local n’est pas activé, ou le fichier de configuration a été écrasé et a perdugateway.mode. Correctif : définissezgateway.mode="local"dans votre configuration, ou réexécutezopenclaw onboard --mode local/openclaw setuppour réestampiller la configuration attendue en mode local. Si vous exécutez OpenClaw via Podman, le chemin de configuration par défaut est~/.openclaw/openclaw.json.refusing to bind gateway ... without auth→ liaison non loopback sans chemin d’authentification Gateway valide (jeton/mot de passe, ou proxy de confiance lorsque configuré).another gateway instance is already listening/EADDRINUSE→ conflit de port.Other gateway-like services detected (best effort)→ des unités launchd/systemd/schtasks obsolètes ou parallèles existent. La plupart des configurations doivent conserver un Gateway par machine ; si vous en avez besoin de plusieurs, isolez les ports + la configuration/l’état/l’espace de travail. Consultez /gateway#multiple-gateways-same-host.System-level OpenClaw gateway service detecteddepuis doctor → une unité système systemd existe alors que le service de niveau utilisateur est manquant. Supprimez ou désactivez le doublon avant d’autoriser doctor à installer un service utilisateur, ou définissezOPENCLAW_SERVICE_REPAIR_POLICY=externalsi l’unité système est le superviseur prévu.Gateway service port does not match current gateway config→ le superviseur installé fixe encore l’ancien--port. Exécutezopenclaw doctor --fixouopenclaw gateway install --force, puis redémarrez le service Gateway.
Connexe :
Le Gateway macOS cesse silencieusement de répondre, puis reprend lorsque vous touchez le tableau de bord
Utilisez ceci lorsque les canaux (Telegram, WhatsApp, etc.) sur un hôte macOS deviennent silencieux pendant des minutes ou des heures à la fois, et que le Gateway semble revenir au moment où vous ouvrez l’interface de contrôle, vous connectez en SSH ou interagissez autrement avec l’hôte. Il n’y a généralement aucun symptôme évident dans openclaw status, car au moment où vous regardez, le Gateway est de nouveau actif.
ls ~/.openclaw/logs/stability/ | tail -5openclaw gateway stability --bundle latestpmset -g log | grep -iE "sleep|wake|maintenance" | tail -50launchctl print gui/$UID/ai.openclaw.gateway | grep -E "state|last exit|runs"Recherchez :
- Un ou plusieurs bundles
*-uncaught_exception.jsondans~/.openclaw/logs/stability/avecerror.codedéfini sur un code réseau transitoire commeENETDOWN,ENETUNREACH,EHOSTUNREACHouECONNREFUSED. - Des lignes
pmset -g logcommeEntering Sleep state due to 'Maintenance Sleep'ouen0 driver is slow (msg: WillChangeState to 0)alignées avec les horodatages des plantages. Power Nap / Maintenance Sleep place brièvement le pilote Wi-Fi dans l’état 0 ; toutconnect()sortant qui tombe dans cette fenêtre peut échouer avecENETDOWN, même sur un hôte qui dispose par ailleurs d’une connectivité réseau complète. - Une sortie
launchctl printaffichantstate = not runningavec plusieursrunsrécents et un code de sortie, surtout lorsque l’écart entre le plantage et le lancement suivant est de l’ordre d’une heure plutôt que de quelques secondes. Sur macOS, launchd applique une barrière non documentée de protection contre les redémarrages après une rafale de plantages, qui peut cesser d’honorerKeepAlive=truejusqu’à ce qu’un déclencheur externe comme une connexion interactive, une connexion au tableau de bord oulaunchctl kickstartla réarme.
Signatures courantes :
- Un bundle de stabilité dont
error.codeestENETDOWNou un code apparenté, avec une pile d’appels pointant vers NodenetlookupAndConnect/Socket.connect. OpenClaw2026.5.26et les versions plus récentes classent ces erreurs comme des erreurs réseau transitoires bénignes, afin qu’elles ne se propagent plus jusqu’au gestionnaire global d’exceptions non interceptées ; si vous utilisez une version plus ancienne, mettez d’abord à niveau. - De longues périodes silencieuses qui prennent fin à l’instant où vous vous connectez à l’interface de contrôle ou en SSH à l’hôte : l’activité visible par l’utilisateur est ce qui réarme la barrière de redémarrage de launchd, pas une action du tableau de bord sur le Gateway.
- Le compteur
runsaugmente au cours de la journée sans ligne correspondantereceived SIG*; shutting downdans~/Library/Logs/openclaw/gateway.log: les arrêts propres journalisent un signal ; les plantages transitoires ne le font pas.
Que faire :
-
Mettez à niveau le Gateway si vous exécutez une version antérieure à
2026.5.26. Après la mise à niveau, les futures erreursENETDOWNseront journalisées comme des avertissements au lieu de terminer le processus. -
Réduisez l’activité de veille de maintenance sur les hôtes Mac mini / de bureau destinés à fonctionner comme serveurs toujours actifs :
bash sudo pmset -a sleep 0 disksleep 0 standby 0 powernap 0Cela réduit fortement, sans l’éliminer entièrement, l’instabilité sous-jacente du pilote. Le système peut toujours effectuer certaines veilles de maintenance pour l’entretien TCP keepalive et mDNS, indépendamment de ces options.
-
Ajoutez un watchdog de disponibilité afin qu’une future rafale de plantages immobilisée par launchd soit détectée rapidement :
bash # Example launchd-aware liveness check, suitable for a 5-minute cron or LaunchAgentstate=$(launchctl print gui/$UID/ai.openclaw.gateway 2>/dev/null | awk -F'= ' '/state =/ {print $2; exit}')if [ "$state" != "running" ]; then launchctl kickstart -k gui/$UID/ai.openclaw.gatewayfiL’objectif est de réarmer de l’extérieur la barrière de redémarrage ;
KeepAlive=trueseul ne suffit pas sur macOS après une rafale de plantages.
Associé :
Le Gateway se ferme lors d’une forte utilisation mémoire
Utilisez ceci lorsque le Gateway disparaît sous charge, que le superviseur signale un redémarrage de type OOM, ou que les journaux mentionnent critical memory pressure bundle written.
openclaw gateway status --deepopenclaw logs --followopenclaw gateway stability --bundle latestopenclaw gateway diagnostics exportRecherchez :
Reason: diagnostic.memory.pressure.criticaldans le dernier bundle de stabilité.Memory pressure:aveccritical/rss_threshold,critical/heap_thresholdoucritical/rss_growth.- Des valeurs
V8 heap:proches de la limite du tas. - Des entrées
Largest session files:commeagents/<agent>/sessions/<session>.jsonlousessions/<session>.jsonl. - Des compteurs mémoire cgroup Linux lorsque le Gateway s’exécute dans un conteneur ou un service à mémoire limitée.
Signatures courantes :
critical memory pressure bundle writtenapparaît peu avant le redémarrage → OpenClaw a capturé un bundle de stabilité pré-OOM. Inspectez-le avecopenclaw gateway stability --bundle latest.memory pressure: level=critical ... memoryPressureSnapshot=disabledapparaît dans les journaux du Gateway → OpenClaw a détecté une pression mémoire critique, mais l’instantané de stabilité pré-OOM est désactivé.Largest session files:pointe vers un très grand chemin de transcription expurgée → réduisez l’historique de session conservé, inspectez la croissance de la session, ou déplacez les anciennes transcriptions hors du magasin actif avant de redémarrer.- Les octets utilisés
V8 heap:sont proches de la limite du tas → réduisez la pression des prompts/sessions, réduisez le travail concurrent, ou augmentez la limite du tas Node seulement après avoir confirmé que la charge de travail est attendue. Memory pressure: critical/rss_growth→ la mémoire a augmenté rapidement dans une même fenêtre d’échantillonnage. Vérifiez les derniers journaux pour une importation volumineuse, une sortie d’outil incontrôlée, des tentatives répétées, ou un lot de travaux d’agent en file d’attente.- Une pression mémoire critique apparaît dans les journaux mais aucun bundle n’existe → c’est le comportement par défaut. Définissez
diagnostics.memoryPressureSnapshot: truepour capturer le bundle de stabilité pré-OOM lors des futurs événements de pression mémoire critique.
Le bundle de stabilité ne contient aucune charge utile. Il inclut des preuves opérationnelles de mémoire et des chemins de fichiers relatifs expurgés, pas le texte des messages, les corps de webhook, les identifiants, les jetons, les cookies ni les identifiants de session bruts. Joignez l’export de diagnostics aux rapports de bug au lieu de copier les journaux bruts.
Associé :
Le Gateway a rejeté une config invalide
Utilisez ceci lorsque le démarrage du Gateway échoue avec Invalid config ou que les journaux de rechargement à chaud indiquent
qu’il a ignoré une modification invalide.
openclaw logs --followopenclaw config fileopenclaw config validateopenclaw doctorRecherchez :
Invalid config at ...config reload skipped (invalid config): ...Config write rejected: ...- Un fichier horodaté
openclaw.json.rejected.*à côté de la config active - Un fichier horodaté
openclaw.json.clobbered.*sidoctor --fixa réparé une modification directe cassée - OpenClaw conserve les 32 derniers fichiers
.clobbered.*pour chaque chemin de config et applique une rotation aux plus anciens
Ce qui s’est passé
- La config n’a pas été validée au démarrage, lors du rechargement à chaud, ou lors d’une écriture appartenant à OpenClaw.
- Le démarrage du Gateway échoue de manière fermée au lieu de réécrire
openclaw.json. - Le rechargement à chaud ignore les modifications externes invalides et conserve la config d’exécution actuelle active.
- Les écritures appartenant à OpenClaw rejettent les charges utiles invalides/destructrices avant validation et enregistrent
.rejected.*. openclaw doctor --fixpossède la réparation. Il peut supprimer les préfixes non JSON ou restaurer la dernière copie connue valide tout en préservant la charge utile rejetée sous forme de.clobbered.*.- Lorsque de nombreuses réparations ont lieu pour un même chemin de config, OpenClaw applique une rotation aux anciens fichiers
.clobbered.*afin que la charge utile réparée la plus récente reste disponible.
Inspecter et réparer
CONFIG="$(openclaw config file)"ls -lt "$CONFIG".clobbered.* "$CONFIG".rejected.* 2>/dev/null | headdiff -u "$CONFIG" "$(ls -t "$CONFIG".clobbered.* 2>/dev/null | head -n 1)"openclaw config validateopenclaw doctorSignatures courantes
.clobbered.*existe → doctor a préservé une modification externe cassée pendant la réparation de la config active..rejected.*existe → une écriture de config appartenant à OpenClaw a échoué aux contrôles de schéma ou d’écrasement avant validation.Config write rejected:→ l’écriture a tenté de supprimer une forme requise, de réduire fortement le fichier, ou de persister une config invalide.config reload skipped (invalid config):→ une modification directe a échoué à la validation et a été ignorée par le Gateway en cours d’exécution.Invalid config at ...→ le démarrage a échoué avant l’amorçage des services du Gateway.missing-meta-vs-last-good,gateway-mode-missing-vs-last-goodousize-drop-vs-last-good:*→ une écriture appartenant à OpenClaw a été rejetée parce qu’elle a perdu des champs ou de la taille par rapport à la dernière sauvegarde connue valide.Config last-known-good promotion skipped→ le candidat contenait des placeholders de secrets expurgés comme***.
Options de correction
- Exécutez
openclaw doctor --fixpour laisser doctor réparer une config préfixée/écrasée ou restaurer la dernière version connue valide. - Copiez uniquement les clés prévues depuis
.clobbered.*ou.rejected.*, puis appliquez-les avecopenclaw config setouconfig.patch. - Exécutez
openclaw config validateavant de redémarrer. - Si vous modifiez à la main, conservez la config JSON5 complète, pas seulement l’objet partiel que vous vouliez changer.
Associé :
Avertissements de sonde du Gateway
Utilisez ceci lorsque openclaw gateway probe atteint quelque chose, mais affiche tout de même un bloc d’avertissement.
openclaw gateway probeopenclaw gateway probe --jsonopenclaw gateway probe --ssh user@gateway-hostRecherchez :
warnings[].codeetprimaryTargetIddans la sortie JSON.- Si l’avertissement concerne le repli SSH, plusieurs gateways, des portées manquantes, ou des références d’authentification non résolues.
Signatures courantes :
SSH tunnel failed to start; falling back to direct probes.→ la configuration SSH a échoué, mais la commande a tout de même essayé les cibles directes configurées/local loopback.multiple reachable gateway identities detected→ des gateways distincts ont répondu, ou OpenClaw n’a pas pu prouver que les cibles atteignables sont le même gateway. Un tunnel SSH, une URL proxy, ou une URL distante configurée vers le même gateway est traité comme un gateway unique avec plusieurs transports, même lorsque les ports de transport diffèrent.Read-probe diagnostics are limited by gateway scopes (missing operator.read)→ la connexion a fonctionné, mais le RPC de détail est limité par la portée ; associez l’identité de l’appareil ou utilisez des identifiants avecoperator.read.Gateway accepted the WebSocket connection, but follow-up read diagnostics failed→ la connexion a fonctionné, mais l’ensemble complet de RPC de diagnostic a expiré ou échoué. Traitez cela comme un Gateway atteignable avec des diagnostics dégradés ; comparezconnect.oketconnect.rpcOkdans la sortie--json.Capability: pairing-pendingougateway closed (1008): pairing required→ le gateway a répondu, mais ce client nécessite encore un appairage/une approbation avant l’accès opérateur normal.- Texte d’avertissement SecretRef
gateway.auth.*/gateway.remote.*non résolu → le matériel d’authentification n’était pas disponible dans ce chemin de commande pour la cible en échec.
Associé :
Canal connecté, messages bloqués
Si l’état du canal est connecté mais que le flux de messages est interrompu, concentrez-vous sur la politique, les permissions et les règles de livraison propres au canal.
openclaw channels status --probeopenclaw pairing list --channel <channel> [--account <id>]openclaw status --deepopenclaw logs --followopenclaw config get channelsRecherchez :
- La politique de messages privés (
pairing,allowlist,open,disabled). - La liste d’autorisation de groupe et les exigences de mention.
- Les permissions/portées d’API de canal manquantes.
Signatures courantes :
mention required→ message ignoré par la politique de mention de groupe.- Traces
pairing/ d’approbation en attente → l’expéditeur n’est pas approuvé. missing_scope,not_in_channel,Forbidden,401/403→ problème d’authentification/permissions du canal.
Associé :
Livraison Cron et Heartbeat
Si cron ou heartbeat ne s’est pas exécuté ou n’a pas livré, vérifiez d’abord l’état du planificateur, puis la cible de livraison.
openclaw cron statusopenclaw cron listopenclaw cron runs --id <jobId> --limit 20openclaw system heartbeat lastopenclaw logs --followRecherchez :
- Cron activé et prochain réveil présent.
- État de l’historique d’exécution des tâches (
ok,skipped,error). - Raisons de saut du Heartbeat (
quiet-hours,requests-in-flight,cron-in-progress,lanes-busy,alerts-disabled,empty-heartbeat-file,no-tasks-due).
Signatures courantes
cron: scheduler disabled; jobs will not run automatically→ Cron désactivé.cron: timer tick failed→ échec du tick du planificateur ; vérifiez les erreurs de fichier, de journal ou d’exécution.heartbeat skippedavecreason=quiet-hours→ en dehors de la fenêtre d’heures actives.heartbeat skippedavecreason=empty-heartbeat-file→HEARTBEAT.mdexiste, mais ne contient que des éléments vides, commentaires, en-têtes, clôtures ou échafaudage de liste de contrôle vide ; OpenClaw ignore donc l’appel au modèle.heartbeat skippedavecreason=no-tasks-due→HEARTBEAT.mdcontient un bloctasks:, mais aucune tâche n’est due sur ce tick.heartbeat: unknown accountId→ identifiant de compte invalide pour la cible de livraison du Heartbeat.heartbeat skippedavecreason=dm-blocked→ la cible de Heartbeat a été résolue vers une destination de type DM alors queagents.defaults.heartbeat.directPolicy(ou une surcharge par agent) est défini surblock.
Associé :
Node appairé, échec de l’outil
Si un Node est appairé mais que les outils échouent, isolez l’état de premier plan, des autorisations et des approbations.
openclaw nodes statusopenclaw nodes describe --node <idOrNameOrIp>openclaw approvals get --node <idOrNameOrIp>openclaw logs --followopenclaw statusRecherchez :
- Node en ligne avec les capacités attendues.
- Autorisations du système d’exploitation pour la caméra, le micro, la localisation et l’écran.
- Approbations d’exécution et état de la liste d’autorisation.
Signatures courantes :
NODE_BACKGROUND_UNAVAILABLE→ l’application du Node doit être au premier plan.*_PERMISSION_REQUIRED/LOCATION_PERMISSION_REQUIRED→ autorisation du système d’exploitation manquante.SYSTEM_RUN_DENIED: approval required→ approbation d’exécution en attente.SYSTEM_RUN_DENIED: allowlist miss→ commande bloquée par la liste d’autorisation.
Associé :
Échec de l’outil navigateur
Utilisez ceci lorsque les actions de l’outil navigateur échouent alors que le Gateway lui-même est sain.
openclaw browser statusopenclaw browser start --browser-profile openclawopenclaw browser profilesopenclaw logs --followopenclaw doctorRecherchez :
- Si
plugins.allowest défini et inclutbrowser. - Chemin valide vers l’exécutable du navigateur.
- Accessibilité du profil CDP.
- Disponibilité de Chrome local pour les profils
existing-session/user.
Signatures de Plugin / exécutable
unknown command "browser"ouunknown command 'browser'→ le plugin de navigateur intégré est exclu parplugins.allow.- outil navigateur manquant / indisponible alors que
browser.enabled=true→plugins.allowexclutbrowser, donc le plugin n’a jamais été chargé. Failed to start Chrome CDP on port→ échec du lancement du processus navigateur.browser.executablePath not found→ le chemin configuré est invalide.browser.cdpUrl must be http(s) or ws(s)→ l’URL CDP configurée utilise un schéma non pris en charge commefile:ouftp:.browser.cdpUrl has invalid port→ l’URL CDP configurée a un port invalide ou hors plage.Playwright is not available in this gateway build; '<feature>' is unsupported.→ l’installation actuelle du Gateway ne dispose pas de la dépendance d’exécution de navigateur principale ; réinstallez ou mettez à jour OpenClaw, puis redémarrez le Gateway. Les instantanés ARIA et les captures d’écran de page de base peuvent toujours fonctionner, mais la navigation, les instantanés IA, les captures d’écran d’éléments par sélecteur CSS et l’export PDF restent indisponibles.
Signatures Chrome MCP / existing-session
Could not find DevToolsActivePort for chrome→ Chrome MCP existing-session n’a pas encore pu s’attacher au répertoire de données de navigateur sélectionné. Ouvrez la page d’inspection du navigateur, activez le débogage distant, gardez le navigateur ouvert, approuvez la première invite d’attachement, puis réessayez. Si l’état connecté n’est pas requis, préférez le profil géréopenclaw.No Chrome tabs found for profile="user"→ le profil d’attachement Chrome MCP n’a aucun onglet Chrome local ouvert.Remote CDP for profile "<name>" is not reachable→ le point de terminaison CDP distant configuré n’est pas accessible depuis l’hôte du Gateway.Browser attachOnly is enabled ... not reachableouBrowser attachOnly is enabled and CDP websocket ... is not reachable→ le profil en attachement seul n’a aucune cible accessible, ou le point de terminaison HTTP a répondu, mais le WebSocket CDP n’a toujours pas pu être ouvert.
Signatures d’élément / capture d’écran / téléversement
fullPage is not supported for element screenshots→ la demande de capture d’écran a combiné--full-pageavec--refou--element.element screenshots are not supported for existing-session profiles; use ref from snapshot.→ les appels de capture d’écran Chrome MCP /existing-sessiondoivent utiliser la capture de page ou une--refd’instantané, pas un--elementCSS.existing-session file uploads do not support element selectors; use ref/inputRef.→ les hooks de téléversement Chrome MCP nécessitent des refs d’instantané, pas des sélecteurs CSS.existing-session file uploads currently support one file at a time.→ envoyez un téléversement par appel sur les profils Chrome MCP.existing-session dialog handling does not support timeoutMs.→ les hooks de dialogue sur les profils Chrome MCP ne prennent pas en charge les surcharges de délai d’expiration.existing-session type does not support timeoutMs overrides.→ ometteztimeoutMspouract:typesur les profilsprofile="user"/ Chrome MCP existing-session, ou utilisez un profil de navigateur géré/CDP lorsqu’un délai personnalisé est requis.existing-session evaluate does not support timeoutMs overrides.→ ometteztimeoutMspouract:evaluatesur les profilsprofile="user"/ Chrome MCP existing-session, ou utilisez un profil de navigateur géré/CDP lorsqu’un délai personnalisé est requis.response body is not supported for existing-session profiles yet.→responsebodynécessite toujours un navigateur géré ou un profil CDP brut.- remplacements obsolètes de fenêtre d’affichage / mode sombre / locale / hors ligne sur les profils en attachement seul ou CDP distant → exécutez
openclaw browser stop --browser-profile <name>pour fermer la session de contrôle active et libérer l’état d’émulation Playwright/CDP sans redémarrer tout le Gateway.
Associé :
Si vous avez effectué une mise à niveau et que quelque chose s’est soudainement cassé
La plupart des pannes après mise à niveau proviennent d’une dérive de configuration ou de valeurs par défaut plus strictes désormais appliquées.
1. Le comportement d’authentification et de surcharge d’URL a changé
openclaw gateway statusopenclaw config get gateway.modeopenclaw config get gateway.remote.urlopenclaw config get gateway.auth.modeCe qu’il faut vérifier :
- Si
gateway.mode=remote, les appels CLI peuvent cibler le distant alors que votre service local fonctionne correctement. - Les appels explicites avec
--urlne se rabattent pas sur les identifiants stockés.
Signatures courantes :
gateway connect failed:→ mauvaise URL cible.unauthorized→ point de terminaison accessible, mais mauvaise authentification.
2. Les garde-fous de liaison et d’authentification sont plus stricts
openclaw config get gateway.bindopenclaw config get gateway.auth.modeopenclaw config get gateway.auth.tokenopenclaw gateway statusopenclaw logs --followCe qu’il faut vérifier :
- Les liaisons non-local loopback (
lan,tailnet,custom) nécessitent un chemin d’authentification Gateway valide : authentification par jeton partagé/mot de passe, ou déploiementtrusted-proxynon-local loopback correctement configuré. - Les anciennes clés comme
gateway.tokenne remplacent pasgateway.auth.token.
Signatures courantes :
refusing to bind gateway ... without auth→ liaison non-local loopback sans chemin d’authentification Gateway valide.Connectivity probe: failedalors que l’exécution est en cours → Gateway actif, mais inaccessible avec l’authentification/URL actuelle.
3. L’appairage et l’état d’identité de l’appareil ont changé
openclaw devices listopenclaw pairing list --channel <channel> [--account <id>]openclaw logs --followopenclaw doctorCe qu’il faut vérifier :
- Approbations d’appareils en attente pour le tableau de bord/les Node.
- Approbations d’appairage DM en attente après des changements de politique ou d’identité.
Signatures courantes :
device identity required→ authentification de l’appareil non satisfaite.pairing required→ l’expéditeur/l’appareil doit être approuvé.
Si la configuration du service et l’exécution divergent encore après les vérifications, réinstallez les métadonnées de service depuis le même répertoire de profil/état :
openclaw gateway install --forceopenclaw gateway restartAssocié :