OpenClaw gère les échecs en deux étapes :Documentation Index
Fetch the complete documentation index at: https://docs.openclaw.ai/llms.txt
Use this file to discover all available pages before exploring further.
- Rotation des profils d’authentification au sein du fournisseur actuel.
- Modèle de repli vers le modèle suivant dans
agents.defaults.model.fallbacks.
Flux d’exécution
Pour une exécution de texte normale, OpenClaw évalue les candidats dans cet ordre :Resolve session state
Résoudre le modèle de session actif et la préférence de profil d’authentification.
Build candidate chain
Construire la chaîne de modèles candidats à partir de la sélection de modèle actuelle et de la politique de repli pour cette source de sélection. Les valeurs par défaut configurées, les modèles principaux des tâches Cron et les modèles de repli sélectionnés automatiquement peuvent utiliser les replis configurés ; les sélections explicites de session utilisateur sont strictes.
Try the current provider
Essayer le fournisseur actuel avec les règles de rotation/refroidissement des profils d’authentification.
Advance on failover-worthy errors
Si ce fournisseur est épuisé avec une erreur justifiant un basculement, passer au modèle candidat suivant.
Persist fallback override
Persister la substitution de repli sélectionnée avant le début de la nouvelle tentative afin que les autres lecteurs de session voient le même fournisseur/modèle que le lanceur est sur le point d’utiliser. La substitution de modèle persistée est marquée
modelOverrideSource: "auto".Roll back narrowly on failure
Si le candidat de repli échoue, annuler uniquement les champs de substitution de session appartenant au repli lorsqu’ils correspondent encore à ce candidat échoué.
providerOverridemodelOverridemodelOverrideSourceauthProfileOverrideauthProfileOverrideSourceauthProfileOverrideCompactionCount
/model ou des mises à jour de rotation de session qui se sont produites pendant l’exécution de la tentative.
Politique de source de sélection
OpenClaw sépare le fournisseur/modèle sélectionné de la raison pour laquelle il a été sélectionné. Cette source détermine si la chaîne de repli est autorisée :- Valeur par défaut configurée :
agents.defaults.model.primaryutiliseagents.defaults.model.fallbacks. - Modèle principal d’agent :
agents.list[].modelest strict sauf si cet objet de modèle d’agent inclut ses propresfallbacks. Utilisezfallbacks: []pour rendre explicite le comportement strict, ou fournissez une liste non vide pour activer le repli de modèle pour cet agent. - Substitution de repli automatique : un repli d’exécution écrit
providerOverride,modelOverride,modelOverrideSource: "auto"et le modèle d’origine sélectionné avant de réessayer. Cette substitution automatique peut continuer à parcourir la chaîne de repli configurée et est effacée par/new,/resetetsessions.reset. Les exécutions Heartbeat sansheartbeat.modelexplicite effacent aussi une substitution automatique directe lorsque son origine ne correspond plus à la valeur par défaut actuellement configurée. - Substitution de session utilisateur :
/model, le sélecteur de modèle,session_status(model=...)etsessions.patchécriventmodelOverrideSource: "user". C’est une sélection de session exacte. Si le fournisseur/modèle sélectionné échoue avant de produire une réponse, OpenClaw signale l’échec au lieu de répondre à partir d’un repli configuré sans rapport. - Substitution de session héritée : les anciennes entrées de session peuvent avoir
modelOverridesansmodelOverrideSource. OpenClaw les traite comme des substitutions utilisateur afin qu’une ancienne sélection explicite ne soit pas convertie silencieusement en comportement de repli. - Modèle de charge utile Cron : un
payload.model/--modelde tâche Cron est un modèle principal de tâche, pas une substitution de session utilisateur. Il utilise les replis configurés sauf si la tâche fournitpayload.fallbacks;payload.fallbacks: []rend l’exécution Cron stricte.
Stockage d’authentification (clés + OAuth)
OpenClaw utilise des profils d’authentification pour les clés API comme pour les jetons OAuth.- Les secrets résident dans
~/.openclaw/agents/<agentId>/agent/auth-profiles.json(hérité :~/.openclaw/agent/auth-profiles.json). - L’état de routage d’authentification d’exécution réside dans
~/.openclaw/agents/<agentId>/agent/auth-state.json. - La configuration
auth.profiles/auth.ordercorrespond uniquement à des métadonnées + routage (aucun secret). - Fichier OAuth hérité uniquement importé :
~/.openclaw/credentials/oauth.json(importé dansauth-profiles.jsonà la première utilisation).
type: "api_key"→{ provider, key }type: "oauth"→{ provider, access, refresh, expires, email? }(+projectId/enterpriseUrlpour certains fournisseurs)
ID de profil
Les connexions OAuth créent des profils distincts afin que plusieurs comptes puissent coexister.- Par défaut :
provider:defaultlorsqu’aucun e-mail n’est disponible. - OAuth avec e-mail :
provider:<email>(par exemplegoogle-antigravity:user@gmail.com).
~/.openclaw/agents/<agentId>/agent/auth-profiles.json sous profiles.
Ordre de rotation
Lorsqu’un fournisseur a plusieurs profils, OpenClaw choisit un ordre comme suit :
Si aucun ordre explicite n’est configuré, OpenClaw utilise un ordre round-robin :
- Clé principale : type de profil (OAuth avant les clés API).
- Clé secondaire :
usageStats.lastUsed(le plus ancien d’abord, dans chaque type). - Les profils en refroidissement/désactivés sont déplacés à la fin, ordonnés par expiration la plus proche.
Affinité de session (compatible avec le cache)
OpenClaw épingle le profil d’authentification choisi par session afin de garder les caches des fournisseurs chauds. Il ne fait pas de rotation à chaque requête. Le profil épinglé est réutilisé jusqu’à ce que :- la session soit réinitialisée (
/new//reset) - une Compaction se termine (le compteur de Compaction augmente)
- le profil soit en refroidissement/désactivé
/model …@<profileId> définit une substitution utilisateur pour cette session et ne fait pas l’objet d’une rotation automatique jusqu’au démarrage d’une nouvelle session.
Les profils épinglés automatiquement (sélectionnés par le routeur de session) sont traités comme une préférence : ils sont essayés en premier, mais OpenClaw peut effectuer une rotation vers un autre profil en cas de limites de débit/délais d’expiration. Lorsque le profil d’origine redevient disponible, les nouvelles exécutions peuvent à nouveau le privilégier sans changer le modèle ou l’exécution sélectionné. Les profils épinglés par l’utilisateur restent verrouillés sur ce profil ; s’il échoue et que des replis de modèle sont configurés, OpenClaw passe au modèle suivant au lieu de changer de profil.
Abonnement OpenAI Codex plus sauvegarde par clé API
Pour les modèles d’agent OpenAI, l’authentification et l’exécution sont séparées.openai/gpt-* reste sur
le harnais Codex tandis que l’authentification peut alterner entre un profil d’abonnement Codex et
une sauvegarde par clé API OpenAI.
Utilisez auth.order.openai pour l’ordre destiné à l’utilisateur :
openai-codex:*. La sauvegarde par clé API ordonnée peut être un profil de clé API
openai:* normal. Lorsque l’abonnement atteint une limite d’utilisation Codex,
OpenClaw enregistre l’heure exacte de réinitialisation lorsque Codex en fournit une, essaie le profil
d’authentification ordonné suivant et conserve l’exécution dans le harnais Codex. Une fois l’heure de réinitialisation
passée, le profil d’abonnement redevient éligible et la prochaine sélection automatique
peut y revenir.
Utilisez un profil épinglé par l’utilisateur uniquement lorsque vous voulez forcer un compte/une clé pour cette
session. Les profils épinglés par l’utilisateur sont volontairement stricts et ne basculent pas silencieusement
vers un autre profil.
Refroidissements
Lorsqu’un profil échoue à cause d’erreurs d’authentification/de limite de débit (ou d’un délai d’expiration qui ressemble à une limitation de débit), OpenClaw le marque en refroidissement et passe au profil suivant.What lands in the rate-limit / timeout bucket
What lands in the rate-limit / timeout bucket
Ce compartiment de limite de débit est plus large qu’un simple
429 : il inclut aussi les messages de fournisseurs comme Too many concurrent requests, ThrottlingException, concurrency limit reached, workers_ai ... quota limit exceeded, throttled, resource exhausted et les limites périodiques de fenêtre d’utilisation comme weekly/monthly limit reached.Les erreurs de format/requête invalide sont généralement terminales parce qu’une nouvelle tentative avec la même charge utile échouerait de la même manière ; OpenClaw les expose donc au lieu d’effectuer une rotation des profils d’authentification. Les chemins connus de réparation par nouvelle tentative peuvent s’y inscrire explicitement : par exemple, les échecs de validation d’ID d’appel d’outil Cloud Code Assist sont assainis et réessayés une fois via la politique allowFormatRetry. Les erreurs de raison d’arrêt compatibles OpenAI, comme Unhandled stop reason: error, stop reason: error et reason: error, sont classées comme signaux de délai d’expiration/basculement.Le texte générique de serveur peut aussi entrer dans ce compartiment de délai d’expiration lorsque la source correspond à un motif transitoire connu. Par exemple, le message brut du wrapper de flux pi-ai An unknown error occurred est traité comme justifiant un basculement pour chaque fournisseur, car pi-ai l’émet lorsque les flux de fournisseurs se terminent avec stopReason: "aborted" ou stopReason: "error" sans détails spécifiques. Les charges utiles JSON api_error avec un texte serveur transitoire comme internal server error, unknown error, 520, upstream error ou backend error sont aussi traitées comme des délais d’expiration justifiant un basculement.Le texte amont générique propre à OpenRouter, comme le simple Provider returned error, est traité comme un délai d’expiration uniquement lorsque le contexte fournisseur est effectivement OpenRouter. Le texte générique de repli interne comme LLM request failed with an unknown error. reste conservateur et ne déclenche pas de basculement à lui seul.SDK retry-after caps
SDK retry-after caps
Certains SDK de fournisseurs peuvent sinon attendre pendant une longue fenêtre
Retry-After avant de rendre le contrôle à OpenClaw. Pour les SDK basés sur Stainless comme Anthropic et OpenAI, OpenClaw plafonne par défaut les attentes internes au SDK retry-after-ms / retry-after à 60 secondes et expose immédiatement les réponses réessayables plus longues afin que ce chemin de basculement puisse s’exécuter. Ajustez ou désactivez le plafond avec OPENCLAW_SDK_RETRY_MAX_WAIT_SECONDS ; consultez Comportement de nouvelle tentative.Model-scoped cooldowns
Model-scoped cooldowns
Les refroidissements de limite de débit peuvent aussi être limités au modèle :
- OpenClaw enregistre
cooldownModelpour les échecs de limite de débit lorsque l’ID du modèle défaillant est connu. - Un modèle frère sur le même fournisseur peut encore être essayé lorsque le refroidissement est limité à un autre modèle.
- Les fenêtres de facturation/désactivation bloquent toujours tout le profil sur tous les modèles.
- 1 minute
- 5 minutes
- 25 minutes
- 1 heure (plafond)
auth-state.json sous usageStats :
Désactivations de facturation
Les échecs de facturation/crédit (par exemple « crédits insuffisants » / « solde de crédit trop faible ») sont traités comme justifiant un basculement, mais ils ne sont généralement pas transitoires. Au lieu d’un court refroidissement, OpenClaw marque le profil comme désactivé (avec un backoff plus long) et effectue une rotation vers le profil/fournisseur suivant.Toutes les réponses ayant l’apparence d’une facturation ne sont pas
402, et tous les HTTP 402 n’arrivent pas ici. OpenClaw conserve le texte de facturation explicite dans la voie de facturation même lorsqu’un fournisseur renvoie plutôt 401 ou 403, mais les correspondances propres aux fournisseurs restent limitées au fournisseur qui les possède (par exemple OpenRouter 403 Key limit exceeded).Pendant ce temps, les erreurs temporaires 402 de fenêtre d’utilisation et de limite de dépenses d’organisation/espace de travail sont classées comme rate_limit lorsque le message semble pouvoir être retenté (par exemple weekly usage limit exhausted, daily limit reached, resets tomorrow ou organization spending limit exceeded). Elles restent sur le chemin de court refroidissement/basculement au lieu du long chemin de désactivation de facturation.auth-state.json :
- Le délai de facturation commence à 5 heures, double à chaque échec de facturation et est plafonné à 24 heures.
- Les compteurs de délai sont réinitialisés si le profil n’a pas échoué pendant 24 heures (configurable).
- Les nouvelles tentatives en cas de surcharge autorisent 1 rotation de profil du même fournisseur avant le repli de modèle.
- Les nouvelles tentatives en cas de surcharge utilisent par défaut un délai de 0 ms.
Repli de modèle
Si tous les profils d’un fournisseur échouent, OpenClaw passe au modèle suivant dansagents.defaults.model.fallbacks. Cela s’applique aux échecs d’authentification, aux limites de débit et aux délais d’expiration qui ont épuisé la rotation de profils (les autres erreurs ne font pas avancer le repli). Les erreurs de fournisseur qui n’exposent pas assez de détails sont tout de même étiquetées précisément dans l’état de repli : empty_response signifie que le fournisseur n’a renvoyé aucun message ni statut utilisable, no_error_details signifie que le fournisseur a explicitement renvoyé Unknown error (no error details in response), et unclassified signifie qu’OpenClaw a conservé l’aperçu brut mais qu’aucun classificateur ne lui correspond encore.
Les erreurs de surcharge et de limite de débit sont traitées plus agressivement que les refroidissements de facturation. Par défaut, OpenClaw autorise une nouvelle tentative avec un profil d’authentification du même fournisseur, puis bascule vers le prochain repli de modèle configuré sans attendre. Les signaux de fournisseur occupé tels que ModelNotReadyException tombent dans ce groupe de surcharge. Ajustez ce comportement avec auth.cooldowns.overloadedProfileRotations, auth.cooldowns.overloadedBackoffMs et auth.cooldowns.rateLimitedProfileRotations.
Lorsqu’une exécution démarre depuis le modèle principal par défaut configuré, le modèle principal d’une tâche cron, le modèle principal d’un agent avec replis explicites, ou une substitution de repli sélectionnée automatiquement, OpenClaw peut parcourir la chaîne de repli configurée correspondante. Les modèles principaux d’agents sans replis explicites et les sélections utilisateur explicites (par exemple /model ollama/qwen3.5:27b, le sélecteur de modèle, sessions.patch ou les substitutions ponctuelles de fournisseur/modèle via la CLI) sont stricts : si ce fournisseur/modèle est inaccessible ou échoue avant de produire une réponse, OpenClaw signale l’échec au lieu de répondre depuis un repli sans rapport.
Règles de chaîne candidate
OpenClaw construit la liste de candidats à partir duprovider/model actuellement demandé plus les replis configurés.
Règles
Règles
- Le modèle demandé est toujours en premier.
- Les replis explicitement configurés sont dédupliqués mais ne sont pas filtrés par la liste d’autorisation des modèles. Ils sont traités comme une intention explicite de l’opérateur.
- Si l’exécution actuelle est déjà sur un repli configuré dans la même famille de fournisseurs, OpenClaw continue d’utiliser la chaîne configurée complète.
- Lorsqu’aucune substitution de repli explicite n’est fournie, les replis configurés sont essayés avant le modèle principal configuré, même si le modèle demandé utilise un autre fournisseur.
- Lorsqu’aucune substitution de repli explicite n’est fournie au lanceur de repli, le modèle principal configuré est ajouté à la fin afin que la chaîne puisse revenir au défaut normal une fois les candidats précédents épuisés.
- Lorsqu’un appelant fournit
fallbacksOverride, le lanceur utilise exactement le modèle demandé plus cette liste de substitutions. Une liste vide désactive le repli de modèle et empêche l’ajout du modèle principal configuré comme cible de nouvelle tentative cachée.
Erreurs qui font avancer le repli
- Continue sur
- Ne continue pas sur
- les échecs d’authentification
- les limites de débit et l’épuisement des refroidissements
- les erreurs de surcharge/fournisseur occupé
- les erreurs de basculement de type délai d’expiration
- les désactivations de facturation
LiveSessionModelSwitchError, qui est normalisée en chemin de basculement afin qu’un modèle persistant obsolète ne crée pas une boucle de nouvelle tentative externe- les autres erreurs non reconnues lorsqu’il reste encore des candidats
Comportement d’évitement du refroidissement et de sonde
Lorsque tous les profils d’authentification d’un fournisseur sont déjà en refroidissement, OpenClaw ne saute pas automatiquement ce fournisseur pour toujours. Il prend une décision par candidat :Décisions par candidat
Décisions par candidat
- Les échecs d’authentification persistants sautent immédiatement tout le fournisseur.
- Les désactivations de facturation sont généralement sautées, mais le candidat principal peut tout de même être sondé avec une limitation afin qu’une récupération soit possible sans redémarrage.
- Le candidat principal peut être sondé à l’approche de l’expiration du refroidissement, avec une limitation par fournisseur.
- Les replis frères du même fournisseur peuvent être tentés malgré le refroidissement lorsque l’échec semble transitoire (
rate_limit,overloadedou inconnu). C’est particulièrement pertinent lorsqu’une limite de débit est limitée au modèle et qu’un modèle frère peut encore récupérer immédiatement. - Les sondes de refroidissement transitoire sont limitées à une par fournisseur et par exécution de repli, afin qu’un seul fournisseur ne bloque pas le repli inter-fournisseurs.
Substitutions de session et changement de modèle en direct
Les changements de modèle de session sont un état partagé. Le lanceur actif, la commande/model, les mises à jour de Compaction/session et la réconciliation de session en direct lisent ou écrivent tous des parties de la même entrée de session.
Cela signifie que les nouvelles tentatives de repli doivent se coordonner avec le changement de modèle en direct :
- Seuls les changements de modèle explicitement déclenchés par l’utilisateur marquent un changement en direct en attente. Cela inclut
/model,session_status(model=...)etsessions.patch. - Les changements de modèle pilotés par le système, tels que la rotation de repli, les substitutions de Heartbeat ou la Compaction, ne marquent jamais à eux seuls un changement en direct en attente.
- Les substitutions de modèle déclenchées par l’utilisateur sont traitées comme des sélections exactes pour la politique de repli, de sorte qu’un fournisseur sélectionné inaccessible apparaît comme un échec au lieu d’être masqué par
agents.defaults.model.fallbacks. - Avant le démarrage d’une nouvelle tentative de repli, le lanceur de réponse persiste les champs de substitution de repli sélectionnés dans l’entrée de session.
- Les substitutions de repli automatiques restent sélectionnées lors des tours suivants afin qu’OpenClaw ne sonde pas un modèle principal connu comme défaillant à chaque message.
/new,/resetetsessions.reseteffacent les substitutions de source automatique et ramènent la session au défaut configuré. /statusaffiche le modèle sélectionné et, lorsque l’état de repli diffère, le modèle de repli actif et la raison.- La réconciliation de session en direct préfère les substitutions de session persistées aux champs de modèle d’exécution obsolètes.
- Si une erreur de changement en direct pointe vers un candidat ultérieur dans la chaîne de repli active, OpenClaw saute directement vers ce modèle sélectionné au lieu de parcourir d’abord des candidats sans rapport.
- Si la tentative de repli échoue, le lanceur annule uniquement les champs de substitution qu’il a écrits, et seulement s’ils correspondent encore à ce candidat échoué.
Le magasin de session indique encore l’ancien modèle principal
Le magasin de session reflète encore l’ancien modèle principal.
La réconciliation en direct lit un état obsolète
La réconciliation de session en direct lit l’état de session obsolète.
Observabilité et résumés d’échec
runWithModelFallback(...) enregistre des détails par tentative qui alimentent les journaux et les messages de refroidissement visibles par l’utilisateur :
- fournisseur/modèle tenté
- raison (
rate_limit,overloaded,billing,auth,model_not_foundet raisons de basculement similaires) - statut/code facultatif
- résumé d’erreur lisible par un humain
model_fallback_decision incluent aussi des champs plats fallbackStep* lorsqu’un candidat échoue, est sauté ou qu’un repli ultérieur réussit. Ces champs rendent la transition tentée explicite (fallbackStepFromModel, fallbackStepToModel, fallbackStepFromFailureReason, fallbackStepFromFailureDetail, fallbackStepFinalOutcome) afin que les exportateurs de journaux et de diagnostics puissent reconstruire l’échec principal même lorsque le repli terminal échoue également.
Lorsque tous les candidats échouent, OpenClaw lève FallbackSummaryError. Le lanceur de réponse externe peut l’utiliser pour construire un message plus spécifique, tel que « tous les modèles sont temporairement limités en débit », et inclure la prochaine expiration de refroidissement lorsqu’elle est connue.
Ce résumé de refroidissement tient compte du modèle :
- les limites de débit limitées à des modèles sans rapport sont ignorées pour la chaîne fournisseur/modèle tentée
- si le blocage restant est une limite de débit limitée au modèle correspondant, OpenClaw signale la dernière expiration correspondante qui bloque encore ce modèle
Configuration associée
Consultez Configuration du Gateway pour :auth.profiles/auth.orderauth.cooldowns.billingBackoffHours/auth.cooldowns.billingBackoffHoursByProviderauth.cooldowns.billingMaxHours/auth.cooldowns.failureWindowHoursauth.cooldowns.overloadedProfileRotations/auth.cooldowns.overloadedBackoffMsauth.cooldowns.rateLimitedProfileRotationsagents.defaults.model.primary/agents.defaults.model.fallbacks- le routage
agents.defaults.imageModel