L’outilDocumentation Index
Fetch the complete documentation index at: https://docs.openclaw.ai/llms.txt
Use this file to discover all available pages before exploring further.
web_fetch effectue un simple HTTP GET et extrait le contenu lisible
(HTML vers markdown ou texte). Il n’exécute pas JavaScript.
Pour les sites fortement dépendants de JS ou les pages protégées par connexion, utilisez plutôt le
Navigateur Web.
Démarrage rapide
web_fetch est activé par défaut — aucune configuration n’est nécessaire. L’agent peut
l’appeler immédiatement :
Paramètres de l’outil
URL à récupérer.
http(s) uniquement.Format de sortie après l’extraction du contenu principal.
Tronque la sortie à ce nombre de caractères.
Fonctionnement
Récupération
Envoie un HTTP GET avec un User-Agent semblable à Chrome et un en-tête
Accept-Language. Bloque les noms d’hôte privés/internes et revérifie les redirections.Repli (facultatif)
Si Readability échoue et que Firecrawl est configuré, réessaie via l’API
Firecrawl avec le mode de contournement des bots.
Configuration
Repli Firecrawl
Si l’extraction Readability échoue,web_fetch peut se replier sur
Firecrawl pour le contournement des bots et une meilleure extraction :
plugins.entries.firecrawl.config.webFetch.apiKey prend en charge les objets SecretRef.
L’ancienne configuration tools.web.fetch.firecrawl.* est migrée automatiquement par openclaw doctor --fix.
Si Firecrawl est activé et que sa SecretRef n’est pas résolue sans solution de repli par variable d’environnement
FIRECRAWL_API_KEY, le démarrage du Gateway échoue rapidement.Les remplacements de
baseUrl Firecrawl sont verrouillés : le trafic hébergé utilise
https://api.firecrawl.dev ; les remplacements auto-hébergés doivent cibler des points de terminaison privés ou
internes, et http:// n’est accepté que pour ces cibles privées.tools.web.fetch.providersélectionne explicitement le fournisseur de repli de récupération.- Si
providerest omis, OpenClaw détecte automatiquement le premier fournisseur web-fetch prêt à partir des identifiants disponibles. Les appelsweb_fetchnon isolés en bac à sable peuvent utiliser les plugins installés qui déclarentcontracts.webFetchProviderset enregistrent un fournisseur correspondant à l’exécution. Aujourd’hui, le fournisseur groupé est Firecrawl. - Les appels
web_fetchisolés en bac à sable restent limités aux fournisseurs groupés. - Si Readability est désactivé,
web_fetchpasse directement au repli du fournisseur sélectionné. Si aucun fournisseur n’est disponible, il échoue de manière fermée.
Proxy d’environnement de confiance
Si votre déploiement exige queweb_fetch passe par un proxy sortant
HTTP(S) de confiance, définissez tools.web.fetch.useTrustedEnvProxy: true.
Dans ce mode, OpenClaw applique toujours les vérifications SSRF basées sur le nom d’hôte avant d’envoyer
la requête, mais il laisse le proxy résoudre le DNS au lieu d’effectuer un épinglage DNS
local. Activez cette option uniquement lorsque le proxy est contrôlé par l’opérateur et applique
la politique sortante après la résolution DNS.
Si aucune variable d’environnement de proxy HTTP(S) n’est configurée, ou si l’hôte cible est exclu par
NO_PROXY, web_fetch revient au chemin strict normal avec épinglage DNS
local.Limites et sécurité
maxCharsest plafonné àtools.web.fetch.maxCharsCap- Le corps de la réponse est plafonné à
maxResponseBytesavant l’analyse ; les réponses surdimensionnées sont tronquées avec un avertissement - Les noms d’hôte privés/internes sont bloqués
tools.web.fetch.ssrfPolicy.allowRfc2544BenchmarkRangeettools.web.fetch.ssrfPolicy.allowIpv6UniqueLocalRangesont des activations explicites limitées pour les piles de proxy à fausse IP de confiance ; laissez-les non définies sauf si votre proxy possède ces plages synthétiques et applique sa propre politique de destination- Les redirections sont vérifiées et limitées par
maxRedirects useTrustedEnvProxyest une activation explicite et ne doit être activée que pour les proxys contrôlés par l’opérateur qui appliquent toujours la politique sortante après la résolution DNSweb_fetchfonctionne au mieux — certains sites nécessitent le Navigateur Web
Profils d’outils
Si vous utilisez des profils d’outils ou des listes d’autorisation, ajoutezweb_fetch ou group:web :
Connexe
- Recherche Web — rechercher sur le Web avec plusieurs fournisseurs
- Navigateur Web — automatisation complète du navigateur pour les sites fortement dépendants de JS
- Firecrawl — outils de recherche et d’extraction Firecrawl