Firecrawl
OpenClaw peut utiliser Firecrawl de trois façons :- comme fournisseur
web_search - comme outils de plugin explicites :
firecrawl_searchetfirecrawl_scrape - comme extracteur de secours pour
web_fetch
Obtenir une clé API
- Créez un compte Firecrawl et générez une clé API.
- Stockez-la dans la configuration ou définissez
FIRECRAWL_API_KEYdans l’environnement de la gateway.
Configurer la recherche Firecrawl
- Choisir Firecrawl lors de l’onboarding ou avec
openclaw configure --section webactive automatiquement le plugin Firecrawl intégré. web_searchavec Firecrawl prend en chargequeryetcount.- Pour les contrôles spécifiques à Firecrawl comme
sources,categoriesou l’extraction des résultats, utilisezfirecrawl_search. - Les remplacements de
baseUrldoivent rester surhttps://api.firecrawl.dev. FIRECRAWL_BASE_URLest la variable d’environnement de secours partagée pour les URL de base de recherche et d’extraction Firecrawl.
Configurer l’extraction Firecrawl + la solution de repli web_fetch
- Les tentatives de repli Firecrawl ne s’exécutent que lorsqu’une clé API est disponible (
plugins.entries.firecrawl.config.webFetch.apiKeyouFIRECRAWL_API_KEY). maxAgeMscontrôle l’ancienneté maximale des résultats mis en cache (en ms). La valeur par défaut est de 2 jours.- L’ancienne configuration
tools.web.fetch.firecrawl.*est migrée automatiquement paropenclaw doctor --fix. - Les remplacements d’URL de base pour l’extraction Firecrawl sont limités à
https://api.firecrawl.dev.
firecrawl_scrape réutilise les mêmes paramètres plugins.entries.firecrawl.config.webFetch.* et les mêmes variables d’environnement.
Outils du plugin Firecrawl
firecrawl_search
Utilisez-le lorsque vous voulez des contrôles de recherche spécifiques à Firecrawl plutôt que web_search générique.
Paramètres principaux :
querycountsourcescategoriesscrapeResultstimeoutSeconds
firecrawl_scrape
Utilisez-le pour les pages riches en JS ou protégées contre les bots lorsque web_fetch simple est insuffisant.
Paramètres principaux :
urlextractModemaxCharsonlyMainContentmaxAgeMsproxystoreInCachetimeoutSeconds
Furtivité / contournement des bots
Firecrawl expose un paramètre de mode proxy pour le contournement des bots (basic, stealth ou auto).
OpenClaw utilise toujours proxy: "auto" avec storeInCache: true pour les requêtes Firecrawl.
Si proxy est omis, Firecrawl utilise auto par défaut. auto réessaie avec des proxys furtifs si une tentative de base échoue, ce qui peut consommer plus de crédits
qu’une extraction en mode basic uniquement.
Comment web_fetch utilise Firecrawl
Ordre d’extraction de web_fetch :
- Readability (local)
- Firecrawl (s’il est sélectionné ou détecté automatiquement comme solution de repli active pour web fetch)
- Nettoyage HTML de base (solution de repli finale)
tools.web.fetch.provider. Si vous l’omettez, OpenClaw
détecte automatiquement le premier fournisseur web fetch prêt à l’emploi selon les identifiants disponibles.
Aujourd’hui, le fournisseur intégré est Firecrawl.
Liens associés
- Vue d’ensemble de Web Search — tous les fournisseurs et la détection automatique
- Web Fetch — outil
web_fetchavec solution de repli Firecrawl - Tavily — outils de recherche et d’extraction