Tools
Firecrawl
OpenClaw peut utiliser Firecrawl de trois façons :
- comme fournisseur
web_search - comme outils de Plugin explicites :
firecrawl_searchetfirecrawl_scrape - comme extracteur de secours pour
web_fetch
Il s’agit d’un service hébergé d’extraction et de recherche qui prend en charge le contournement des bots et la mise en cache, ce qui aide avec les sites riches en JS ou les pages qui bloquent les récupérations HTTP simples.
Installer le Plugin
Installez le Plugin officiel, puis redémarrez Gateway :
openclaw plugins install @openclaw/firecrawl-pluginopenclaw gateway restartweb_fetch sans clé et clés d’API
Le secours web_fetch Firecrawl hébergé explicitement sélectionné prend en charge un accès de démarrage
sans clé d’API. Ajoutez FIRECRAWL_API_KEY dans l’environnement du gateway
ou configurez-la lorsque vous avez besoin de limites plus élevées. Firecrawl web_search et
firecrawl_scrape nécessitent une clé d’API.
Configurer la recherche Firecrawl
{ tools: { web: { search: { provider: "firecrawl", }, }, }, plugins: { entries: { firecrawl: { enabled: true, config: { webSearch: { apiKey: "FIRECRAWL_API_KEY_HERE", baseUrl: "https://api.firecrawl.dev", }, }, }, }, },}Notes :
- Choisir Firecrawl lors de l’intégration ou avec
openclaw configure --section webactive automatiquement le Plugin Firecrawl installé. web_searchavec Firecrawl prend en chargequeryetcount.- Pour les contrôles propres à Firecrawl comme
sources,categoriesou l’extraction des résultats, utilisezfirecrawl_search. baseUrlutilise par défaut Firecrawl hébergé à l’adressehttps://api.firecrawl.dev. Les substitutions auto-hébergées ne sont autorisées que pour les points de terminaison privés/internes ; HTTP n’est accepté que pour ces cibles privées.FIRECRAWL_BASE_URLest le secours d’environnement partagé pour les URL de base de recherche et d’extraction Firecrawl.
Configurer le secours web_fetch Firecrawl
{ tools: { web: { fetch: { provider: "firecrawl", // la sélection explicite active le secours sans clé }, }, }, plugins: { entries: { firecrawl: { enabled: true, config: { webFetch: { baseUrl: "https://api.firecrawl.dev", onlyMainContent: true, maxAgeMs: 172800000, timeoutSeconds: 60, }, }, }, }, },}Notes :
- Le secours
web_fetchFirecrawl explicitement sélectionné fonctionne sans clé d’API. Lorsqu’il est configuré, OpenClaw envoieplugins.entries.firecrawl.config.webFetch.apiKeyouFIRECRAWL_API_KEYpour des limites plus élevées. - Choisir Firecrawl pendant l’intégration ou avec
openclaw configure --section webactive le Plugin et sélectionne Firecrawl pourweb_fetch, sauf si un autre fournisseur de récupération est déjà configuré. firecrawl_scrapenécessite une clé d’API.maxAgeMscontrôle l’ancienneté autorisée des résultats mis en cache (ms). La valeur par défaut est de 2 jours.- La configuration héritée
tools.web.fetch.firecrawl.*est automatiquement migrée paropenclaw doctor --fix. - Les substitutions d’URL de base/d’extraction Firecrawl suivent la même règle hébergé/privé que la recherche : le trafic hébergé public utilise
https://api.firecrawl.dev; les substitutions auto-hébergées doivent résoudre vers des points de terminaison privés/internes. firecrawl_scraperejette les URL cibles manifestement privées, loopback, de métadonnées et non HTTP(S) avant de les transmettre à Firecrawl, conformément au contrat de sûreté des cibles deweb_fetchpour les appels explicites d’extraction Firecrawl.
firecrawl_scrape réutilise les mêmes paramètres et variables d’environnement plugins.entries.firecrawl.config.webFetch.*, y compris sa clé d’API requise.
Firecrawl auto-hébergé
Définissez plugins.entries.firecrawl.config.webSearch.baseUrl,
plugins.entries.firecrawl.config.webFetch.baseUrl ou FIRECRAWL_BASE_URL
lorsque vous exécutez Firecrawl vous-même. OpenClaw accepte http:// uniquement pour les cibles loopback,
de réseau privé, .local, .internal ou .localhost. Les hôtes personnalisés publics
sont rejetés afin que les clés d’API Firecrawl ne soient pas envoyées par
accident à des points de terminaison arbitraires.
Outils du Plugin Firecrawl
firecrawl_search
Utilisez ceci lorsque vous voulez des contrôles de recherche propres à Firecrawl plutôt que le web_search générique.
Paramètres principaux :
querycountsourcescategoriesscrapeResultstimeoutSeconds
firecrawl_scrape
Utilisez ceci pour les pages riches en JS ou protégées contre les bots lorsque web_fetch simple est insuffisant.
Paramètres principaux :
urlextractModemaxCharsonlyMainContentmaxAgeMsproxystoreInCachetimeoutSeconds
Furtivité / contournement des bots
Firecrawl expose un paramètre mode proxy pour le contournement des bots (basic, stealth ou auto).
OpenClaw utilise toujours proxy: "auto" ainsi que storeInCache: true pour les requêtes Firecrawl.
Si proxy est omis, Firecrawl utilise par défaut auto. auto réessaie avec des proxys furtifs si une tentative basique échoue, ce qui peut utiliser plus de crédits
qu’une extraction uniquement basique.
Comment web_fetch utilise Firecrawl
Ordre d’extraction de web_fetch :
- Readability (local)
- Firecrawl (lorsqu’il est sélectionné, ou détecté automatiquement à partir des identifiants configurés)
- Nettoyage HTML basique (dernier secours)
Le réglage de sélection est tools.web.fetch.provider. Si vous l’omettez, OpenClaw
détecte automatiquement le premier fournisseur web-fetch prêt à partir des identifiants disponibles.
Le Plugin Firecrawl officiel fournit ce secours.
Connexe
- Vue d’ensemble de Web Search -- tous les fournisseurs et la détection automatique
- Web Fetch -- outil web_fetch avec secours Firecrawl
- Tavily -- outils de recherche + extraction