Firecrawl
OpenClaw kann Firecrawl auf drei Arten verwenden:- als
web_search-Provider - als explizite Plugin-Tools:
firecrawl_searchundfirecrawl_scrape - als Fallback-Extractor für
web_fetch
API-Key abrufen
- Erstellen Sie ein Firecrawl-Konto und generieren Sie einen API-Key.
- Speichern Sie ihn in der Konfiguration oder setzen Sie
FIRECRAWL_API_KEYin der Gateway-Umgebung.
Firecrawl-Suche konfigurieren
- Wenn Sie Firecrawl im Onboarding oder mit
openclaw configure --section webauswählen, wird das gebündelte Firecrawl-Plugin automatisch aktiviert. web_searchmit Firecrawl unterstütztqueryundcount.- Für Firecrawl-spezifische Steuerungen wie
sources,categoriesoder Ergebnis-Scraping verwenden Siefirecrawl_search. baseUrl-Overrides müssen aufhttps://api.firecrawl.devbleiben.FIRECRAWL_BASE_URList der gemeinsame Env-Fallback für die Base URLs von Firecrawl-Suche und -Scraping.
Firecrawl-Scraping + web_fetch-Fallback konfigurieren
- Firecrawl-Fallback-Versuche werden nur ausgeführt, wenn ein API-Key verfügbar ist (
plugins.entries.firecrawl.config.webFetch.apiKeyoderFIRECRAWL_API_KEY). maxAgeMssteuert, wie alt gecachte Ergebnisse sein dürfen (ms). Standard sind 2 Tage.- Die veraltete Konfiguration
tools.web.fetch.firecrawl.*wird vonopenclaw doctor --fixautomatisch migriert. - Overrides für Firecrawl-Scraping/
baseUrlsind aufhttps://api.firecrawl.devbeschränkt.
firecrawl_scrape verwendet dieselben Einstellungen und Env-Variablen aus plugins.entries.firecrawl.config.webFetch.* erneut.
Firecrawl-Plugin-Tools
firecrawl_search
Verwenden Sie dies, wenn Sie Firecrawl-spezifische Suchsteuerungen statt des generischen web_search möchten.
Zentrale Parameter:
querycountsourcescategoriesscrapeResultstimeoutSeconds
firecrawl_scrape
Verwenden Sie dies für JS-lastige oder botgeschützte Seiten, bei denen einfaches web_fetch schwach ist.
Zentrale Parameter:
urlextractModemaxCharsonlyMainContentmaxAgeMsproxystoreInCachetimeoutSeconds
Stealth / Bot-Umgehung
Firecrawl stellt einen Parameter für den Proxy-Modus zur Bot-Umgehung bereit (basic, stealth oder auto).
OpenClaw verwendet für Firecrawl-Requests immer proxy: "auto" plus storeInCache: true.
Wenn proxy weggelassen wird, verwendet Firecrawl standardmäßig auto. auto versucht bei einem Fehlschlag eines einfachen Versuchs erneut mit Stealth-Proxys, was mehr Credits
als Scraping nur mit basic verbrauchen kann.
Wie web_fetch Firecrawl verwendet
Reihenfolge der web_fetch-Extraktion:
- Readability (lokal)
- Firecrawl (wenn ausgewählt oder automatisch als aktiver Web-Fetch-Fallback erkannt)
- Einfache HTML-Bereinigung (letzter Fallback)
tools.web.fetch.provider. Wenn Sie ihn weglassen, erkennt OpenClaw
den ersten bereiten Web-Fetch-Provider anhand verfügbarer Zugangsdaten automatisch.
Heute ist der gebündelte Provider Firecrawl.
Verwandt
- Überblick Web Search — alle Provider und automatische Erkennung
- Web Fetch —
web_fetch-Tool mit Firecrawl-Fallback - Tavily — Such- und Extraktionstools