Firecrawl
OpenClaw może używać Firecrawl na trzy sposoby:- jako dostawcy
web_search - jako jawnych narzędzi wtyczki:
firecrawl_searchifirecrawl_scrape - jako awaryjnego ekstraktora dla
web_fetch
Pobierz klucz API
- Utwórz konto Firecrawl i wygeneruj klucz API.
- Zapisz go w konfiguracji albo ustaw
FIRECRAWL_API_KEYw środowisku gateway.
Skonfiguruj wyszukiwanie Firecrawl
- Wybranie Firecrawl podczas onboardingu albo w
openclaw configure --section webautomatycznie włącza dołączoną wtyczkę Firecrawl. web_searchz Firecrawl obsługujequeryicount.- Dla kontrolek specyficznych dla Firecrawl, takich jak
sources,categorieslub scrapowanie wyników, użyjfirecrawl_search. - Nadpisania
baseUrlmuszą pozostać w obrębiehttps://api.firecrawl.dev. FIRECRAWL_BASE_URLjest współdzielonym fallbackiem środowiskowym dla adresów bazowych wyszukiwania i scrapowania Firecrawl.
Skonfiguruj scrapowanie Firecrawl i fallback web_fetch
- Próby fallbacku Firecrawl są wykonywane tylko wtedy, gdy dostępny jest klucz API (
plugins.entries.firecrawl.config.webFetch.apiKeylubFIRECRAWL_API_KEY). maxAgeMsokreśla, jak stare mogą być wyniki z cache (w ms). Domyślnie są to 2 dni.- Starsza konfiguracja
tools.web.fetch.firecrawl.*jest automatycznie migrowana przezopenclaw doctor --fix. - Nadpisania adresu bazowego scrapowania/base URL Firecrawl są ograniczone do
https://api.firecrawl.dev.
firecrawl_scrape używa ponownie tych samych ustawień plugins.entries.firecrawl.config.webFetch.* i tych samych zmiennych środowiskowych.
Narzędzia wtyczki Firecrawl
firecrawl_search
Użyj tego, jeśli chcesz korzystać z kontrolek wyszukiwania specyficznych dla Firecrawl zamiast z ogólnego web_search.
Główne parametry:
querycountsourcescategoriesscrapeResultstimeoutSeconds
firecrawl_scrape
Użyj tego dla stron intensywnie korzystających z JS lub chronionych przed botami, gdzie zwykłe web_fetch działa słabo.
Główne parametry:
urlextractModemaxCharsonlyMainContentmaxAgeMsproxystoreInCachetimeoutSeconds
Stealth / omijanie zabezpieczeń botów
Firecrawl udostępnia parametr proxy mode do omijania zabezpieczeń botów (basic, stealth lub auto).
OpenClaw zawsze używa proxy: "auto" oraz storeInCache: true dla żądań Firecrawl.
Jeśli proxy zostanie pominięte, Firecrawl domyślnie używa auto. auto ponawia próbę z użyciem proxy stealth, jeśli podstawowa próba się nie powiedzie, co może zużywać więcej kredytów
niż scrapowanie tylko w trybie basic.
Jak web_fetch używa Firecrawl
Kolejność ekstrakcji web_fetch:
- Readability (lokalnie)
- Firecrawl (jeśli wybrany lub automatycznie wykryty jako aktywny fallback web-fetch)
- Podstawowe oczyszczanie HTML (ostatni fallback)
tools.web.fetch.provider. Jeśli je pominiesz, OpenClaw
automatycznie wykryje pierwszego gotowego dostawcę web-fetch na podstawie dostępnych poświadczeń.
Obecnie dołączonym dostawcą jest Firecrawl.
Powiązane
- Przegląd Web Search — wszyscy dostawcy i automatyczne wykrywanie
- Web Fetch — narzędzie web_fetch z fallbackiem Firecrawl
- Tavily — narzędzia wyszukiwania i ekstrakcji