Tools
Firecrawl
OpenClaw może używać Firecrawl na trzy sposoby:
- jako dostawcy
web_search - jako jawnych narzędzi pluginu:
firecrawl_searchifirecrawl_scrape - jako zapasowego ekstraktora dla
web_fetch
Jest to hostowana usługa ekstrakcji/wyszukiwania obsługująca obchodzenie zabezpieczeń przed botami i buforowanie, co pomaga w przypadku stron intensywnie korzystających z JS lub stron blokujących zwykłe pobieranie HTTP.
Zainstaluj plugin
Zainstaluj oficjalny plugin, a następnie uruchom ponownie Gateway:
openclaw plugins install @openclaw/firecrawl-pluginopenclaw gateway restartweb_fetch bez klucza i klucze API
Jawnie wybrany hostowany zapasowy Firecrawl web_fetch obsługuje dostęp startowy
bez klucza API. Dodaj FIRECRAWL_API_KEY w środowisku gateway
albo skonfiguruj go, gdy potrzebujesz wyższych limitów. Firecrawl web_search i
firecrawl_scrape wymagają klucza API.
Skonfiguruj wyszukiwanie Firecrawl
{ tools: { web: { search: { provider: "firecrawl", }, }, }, plugins: { entries: { firecrawl: { enabled: true, config: { webSearch: { apiKey: "FIRECRAWL_API_KEY_HERE", baseUrl: "https://api.firecrawl.dev", }, }, }, }, },}Uwagi:
- Wybranie Firecrawl podczas wdrażania lub przez
openclaw configure --section webautomatycznie włącza zainstalowany plugin Firecrawl. web_searchz Firecrawl obsługujequeryicount.- W przypadku kontrolek specyficznych dla Firecrawl, takich jak
sources,categorieslub scraping wyników, użyjfirecrawl_search. baseUrldomyślnie wskazuje hostowany Firecrawl pod adresemhttps://api.firecrawl.dev. Nadpisania self-hosted są dozwolone tylko dla prywatnych/wewnętrznych punktów końcowych; HTTP jest akceptowany tylko dla tych prywatnych celów.FIRECRAWL_BASE_URLto wspólna zapasowa zmienna środowiskowa dla bazowych adresów URL wyszukiwania i scrapingu Firecrawl.
Skonfiguruj zapasowy Firecrawl web_fetch
{ tools: { web: { fetch: { provider: "firecrawl", // explicit selection enables keyless fallback }, }, }, plugins: { entries: { firecrawl: { enabled: true, config: { webFetch: { baseUrl: "https://api.firecrawl.dev", onlyMainContent: true, maxAgeMs: 172800000, timeoutSeconds: 60, }, }, }, }, },}Uwagi:
- Jawnie wybrany zapasowy Firecrawl
web_fetchdziała bez klucza API. Po skonfigurowaniu OpenClaw wysyłaplugins.entries.firecrawl.config.webFetch.apiKeylubFIRECRAWL_API_KEYw celu uzyskania wyższych limitów. - Wybranie Firecrawl podczas wdrażania lub przez
openclaw configure --section webwłącza plugin i wybiera Firecrawl dlaweb_fetch, chyba że skonfigurowano już innego dostawcę pobierania. firecrawl_scrapewymaga klucza API.maxAgeMskontroluje, jak stare mogą być wyniki z pamięci podręcznej (ms). Wartość domyślna to 2 dni.- Starsza konfiguracja
tools.web.fetch.firecrawl.*jest automatycznie migrowana przezopenclaw doctor --fix. - Nadpisania scrapingu/bazowego URL Firecrawl stosują tę samą regułę hostowane/prywatne co wyszukiwanie: publiczny ruch hostowany używa
https://api.firecrawl.dev; nadpisania self-hosted muszą wskazywać prywatne/wewnętrzne punkty końcowe. firecrawl_scrapeodrzuca oczywiste prywatne, loopback, metadanych i inne niż HTTP(S) docelowe adresy URL przed przekazaniem ich do Firecrawl, zgodnie z kontraktem bezpieczeństwa celuweb_fetchdla jawnych wywołań scrapingu Firecrawl.
firecrawl_scrape ponownie używa tych samych ustawień plugins.entries.firecrawl.config.webFetch.* i zmiennych środowiskowych, w tym wymaganego klucza API.
Self-hosted Firecrawl
Ustaw plugins.entries.firecrawl.config.webSearch.baseUrl,
plugins.entries.firecrawl.config.webFetch.baseUrl lub FIRECRAWL_BASE_URL,
gdy uruchamiasz Firecrawl samodzielnie. OpenClaw akceptuje http:// tylko dla celów loopback,
sieci prywatnej, .local, .internal lub .localhost. Publiczne niestandardowe
hosty są odrzucane, aby klucze API Firecrawl nie zostały przypadkowo wysłane do
dowolnych punktów końcowych.
Narzędzia pluginu Firecrawl
firecrawl_search
Użyj tego, gdy chcesz użyć kontrolek wyszukiwania specyficznych dla Firecrawl zamiast ogólnego web_search.
Podstawowe parametry:
querycountsourcescategoriesscrapeResultstimeoutSeconds
firecrawl_scrape
Użyj tego dla stron intensywnie korzystających z JS lub chronionych przed botami, gdzie zwykły web_fetch jest niewystarczający.
Podstawowe parametry:
urlextractModemaxCharsonlyMainContentmaxAgeMsproxystoreInCachetimeoutSeconds
Stealth / obchodzenie zabezpieczeń przed botami
Firecrawl udostępnia parametr trybu proxy do obchodzenia zabezpieczeń przed botami (basic, stealth lub auto).
OpenClaw zawsze używa proxy: "auto" oraz storeInCache: true dla żądań Firecrawl.
Jeśli proxy zostanie pominięte, Firecrawl domyślnie używa auto. auto ponawia próbę z proxy stealth, jeśli próba basic się nie powiedzie, co może zużyć więcej kredytów
niż scraping tylko w trybie basic.
Jak web_fetch używa Firecrawl
Kolejność ekstrakcji web_fetch:
- Readability (lokalnie)
- Firecrawl (gdy wybrany lub automatycznie wykryty na podstawie skonfigurowanych poświadczeń)
- Podstawowe czyszczenie HTML (ostatnia opcja zapasowa)
Pokrętłem wyboru jest tools.web.fetch.provider. Jeśli je pominiesz, OpenClaw
automatycznie wykrywa pierwszego gotowego dostawcę web-fetch na podstawie dostępnych poświadczeń.
Oficjalny plugin Firecrawl zapewnia tę opcję zapasową.
Powiązane
- Omówienie Web Search -- wszyscy dostawcy i automatyczne wykrywanie
- Web Fetch -- narzędzie web_fetch z zapasowym Firecrawl
- Tavily -- narzędzia wyszukiwania i ekstrakcji