OpenClaw może używać Firecrawl na trzy sposoby:Documentation Index
Fetch the complete documentation index at: https://docs.openclaw.ai/llms.txt
Use this file to discover all available pages before exploring further.
- jako dostawcy
web_search - jako jawnych narzędzi Plugin:
firecrawl_searchifirecrawl_scrape - jako zapasowego ekstraktora dla
web_fetch
Uzyskaj klucz API
- Utwórz konto Firecrawl i wygeneruj klucz API.
- Zapisz go w konfiguracji albo ustaw
FIRECRAWL_API_KEYw środowisku Gateway.
Skonfiguruj wyszukiwanie Firecrawl
- Wybranie Firecrawl podczas onboardingu lub w
openclaw configure --section webautomatycznie włącza dołączony Plugin Firecrawl. web_searchz Firecrawl obsługujequeryicount.- Aby użyć kontrolek specyficznych dla Firecrawl, takich jak
sources,categorieslub scraping wyników, użyjfirecrawl_search. baseUrldomyślnie wskazuje hostowany Firecrawl pod adresemhttps://api.firecrawl.dev. Nadpisania self-hosted są dozwolone tylko dla prywatnych/wewnętrznych endpointów; HTTP jest akceptowane tylko dla tych prywatnych celów.FIRECRAWL_BASE_URLto wspólny zapasowy env dla bazowych URL wyszukiwania i scrape Firecrawl.
Skonfiguruj scrape Firecrawl + fallback web_fetch
- Próby fallback Firecrawl są uruchamiane tylko wtedy, gdy dostępny jest klucz API (
plugins.entries.firecrawl.config.webFetch.apiKeylubFIRECRAWL_API_KEY). maxAgeMskontroluje, jak stare mogą być wyniki z pamięci podręcznej (ms). Domyślnie są to 2 dni.- Starsza konfiguracja
tools.web.fetch.firecrawl.*jest automatycznie migrowana przezopenclaw doctor --fix. - Nadpisania URL scrape/base Firecrawl podlegają tej samej regule hosted/private co wyszukiwanie: publiczny ruch hostowany używa
https://api.firecrawl.dev; nadpisania self-hosted muszą wskazywać prywatne/wewnętrzne endpointy. firecrawl_scrapeodrzuca oczywiste prywatne, loopback, metadane i docelowe URL inne niż HTTP(S), zanim przekaże je do Firecrawl, zgodnie z kontraktem bezpieczeństwa celówweb_fetchdla jawnych wywołań scrape Firecrawl.
firecrawl_scrape ponownie używa tych samych ustawień plugins.entries.firecrawl.config.webFetch.* i zmiennych env.
Self-hosted Firecrawl
Ustawplugins.entries.firecrawl.config.webSearch.baseUrl,
plugins.entries.firecrawl.config.webFetch.baseUrl lub FIRECRAWL_BASE_URL,
gdy uruchamiasz Firecrawl samodzielnie. OpenClaw akceptuje http:// tylko dla celów loopback,
sieci prywatnej, .local, .internal lub .localhost. Publiczne niestandardowe
hosty są odrzucane, aby klucze API Firecrawl nie zostały przypadkowo wysłane do dowolnych endpointów.
Narzędzia Plugin Firecrawl
firecrawl_search
Użyj tego, gdy chcesz użyć kontrolek wyszukiwania specyficznych dla Firecrawl zamiast ogólnego web_search.
Główne parametry:
querycountsourcescategoriesscrapeResultstimeoutSeconds
firecrawl_scrape
Użyj tego dla stron mocno opartych na JS lub chronionych przed botami, dla których zwykły web_fetch jest słaby.
Główne parametry:
urlextractModemaxCharsonlyMainContentmaxAgeMsproxystoreInCachetimeoutSeconds
Stealth / obchodzenie botów
Firecrawl udostępnia parametr proxy mode do obchodzenia botów (basic, stealth lub auto).
OpenClaw zawsze używa proxy: "auto" oraz storeInCache: true dla żądań Firecrawl.
Jeśli proxy zostanie pominięte, Firecrawl domyślnie używa auto. auto ponawia próbę z proxy stealth, jeśli próba basic się nie powiedzie, co może zużyć więcej kredytów
niż scraping tylko w trybie basic.
Jak web_fetch używa Firecrawl
Kolejność ekstrakcji web_fetch:
- Readability (lokalnie)
- Firecrawl (jeśli wybrany lub automatycznie wykryty jako aktywny fallback web-fetch)
- Podstawowe czyszczenie HTML (ostatni fallback)
tools.web.fetch.provider. Jeśli je pominiesz, OpenClaw
automatycznie wykrywa pierwszego gotowego dostawcę web-fetch na podstawie dostępnych poświadczeń.
Obecnie dołączonym dostawcą jest Firecrawl.
Powiązane
- Omówienie Web Search — wszyscy dostawcy i automatyczne wykrywanie
- Web Fetch — narzędzie web_fetch z fallback Firecrawl
- Tavily — narzędzia wyszukiwania i ekstrakcji