Web Fetch
Narzędzieweb_fetch wykonuje zwykłe żądanie HTTP GET i wyodrębnia czytelną treść
(HTML do markdown lub tekstu). Nie wykonuje JavaScript.
W przypadku stron mocno opartych na JS lub stron chronionych logowaniem użyj zamiast tego
Web Browser.
Szybki start
web_fetch jest domyślnie włączone — nie wymaga konfiguracji. Agent może
wywołać je od razu:
Parametry narzędzia
| Parametr | Typ | Opis |
|---|---|---|
url | string | URL do pobrania (wymagany, tylko http/https) |
extractMode | string | "markdown" (domyślnie) lub "text" |
maxChars | number | Obetnij wyjście do tej liczby znaków |
Jak to działa
Pobranie
Wysyła HTTP GET z nagłówkiem User-Agent podobnym do Chrome oraz nagłówkiem
Accept-Language.
Blokuje prywatne/wewnętrzne hostname i ponownie sprawdza przekierowania.Fallback (opcjonalnie)
Jeśli Readability się nie powiedzie i Firecrawl jest skonfigurowany, ponawia próbę przez
API Firecrawl z trybem obchodzenia zabezpieczeń przed botami.
Konfiguracja
Fallback Firecrawl
Jeśli ekstrakcja przez Readability się nie powiedzie,web_fetch może użyć fallbacku do
Firecrawl w celu obejścia zabezpieczeń przed botami i uzyskania lepszej ekstrakcji:
plugins.entries.firecrawl.config.webFetch.apiKey obsługuje obiekty SecretRef.
Starsza konfiguracja tools.web.fetch.firecrawl.* jest automatycznie migrowana przez openclaw doctor --fix.
Jeśli Firecrawl jest włączony, a jego SecretRef nie jest rozwiązany i nie ma
fallbacku env
FIRECRAWL_API_KEY, uruchomienie gateway kończy się natychmiast błędem.Nadpisania
baseUrl Firecrawl są ograniczone: muszą używać https:// i
oficjalnego hosta Firecrawl (api.firecrawl.dev).tools.web.fetch.providerjawnie wybiera providera fallbacku pobierania.- Jeśli
providerjest pominięty, OpenClaw automatycznie wykrywa pierwszego gotowego providera web fetch na podstawie dostępnych poświadczeń. Obecnie dołączonym providerem jest Firecrawl. - Jeśli Readability jest wyłączone,
web_fetchod razu przechodzi do wybranego fallbacku providera. Jeśli żaden provider nie jest dostępny, kończy działanie bezpieczną odmową.
Limity i bezpieczeństwo
maxCharsjest ograniczane dotools.web.fetch.maxCharsCap- Treść odpowiedzi jest ograniczana do
maxResponseBytesprzed parsowaniem; zbyt duże odpowiedzi są obcinane z ostrzeżeniem - Prywatne/wewnętrzne hostname są blokowane
- Przekierowania są sprawdzane i ograniczane przez
maxRedirects web_fetchdziała w trybie best-effort — niektóre strony wymagają Web Browser
Profile narzędzi
Jeśli używasz profili narzędzi lub list dozwolonych, dodajweb_fetch lub group:web:
Powiązane
- Web Search — przeszukuj sieć z użyciem wielu providerów
- Web Browser — pełna automatyzacja browser dla stron mocno opartych na JS
- Firecrawl — narzędzia wyszukiwania i scrape w Firecrawl