NarzędzieDocumentation Index
Fetch the complete documentation index at: https://docs.openclaw.ai/llms.txt
Use this file to discover all available pages before exploring further.
web_fetch wykonuje zwykłe żądanie HTTP GET i wyodrębnia czytelną treść
(HTML do markdown lub tekstu). Nie wykonuje JavaScriptu.
W przypadku witryn mocno opartych na JS lub stron chronionych logowaniem użyj zamiast tego
przeglądarki internetowej.
Szybki start
web_fetch jest włączone domyślnie — konfiguracja nie jest potrzebna. Agent może
wywołać je natychmiast:
Parametry narzędzia
URL do pobrania. Tylko
http(s).Format wyjściowy po wyodrębnieniu głównej treści.
Przytnij dane wyjściowe do tej liczby znaków.
Jak to działa
Pobieranie
Wysyła żądanie HTTP GET z nagłówkiem User-Agent podobnym do Chrome oraz
nagłówkiem
Accept-Language. Blokuje prywatne/wewnętrzne nazwy hostów i ponownie sprawdza przekierowania.Fallback (opcjonalnie)
Jeśli Readability zawiedzie, a Firecrawl jest skonfigurowany, ponawia próbę przez
API Firecrawl w trybie obchodzenia botów.
Konfiguracja
Fallback Firecrawl
Jeśli wyodrębnianie Readability zawiedzie,web_fetch może przejść na
Firecrawl, aby obchodzić boty i lepiej wyodrębniać treść:
plugins.entries.firecrawl.config.webFetch.apiKey obsługuje obiekty SecretRef.
Starsza konfiguracja tools.web.fetch.firecrawl.* jest automatycznie migrowana przez openclaw doctor --fix.
Jeśli Firecrawl jest włączony, a jego SecretRef pozostaje nierozwiązany i nie ma
awaryjnej zmiennej środowiskowej
FIRECRAWL_API_KEY, uruchamianie Gateway kończy się szybko błędem.Nadpisania
baseUrl Firecrawl są ograniczone: ruch hostowany używa
https://api.firecrawl.dev; samodzielnie hostowane nadpisania muszą wskazywać prywatne lub
wewnętrzne punkty końcowe, a http:// jest akceptowane tylko dla tych prywatnych celów.tools.web.fetch.providerjawnie wybiera dostawcę fallback pobierania.- Jeśli
providerzostanie pominięty, OpenClaw automatycznie wykrywa pierwszego gotowego dostawcę web-fetch na podstawie dostępnych poświadczeń. Niesandboxowaneweb_fetchmoże używać zainstalowanych plugins, które deklarującontracts.webFetchProvidersi rejestrują pasującego dostawcę w czasie działania. Obecnie dołączonym dostawcą jest Firecrawl. - Sandboxowane wywołania
web_fetchpozostają ograniczone do dołączonych dostawców. - Jeśli Readability jest wyłączone,
web_fetchprzechodzi od razu do wybranego fallback dostawcy. Jeśli żaden dostawca nie jest dostępny, kończy się zamkniętym błędem.
Zaufany proxy środowiskowy
Jeśli Twoje wdrożenie wymaga, abyweb_fetch przechodziło przez zaufany wychodzący
proxy HTTP(S), ustaw tools.web.fetch.useTrustedEnvProxy: true.
W tym trybie OpenClaw nadal stosuje kontrole SSRF oparte na nazwach hostów przed wysłaniem
żądania, ale pozwala proxy rozwiązywać DNS zamiast wykonywać lokalne przypinanie DNS.
Włącz to tylko wtedy, gdy proxy jest kontrolowany przez operatora i egzekwuje
politykę wychodzącą po rozwiązaniu DNS.
Jeśli nie skonfigurowano żadnej zmiennej środowiskowej proxy HTTP(S) albo host docelowy jest wykluczony przez
NO_PROXY, web_fetch wraca do normalnej ścisłej ścieżki z lokalnym
przypinaniem DNS.Limity i bezpieczeństwo
maxCharsjest ograniczane dotools.web.fetch.maxCharsCap- Treść odpowiedzi jest ograniczana do
maxResponseBytesprzed parsowaniem; zbyt duże odpowiedzi są przycinane z ostrzeżeniem - Prywatne/wewnętrzne nazwy hostów są blokowane
tools.web.fetch.ssrfPolicy.allowRfc2544BenchmarkRangeoraztools.web.fetch.ssrfPolicy.allowIpv6UniqueLocalRangeto wąskie opcje opt-in dla zaufanych stosów proxy z fałszywymi IP; pozostaw je nieustawione, chyba że Twój proxy jest właścicielem tych syntetycznych zakresów i egzekwuje własną politykę miejsc docelowych- Przekierowania są sprawdzane i ograniczane przez
maxRedirects useTrustedEnvProxyto jawna opcja opt-in i powinna być włączana tylko dla proxy kontrolowanych przez operatora, które nadal egzekwują politykę wychodzącą po rozwiązaniu DNSweb_fetchdziała na zasadzie najlepszej możliwej próby — niektóre witryny wymagają przeglądarki internetowej
Profile narzędzi
Jeśli używasz profili narzędzi lub list dozwolonych, dodajweb_fetch albo group:web:
Powiązane
- Wyszukiwanie w sieci — przeszukuj sieć za pomocą wielu dostawców
- Przeglądarka internetowa — pełna automatyzacja przeglądarki dla witryn mocno opartych na JS
- Firecrawl — narzędzia wyszukiwania i scrapowania Firecrawl