AlatDocumentation Index
Fetch the complete documentation index at: https://docs.openclaw.ai/llms.txt
Use this file to discover all available pages before exploring further.
web_fetch melakukan HTTP GET biasa dan mengekstrak konten yang dapat dibaca
(HTML ke markdown atau teks). Alat ini tidak menjalankan JavaScript.
Untuk situs yang sangat bergantung pada JS atau halaman yang dilindungi login, gunakan
Peramban Web sebagai gantinya.
Mulai cepat
web_fetch diaktifkan secara default — tidak perlu konfigurasi. Agent dapat
memanggilnya langsung:
Parameter alat
URL yang akan diambil. Hanya
http(s).Format keluaran setelah ekstraksi konten utama.
Potong keluaran hingga sebanyak karakter ini.
Cara kerjanya
Fetch
Mengirim HTTP GET dengan User-Agent mirip Chrome dan header
Accept-Language. Memblokir hostname privat/internal dan memeriksa ulang pengalihan.Fallback (optional)
Jika Readability gagal dan Firecrawl dikonfigurasi, mencoba ulang melalui
API Firecrawl dengan mode pengelakan bot.
Konfigurasi
Fallback Firecrawl
Jika ekstraksi Readability gagal,web_fetch dapat menggunakan fallback ke
Firecrawl untuk pengelakan bot dan ekstraksi yang lebih baik:
plugins.entries.firecrawl.config.webFetch.apiKey mendukung objek SecretRef.
Konfigurasi legacy tools.web.fetch.firecrawl.* dimigrasikan otomatis oleh openclaw doctor --fix.
Jika Firecrawl diaktifkan dan SecretRef-nya tidak terselesaikan tanpa fallback env
FIRECRAWL_API_KEY, startup gateway gagal dengan cepat.Override
baseUrl Firecrawl dikunci ketat: lalu lintas hosted menggunakan
https://api.firecrawl.dev; override self-hosted harus menargetkan endpoint privat atau
internal, dan http:// hanya diterima untuk target privat tersebut.tools.web.fetch.providermemilih penyedia fallback pengambilan secara eksplisit.- Jika
providerdihilangkan, OpenClaw mendeteksi otomatis penyedia web-fetch pertama yang siap dari kredensial yang tersedia.web_fetchnon-sandbox dapat menggunakan plugin terpasang yang mendeklarasikancontracts.webFetchProvidersdan mendaftarkan penyedia yang cocok pada runtime. Saat ini penyedia bawaan adalah Firecrawl. - Panggilan
web_fetchyang di-sandbox tetap terbatas pada penyedia bawaan. - Jika Readability dinonaktifkan,
web_fetchlangsung melewati ke fallback penyedia yang dipilih. Jika tidak ada penyedia yang tersedia, alat ini gagal secara tertutup.
Proxy env tepercaya
Jika deployment Anda mengharuskanweb_fetch melewati proxy HTTP(S) keluar
yang tepercaya, setel tools.web.fetch.useTrustedEnvProxy: true.
Dalam mode ini, OpenClaw tetap menerapkan pemeriksaan SSRF berbasis hostname sebelum mengirim
permintaan, tetapi membiarkan proxy menyelesaikan DNS alih-alih melakukan pinning DNS
lokal. Aktifkan ini hanya ketika proxy dikendalikan operator dan memberlakukan
kebijakan keluar setelah resolusi DNS.
Jika tidak ada variabel env proxy HTTP(S) yang dikonfigurasi, atau host target dikecualikan oleh
NO_PROXY, web_fetch menggunakan fallback ke jalur ketat normal dengan pinning DNS
lokal.Batasan dan keamanan
maxCharsdibatasi ketools.web.fetch.maxCharsCap- Body respons dibatasi pada
maxResponseBytessebelum parsing; respons yang terlalu besar dipotong dengan peringatan - Hostname privat/internal diblokir
tools.web.fetch.ssrfPolicy.allowRfc2544BenchmarkRangedantools.web.fetch.ssrfPolicy.allowIpv6UniqueLocalRangeadalah opt-in sempit untuk stack proxy fake-IP tepercaya; biarkan tidak disetel kecuali proxy Anda memiliki rentang sintetis tersebut dan memberlakukan kebijakan tujuannya sendiri- Pengalihan diperiksa dan dibatasi oleh
maxRedirects useTrustedEnvProxyadalah opt-in eksplisit dan sebaiknya hanya diaktifkan untuk proxy yang dikendalikan operator yang tetap memberlakukan kebijakan keluar setelah resolusi DNSweb_fetchbersifat best-effort — beberapa situs memerlukan Peramban Web
Profil alat
Jika Anda menggunakan profil alat atau allowlist, tambahkanweb_fetch atau group:web:
Terkait
- Pencarian Web — cari di web dengan beberapa penyedia
- Peramban Web — automasi browser penuh untuk situs yang sangat bergantung pada JS
- Firecrawl — alat pencarian dan scrape Firecrawl