Tools
Web'den getirme
web_fetch aracı düz bir HTTP GET yapar ve okunabilir içeriği çıkarır
(HTML'den markdown veya metne). JavaScript'i çalıştırmaz.
JS ağırlıklı siteler veya oturum açma korumalı sayfalar için bunun yerine Web Tarayıcısı kullanın.
Hızlı başlangıç
web_fetch varsayılan olarak etkindir -- yapılandırma gerekmez. Agent bunu
hemen çağırabilir:
await web_fetch({ url: "https://example.com/article" });Araç parametreleri
urlstringrequiredGetirilecek URL. Yalnızca http(s).
extractMode'markdown' | 'text'default: markdownAna içerik çıkarma işleminden sonraki çıktı biçimi.
maxCharsnumberÇıktıyı bu kadar karakterle sınırla.
Nasıl çalışır?
Fetch
Chrome benzeri bir User-Agent ve Accept-Language başlığıyla HTTP GET
gönderir. Özel/dahili ana makine adlarını engeller ve yönlendirmeleri
yeniden denetler.
Extract
HTML yanıtında Readability'yi (ana içerik çıkarma) çalıştırır.
Fallback (optional)
Readability başarısız olursa ve Firecrawl seçiliyse, bot engellerini aşma moduyla Firecrawl API üzerinden yeniden dener.
Cache
Aynı URL'nin tekrar tekrar getirilmesini azaltmak için sonuçlar 15 dakika boyunca önbelleğe alınır (yapılandırılabilir).
İlerleme güncellemeleri
web_fetch, yalnızca getirme işlemi beş saniye sonra hâlâ beklemedeyse herkese
açık bir ilerleme satırı yayar:
Fetching page content...Hızlı önbellek isabetleri ve hızlı ağ yanıtları zamanlayıcı tetiklenmeden önce tamamlanır, bu nedenle ilerleme satırı göstermezler. Çağrı iptal edilirse zamanlayıcı temizlenir. Getirme işlemi sonunda tamamlandığında agent normal araç sonucunu alır; ilerleme satırı yalnızca kanal UI durumudur ve hiçbir zaman getirilen sayfa içeriğini içermez.
Yapılandırma
{ tools: { web: { fetch: { enabled: true, // default: true provider: "firecrawl", // optional; omit for auto-detect maxChars: 50000, // max output chars maxCharsCap: 50000, // hard cap for maxChars param maxResponseBytes: 2000000, // max download size before truncation timeoutSeconds: 30, cacheTtlMinutes: 15, maxRedirects: 3, useTrustedEnvProxy: false, // let a trusted HTTP(S) env proxy resolve DNS readability: true, // use Readability extraction userAgent: "Mozilla/5.0 ...", // override User-Agent ssrfPolicy: { allowRfc2544BenchmarkRange: true, // opt-in for trusted fake-IP proxies using 198.18.0.0/15 allowIpv6UniqueLocalRange: true, // opt-in for trusted fake-IP proxies using fc00::/7 }, }, }, },}Firecrawl geri dönüşü
Readability çıkarma işlemi başarısız olursa web_fetch, bot engellerini aşma ve
daha iyi çıkarma için Firecrawl kullanarak geri dönebilir:
{ tools: { web: { fetch: { provider: "firecrawl", // optional; omit for auto-detect from available credentials }, }, }, plugins: { entries: { firecrawl: { enabled: true, config: { webFetch: { // apiKey: "fc-...", // optional; omit for keyless starter access baseUrl: "https://api.firecrawl.dev", onlyMainContent: true, maxAgeMs: 86400000, // cache duration (1 day) timeoutSeconds: 60, }, }, }, }, },}plugins.entries.firecrawl.config.webFetch.apiKey isteğe bağlıdır ve SecretRef nesnelerini destekler.
Eski tools.web.fetch.firecrawl.* yapılandırması openclaw doctor --fix tarafından otomatik olarak geçirilir.
Geçerli runtime davranışı:
tools.web.fetch.provider, getirme geri dönüş sağlayıcısını açıkça seçer.provideratlanırsa OpenClaw, yapılandırılmış kimlik bilgilerinden ilk hazır web-fetch sağlayıcısını otomatik algılar. Sandbox dışıweb_fetch,contracts.webFetchProvidersbildiren ve runtime sırasında eşleşen bir sağlayıcı kaydeden yüklü plugin'leri kullanabilir. Resmi Firecrawl plugin'i bu geri dönüşü sağlar.- Sandbox içindeki
web_fetchçağrıları, paketlenmiş sağlayıcılara ek olarak resmi npm veya ClawHub kökeni doğrulanmış yüklü sağlayıcılara izin verir. Bugün bu, resmi Firecrawl plugin'ine izin verir; üçüncü taraf harici getirme plugin'leri hariç tutulur. - Readability devre dışıysa
web_fetchdoğrudan seçili sağlayıcı geri dönüşüne geçer. Kullanılabilir sağlayıcı yoksa kapalı şekilde başarısız olur.
Güvenilen env proxy
Dağıtımınız web_fetch işleminin güvenilen bir giden HTTP(S) proxy üzerinden
geçmesini gerektiriyorsa tools.web.fetch.useTrustedEnvProxy: true ayarlayın.
Bu modda OpenClaw, isteği göndermeden önce ana makine adına dayalı SSRF denetimlerini yine uygular, ancak yerel DNS pinning yapmak yerine proxy'nin DNS çözümlemesine izin verir. Bunu yalnızca proxy operatör denetimindeyse ve DNS çözümlemesinden sonra giden trafik ilkesini uyguluyorsa etkinleştirin.
Sınırlar ve güvenlik
maxChars,tools.web.fetch.maxCharsCapdeğerine sıkıştırılır- Yanıt gövdesi ayrıştırmadan önce
maxResponseBytesile sınırlandırılır; aşırı büyük yanıtlar bir uyarıyla kesilir - Özel/dahili ana makine adları engellenir
tools.web.fetch.ssrfPolicy.allowRfc2544BenchmarkRangevetools.web.fetch.ssrfPolicy.allowIpv6UniqueLocalRange, güvenilen sahte IP proxy yığınları için dar kapsamlı opt-in seçenekleridir; proxy'niz bu sentetik aralıkların sahibi değilse ve kendi hedef ilkesini uygulamıyorsa bunları ayarlamadan bırakın- Yönlendirmeler denetlenir ve
maxRedirectsile sınırlandırılır useTrustedEnvProxyaçık bir opt-in seçeneğidir ve yalnızca DNS çözümlemesinden sonra da giden trafik ilkesini uygulayan, operatör denetimli proxy'ler için etkinleştirilmelidirweb_fetchen iyi çaba temelinde çalışır -- bazı siteler Web Tarayıcısı gerektirir
Araç profilleri
Araç profilleri veya izin listeleri kullanıyorsanız web_fetch ya da group:web
ekleyin:
{ tools: { allow: ["web_fetch"], // or: allow: ["group:web"] (includes web_fetch, web_search, and x_search) },}İlgili
- Web Arama -- web'i birden fazla sağlayıcıyla arayın
- Web Tarayıcısı -- JS ağırlıklı siteler için tam tarayıcı otomasyonu
- Firecrawl -- Firecrawl arama ve kazıma araçları