Lo strumentoDocumentation Index
Fetch the complete documentation index at: https://docs.openclaw.ai/llms.txt
Use this file to discover all available pages before exploring further.
web_fetch esegue un semplice HTTP GET ed estrae contenuto leggibile
(da HTML a markdown o testo). Non esegue JavaScript.
Per siti con uso intensivo di JS o pagine protette da login, usa invece il
Web Browser.
Avvio rapido
web_fetch è abilitato per impostazione predefinita: non serve alcuna configurazione. L’agente può
chiamarlo subito:
Parametri dello strumento
URL da recuperare. Solo
http(s).Formato di output dopo l’estrazione del contenuto principale.
Tronca l’output a questo numero di caratteri.
Come funziona
Fetch
Invia un HTTP GET con uno User-Agent simile a Chrome e un’intestazione
Accept-Language. Blocca hostname privati/interni e ricontrolla i reindirizzamenti.Fallback (optional)
Se Readability non riesce e Firecrawl è configurato, riprova tramite l’API
Firecrawl con modalità di aggiramento dei bot.
Configurazione
Fallback Firecrawl
Se l’estrazione Readability non riesce,web_fetch può passare in fallback a
Firecrawl per l’aggiramento dei bot e una migliore estrazione:
plugins.entries.firecrawl.config.webFetch.apiKey supporta oggetti SecretRef.
La configurazione legacy tools.web.fetch.firecrawl.* viene migrata automaticamente da openclaw doctor --fix.
Se Firecrawl è abilitato e il relativo SecretRef non viene risolto senza un fallback env
FIRECRAWL_API_KEY, l’avvio del gateway fallisce rapidamente.Gli override di
baseUrl di Firecrawl sono vincolati: il traffico hosted usa
https://api.firecrawl.dev; gli override self-hosted devono puntare a endpoint privati o
interni, e http:// è accettato solo per questi target privati.tools.web.fetch.providerseleziona esplicitamente il provider di fallback del recupero.- Se
providerviene omesso, OpenClaw rileva automaticamente il primo provider web-fetch pronto dalle credenziali disponibili.web_fetchnon in sandbox può usare Plugin installati che dichiaranocontracts.webFetchProviderse registrano un provider corrispondente a runtime. Oggi il provider incluso è Firecrawl. - Le chiamate
web_fetchin sandbox restano limitate ai provider inclusi. - Se Readability è disabilitato,
web_fetchpassa direttamente al fallback del provider selezionato. Se non è disponibile alcun provider, fallisce in modo chiuso.
Proxy env attendibile
Se il tuo deployment richiede cheweb_fetch passi attraverso un proxy outbound
HTTP(S) attendibile, imposta tools.web.fetch.useTrustedEnvProxy: true.
In questa modalità, OpenClaw applica comunque i controlli SSRF basati su hostname prima di inviare
la richiesta, ma lascia che sia il proxy a risolvere il DNS invece di effettuare il pinning DNS
locale. Abilitalo solo quando il proxy è controllato dall’operatore e applica
la policy outbound dopo la risoluzione DNS.
Se non è configurata alcuna variabile env proxy HTTP(S), o l’host target è escluso da
NO_PROXY, web_fetch torna al normale percorso rigoroso con pinning DNS
locale.Limiti e sicurezza
maxCharsviene limitato atools.web.fetch.maxCharsCap- Il corpo della risposta è limitato a
maxResponseBytesprima del parsing; le risposte troppo grandi vengono troncate con un avviso - Gli hostname privati/interni vengono bloccati
tools.web.fetch.ssrfPolicy.allowRfc2544BenchmarkRangeetools.web.fetch.ssrfPolicy.allowIpv6UniqueLocalRangesono opt-in limitati per stack di proxy fake-IP attendibili; lasciali non impostati a meno che il tuo proxy possieda quegli intervalli sintetici e applichi la propria policy di destinazione- I reindirizzamenti vengono controllati e limitati da
maxRedirects useTrustedEnvProxyè un opt-in esplicito e deve essere abilitato solo per proxy controllati dall’operatore che applicano comunque la policy outbound dopo la risoluzione DNSweb_fetchè best-effort: alcuni siti richiedono il Web Browser
Profili degli strumenti
Se usi profili degli strumenti o allowlist, aggiungiweb_fetch o group:web:
Correlati
- Web Search: cerca nel web con più provider
- Web Browser: automazione completa del browser per siti con uso intensivo di JS
- Firecrawl: strumenti di ricerca e scraping Firecrawl