Web Fetch
La herramientaweb_fetch realiza un HTTP GET simple y extrae contenido legible
(HTML a markdown o texto). No ejecuta JavaScript.
Para sitios con mucho JS o páginas protegidas por inicio de sesión, usa el
Web Browser en su lugar.
Inicio rápido
web_fetch está habilitado de forma predeterminada; no se necesita configuración. El agente puede
llamarlo de inmediato:
Parámetros de la herramienta
| Parameter | Type | Description |
|---|---|---|
url | string | URL que se va a obtener (obligatoria, solo http/https) |
extractMode | string | "markdown" (predeterminado) o "text" |
maxChars | number | Trunca la salida a esta cantidad de caracteres |
Cómo funciona
Fetch
Envía un HTTP GET con un User-Agent similar a Chrome y el encabezado
Accept-Language. Bloquea nombres de host privados/internos y vuelve a comprobar los redireccionamientos.Fallback (optional)
Si Readability falla y Firecrawl está configurado, vuelve a intentarlo mediante la
API de Firecrawl con modo de evasión de bots.
Configuración
Alternativa de Firecrawl
Si falla la extracción de Readability,web_fetch puede recurrir a
Firecrawl para evasión de bots y una mejor extracción:
plugins.entries.firecrawl.config.webFetch.apiKey admite objetos SecretRef.
La configuración heredada tools.web.fetch.firecrawl.* se migra automáticamente mediante openclaw doctor --fix.
Si Firecrawl está habilitado y su SecretRef no se resuelve sin
alternativa de variable de entorno
FIRECRAWL_API_KEY, el inicio del gateway falla rápidamente.Las sobrescrituras de
baseUrl de Firecrawl están restringidas: deben usar https:// y
el host oficial de Firecrawl (api.firecrawl.dev).tools.web.fetch.providerselecciona explícitamente el proveedor alternativo de obtención.- Si se omite
provider, OpenClaw detecta automáticamente el primer proveedor de web-fetch listo a partir de las credenciales disponibles. Hoy, el proveedor incluido es Firecrawl. - Si Readability está deshabilitado,
web_fetchomite directamente la alternativa del proveedor seleccionado. Si no hay ningún proveedor disponible, falla de forma segura.
Límites y seguridad
maxCharsse ajusta al límite detools.web.fetch.maxCharsCap- El cuerpo de la respuesta se limita a
maxResponseBytesantes del análisis; las respuestas demasiado grandes se truncan con una advertencia - Los nombres de host privados/internos están bloqueados
- Los redireccionamientos se comprueban y limitan mediante
maxRedirects web_fetches de mejor esfuerzo; algunos sitios necesitan Web Browser
Perfiles de herramientas
Si usas perfiles de herramientas o listas de permitidos, añadeweb_fetch o group:web:
Relacionado
- Web Search — busca en la web con varios proveedores
- Web Browser — automatización completa del navegador para sitios con mucho JS
- Firecrawl — herramientas de búsqueda y scraping de Firecrawl