La herramientaDocumentation Index
Fetch the complete documentation index at: https://docs.openclaw.ai/llms.txt
Use this file to discover all available pages before exploring further.
web_fetch realiza un HTTP GET simple y extrae contenido legible
(HTML a markdown o texto). No ejecuta JavaScript.
Para sitios con mucho JS o páginas protegidas por inicio de sesión, usa el
Navegador web en su lugar.
Inicio rápido
web_fetch está habilitada de forma predeterminada; no hace falta configuración. El agente puede
llamarla de inmediato:
Parámetros de la herramienta
URL que se va a obtener. Solo
http(s).Formato de salida después de la extracción del contenido principal.
Trunca la salida a esta cantidad de caracteres.
Cómo funciona
Obtener
Envía un HTTP GET con un User-Agent similar al de Chrome y un encabezado
Accept-Language. Bloquea nombres de host privados/internos y vuelve a comprobar las redirecciones.Reserva (opcional)
Si Readability falla y Firecrawl está configurado, vuelve a intentarlo mediante la
API de Firecrawl con modo de elusión de bots.
Configuración
Reserva con Firecrawl
Si la extracción de Readability falla,web_fetch puede recurrir a
Firecrawl para elusión de bots y una mejor extracción:
plugins.entries.firecrawl.config.webFetch.apiKey admite objetos SecretRef.
La configuración heredada tools.web.fetch.firecrawl.* se migra automáticamente mediante openclaw doctor --fix.
Si Firecrawl está habilitado y su SecretRef no se resuelve sin una alternativa de entorno
FIRECRAWL_API_KEY, el inicio de Gateway falla rápidamente.Las sobrescrituras de
baseUrl de Firecrawl están restringidas: el tráfico alojado usa
https://api.firecrawl.dev; las sobrescrituras autoalojadas deben apuntar a endpoints privados o
internos, y http:// se acepta solo para esos destinos privados.tools.web.fetch.providerselecciona explícitamente el proveedor de reserva de obtención.- Si se omite
provider, OpenClaw detecta automáticamente el primer proveedor de web-fetch listo a partir de las credenciales disponibles.web_fetchno aislado puede usar plugins instalados que declarencontracts.webFetchProvidersy registren un proveedor coincidente en tiempo de ejecución. Hoy, el proveedor incluido es Firecrawl. - Las llamadas de
web_fetchaisladas permanecen limitadas a los proveedores incluidos. - Si Readability está deshabilitado,
web_fetchpasa directamente a la reserva del proveedor seleccionado. Si no hay ningún proveedor disponible, falla de forma cerrada.
Proxy de entorno confiable
Si tu despliegue requiere queweb_fetch pase por un proxy HTTP(S) saliente
confiable, configura tools.web.fetch.useTrustedEnvProxy: true.
En este modo, OpenClaw sigue aplicando comprobaciones SSRF basadas en el nombre de host antes de enviar
la solicitud, pero permite que el proxy resuelva DNS en lugar de hacer fijación de DNS
local. Habilita esto solo cuando el proxy esté controlado por el operador y haga cumplir
la política saliente después de la resolución de DNS.
Si no hay ninguna variable de entorno de proxy HTTP(S) configurada, o el host de destino está excluido por
NO_PROXY, web_fetch vuelve a la ruta estricta normal con fijación de DNS
local.Límites y seguridad
maxCharsse limita atools.web.fetch.maxCharsCap- El cuerpo de la respuesta se limita a
maxResponseBytesantes del análisis; las respuestas sobredimensionadas se truncan con una advertencia - Los nombres de host privados/internos se bloquean
tools.web.fetch.ssrfPolicy.allowRfc2544BenchmarkRangeytools.web.fetch.ssrfPolicy.allowIpv6UniqueLocalRangeson permisos explícitos restringidos para pilas de proxy de IP falsa confiables; déjalos sin configurar salvo que tu proxy sea propietario de esos rangos sintéticos y haga cumplir su propia política de destino- Las redirecciones se comprueban y se limitan mediante
maxRedirects useTrustedEnvProxyes un permiso explícito y solo debe habilitarse para proxies controlados por el operador que sigan haciendo cumplir la política saliente después de la resolución de DNSweb_fetchfunciona en modalidad de mejor esfuerzo; algunos sitios necesitan el Navegador web
Perfiles de herramientas
Si usas perfiles de herramientas o listas de permitidos, añadeweb_fetch o group:web:
Relacionado
- Búsqueda web — busca en la web con varios proveedores
- Navegador web — automatización completa del navegador para sitios con mucho JS
- Firecrawl — herramientas de búsqueda y extracción de Firecrawl