Documentation Index
Fetch the complete documentation index at: https://docs.openclaw.ai/llms.txt
Use this file to discover all available pages before exploring further.
web_fetch 工具会执行普通的 HTTP GET,并提取可读内容(将 HTML 转为 Markdown 或文本)。它不会执行 JavaScript。
对于重度依赖 JS 的站点或受登录保护的页面,请改用
Web 浏览器。
快速开始
web_fetch 默认启用,无需配置。智能体可以立即调用它:
工具参数
要获取的 URL。仅支持
http(s)。主内容提取后的输出格式。
将输出截断为指定字符数。
工作原理
配置
Firecrawl 回退
如果 Readability 提取失败,web_fetch 可以回退到
Firecrawl,用于机器人规避和更好的提取:
plugins.entries.firecrawl.config.webFetch.apiKey 支持 SecretRef 对象。旧版 tools.web.fetch.firecrawl.* 配置会由 openclaw doctor --fix 自动迁移。
如果 Firecrawl 已启用,并且其 SecretRef 未解析且没有
FIRECRAWL_API_KEY 环境变量回退,Gateway 网关启动会快速失败。Firecrawl
baseUrl 覆盖会被锁定:托管流量使用 https://api.firecrawl.dev;自托管覆盖必须指向私有或内部端点,并且 http:// 仅对这些私有目标可接受。tools.web.fetch.provider会显式选择获取回退提供商。- 如果省略
provider,OpenClaw 会从可用凭证中自动检测第一个就绪的 Web 获取提供商。非沙箱隔离的web_fetch可以使用已安装的插件,这些插件声明contracts.webFetchProviders并在运行时注册匹配的提供商。目前内置提供商是 Firecrawl。 - 沙箱隔离的
web_fetch调用仍仅限于内置提供商。 - 如果禁用 Readability,
web_fetch会直接跳到选定的提供商回退。如果没有可用提供商,它会以封闭方式失败。
可信环境代理
如果你的部署要求web_fetch 通过可信的出站 HTTP(S) 代理,请设置 tools.web.fetch.useTrustedEnvProxy: true。
在此模式下,OpenClaw 仍会在发送请求前应用基于主机名的 SSRF 检查,但会让代理解析 DNS,而不是执行本地 DNS 固定。仅当该代理由操作方控制,并在 DNS 解析后强制执行出站策略时,才启用此选项。
如果未配置 HTTP(S) 代理环境变量,或目标主机被
NO_PROXY 排除,web_fetch 会回退到带本地 DNS 固定的普通严格路径。限制与安全
maxChars会被限制到tools.web.fetch.maxCharsCap- 响应体在解析前会被限制为
maxResponseBytes;超大响应会被截断并附带警告 - 私有/内部主机名会被阻止
tools.web.fetch.ssrfPolicy.allowRfc2544BenchmarkRange和tools.web.fetch.ssrfPolicy.allowIpv6UniqueLocalRange是面向可信假 IP 代理栈的窄范围选择加入项;除非你的代理拥有这些合成范围并强制执行自己的目标策略,否则请保持未设置- 重定向会被检查,并受
maxRedirects限制 useTrustedEnvProxy是显式选择加入项,只应为由操作方控制、且在 DNS 解析后仍会强制执行出站策略的代理启用web_fetch是尽力而为的工具,有些站点需要使用 Web 浏览器
工具配置文件
如果你使用工具配置文件或允许列表,请添加web_fetch 或 group:web: