Firecrawl
OpenClaw 可以通过三种方式使用 Firecrawl:- 作为
web_search提供商 - 作为显式插件工具:
firecrawl_search和firecrawl_scrape - 作为
web_fetch的回退提取器
获取 API 密钥
- 创建一个 Firecrawl 账户并生成 API 密钥。
- 将其存储在配置中,或在 gateway 环境中设置
FIRECRAWL_API_KEY。
配置 Firecrawl 搜索
- 在新手引导中选择 Firecrawl,或运行
openclaw configure --section web选择它时,会自动启用内置 Firecrawl 插件。 - 搭配 Firecrawl 的
web_search支持query和count。 - 如需 Firecrawl 专属控制项,例如
sources、categories或结果抓取,请使用firecrawl_search。 baseUrl覆盖值必须保持为https://api.firecrawl.dev。FIRECRAWL_BASE_URL是 Firecrawl 搜索和抓取 base URL 的共享环境变量回退值。
配置 Firecrawl 抓取 + web_fetch 回退
- 只有在 API 密钥可用时(
plugins.entries.firecrawl.config.webFetch.apiKey或FIRECRAWL_API_KEY),才会尝试 Firecrawl 回退。 maxAgeMs控制缓存结果允许的最大陈旧时间(毫秒)。默认值为 2 天。- 旧版
tools.web.fetch.firecrawl.*配置会由openclaw doctor --fix自动迁移。 - Firecrawl 抓取/base URL 覆盖值仅限于
https://api.firecrawl.dev。
firecrawl_scrape 会复用相同的 plugins.entries.firecrawl.config.webFetch.* 设置和环境变量。
Firecrawl 插件工具
firecrawl_search
当你希望使用 Firecrawl 专属搜索控制,而不是通用 web_search 时,请使用此工具。
核心参数:
querycountsourcescategoriesscrapeResultstimeoutSeconds
firecrawl_scrape
对于 JS 较重或受机器人防护的页面,而普通 web_fetch 效果较弱时,请使用此工具。
核心参数:
urlextractModemaxCharsonlyMainContentmaxAgeMsproxystoreInCachetimeoutSeconds
隐身 / 机器人绕过
Firecrawl 提供了一个用于绕过机器人的代理模式参数(basic、stealth 或 auto)。
OpenClaw 对 Firecrawl 请求始终使用 proxy: "auto" 加 storeInCache: true。
如果省略 proxy,Firecrawl 默认使用 auto。auto 会在基础尝试失败时使用 stealth 代理重试,这可能比仅使用 basic 抓取
消耗更多额度。
web_fetch 如何使用 Firecrawl
web_fetch 的提取顺序:
- Readability(本地)
- Firecrawl(如果已选择,或被自动检测为当前活跃的 web-fetch 回退)
- 基础 HTML 清理(最后的回退)
tools.web.fetch.provider。如果你省略它,OpenClaw
会从可用凭证中自动检测第一个已就绪的 web-fetch 提供商。
当前内置提供商是 Firecrawl。
相关内容
- Web Search 概览 — 所有提供商和自动检测
- Web Fetch — 带 Firecrawl 回退的
web_fetch工具 - Tavily — 搜索 + 提取工具