OpenClaw có thể dùng Firecrawl theo ba cách:Documentation Index
Fetch the complete documentation index at: https://docs.openclaw.ai/llms.txt
Use this file to discover all available pages before exploring further.
- làm provider
web_search - làm công cụ Plugin rõ ràng:
firecrawl_searchvàfirecrawl_scrape - làm trình trích xuất dự phòng cho
web_fetch
Lấy API key
- Tạo tài khoản Firecrawl và tạo API key.
- Lưu trong cấu hình hoặc đặt
FIRECRAWL_API_KEYtrong môi trường Gateway.
Cấu hình tìm kiếm Firecrawl
- Chọn Firecrawl trong quy trình thiết lập ban đầu hoặc
openclaw configure --section websẽ tự động bật Plugin Firecrawl đi kèm. web_searchvới Firecrawl hỗ trợqueryvàcount.- Với các điều khiển riêng của Firecrawl như
sources,categories, hoặc cào dữ liệu kết quả, hãy dùngfirecrawl_search. - Ghi đè
baseUrlphải giữ ởhttps://api.firecrawl.dev. FIRECRAWL_BASE_URLlà env dự phòng dùng chung cho URL cơ sở của tìm kiếm và scrape Firecrawl.
Cấu hình Firecrawl scrape + dự phòng web_fetch
- Các lần thử dự phòng Firecrawl chỉ chạy khi có API key (
plugins.entries.firecrawl.config.webFetch.apiKeyhoặcFIRECRAWL_API_KEY). maxAgeMskiểm soát kết quả được lưu trong bộ nhớ đệm có thể cũ bao lâu (ms). Mặc định là 2 ngày.- Cấu hình cũ
tools.web.fetch.firecrawl.*được tự động di chuyển bởiopenclaw doctor --fix. - Ghi đè URL scrape/cơ sở của Firecrawl bị giới hạn ở
https://api.firecrawl.dev.
firecrawl_scrape dùng lại cùng các thiết lập plugins.entries.firecrawl.config.webFetch.* và env vars.
Công cụ Plugin Firecrawl
firecrawl_search
Dùng mục này khi bạn muốn các điều khiển tìm kiếm riêng của Firecrawl thay vì web_search chung.
Tham số cốt lõi:
querycountsourcescategoriesscrapeResultstimeoutSeconds
firecrawl_scrape
Dùng mục này cho các trang nặng JS hoặc được bảo vệ chống bot, nơi web_fetch thuần hoạt động yếu.
Tham số cốt lõi:
urlextractModemaxCharsonlyMainContentmaxAgeMsproxystoreInCachetimeoutSeconds
Ẩn mình / vượt qua cơ chế chặn bot
Firecrawl cung cấp tham số chế độ proxy để vượt qua cơ chế chặn bot (basic, stealth, hoặc auto).
OpenClaw luôn dùng proxy: "auto" cộng với storeInCache: true cho các yêu cầu Firecrawl.
Nếu bỏ qua proxy, Firecrawl mặc định là auto. auto sẽ thử lại bằng proxy ẩn mình nếu lần thử cơ bản thất bại, điều này có thể dùng nhiều credit hơn
so với scrape chỉ dùng basic.
Cách web_fetch dùng Firecrawl
Thứ tự trích xuất của web_fetch:
- Readability (cục bộ)
- Firecrawl (nếu được chọn hoặc tự động phát hiện là dự phòng web-fetch đang hoạt động)
- Dọn dẹp HTML cơ bản (dự phòng cuối cùng)
tools.web.fetch.provider. Nếu bạn bỏ qua, OpenClaw
sẽ tự động phát hiện provider web-fetch sẵn sàng đầu tiên từ thông tin xác thực hiện có.
Hiện tại provider đi kèm là Firecrawl.
Liên quan
- Tổng quan Web Search — tất cả provider và tự động phát hiện
- Web Fetch — công cụ web_fetch với dự phòng Firecrawl
- Tavily — công cụ tìm kiếm + trích xuất