Công cụDocumentation Index
Fetch the complete documentation index at: https://docs.openclaw.ai/llms.txt
Use this file to discover all available pages before exploring further.
web_fetch thực hiện HTTP GET thuần túy và trích xuất nội dung dễ đọc
(HTML sang markdown hoặc văn bản). Công cụ này không thực thi JavaScript.
Đối với các trang dùng nhiều JS hoặc trang được bảo vệ bằng đăng nhập, hãy dùng
Web Browser thay thế.
Bắt đầu nhanh
web_fetch được bật theo mặc định — không cần cấu hình. Agent có thể
gọi ngay:
Tham số công cụ
URL cần tìm nạp. Chỉ hỗ trợ
http(s).Định dạng đầu ra sau khi trích xuất nội dung chính.
Cắt ngắn đầu ra xuống số ký tự này.
Cách hoạt động
Fetch
Gửi HTTP GET với User-Agent giống Chrome và header
Accept-Language.
Chặn tên máy chủ riêng tư/nội bộ và kiểm tra lại chuyển hướng.Fallback (optional)
Nếu Readability thất bại và Firecrawl đã được cấu hình, thử lại thông qua
API Firecrawl với chế độ vượt qua bot.
Cấu hình
Dự phòng Firecrawl
Nếu trích xuất Readability thất bại,web_fetch có thể chuyển sang
Firecrawl để vượt qua bot và trích xuất tốt hơn:
plugins.entries.firecrawl.config.webFetch.apiKey hỗ trợ các đối tượng SecretRef.
Cấu hình tools.web.fetch.firecrawl.* cũ được openclaw doctor --fix tự động di chuyển.
Nếu Firecrawl được bật và SecretRef của nó chưa được phân giải mà không có
phương án dự phòng env
FIRECRAWL_API_KEY, quá trình khởi động Gateway sẽ thất bại nhanh.Ghi đè
baseUrl của Firecrawl được khóa chặt: lưu lượng được lưu trữ dùng
https://api.firecrawl.dev; ghi đè tự lưu trữ phải nhắm tới endpoint riêng tư hoặc
nội bộ, và http:// chỉ được chấp nhận cho các đích riêng tư đó.tools.web.fetch.providerchọn rõ ràng nhà cung cấp dự phòng cho việc tìm nạp.- Nếu bỏ qua
provider, OpenClaw tự động phát hiện nhà cung cấp web-fetch sẵn sàng đầu tiên từ các thông tin xác thực khả dụng.web_fetchkhông sandbox có thể dùng các Plugin đã cài đặt khai báocontracts.webFetchProvidersvà đăng ký một nhà cung cấp khớp tại runtime. Hiện nay nhà cung cấp đi kèm là Firecrawl. - Các lệnh gọi
web_fetchtrong sandbox vẫn chỉ giới hạn ở các nhà cung cấp đi kèm. - Nếu Readability bị tắt,
web_fetchbỏ qua thẳng tới phương án dự phòng của nhà cung cấp đã chọn. Nếu không có nhà cung cấp nào khả dụng, nó thất bại đóng.
Proxy env tin cậy
Nếu triển khai của bạn yêu cầuweb_fetch đi qua một proxy HTTP(S) outbound
tin cậy, hãy đặt tools.web.fetch.useTrustedEnvProxy: true.
Ở chế độ này, OpenClaw vẫn áp dụng kiểm tra SSRF dựa trên tên máy chủ trước khi gửi
yêu cầu, nhưng cho phép proxy phân giải DNS thay vì ghim DNS cục bộ.
Chỉ bật tùy chọn này khi proxy do operator kiểm soát và thực thi
chính sách outbound sau khi phân giải DNS.
Nếu không có biến env proxy HTTP(S) nào được cấu hình, hoặc máy chủ đích bị loại trừ bởi
NO_PROXY, web_fetch sẽ quay về đường dẫn nghiêm ngặt thông thường với ghim DNS
cục bộ.Giới hạn và an toàn
maxCharsbị giới hạn theotools.web.fetch.maxCharsCap- Nội dung phản hồi bị giới hạn ở
maxResponseBytestrước khi phân tích; phản hồi quá lớn sẽ bị cắt ngắn kèm cảnh báo - Tên máy chủ riêng tư/nội bộ bị chặn
tools.web.fetch.ssrfPolicy.allowRfc2544BenchmarkRangevàtools.web.fetch.ssrfPolicy.allowIpv6UniqueLocalRangelà các tùy chọn tham gia hẹp cho các ngăn xếp proxy IP giả tin cậy; hãy để chúng chưa đặt trừ khi proxy của bạn sở hữu các dải tổng hợp đó và thực thi chính sách đích riêng của nó- Chuyển hướng được kiểm tra và giới hạn bởi
maxRedirects useTrustedEnvProxylà tùy chọn tham gia rõ ràng và chỉ nên được bật cho các proxy do operator kiểm soát vẫn thực thi chính sách outbound sau khi phân giải DNSweb_fetchhoạt động theo nỗ lực tối đa — một số trang cần Web Browser
Hồ sơ công cụ
Nếu bạn dùng hồ sơ công cụ hoặc allowlist, hãy thêmweb_fetch hoặc group:web:
Liên quan
- Web Search — tìm kiếm web bằng nhiều nhà cung cấp
- Web Browser — tự động hóa trình duyệt đầy đủ cho các trang dùng nhiều JS
- Firecrawl — công cụ tìm kiếm và scrape của Firecrawl