เครื่องมือDocumentation Index
Fetch the complete documentation index at: https://docs.openclaw.ai/llms.txt
Use this file to discover all available pages before exploring further.
web_fetch ทำ HTTP GET แบบธรรมดาและดึงเนื้อหาที่อ่านได้
(HTML เป็น markdown หรือข้อความ) เครื่องมือนี้ ไม่ เรียกใช้ JavaScript.
สำหรับเว็บไซต์ที่ใช้ JS หนักหรือหน้าที่ป้องกันด้วยการเข้าสู่ระบบ ให้ใช้
เว็บเบราว์เซอร์ แทน
เริ่มต้นอย่างรวดเร็ว
web_fetch เปิดใช้งานตามค่าเริ่มต้น — ไม่ต้องกำหนดค่า Agent สามารถ
เรียกใช้ได้ทันที:
พารามิเตอร์ของเครื่องมือ
URL ที่จะดึงข้อมูล รองรับเฉพาะ
http(s) เท่านั้นรูปแบบเอาต์พุตหลังจากดึงเนื้อหาหลักแล้ว
ตัดเอาต์พุตให้เหลือจำนวนอักขระเท่านี้
วิธีการทำงาน
Fetch
ส่ง HTTP GET พร้อม User-Agent ที่คล้าย Chrome และส่วนหัว
Accept-Language
บล็อกชื่อโฮสต์ส่วนตัว/ภายในและตรวจสอบการเปลี่ยนเส้นทางซ้ำFallback (optional)
หาก Readability ล้มเหลวและมีการกำหนดค่า Firecrawl ไว้ จะลองใหม่ผ่าน
Firecrawl API ด้วยโหมดหลบเลี่ยงบอต
การกำหนดค่า
Firecrawl สำรอง
หากการดึงข้อมูลด้วย Readability ล้มเหลวweb_fetch สามารถสำรองไปใช้
Firecrawl เพื่อหลบเลี่ยงบอตและดึงข้อมูลได้ดีขึ้น:
plugins.entries.firecrawl.config.webFetch.apiKey รองรับออบเจ็กต์ SecretRef
การกำหนดค่าเดิม tools.web.fetch.firecrawl.* จะถูกย้ายโดยอัตโนมัติด้วย openclaw doctor --fix
หากเปิดใช้งาน Firecrawl และ SecretRef ของมันยัง resolve ไม่ได้โดยไม่มี
FIRECRAWL_API_KEY env สำรอง การเริ่มต้น Gateway จะล้มเหลวทันทีการ override
baseUrl ของ Firecrawl ถูกจำกัดอย่างเข้มงวด: ทราฟฟิกที่โฮสต์จะใช้
https://api.firecrawl.dev; การ override แบบ self-hosted ต้องชี้ไปยัง endpoint
ส่วนตัวหรือภายใน และ http:// จะยอมรับเฉพาะสำหรับเป้าหมายส่วนตัวเหล่านั้นtools.web.fetch.providerเลือกผู้ให้บริการสำรองสำหรับการดึงข้อมูลอย่างชัดเจน- หากละ
providerไว้ OpenClaw จะตรวจหา provider สำหรับ web-fetch ตัวแรกที่พร้อมใช้งาน จากข้อมูลรับรองที่มีโดยอัตโนมัติweb_fetchที่ไม่อยู่ใน sandbox สามารถใช้ plugins ที่ติดตั้งไว้ซึ่งประกาศcontracts.webFetchProvidersและลงทะเบียน provider ที่ตรงกันใน runtime ได้ ปัจจุบัน provider ที่รวมมาให้คือ Firecrawl - การเรียก
web_fetchแบบ sandboxed ยังคงจำกัดไว้เฉพาะ provider ที่รวมมาให้ - หากปิดใช้งาน Readability
web_fetchจะข้ามตรงไปยัง provider สำรองที่เลือกไว้ หากไม่มี provider ที่พร้อมใช้งาน จะล้มเหลวแบบปิด
พร็อกซี env ที่เชื่อถือได้
หาก deployment ของคุณต้องให้web_fetch ผ่านพร็อกซีขาออก
HTTP(S) ที่เชื่อถือได้ ให้ตั้งค่า tools.web.fetch.useTrustedEnvProxy: true
ในโหมดนี้ OpenClaw ยังคงใช้การตรวจ SSRF ตามชื่อโฮสต์ก่อนส่งคำขอ
แต่จะให้พร็อกซี resolve DNS แทนการทำ DNS pinning ภายในเครื่อง
เปิดใช้สิ่งนี้เฉพาะเมื่อพร็อกซีถูกควบคุมโดยผู้ปฏิบัติการและบังคับใช้นโยบาย
ขาออกหลังจากการ resolve DNS แล้วเท่านั้น
หากไม่ได้กำหนดค่าตัวแปร env สำหรับพร็อกซี HTTP(S) หรือโฮสต์เป้าหมายถูกยกเว้นโดย
NO_PROXY web_fetch จะย้อนกลับไปใช้เส้นทางเข้มงวดปกติพร้อม DNS pinning ภายในเครื่องขีดจำกัดและความปลอดภัย
maxCharsถูกจำกัดไม่ให้เกินtools.web.fetch.maxCharsCap- เนื้อหาการตอบกลับถูกจำกัดที่
maxResponseBytesก่อน parsing; การตอบกลับที่ใหญ่เกินไป จะถูกตัดพร้อมคำเตือน - ชื่อโฮสต์ส่วนตัว/ภายในถูกบล็อก
tools.web.fetch.ssrfPolicy.allowRfc2544BenchmarkRangeและtools.web.fetch.ssrfPolicy.allowIpv6UniqueLocalRangeเป็นการ opt-in แบบจำกัด สำหรับสแต็กพร็อกซี fake-IP ที่เชื่อถือได้; อย่าตั้งค่าเว้นแต่พร็อกซีของคุณเป็นเจ้าของ ช่วงสังเคราะห์เหล่านั้นและบังคับใช้นโยบายปลายทางของตัวเอง- การเปลี่ยนเส้นทางจะถูกตรวจสอบและจำกัดด้วย
maxRedirects useTrustedEnvProxyเป็นการ opt-in ที่ชัดเจน และควรเปิดใช้เฉพาะกับ พร็อกซีที่ถูกควบคุมโดยผู้ปฏิบัติการซึ่งยังคงบังคับใช้นโยบายขาออกหลังจาก การ resolve DNSweb_fetchเป็นแบบ best-effort — บางเว็บไซต์ต้องใช้ เว็บเบราว์เซอร์
โปรไฟล์เครื่องมือ
หากคุณใช้โปรไฟล์เครื่องมือหรือ allowlists ให้เพิ่มweb_fetch หรือ group:web:
ที่เกี่ยวข้อง
- การค้นหาเว็บ — ค้นหาเว็บด้วย provider หลายตัว
- เว็บเบราว์เซอร์ — ระบบอัตโนมัติของเบราว์เซอร์เต็มรูปแบบสำหรับเว็บไซต์ที่ใช้ JS หนัก
- Firecrawl — เครื่องมือค้นหาและ scrape ของ Firecrawl