Web Fetch
تقوم أداةweb_fetch بتنفيذ طلب HTTP GET عادي واستخراج محتوى قابل للقراءة
(من HTML إلى markdown أو نص). وهي لا تنفّذ JavaScript.
بالنسبة إلى المواقع المعتمدة بكثافة على JS أو الصفحات المحمية بتسجيل الدخول، استخدم
Web Browser بدلًا من ذلك.
بداية سريعة
web_fetch مفعّلة افتراضيًا — ولا تحتاج إلى أي إعداد. يمكن للوكيل
استدعاؤها فورًا:
معلمات الأداة
| المعلمة | النوع | الوصف |
|---|---|---|
url | string | عنوان URL المطلوب جلبه (مطلوب، http/https فقط) |
extractMode | string | "markdown" (الافتراضي) أو "text" |
maxChars | number | اقتطاع المخرجات إلى هذا العدد من الأحرف |
كيف تعمل
الجلب
ترسل طلب HTTP GET باستخدام User-Agent شبيه بـ Chrome وترويسة
Accept-Language. وتحظر أسماء المضيفين الخاصة/الداخلية، وتعيد التحقق من عمليات إعادة التوجيه.الرجوع الاحتياطي (اختياري)
إذا فشل Readability وكان Firecrawl مُعدًا، تعيد المحاولة عبر
API الخاص بـ Firecrawl مع وضع تجاوز حماية الروبوتات.
الإعدادات
الرجوع الاحتياطي عبر Firecrawl
إذا فشل استخراج Readability، يمكن لـweb_fetch الرجوع احتياطيًا إلى
Firecrawl لتجاوز حماية الروبوتات وتحسين الاستخراج:
plugins.entries.firecrawl.config.webFetch.apiKey كائنات SecretRef.
ويتم ترحيل إعدادات tools.web.fetch.firecrawl.* القديمة تلقائيًا بواسطة openclaw doctor --fix.
إذا كان Firecrawl مفعّلًا وكان SecretRef الخاص به غير محلول بدون
رجوع احتياطي عبر متغير البيئة
FIRECRAWL_API_KEY،
فإن بدء تشغيل gateway يفشل بسرعة.يتم تقييد تجاوزات Firecrawl
baseUrl: إذ يجب أن تستخدم https:// و
المضيف الرسمي لـ Firecrawl (api.firecrawl.dev).- يختار
tools.web.fetch.providerمزوّد الرجوع الاحتياطي للجلب بشكل صريح. - إذا تم حذف
provider، يكتشف OpenClaw تلقائيًا أول مزوّد جاهز لجلب الويب من بيانات الاعتماد المتاحة. والمزوّد المضمّن اليوم هو Firecrawl. - إذا تم تعطيل Readability، فإن
web_fetchيتخطى مباشرةً إلى مزوّد الرجوع الاحتياطي المحدد. وإذا لم يكن أي مزوّد متاحًا، فإنه يفشل بشكل مغلق.
الحدود والأمان
- يتم تقييد
maxCharsإلىtools.web.fetch.maxCharsCap - يتم وضع حد أقصى لجسم الاستجابة عند
maxResponseBytesقبل التحليل؛ وتُقتطع الاستجابات كبيرة الحجم مع تحذير - يتم حظر أسماء المضيفين الخاصة/الداخلية
- يتم التحقق من عمليات إعادة التوجيه وتقييدها بواسطة
maxRedirects - تعمل
web_fetchعلى أساس أفضل جهد — إذ تحتاج بعض المواقع إلى Web Browser
ملفات تعريف الأدوات
إذا كنت تستخدم ملفات تعريف الأدوات أو قوائم السماح، فأضفweb_fetch أو group:web:
ذو صلة
- Web Search — ابحث في الويب باستخدام عدة مزوّدين
- Web Browser — أتمتة متصفح كاملة للمواقع المعتمدة بكثافة على JS
- Firecrawl — أدوات البحث والكشط الخاصة بـ Firecrawl