تُجري أداةDocumentation Index
Fetch the complete documentation index at: https://docs.openclaw.ai/llms.txt
Use this file to discover all available pages before exploring further.
web_fetch طلب HTTP GET عاديًا وتستخرج المحتوى المقروء
(من HTML إلى Markdown أو نص). وهي لا تنفّذ JavaScript.
للمواقع المعتمدة بكثافة على JS أو الصفحات المحمية بتسجيل الدخول، استخدم
متصفح الويب بدلًا منها.
البدء السريع
تكونweb_fetch مفعّلة افتراضيًا — لا حاجة إلى أي إعداد. يمكن للوكيل
استدعاؤها فورًا:
معاملات الأداة
عنوان URL المطلوب جلبه.
http(s) فقط.تنسيق الإخراج بعد استخراج المحتوى الرئيسي.
اقتطاع الإخراج إلى هذا العدد من الأحرف.
كيف تعمل
الجلب
ترسل طلب HTTP GET مع User-Agent شبيه بـ Chrome وترويسة
Accept-Language.
تحظر أسماء المضيفين الخاصة/الداخلية وتعيد فحص عمليات إعادة التوجيه.الخيار الاحتياطي (اختياري)
إذا فشل Readability وكان Firecrawl مضبوطًا، تعيد المحاولة عبر
Firecrawl API مع وضع تجاوز البوتات.
الإعداد
الخيار الاحتياطي Firecrawl
إذا فشل استخراج Readability، يمكن لـweb_fetch الرجوع إلى
Firecrawl لتجاوز البوتات وتحسين الاستخراج:
plugins.entries.firecrawl.config.webFetch.apiKey كائنات SecretRef.
تُرحَّل إعدادات tools.web.fetch.firecrawl.* القديمة تلقائيًا بواسطة openclaw doctor --fix.
إذا كان Firecrawl مفعّلًا وكان SecretRef الخاص به غير محلول من دون خيار احتياطي
عبر متغير البيئة
FIRECRAWL_API_KEY، يفشل بدء تشغيل Gateway سريعًا.تكون تجاوزات
baseUrl في Firecrawl مقيدة بإحكام: تستخدم الحركة المستضافة
https://api.firecrawl.dev؛ ويجب أن تستهدف التجاوزات ذاتية الاستضافة نقاط نهاية خاصة أو
داخلية، ولا يُقبل http:// إلا لتلك الأهداف الخاصة.- يحدد
tools.web.fetch.providerموفر خيار الجلب الاحتياطي صراحةً. - إذا حُذف
provider، يكتشف OpenClaw تلقائيًا أول موفر web-fetch جاهز من بيانات الاعتماد المتاحة. يمكن لـweb_fetchغير المعزول استخدام Plugins المثبتة التي تعلنcontracts.webFetchProvidersوتُسجّل موفرًا مطابقًا في وقت التشغيل. حاليًا الموفر المضمّن هو Firecrawl. - تبقى استدعاءات
web_fetchالمعزولة مقتصرة على الموفرين المضمّنين. - إذا كان Readability معطلًا، يتخطى
web_fetchمباشرةً إلى الخيار الاحتياطي للموفر المحدد. إذا لم يتوفر أي موفر، فإنه يفشل بشكل مغلق.
وكيل البيئة الموثوق
إذا كان النشر لديك يتطلب مرورweb_fetch عبر وكيل HTTP(S) صادر
موثوق، فاضبط tools.web.fetch.useTrustedEnvProxy: true.
في هذا الوضع، يظل OpenClaw يطبّق فحوصات SSRF المستندة إلى اسم المضيف قبل إرسال
الطلب، لكنه يتيح للوكيل حل DNS بدلًا من إجراء تثبيت DNS محلي.
فعّل ذلك فقط عندما يكون الوكيل خاضعًا لتحكم المشغّل ويفرض
سياسة الصادر بعد حل DNS.
إذا لم يكن أي متغير بيئة لوكيل HTTP(S) مضبوطًا، أو كان المضيف الهدف مستثنى بواسطة
NO_PROXY، يعود web_fetch إلى المسار الصارم العادي مع تثبيت DNS
محلي.الحدود والسلامة
- يُقيّد
maxCharsإلىtools.web.fetch.maxCharsCap - يُحدّ جسم الاستجابة عند
maxResponseBytesقبل التحليل؛ وتُقتطع الاستجابات كبيرة الحجم مع تحذير - تُحظر أسماء المضيفين الخاصة/الداخلية
- يُعد
tools.web.fetch.ssrfPolicy.allowRfc2544BenchmarkRangeوtools.web.fetch.ssrfPolicy.allowIpv6UniqueLocalRangeتفعيلين اختياريين ضيقين لمكدسات وكلاء fake-IP الموثوقة؛ اتركهما غير مضبوطين ما لم يكن وكيلك يمتلك تلك النطاقات الاصطناعية ويفرض سياسة وجهته الخاصة - تُفحص عمليات إعادة التوجيه وتُحد بواسطة
maxRedirects - يُعد
useTrustedEnvProxyتفعيلًا اختياريًا صريحًا ويجب ألا يُمكّن إلا للوكلاء الخاضعين لتحكم المشغّل الذين لا يزالون يفرضون سياسة الصادر بعد حل DNS web_fetchجهدها الأفضل — بعض المواقع تحتاج إلى متصفح الويب
ملفات تعريف الأدوات
إذا كنت تستخدم ملفات تعريف الأدوات أو قوائم السماح، فأضفweb_fetch أو group:web:
ذات صلة
- بحث الويب — ابحث في الويب باستخدام موفرين متعددين
- متصفح الويب — أتمتة متصفح كاملة للمواقع المعتمدة بكثافة على JS
- Firecrawl — أدوات البحث والكشط من Firecrawl