Firecrawl
يمكن لـ OpenClaw استخدام Firecrawl بثلاث طرق:- كموفّر
web_search - كأدوات plugin صريحة:
firecrawl_searchوfirecrawl_scrape - كأداة استخراج بديلة لـ
web_fetch
الحصول على مفتاح API
- أنشئ حساب Firecrawl وأنشئ مفتاح API.
- خزّنه في التهيئة أو عيّن
FIRECRAWL_API_KEYفي بيئة gateway.
تهيئة بحث Firecrawl
- يؤدي اختيار Firecrawl أثناء الإعداد الأولي أو عبر
openclaw configure --section webإلى تمكين plugin Firecrawl المضمّن تلقائيًا. - يدعم
web_searchمع Firecrawl كلًا منqueryوcount. - لاستخدام عناصر تحكم خاصة بـ Firecrawl مثل
sourcesأوcategoriesأو استخراج النتائج، استخدمfirecrawl_search. - يجب أن تبقى أي تجاوزات لـ
baseUrlعلىhttps://api.firecrawl.dev. - يُعد
FIRECRAWL_BASE_URLخيار env الاحتياطي المشترك لعناوين Firecrawl الأساسية للبحث والاستخراج.
تهيئة Firecrawl scrape + بديل web_fetch
- لا تُجرى محاولات البديل Firecrawl إلا عند توفر مفتاح API (
plugins.entries.firecrawl.config.webFetch.apiKeyأوFIRECRAWL_API_KEY). - يتحكم
maxAgeMsفي عمر النتائج المخزنة مؤقتًا المسموح به (بالملي ثانية). الافتراضي هو يومان. - تُرحَّل تلقائيًا تهيئة
tools.web.fetch.firecrawl.*القديمة بواسطةopenclaw doctor --fix. - تقتصر تجاوزات Firecrawl scrape/base URL على
https://api.firecrawl.dev.
firecrawl_scrape استخدام إعدادات ومتغيرات env نفسها الخاصة بـ plugins.entries.firecrawl.config.webFetch.*.
أدوات plugin Firecrawl
firecrawl_search
استخدم هذا عندما تريد عناصر تحكم في البحث خاصة بـ Firecrawl بدلًا من web_search العام.
المعلمات الأساسية:
querycountsourcescategoriesscrapeResultstimeoutSeconds
firecrawl_scrape
استخدم هذا للصفحات الثقيلة بـ JavaScript أو المحمية ضد الروبوتات عندما يكون web_fetch العادي ضعيفًا.
المعلمات الأساسية:
urlextractModemaxCharsonlyMainContentmaxAgeMsproxystoreInCachetimeoutSeconds
Stealth / تجاوز آليات مكافحة الروبوتات
يوفر Firecrawl معلمة proxy mode لتجاوز آليات مكافحة الروبوتات (basic أو stealth أو auto).
يستخدم OpenClaw دائمًا proxy: "auto" بالإضافة إلى storeInCache: true لطلبات Firecrawl.
إذا لم يتم تحديد proxy، فسيستخدم Firecrawl الوضع الافتراضي auto. يقوم auto بإعادة المحاولة باستخدام وسطاء stealth إذا فشلت محاولة أساسية، وقد يستهلك ذلك أرصدة أكثر
من الاستخراج الأساسي فقط.
كيف يستخدم web_fetch Firecrawl
ترتيب استخراج web_fetch:
- Readability (محلي)
- Firecrawl (إذا تم اختياره أو اكتشافه تلقائيًا باعتباره بديل web-fetch النشط)
- تنظيف HTML أساسي (البديل الأخير)
tools.web.fetch.provider. إذا لم تحدده، فسيقوم OpenClaw
باكتشاف أول موفّر web-fetch جاهز تلقائيًا من بيانات الاعتماد المتاحة.
اليوم، الموفّر المضمّن هو Firecrawl.
ذو صلة
- نظرة عامة على Web Search — جميع الموفّرين والكشف التلقائي
- Web Fetch — أداة
web_fetchمع بديل Firecrawl - Tavily — أدوات البحث + الاستخراج