Tools
Firecrawl
OpenClaw Firecrawl का उपयोग तीन तरीकों से कर सकता है:
web_searchprovider के रूप में- स्पष्ट Plugin tools के रूप में:
firecrawl_searchऔरfirecrawl_scrape web_fetchके लिए फॉलबैक निष्कर्षक के रूप में
यह एक होस्टेड निष्कर्षण/खोज सेवा है जो बॉट परिहार और कैशिंग का समर्थन करती है, जिससे JS-भारी साइटों या उन पेजों में मदद मिलती है जो सादे HTTP fetch को ब्लॉक करते हैं।
Plugin इंस्टॉल करें
आधिकारिक Plugin इंस्टॉल करें, फिर Gateway रीस्टार्ट करें:
openclaw plugins install @openclaw/firecrawl-pluginopenclaw gateway restartकुंजी-रहित web_fetch और API कुंजियां
स्पष्ट रूप से चुना गया होस्टेड Firecrawl web_fetch फॉलबैक API कुंजी के बिना स्टार्टर
एक्सेस का समर्थन करता है। जब आपको उच्च सीमाओं की जरूरत हो, तो gateway वातावरण में
FIRECRAWL_API_KEY जोड़ें या इसे कॉन्फिगर करें। Firecrawl web_search और
firecrawl_scrape के लिए API कुंजी जरूरी है।
Firecrawl खोज कॉन्फिगर करें
{ tools: { web: { search: { provider: "firecrawl", }, }, }, plugins: { entries: { firecrawl: { enabled: true, config: { webSearch: { apiKey: "FIRECRAWL_API_KEY_HERE", baseUrl: "https://api.firecrawl.dev", }, }, }, }, },}नोट्स:
- onboarding में Firecrawl चुनने या
openclaw configure --section webचलाने पर इंस्टॉल किया गया Firecrawl Plugin अपने-आप सक्षम हो जाता है। - Firecrawl के साथ
web_searchqueryऔरcountका समर्थन करता है। sources,categoriesया परिणाम scraping जैसे Firecrawl-विशिष्ट नियंत्रणों के लिएfirecrawl_searchका उपयोग करें।baseUrlका डिफॉल्टhttps://api.firecrawl.devपर होस्टेड Firecrawl है। स्व-होस्टेड ओवरराइड केवल निजी/आंतरिक endpoints के लिए अनुमत हैं; HTTP केवल उन्हीं निजी targets के लिए स्वीकार किया जाता है।FIRECRAWL_BASE_URLFirecrawl खोज और scrape base URLs के लिए साझा env फॉलबैक है।
Firecrawl web_fetch फॉलबैक कॉन्फिगर करें
{ tools: { web: { fetch: { provider: "firecrawl", // explicit selection enables keyless fallback }, }, }, plugins: { entries: { firecrawl: { enabled: true, config: { webFetch: { baseUrl: "https://api.firecrawl.dev", onlyMainContent: true, maxAgeMs: 172800000, timeoutSeconds: 60, }, }, }, }, },}नोट्स:
- स्पष्ट रूप से चुना गया Firecrawl
web_fetchफॉलबैक API कुंजी के बिना काम करता है। कॉन्फिगर होने पर, OpenClaw उच्च सीमाओं के लिएplugins.entries.firecrawl.config.webFetch.apiKeyयाFIRECRAWL_API_KEYभेजता है। - onboarding के दौरान Firecrawl चुनने या
openclaw configure --section webचलाने पर Plugin सक्षम हो जाता है औरweb_fetchके लिए Firecrawl चुना जाता है, जब तक कोई दूसरा fetch provider पहले से कॉन्फिगर न हो। firecrawl_scrapeके लिए API कुंजी जरूरी है।maxAgeMsनियंत्रित करता है कि cached परिणाम कितने पुराने हो सकते हैं (ms)। डिफॉल्ट 2 दिन है।- लेगेसी
tools.web.fetch.firecrawl.*config कोopenclaw doctor --fixअपने-आप migrate करता है। - Firecrawl scrape/base URL ओवरराइड खोज जैसे ही होस्टेड/निजी नियम का पालन करते हैं: सार्वजनिक होस्टेड traffic
https://api.firecrawl.devका उपयोग करता है; स्व-होस्टेड ओवरराइड को निजी/आंतरिक endpoints पर resolve होना चाहिए। firecrawl_scrapeस्पष्ट Firecrawl scrape calls के लिएweb_fetchtarget-safety contract से मेल खाते हुए, स्पष्ट निजी, loopback, metadata और non-HTTP(S) target URLs को Firecrawl पर forward करने से पहले अस्वीकार करता है।
firecrawl_scrape वही plugins.entries.firecrawl.config.webFetch.* settings और env vars दोबारा उपयोग करता है, जिसमें इसकी जरूरी API कुंजी भी शामिल है।
स्व-होस्टेड Firecrawl
जब आप Firecrawl खुद चलाते हैं, तो plugins.entries.firecrawl.config.webSearch.baseUrl,
plugins.entries.firecrawl.config.webFetch.baseUrl या FIRECRAWL_BASE_URL
सेट करें। OpenClaw http:// केवल loopback,
private-network, .local, .internal या .localhost targets के लिए स्वीकार करता है। सार्वजनिक custom
hosts अस्वीकार किए जाते हैं ताकि Firecrawl API कुंजियां गलती से मनमाने endpoints पर न भेजी जाएं।
Firecrawl Plugin tools
firecrawl_search
इसे तब उपयोग करें जब आपको generic web_search के बजाय Firecrawl-विशिष्ट खोज नियंत्रण चाहिए हों।
मुख्य parameters:
querycountsourcescategoriesscrapeResultstimeoutSeconds
firecrawl_scrape
इसे JS-भारी या बॉट-सुरक्षित पेजों के लिए उपयोग करें जहां सादा web_fetch कमजोर पड़ता है।
मुख्य parameters:
urlextractModemaxCharsonlyMainContentmaxAgeMsproxystoreInCachetimeoutSeconds
Stealth / बॉट परिहार
Firecrawl बॉट परिहार के लिए proxy mode parameter उजागर करता है (basic, stealth या auto)।
OpenClaw Firecrawl requests के लिए हमेशा proxy: "auto" और storeInCache: true का उपयोग करता है।
अगर proxy छोड़ा गया है, तो Firecrawl का डिफॉल्ट auto होता है। auto basic प्रयास विफल होने पर stealth proxies के साथ retry करता है, जिससे basic-only scraping की तुलना में
अधिक credits लग सकते हैं।
web_fetch Firecrawl का उपयोग कैसे करता है
web_fetch निष्कर्षण क्रम:
- Readability (स्थानीय)
- Firecrawl (चुने जाने पर, या कॉन्फिगर किए गए credentials से अपने-आप detect होने पर)
- बेसिक HTML cleanup (अंतिम फॉलबैक)
चयन knob tools.web.fetch.provider है। अगर आप इसे छोड़ते हैं, तो OpenClaw
उपलब्ध credentials से पहले तैयार web-fetch provider को अपने-आप detect करता है।
आधिकारिक Firecrawl Plugin वह फॉलबैक प्रदान करता है।
संबंधित
- Web Search अवलोकन -- सभी providers और auto-detection
- Web Fetch -- Firecrawl फॉलबैक वाला web_fetch tool
- Tavily -- खोज + extract tools