OpenClaw dapat menggunakan Firecrawl dalam tiga cara:Documentation Index
Fetch the complete documentation index at: https://docs.openclaw.ai/llms.txt
Use this file to discover all available pages before exploring further.
- sebagai penyedia
web_search - sebagai alat Plugin eksplisit:
firecrawl_searchdanfirecrawl_scrape - sebagai ekstraktor fallback untuk
web_fetch
Dapatkan API key
- Buat akun Firecrawl dan hasilkan API key.
- Simpan di konfigurasi atau setel
FIRECRAWL_API_KEYdi lingkungan gateway.
Konfigurasi pencarian Firecrawl
- Memilih Firecrawl saat onboarding atau
openclaw configure --section webmengaktifkan Plugin Firecrawl bawaan secara otomatis. web_searchdengan Firecrawl mendukungquerydancount.- Untuk kontrol khusus Firecrawl seperti
sources,categories, atau scraping hasil, gunakanfirecrawl_search. baseUrldefault ke Firecrawl terhosting dihttps://api.firecrawl.dev. Override yang dihosting sendiri hanya diizinkan untuk endpoint privat/internal; HTTP hanya diterima untuk target privat tersebut.FIRECRAWL_BASE_URLadalah fallback env bersama untuk URL dasar pencarian dan scrape Firecrawl.
Konfigurasi scrape Firecrawl + fallback web_fetch
- Upaya fallback Firecrawl hanya berjalan ketika API key tersedia (
plugins.entries.firecrawl.config.webFetch.apiKeyatauFIRECRAWL_API_KEY). maxAgeMsmengontrol seberapa lama hasil cache dapat digunakan (ms). Default-nya adalah 2 hari.- Konfigurasi lama
tools.web.fetch.firecrawl.*dimigrasikan otomatis olehopenclaw doctor --fix. - Override URL scrape/dasar Firecrawl mengikuti aturan terhosting/privat yang sama seperti pencarian: lalu lintas terhosting publik menggunakan
https://api.firecrawl.dev; override yang dihosting sendiri harus resolve ke endpoint privat/internal. firecrawl_scrapemenolak URL target privat, loopback, metadata, dan non-HTTP(S) yang jelas sebelum meneruskannya ke Firecrawl, sesuai dengan kontrak keamanan targetweb_fetchuntuk panggilan scrape Firecrawl eksplisit.
firecrawl_scrape menggunakan kembali pengaturan plugins.entries.firecrawl.config.webFetch.* dan env var yang sama.
Firecrawl yang dihosting sendiri
Setelplugins.entries.firecrawl.config.webSearch.baseUrl,
plugins.entries.firecrawl.config.webFetch.baseUrl, atau FIRECRAWL_BASE_URL
ketika Anda menjalankan Firecrawl sendiri. OpenClaw menerima http:// hanya untuk target loopback,
jaringan privat, .local, .internal, atau .localhost. Host kustom publik
ditolak agar API key Firecrawl tidak terkirim ke endpoint sembarang secara
tidak sengaja.
Alat Plugin Firecrawl
firecrawl_search
Gunakan ini ketika Anda menginginkan kontrol pencarian khusus Firecrawl, bukan web_search generik.
Parameter inti:
querycountsourcescategoriesscrapeResultstimeoutSeconds
firecrawl_scrape
Gunakan ini untuk halaman berat JS atau dilindungi bot ketika web_fetch biasa kurang memadai.
Parameter inti:
urlextractModemaxCharsonlyMainContentmaxAgeMsproxystoreInCachetimeoutSeconds
Stealth / pengelakan bot
Firecrawl mengekspos parameter mode proxy untuk pengelakan bot (basic, stealth, atau auto).
OpenClaw selalu menggunakan proxy: "auto" plus storeInCache: true untuk permintaan Firecrawl.
Jika proxy dihilangkan, Firecrawl default ke auto. auto mencoba ulang dengan proxy stealth jika upaya dasar gagal, yang dapat menggunakan lebih banyak kredit
daripada scraping basic-only.
Bagaimana web_fetch menggunakan Firecrawl
Urutan ekstraksi web_fetch:
- Readability (lokal)
- Firecrawl (jika dipilih atau terdeteksi otomatis sebagai fallback web-fetch aktif)
- Pembersihan HTML dasar (fallback terakhir)
tools.web.fetch.provider. Jika Anda menghilangkannya, OpenClaw
mendeteksi otomatis penyedia web-fetch pertama yang siap dari kredensial yang tersedia.
Saat ini penyedia bawaan adalah Firecrawl.
Terkait
- Ikhtisar Web Search — semua penyedia dan deteksi otomatis
- Web Fetch — alat web_fetch dengan fallback Firecrawl
- Tavily — alat pencarian + ekstraksi