Tools
Firecrawl
OpenClaw може використовувати Firecrawl трьома способами:
- як провайдера
web_search - як явні інструменти Plugin:
firecrawl_searchіfirecrawl_scrape - як резервний екстрактор для
web_fetch
Це розміщений сервіс витягування даних і пошуку, який підтримує обхід бот-захисту та кешування, що допомагає із сайтами з великою кількістю JS або сторінками, які блокують звичайні HTTP-запити.
Установлення Plugin
Установіть офіційний Plugin, а потім перезапустіть Gateway:
openclaw plugins install @openclaw/firecrawl-pluginopenclaw gateway restartweb_fetch без ключа й API-ключі
Явно вибраний резервний розміщений Firecrawl для web_fetch підтримує стартовий
доступ без API-ключа. Додайте FIRECRAWL_API_KEY у середовище gateway
або налаштуйте його, коли потрібні вищі ліміти. Firecrawl web_search і
firecrawl_scrape потребують API-ключа.
Налаштування пошуку Firecrawl
{ tools: { web: { search: { provider: "firecrawl", }, }, }, plugins: { entries: { firecrawl: { enabled: true, config: { webSearch: { apiKey: "FIRECRAWL_API_KEY_HERE", baseUrl: "https://api.firecrawl.dev", }, }, }, }, },}Примітки:
- Вибір Firecrawl під час onboarding або
openclaw configure --section webавтоматично вмикає встановлений Plugin Firecrawl. web_searchіз Firecrawl підтримуєqueryіcount.- Для специфічних елементів керування Firecrawl, як-от
sources,categoriesабо scraping результатів, використовуйтеfirecrawl_search. baseUrlза замовчуванням вказує на розміщений Firecrawl за адресоюhttps://api.firecrawl.dev. Самостійно розміщені перевизначення дозволені лише для приватних/внутрішніх кінцевих точок; HTTP приймається лише для таких приватних цілей.FIRECRAWL_BASE_URLє спільним резервним значенням env для базових URL пошуку й scrape у Firecrawl.
Налаштування резервного Firecrawl для web_fetch
{ tools: { web: { fetch: { provider: "firecrawl", // explicit selection enables keyless fallback }, }, }, plugins: { entries: { firecrawl: { enabled: true, config: { webFetch: { baseUrl: "https://api.firecrawl.dev", onlyMainContent: true, maxAgeMs: 172800000, timeoutSeconds: 60, }, }, }, }, },}Примітки:
- Явно вибраний резервний Firecrawl для
web_fetchпрацює без API-ключа. Коли його налаштовано, OpenClaw надсилаєplugins.entries.firecrawl.config.webFetch.apiKeyабоFIRECRAWL_API_KEYдля вищих лімітів. - Вибір Firecrawl під час onboarding або
openclaw configure --section webвмикає Plugin і вибирає Firecrawl дляweb_fetch, якщо інший провайдер fetch ще не налаштований. firecrawl_scrapeпотребує API-ключа.maxAgeMsкерує тим, наскільки старими можуть бути кешовані результати (мс). За замовчуванням — 2 дні.- Застаріла конфігурація
tools.web.fetch.firecrawl.*автоматично мігрується командоюopenclaw doctor --fix. - Перевизначення URL для scrape/base у Firecrawl дотримуються того самого правила для розміщених/приватних цілей, що й пошук: публічний розміщений трафік використовує
https://api.firecrawl.dev; самостійно розміщені перевизначення мають резолвитися у приватні/внутрішні кінцеві точки. firecrawl_scrapeвідхиляє очевидні приватні, loopback, metadata та не-HTTP(S) цільові URL перед пересиланням їх до Firecrawl, відповідно до контракту безпеки цілейweb_fetchдля явних викликів scrape Firecrawl.
firecrawl_scrape повторно використовує ті самі налаштування plugins.entries.firecrawl.config.webFetch.* і змінні env, зокрема потрібний API-ключ.
Самостійно розміщений Firecrawl
Установіть plugins.entries.firecrawl.config.webSearch.baseUrl,
plugins.entries.firecrawl.config.webFetch.baseUrl або FIRECRAWL_BASE_URL,
коли запускаєте Firecrawl самостійно. OpenClaw приймає http:// лише для цілей
loopback, приватної мережі, .local, .internal або .localhost. Публічні користувацькі
хости відхиляються, щоб API-ключі Firecrawl випадково не надсилалися на довільні кінцеві точки.
Інструменти Plugin Firecrawl
firecrawl_search
Використовуйте це, коли потрібні специфічні елементи керування пошуком Firecrawl замість загального web_search.
Основні параметри:
querycountsourcescategoriesscrapeResultstimeoutSeconds
firecrawl_scrape
Використовуйте це для сторінок із великою кількістю JS або захистом від ботів, де звичайний web_fetch слабкий.
Основні параметри:
urlextractModemaxCharsonlyMainContentmaxAgeMsproxystoreInCachetimeoutSeconds
Непомітність / обхід бот-захисту
Firecrawl надає параметр proxy mode для обходу бот-захисту (basic, stealth або auto).
OpenClaw завжди використовує proxy: "auto" разом із storeInCache: true для запитів Firecrawl.
Якщо proxy опущено, Firecrawl за замовчуванням використовує auto. auto повторює спробу зі stealth-проксі, якщо базова спроба не вдалася, що може використовувати більше кредитів,
ніж scraping лише в basic-режимі.
Як web_fetch використовує Firecrawl
Порядок витягування в web_fetch:
- Readability (локально)
- Firecrawl (коли вибрано або автоматично виявлено з налаштованих облікових даних)
- Базове очищення HTML (останній резервний варіант)
Перемикач вибору — tools.web.fetch.provider. Якщо його опустити, OpenClaw
автоматично виявляє першого готового провайдера web-fetch з доступних облікових даних.
Офіційний Plugin Firecrawl надає цей резервний варіант.
Пов’язане
- Огляд Web Search -- усі провайдери й автоматичне виявлення
- Web Fetch -- інструмент web_fetch із резервним Firecrawl
- Tavily -- інструменти пошуку й витягування даних