Tools
Firecrawl
OpenClaw может использовать Firecrawl тремя способами:
- как провайдера
web_search - как явные инструменты плагина:
firecrawl_searchиfirecrawl_scrape - как резервный экстрактор для
web_fetch
Это размещенный сервис извлечения/поиска, который поддерживает обход ограничений для ботов и кэширование, что помогает с сайтами, активно использующими JS, или страницами, которые блокируют обычные HTTP-запросы.
Установка плагина
Установите официальный плагин, затем перезапустите Gateway:
openclaw plugins install @openclaw/firecrawl-pluginopenclaw gateway restartweb_fetch без ключа и ключи API
Явно выбранный размещенный резервный вариант Firecrawl для web_fetch поддерживает стартовый
доступ без ключа API. Добавьте FIRECRAWL_API_KEY в окружение Gateway
или настройте его, когда нужны более высокие лимиты. Firecrawl web_search и
firecrawl_scrape требуют ключ API.
Настройка поиска Firecrawl
{ tools: { web: { search: { provider: "firecrawl", }, }, }, plugins: { entries: { firecrawl: { enabled: true, config: { webSearch: { apiKey: "FIRECRAWL_API_KEY_HERE", baseUrl: "https://api.firecrawl.dev", }, }, }, }, },}Примечания:
- Выбор Firecrawl при первоначальной настройке или через
openclaw configure --section webавтоматически включает установленный плагин Firecrawl. web_searchс Firecrawl поддерживаетqueryиcount.- Для специфичных элементов управления Firecrawl, таких как
sources,categoriesили извлечение результатов, используйтеfirecrawl_search. baseUrlпо умолчанию указывает на размещенный Firecrawl по адресуhttps://api.firecrawl.dev. Переопределения для самостоятельного размещения разрешены только для приватных/внутренних конечных точек; HTTP принимается только для таких приватных целей.FIRECRAWL_BASE_URL— общий резервный env для базовых URL поиска и извлечения Firecrawl.
Настройка резервного варианта Firecrawl для web_fetch
{ tools: { web: { fetch: { provider: "firecrawl", // explicit selection enables keyless fallback }, }, }, plugins: { entries: { firecrawl: { enabled: true, config: { webFetch: { baseUrl: "https://api.firecrawl.dev", onlyMainContent: true, maxAgeMs: 172800000, timeoutSeconds: 60, }, }, }, }, },}Примечания:
- Явно выбранный резервный вариант Firecrawl для
web_fetchработает без ключа API. При настройке OpenClaw отправляетplugins.entries.firecrawl.config.webFetch.apiKeyилиFIRECRAWL_API_KEYдля более высоких лимитов. - Выбор Firecrawl во время первоначальной настройки или через
openclaw configure --section webвключает плагин и выбирает Firecrawl дляweb_fetch, если другой провайдер извлечения еще не настроен. firecrawl_scrapeтребует ключ API.maxAgeMsуправляет тем, насколько старыми могут быть кэшированные результаты (мс). Значение по умолчанию — 2 дня.- Устаревшая конфигурация
tools.web.fetch.firecrawl.*автоматически мигрируется командойopenclaw doctor --fix. - Переопределения URL для извлечения/базы Firecrawl следуют тому же правилу размещенного/приватного режима, что и поиск: публичный размещенный трафик использует
https://api.firecrawl.dev; переопределения для самостоятельного размещения должны разрешаться в приватные/внутренние конечные точки. firecrawl_scrapeотклоняет очевидно приватные, loopback, metadata и не-HTTP(S) целевые URL перед пересылкой их в Firecrawl, соответствуя контракту безопасности целейweb_fetchдля явных вызовов извлечения Firecrawl.
firecrawl_scrape повторно использует те же настройки plugins.entries.firecrawl.config.webFetch.* и env-переменные, включая обязательный ключ API.
Самостоятельно размещенный Firecrawl
Задайте plugins.entries.firecrawl.config.webSearch.baseUrl,
plugins.entries.firecrawl.config.webFetch.baseUrl или FIRECRAWL_BASE_URL,
когда запускаете Firecrawl самостоятельно. OpenClaw принимает http:// только для целей loopback,
частной сети, .local, .internal или .localhost. Публичные пользовательские
хосты отклоняются, чтобы ключи API Firecrawl случайно не отправлялись на произвольные конечные точки.
Инструменты Plugin Firecrawl
firecrawl_search
Используйте это, когда нужны специфичные для Firecrawl элементы управления поиском вместо универсального web_search.
Основные параметры:
querycountsourcescategoriesscrapeResultstimeoutSeconds
firecrawl_scrape
Используйте это для страниц с активным JS или защитой от ботов, где обычный web_fetch слаб.
Основные параметры:
urlextractModemaxCharsonlyMainContentmaxAgeMsproxystoreInCachetimeoutSeconds
Скрытность / обход защиты от ботов
Firecrawl предоставляет параметр режима прокси для обхода защиты от ботов (basic, stealth или auto).
OpenClaw всегда использует proxy: "auto" плюс storeInCache: true для запросов Firecrawl.
Если прокси не указан, Firecrawl по умолчанию использует auto. auto повторяет попытку со скрытными прокси, если базовая попытка завершается неудачно, что может расходовать больше кредитов,
чем парсинг только в базовом режиме.
Как web_fetch использует Firecrawl
Порядок извлечения web_fetch:
- Readability (локально)
- Firecrawl (когда выбран или автоматически определен по настроенным учетным данным)
- Базовая очистка HTML (последний резервный вариант)
Переключатель выбора — tools.web.fetch.provider. Если его опустить, OpenClaw
автоматически определяет первого готового провайдера web-fetch по доступным учетным данным.
Официальный Plugin Firecrawl предоставляет этот резервный вариант.
См. также
- Обзор Web Search -- все провайдеры и автоопределение
- Web Fetch -- инструмент web_fetch с резервным вариантом Firecrawl
- Tavily -- инструменты поиска и извлечения