Web Fetch
Інструментweb_fetch виконує звичайний HTTP GET і витягує читабельний вміст
(HTML у markdown або text). Він не виконує JavaScript.
Для сайтів із великою залежністю від JS або сторінок, захищених входом,
замість цього використовуйте
Web Browser.
Швидкий старт
web_fetch увімкнено типово — додаткова конфігурація не потрібна. Агент може
викликати його одразу:
Параметри інструмента
| Параметр | Тип | Опис |
|---|---|---|
url | string | URL для отримання (обов’язковий, лише http/https) |
extractMode | string | "markdown" (типово) або "text" |
maxChars | number | Обрізати вивід до цієї кількості символів |
Як це працює
Отримання
Надсилає HTTP GET із User-Agent, схожим на Chrome, і заголовком
Accept-Language. Блокує приватні/внутрішні імена хостів і повторно перевіряє перенаправлення.Резервний варіант (необов’язково)
Якщо Readability не спрацьовує і Firecrawl налаштовано, повторює спробу через
API Firecrawl у режимі обходу бот-захисту.
Конфігурація
Резервний варіант Firecrawl
Якщо витягування через Readability не вдається,web_fetch може перейти на
Firecrawl для обходу бот-захисту й кращого витягування:
plugins.entries.firecrawl.config.webFetch.apiKey підтримує об’єкти SecretRef.
Застаріла конфігурація tools.web.fetch.firecrawl.* автоматично мігрується через openclaw doctor --fix.
Якщо Firecrawl увімкнено, а його SecretRef не розв’язано й немає
резервного env
FIRECRAWL_API_KEY, запуск gateway завершується помилкою одразу.Перевизначення Firecrawl
baseUrl жорстко обмежені: вони мають використовувати https:// і
офіційний хост Firecrawl (api.firecrawl.dev).tools.web.fetch.providerявно вибирає резервного провайдера отримання.- Якщо
providerне вказано, OpenClaw автоматично визначає першого готового провайдера web-fetch з доступних облікових даних. Наразі вбудований провайдер — Firecrawl. - Якщо Readability вимкнено,
web_fetchодразу переходить до вибраного резервного провайдера. Якщо жоден провайдер недоступний, він завершується з fail-closed.
Обмеження та безпека
maxCharsобмежується значеннямtools.web.fetch.maxCharsCap- Тіло відповіді обмежується
maxResponseBytesдо розбору; надто великі відповіді обрізаються з попередженням - Приватні/внутрішні імена хостів блокуються
- Перенаправлення перевіряються й обмежуються через
maxRedirects web_fetchпрацює за принципом best-effort — для деяких сайтів потрібен Web Browser
Профілі інструментів
Якщо ви використовуєте профілі інструментів або allowlist-и, додайтеweb_fetch або group:web:
Пов’язане
- Web Search — пошук в інтернеті через кількох провайдерів
- Web Browser — повна автоматизація браузера для сайтів із великою залежністю від JS
- Firecrawl — інструменти Firecrawl для пошуку та скрапінгу