Web Fetch
web_fetch ツールは通常の HTTP GET を行い、可読コンテンツを抽出します
(HTML を markdown または text に変換)。JavaScript は実行しません。
JS を多用するサイトやログイン保護されたページには、
代わりに Web Browser を使ってください。
クイックスタート
web_fetch はデフォルトで有効です — 設定は不要です。エージェントは
すぐに呼び出せます。
ツールパラメータ
| Parameter | Type | 説明 |
|---|---|---|
url | string | 取得する URL(必須、http/https のみ) |
extractMode | string | "markdown"(デフォルト)または "text" |
maxChars | number | 出力をこの文字数で切り詰める |
動作の仕組み
Fetch
Chrome 風の User-Agent と
Accept-Language
ヘッダーを付けて HTTP GET を送信します。プライベート/内部ホスト名をブロックし、リダイレクトも再確認します。設定
Firecrawl フォールバック
Readability 抽出が失敗した場合、web_fetch は
bot 回避やより良い抽出のために Firecrawl にフォールバックできます。
plugins.entries.firecrawl.config.webFetch.apiKey は SecretRef オブジェクトに対応しています。
従来の tools.web.fetch.firecrawl.* 設定は openclaw doctor --fix により自動移行されます。
Firecrawl が有効で、その SecretRef が未解決であり、
FIRECRAWL_API_KEY の env フォールバックもない場合、gateway の起動は即座に失敗します。Firecrawl の
baseUrl 上書きは制限されています。https:// を使い、
公式の Firecrawl ホスト(api.firecrawl.dev)でなければなりません。tools.web.fetch.providerは fetch フォールバックプロバイダーを明示的に選択します。providerを省略した場合、OpenClaw は利用可能な認証情報から、準備完了状態の最初の web-fetch プロバイダーを自動検出します。現時点でのバンドルプロバイダーは Firecrawl です。- Readability が無効な場合、
web_fetchは選択された プロバイダーフォールバックへ直接進みます。利用可能なプロバイダーがない場合は fail closed します。
制限と安全性
maxCharsはtools.web.fetch.maxCharsCapにクランプされます- 応答本文は解析前に
maxResponseBytesで上限が設けられます。大きすぎる 応答は警告付きで切り詰められます - プライベート/内部ホスト名はブロックされます
- リダイレクトは確認され、
maxRedirectsによって制限されます web_fetchはベストエフォートです — 一部サイトでは Web Browser が必要です
ツールプロファイル
ツールプロファイルまたは allowlist を使っている場合は、web_fetch または group:web を追加してください。
関連
- Web Search — 複数プロバイダーで Web を検索
- Web Browser — JS を多用するサイト向けの完全なブラウザー自動化
- Firecrawl — Firecrawl の検索およびスクレイプツール