Web Fetch
Das Toolweb_fetch führt einen normalen HTTP-GET aus und extrahiert lesbaren Inhalt
(HTML zu Markdown oder Text). Es führt kein JavaScript aus.
Für stark JavaScript-lastige Websites oder login-geschützte Seiten verwenden Sie stattdessen den
Web Browser.
Schnellstart
web_fetch ist standardmäßig aktiviert — keine Konfiguration erforderlich. Der Agent kann
es sofort aufrufen:
Tool-Parameter
| Parameter | Typ | Beschreibung |
|---|---|---|
url | string | Abzurufende URL (erforderlich, nur http/https) |
extractMode | string | "markdown" (Standard) oder "text" |
maxChars | number | Ausgabe auf diese Anzahl Zeichen kürzen |
So funktioniert es
Abrufen
Sendet einen HTTP-GET mit einem Chrome-ähnlichen User-Agent und einem
Accept-Language-
Header. Blockiert private/interne Hostnamen und prüft Redirects erneut.Fallback (optional)
Wenn Readability fehlschlägt und Firecrawl konfiguriert ist, wird der Abruf über die
Firecrawl-API mit Bot-Umgehungsmodus erneut versucht.
Konfiguration
Firecrawl-Fallback
Wenn die Readability-Extraktion fehlschlägt, kannweb_fetch auf
Firecrawl zurückfallen, um Bot-Umgehung und bessere Extraktion zu erhalten:
plugins.entries.firecrawl.config.webFetch.apiKey unterstützt SecretRef-Objekte.
Legacy-Konfiguration unter tools.web.fetch.firecrawl.* wird von openclaw doctor --fix automatisch migriert.
Wenn Firecrawl aktiviert ist und sein SecretRef nicht aufgelöst wird und es kein
Env-Fallback
FIRECRAWL_API_KEY gibt, schlägt der Start des Gateways sofort fehl.Überschreibungen für
baseUrl von Firecrawl sind eingeschränkt: Sie müssen https:// verwenden und
den offiziellen Firecrawl-Host (api.firecrawl.dev).tools.web.fetch.providerwählt den Fetch-Fallback-Provider explizit aus.- Wenn
providerweggelassen wird, erkennt OpenClaw den ersten bereiten Web-Fetch- Provider anhand der verfügbaren Zugangsdaten automatisch. Derzeit ist der gebündelte Provider Firecrawl. - Wenn Readability deaktiviert ist, überspringt
web_fetchdirekt zum ausgewählten Provider-Fallback. Wenn kein Provider verfügbar ist, schlägt es fail-closed fehl.
Limits und Sicherheit
maxCharswird auftools.web.fetch.maxCharsCapbegrenzt- Der Antwort-Body wird vor dem Parsen auf
maxResponseBytesbegrenzt; übergroße Antworten werden mit einer Warnung gekürzt - Private/interne Hostnamen werden blockiert
- Redirects werden geprüft und durch
maxRedirectsbegrenzt web_fetchist Best-Effort — für manche Websites ist der Web Browser nötig
Tool-Profile
Wenn Sie Tool-Profile oder Allowlists verwenden, fügen Sieweb_fetch oder group:web hinzu:
Verwandte Themen
- Web Search — das Web mit mehreren Providern durchsuchen
- Web Browser — vollständige Browser-Automatisierung für stark JavaScript-lastige Websites
- Firecrawl — Firecrawl-Tools für Suche und Scraping