Web Fetch
web_fetch 도구는 일반 HTTP GET을 수행하고 읽기 가능한 콘텐츠를 추출합니다
(HTML을 markdown 또는 텍스트로 변환). JavaScript는 실행하지 않습니다.
JS 비중이 높은 사이트나 로그인 보호 페이지의 경우
대신 Web Browser를 사용하세요.
빠른 시작
web_fetch는 기본적으로 활성화되어 있어 별도 구성이 필요 없습니다. agent가
즉시 호출할 수 있습니다:
도구 매개변수
| 매개변수 | 타입 | 설명 |
|---|---|---|
url | string | 가져올 URL(필수, http/https만 허용) |
extractMode | string | "markdown"(기본값) 또는 "text" |
maxChars | number | 출력을 이 문자 수로 잘라냄 |
동작 방식
가져오기
Chrome과 유사한 User-Agent와
Accept-Language
헤더를 사용해 HTTP GET을 보냅니다. 비공개/내부 호스트 이름을 차단하고 리디렉션도 다시 확인합니다.구성
Firecrawl fallback
Readability 추출이 실패하면web_fetch는 bot 우회와 더 나은 추출을 위해
Firecrawl로 fallback할 수 있습니다:
plugins.entries.firecrawl.config.webFetch.apiKey는 SecretRef 객체를 지원합니다.
레거시 tools.web.fetch.firecrawl.* 구성은 openclaw doctor --fix로 자동 마이그레이션됩니다.
Firecrawl이 활성화되어 있고 해당 SecretRef를 확인할 수 없으며
FIRECRAWL_API_KEY 환경 변수 fallback도 없으면 gateway 시작이 즉시 실패합니다.Firecrawl
baseUrl 재정의는 제한됩니다. https://를 사용해야 하며
공식 Firecrawl 호스트(api.firecrawl.dev)여야 합니다.tools.web.fetch.provider는 fetch fallback provider를 명시적으로 선택합니다.provider가 생략되면 OpenClaw는 사용 가능한 자격 증명에서 준비된 첫 번째 web-fetch provider를 자동 감지합니다. 현재 번들 provider는 Firecrawl입니다.- Readability가 비활성화되면
web_fetch는 선택된 provider fallback으로 바로 건너뜁니다. 사용 가능한 provider가 없으면 fail-closed 방식으로 실패합니다.
제한 사항 및 안전
maxChars는tools.web.fetch.maxCharsCap으로 제한됩니다- 응답 본문은 파싱 전에
maxResponseBytes로 제한됩니다. 너무 큰 응답은 경고와 함께 잘립니다 - 비공개/내부 호스트 이름은 차단됩니다
- 리디렉션은 확인되며
maxRedirects에 따라 제한됩니다 web_fetch는 최선의 노력 방식입니다 — 일부 사이트는 Web Browser가 필요합니다
도구 프로필
도구 프로필 또는 allowlist를 사용하는 경우web_fetch 또는 group:web를 추가하세요:
관련
- Web Search — 여러 provider로 웹 검색
- Web Browser — JS 비중이 높은 사이트를 위한 전체 브라우저 자동화
- Firecrawl — Firecrawl 검색 및 스크레이프 도구