Web Fetch
A ferramentaweb_fetch faz um HTTP GET simples e extrai conteúdo legível
(HTML para markdown ou texto). Ela não executa JavaScript.
Para sites com uso intenso de JS ou páginas protegidas por login, use o
Web Browser.
Início rápido
web_fetch é ativado por padrão — nenhuma configuração é necessária. O agente pode
chamá-lo imediatamente:
Parâmetros da ferramenta
| Parâmetro | Tipo | Descrição |
|---|---|---|
url | string | URL para buscar (obrigatório, apenas http/https) |
extractMode | string | "markdown" (padrão) ou "text" |
maxChars | number | Trunca a saída para este número de caracteres |
Como funciona
Busca
Envia um HTTP GET com um User-Agent semelhante ao do Chrome e o cabeçalho
Accept-Language. Bloqueia nomes de host privados/internos e verifica novamente os redirecionamentos.Fallback (opcional)
Se o Readability falhar e o Firecrawl estiver configurado, tenta novamente por meio da
API do Firecrawl com modo de contorno de bot.
Configuração
Fallback do Firecrawl
Se a extração do Readability falhar,web_fetch pode usar
Firecrawl como fallback para contorno de bot e melhor extração:
plugins.entries.firecrawl.config.webFetch.apiKey oferece suporte a objetos SecretRef.
A configuração legada tools.web.fetch.firecrawl.* é migrada automaticamente por openclaw doctor --fix.
Se o Firecrawl estiver ativado e seu SecretRef não for resolvido, sem
fallback da variável de ambiente
FIRECRAWL_API_KEY, a inicialização do gateway falhará imediatamente.As substituições de
baseUrl do Firecrawl são restritas: elas devem usar https:// e
o host oficial do Firecrawl (api.firecrawl.dev).tools.web.fetch.providerseleciona explicitamente o provedor de fallback de busca.- Se
providerfor omitido, o OpenClaw detectará automaticamente o primeiro provedor de web-fetch pronto a partir das credenciais disponíveis. Hoje, o provedor incluído é o Firecrawl. - Se o Readability estiver desativado,
web_fetchirá diretamente para o fallback do provedor selecionado. Se nenhum provedor estiver disponível, ele falhará de forma fechada.
Limites e segurança
maxCharsé limitado portools.web.fetch.maxCharsCap- O corpo da resposta é limitado por
maxResponseBytesantes da análise; respostas grandes demais são truncadas com um aviso - Nomes de host privados/internos são bloqueados
- Os redirecionamentos são verificados e limitados por
maxRedirects web_fetché melhor esforço — alguns sites precisam do Web Browser
Perfis de ferramentas
Se você usa perfis de ferramentas ou listas de permissões, adicioneweb_fetch ou group:web:
Relacionados
- Web Search — pesquise na web com vários provedores
- Web Browser — automação completa de navegador para sites com uso intenso de JS
- Firecrawl — ferramentas de busca e scraping do Firecrawl