Tools
Firecrawl
OpenClaw pode usar Firecrawl de três formas:
- como provedor
web_search - como ferramentas explícitas de Plugin:
firecrawl_searchefirecrawl_scrape - como extrator de fallback para
web_fetch
Ele é um serviço hospedado de extração/pesquisa compatível com contorno de bots e cache, o que ajuda com sites pesados em JS ou páginas que bloqueiam buscas HTTP simples.
Instalar Plugin
Instale o Plugin oficial e reinicie o Gateway:
openclaw plugins install @openclaw/firecrawl-pluginopenclaw gateway restartweb_fetch sem chave e chaves de API
O fallback web_fetch hospedado do Firecrawl selecionado explicitamente oferece suporte a acesso
inicial sem uma chave de API. Adicione FIRECRAWL_API_KEY no ambiente do gateway
ou configure-a quando precisar de limites maiores. web_search do Firecrawl e
firecrawl_scrape exigem uma chave de API.
Configurar a pesquisa do Firecrawl
{ tools: { web: { search: { provider: "firecrawl", }, }, }, plugins: { entries: { firecrawl: { enabled: true, config: { webSearch: { apiKey: "FIRECRAWL_API_KEY_HERE", baseUrl: "https://api.firecrawl.dev", }, }, }, }, },}Observações:
- Escolher Firecrawl na integração inicial ou em
openclaw configure --section webhabilita automaticamente o Plugin Firecrawl instalado. web_searchcom Firecrawl oferece suporte aqueryecount.- Para controles específicos do Firecrawl, como
sources,categoriesou extração de resultados, usefirecrawl_search. baseUrlusa como padrão o Firecrawl hospedado emhttps://api.firecrawl.dev. Substituições auto-hospedadas são permitidas somente para endpoints privados/internos; HTTP é aceito apenas para esses destinos privados.FIRECRAWL_BASE_URLé o fallback de ambiente compartilhado para URLs base de pesquisa e extração do Firecrawl.
Configurar o fallback web_fetch do Firecrawl
{ tools: { web: { fetch: { provider: "firecrawl", // explicit selection enables keyless fallback }, }, }, plugins: { entries: { firecrawl: { enabled: true, config: { webFetch: { baseUrl: "https://api.firecrawl.dev", onlyMainContent: true, maxAgeMs: 172800000, timeoutSeconds: 60, }, }, }, }, },}Observações:
- O fallback
web_fetchdo Firecrawl selecionado explicitamente funciona sem uma chave de API. Quando configurado, o OpenClaw enviaplugins.entries.firecrawl.config.webFetch.apiKeyouFIRECRAWL_API_KEYpara limites maiores. - Escolher Firecrawl durante a integração inicial ou em
openclaw configure --section webhabilita o Plugin e seleciona Firecrawl paraweb_fetch, a menos que outro provedor de busca já esteja configurado. firecrawl_scrapeexige uma chave de API.maxAgeMscontrola a idade máxima dos resultados em cache (ms). O padrão é 2 dias.- A configuração legada
tools.web.fetch.firecrawl.*é migrada automaticamente poropenclaw doctor --fix. - As substituições de URL base/extração do Firecrawl seguem a mesma regra hospedado/privado da pesquisa: o tráfego hospedado público usa
https://api.firecrawl.dev; substituições auto-hospedadas devem resolver para endpoints privados/internos. firecrawl_scraperejeita URLs de destino obviamente privadas, loopback, de metadados e não HTTP(S) antes de encaminhá-las ao Firecrawl, correspondendo ao contrato de segurança de destino deweb_fetchpara chamadas explícitas de extração do Firecrawl.
firecrawl_scrape reutiliza as mesmas configurações e variáveis de ambiente plugins.entries.firecrawl.config.webFetch.*, incluindo a chave de API obrigatória.
Firecrawl auto-hospedado
Defina plugins.entries.firecrawl.config.webSearch.baseUrl,
plugins.entries.firecrawl.config.webFetch.baseUrl ou FIRECRAWL_BASE_URL
quando você executar o Firecrawl por conta própria. O OpenClaw aceita http:// somente para destinos de loopback,
rede privada, .local, .internal ou .localhost. Hosts personalizados públicos
são rejeitados para que as chaves de API do Firecrawl não sejam enviadas a endpoints arbitrários por
acidente.
Ferramentas do Plugin Firecrawl
firecrawl_search
Use isto quando quiser controles de pesquisa específicos do Firecrawl em vez do web_search genérico.
Parâmetros principais:
querycountsourcescategoriesscrapeResultstimeoutSeconds
firecrawl_scrape
Use isto para páginas pesadas em JS ou protegidas contra bots em que web_fetch simples é fraco.
Parâmetros principais:
urlextractModemaxCharsonlyMainContentmaxAgeMsproxystoreInCachetimeoutSeconds
Stealth / contorno de bots
O Firecrawl expõe um parâmetro de modo de proxy para contorno de bots (basic, stealth ou auto).
O OpenClaw sempre usa proxy: "auto" mais storeInCache: true para solicitações do Firecrawl.
Se proxy for omitido, o Firecrawl usa auto por padrão. auto tenta novamente com proxies stealth se uma tentativa básica falhar, o que pode usar mais créditos
do que a extração somente básica.
Como web_fetch usa o Firecrawl
Ordem de extração de web_fetch:
- Readability (local)
- Firecrawl (quando selecionado ou detectado automaticamente a partir de credenciais configuradas)
- Limpeza básica de HTML (último fallback)
O controle de seleção é tools.web.fetch.provider. Se você omiti-lo, o OpenClaw
detectará automaticamente o primeiro provedor de web-fetch pronto a partir das credenciais disponíveis.
O Plugin oficial Firecrawl fornece esse fallback.
Relacionados
- Visão geral da Web Search -- todos os provedores e detecção automática
- Web Fetch -- ferramenta web_fetch com fallback do Firecrawl
- Tavily -- ferramentas de pesquisa + extração