Tool PDF
pdf analisa um ou mais documentos PDF e retorna texto.
Comportamento rápido:
- Modo nativo do provider para providers de modelo Anthropic e Google.
- Modo de fallback por extração para outros providers (extrai o texto primeiro, depois imagens das páginas quando necessário).
- Suporta entrada única (
pdf) ou múltipla (pdfs), no máximo 10 PDFs por chamada.
Disponibilidade
A tool é registrada apenas quando o OpenClaw consegue resolver uma configuração de modelo compatível com PDF para o agente:agents.defaults.pdfModel- fallback para
agents.defaults.imageModel - fallback para o modelo resolvido da sessão/padrão do agente
- se providers de PDF nativo forem respaldados por autenticação, prefira-os antes de candidatos genéricos de fallback de imagem
pdf não é exposta.
Observações sobre disponibilidade:
- A cadeia de fallback reconhece autenticação. Um
provider/modelconfigurado só conta se o OpenClaw realmente conseguir autenticar esse provider para o agente. - Os providers de PDF nativo atualmente são Anthropic e Google.
- Se o provider resolvido da sessão/padrão já tiver um modelo de visão/PDF configurado, a tool PDF o reutiliza antes de recorrer a outros providers respaldados por autenticação.
Referência de entrada
pdf(string): um caminho ou URL de PDFpdfs(string[]): múltiplos caminhos ou URLs de PDF, até 10 no totalprompt(string): prompt de análise, padrãoAnalyze this PDF document.pages(string): filtro de páginas como1-5ou1,3,7-9model(string): override opcional de modelo (provider/model)maxBytesMb(number): limite de tamanho por PDF em MB
pdfepdfssão mesclados e deduplicados antes do carregamento.- Se nenhuma entrada de PDF for fornecida, a tool retorna erro.
pagesé interpretado como números de página começando em 1, deduplicados, ordenados e limitados ao máximo configurado de páginas.maxBytesMbassume por padrãoagents.defaults.pdfMaxBytesMbou10.
Referências de PDF compatíveis
- caminho de arquivo local (incluindo expansão de
~) - URL
file:// - URL
http://ehttps://
- Outros esquemas de URI (por exemplo
ftp://) são rejeitados comunsupported_pdf_reference. - No modo sandbox, URLs remotas
http(s)são rejeitadas. - Com a política de arquivos restrita ao workspace habilitada, caminhos de arquivo local fora das raízes permitidas são rejeitados.
Modos de execução
Modo nativo do provider
O modo nativo é usado para o provideranthropic e google.
A tool envia bytes brutos do PDF diretamente para as APIs do provider.
Limites do modo nativo:
pagesnão é compatível. Se definido, a tool retorna erro.- A entrada com múltiplos PDFs é compatível; cada PDF é enviado como um bloco de documento nativo / parte inline de PDF antes do prompt.
Modo de fallback por extração
O modo de fallback é usado para providers não nativos. Fluxo:- Extrai texto das páginas selecionadas (até
agents.defaults.pdfMaxPages, padrão20). - Se o comprimento do texto extraído ficar abaixo de
200caracteres, renderiza as páginas selecionadas em imagens PNG e as inclui. - Envia o conteúdo extraído mais o prompt para o modelo selecionado.
- A extração de imagens de página usa um orçamento de pixels de
4,000,000. - Se o modelo de destino não oferecer suporte a entrada de imagem e não houver texto extraível, a tool retorna erro.
- Se a extração de texto tiver êxito, mas a extração de imagem exigir visão em um modelo somente de texto, o OpenClaw descarta as imagens renderizadas e continua com o texto extraído.
- O fallback por extração exige
pdfjs-dist(e@napi-rs/canvaspara renderização de imagem).
Configuração
Detalhes de saída
A tool retorna texto emcontent[0].text e metadados estruturados em details.
Campos comuns de details:
model: ref do modelo resolvido (provider/model)native:truepara modo nativo do provider,falsepara fallbackattempts: tentativas de fallback que falharam antes do sucesso
- entrada de PDF único:
details.pdf - entrada de múltiplos PDFs:
details.pdfs[]com entradaspdf - metadados de reescrita de caminho do sandbox (quando aplicável):
rewrittenFrom
Comportamento de erro
- Entrada de PDF ausente: gera
pdf required: provide a path or URL to a PDF document - PDFs demais: retorna erro estruturado em
details.error = "too_many_pdfs" - Esquema de referência não compatível: retorna
details.error = "unsupported_pdf_reference" - Modo nativo com
pages: gera o erro claropages is not supported with native PDF providers
Exemplos
PDF único:Relacionado
- Tools Overview — todas as tools de agente disponíveis
- Configuration Reference — configuração de pdfMaxBytesMb e pdfMaxPages