Documentation Index
Fetch the complete documentation index at: https://docs.openclaw.ai/llms.txt
Use this file to discover all available pages before exploring further.
pdf analisa um ou mais documentos PDF e retorna texto.
Comportamento rápido:
- Modo de provedor nativo para provedores de modelo Anthropic e Google.
- Modo de fallback de extração para outros provedores (extrai texto primeiro e, depois, imagens das páginas quando necessário).
- Compatível com entrada única (
pdf) ou múltipla (pdfs), com máximo de 10 PDFs por chamada.
Disponibilidade
A ferramenta só é registrada quando o OpenClaw consegue resolver uma configuração de modelo compatível com PDF para o agente:agents.defaults.pdfModel- fallback para
agents.defaults.imageModel - fallback para o modelo resolvido de sessão/padrão do agente
- se provedores com PDF nativo forem baseados em autenticação, preferi-los antes de candidatos genéricos de fallback de imagem
pdf não é exposta.
Observações de disponibilidade:
- A cadeia de fallback considera autenticação. Um
provider/modelconfigurado só conta se o OpenClaw realmente conseguir autenticar esse provedor para o agente. - Provedores de PDF nativo atualmente são Anthropic e Google.
- Se o provedor resolvido de sessão/padrão já tiver um modelo de visão/PDF configurado, a ferramenta PDF o reutiliza antes de recorrer a outros provedores baseados em autenticação.
Referência de entrada
Um caminho ou URL de PDF.
Vários caminhos ou URLs de PDF, até 10 no total.
Prompt de análise.
Filtro de páginas como
1-5 ou 1,3,7-9.Substituição opcional de modelo no formato
provider/model.Limite de tamanho por PDF em MB. O padrão é
agents.defaults.pdfMaxBytesMb ou 10.pdfepdfssão mesclados e deduplicados antes do carregamento.- Se nenhuma entrada de PDF for fornecida, a ferramenta retorna erro.
pagesé interpretado como números de página começando em 1, deduplicado, ordenado e limitado ao máximo de páginas configurado.maxBytesMbusa como padrãoagents.defaults.pdfMaxBytesMbou10.
Referências de PDF compatíveis
- caminho de arquivo local (incluindo expansão de
~) - URL
file:// - URL
http://ehttps:// - refs de entrada gerenciadas pelo OpenClaw, como
media://inbound/<id>
- Outros esquemas de URI (por exemplo,
ftp://) são rejeitados comunsupported_pdf_reference. - No modo sandbox, URLs remotos
http(s)são rejeitados. - Com a política de arquivos somente no workspace ativada, caminhos de arquivos locais fora das raízes permitidas são rejeitados.
- Refs de entrada gerenciadas e caminhos reproduzidos no armazenamento de mídia de entrada do OpenClaw são permitidos com a política de arquivos somente no workspace.
Modos de execução
Modo de provedor nativo
O modo nativo é usado para os provedoresanthropic e google.
A ferramenta envia bytes brutos de PDF diretamente para as APIs do provedor.
Limites do modo nativo:
pagesnão é compatível. Se definido, a ferramenta retorna um erro.- Entrada com múltiplos PDFs é compatível; cada PDF é enviado como um bloco de documento nativo / parte de PDF inline antes do prompt.
Modo de fallback de extração
O modo de fallback é usado para provedores não nativos. Fluxo:- Extrair texto das páginas selecionadas (até
agents.defaults.pdfMaxPages, padrão20). - Se o comprimento do texto extraído for inferior a
200caracteres, renderizar as páginas selecionadas como imagens PNG e incluí-las. - Enviar o conteúdo extraído mais o prompt para o modelo selecionado.
- A extração de imagem de página usa um orçamento de pixels de
4,000,000. - Se o modelo de destino não oferecer suporte a entrada de imagem e não houver texto extraível, a ferramenta retorna erro.
- Se a extração de texto tiver sucesso, mas a extração de imagem exigiria visão em um modelo somente texto, o OpenClaw descarta as imagens renderizadas e continua com o texto extraído.
- O fallback de extração usa o Plugin
document-extractincluído. O Plugin é responsável porpdfjs-dist;@napi-rs/canvasé usado somente quando o fallback de renderização de imagem está disponível.
Configuração
Detalhes da saída
A ferramenta retorna texto emcontent[0].text e metadados estruturados em details.
Campos comuns de details:
model: ref de modelo resolvida (provider/model)native:truepara modo de provedor nativo,falsepara fallbackattempts: tentativas de fallback que falharam antes do sucesso
- entrada de PDF único:
details.pdf - entradas de múltiplos PDFs:
details.pdfs[]com entradaspdf - metadados de reescrita de caminho no sandbox (quando aplicável):
rewrittenFrom
Comportamento de erro
- Entrada de PDF ausente: lança
pdf required: provide a path or URL to a PDF document - PDFs em excesso: retorna erro estruturado em
details.error = "too_many_pdfs" - Esquema de referência incompatível: retorna
details.error = "unsupported_pdf_reference" - Modo nativo com
pages: lança erro claropages is not supported with native PDF providers
Exemplos
PDF único:Relacionado
- Visão geral das ferramentas - todas as ferramentas de agente disponíveis
- Referência de configuração - configuração de pdfMaxBytesMb e pdfMaxPages