Herramienta PDF
pdf analiza uno o más documentos PDF y devuelve texto.
Comportamiento rápido:
- Modo nativo del proveedor para los proveedores de modelos Anthropic y Google.
- Modo de respaldo por extracción para otros proveedores (primero extrae texto y luego imágenes de páginas cuando sea necesario).
- Admite entrada única (
pdf) o múltiple (pdfs), con un máximo de 10 PDF por llamada.
Disponibilidad
La herramienta solo se registra cuando OpenClaw puede resolver una configuración de modelo con capacidad para PDF para el agente:agents.defaults.pdfModel- respaldo a
agents.defaults.imageModel - respaldo al modelo resuelto de la sesión/predeterminado del agente
- si los proveedores de PDF nativo usan autenticación respaldada, se prefieren por delante de los candidatos genéricos de respaldo de imagen
pdf no se expone.
Notas sobre disponibilidad:
- La cadena de respaldo tiene en cuenta la autenticación. Un
provider/modelconfigurado solo cuenta si OpenClaw realmente puede autenticar ese proveedor para el agente. - Los proveedores de PDF nativo actualmente son Anthropic y Google.
- Si el proveedor resuelto de la sesión/predeterminado ya tiene configurado un modelo de visión/PDF, la herramienta PDF lo reutiliza antes de recurrir a otros proveedores respaldados por autenticación.
Referencia de entrada
pdf(string): una ruta o URL de PDFpdfs(string[]): varias rutas o URL de PDF, hasta 10 en totalprompt(string): prompt de análisis, predeterminadoAnalyze this PDF document.pages(string): filtro de páginas como1-5o1,3,7-9model(string): anulación opcional del modelo (provider/model)maxBytesMb(number): límite de tamaño por PDF en MB
pdfypdfsse fusionan y desduplican antes de cargarse.- Si no se proporciona ninguna entrada PDF, la herramienta devuelve un error.
pagesse analiza como números de página con base 1, se desduplica, se ordena y se ajusta al máximo de páginas configurado.maxBytesMbusa como valor predeterminadoagents.defaults.pdfMaxBytesMbo10.
Referencias PDF admitidas
- ruta de archivo local (incluida la expansión de
~) - URL
file:// - URL
http://yhttps://
- Otros esquemas URI (por ejemplo,
ftp://) se rechazan conunsupported_pdf_reference. - En modo sandbox, las URL remotas
http(s)se rechazan. - Con la política de archivos solo del espacio de trabajo habilitada, se rechazan las rutas de archivos locales fuera de las raíces permitidas.
Modos de ejecución
Modo nativo del proveedor
El modo nativo se usa para los proveedoresanthropic y google.
La herramienta envía bytes PDF sin procesar directamente a las API del proveedor.
Límites del modo nativo:
pagesno es compatible. Si se establece, la herramienta devuelve un error.- Se admite entrada de varios PDF; cada PDF se envía como un bloque de documento nativo / parte PDF en línea antes del prompt.
Modo de respaldo por extracción
El modo de respaldo se usa para proveedores no nativos. Flujo:- Extrae texto de las páginas seleccionadas (hasta
agents.defaults.pdfMaxPages, valor predeterminado20). - Si la longitud del texto extraído es inferior a
200caracteres, renderiza las páginas seleccionadas como imágenes PNG y las incluye. - Envía el contenido extraído más el prompt al modelo seleccionado.
- La extracción de imágenes de páginas usa un presupuesto de píxeles de
4,000,000. - Si el modelo de destino no admite entrada de imágenes y no hay texto extraíble, la herramienta devuelve un error.
- Si la extracción de texto funciona pero la extracción de imágenes requeriría visión en un modelo solo de texto, OpenClaw elimina las imágenes renderizadas y continúa con el texto extraído.
- El respaldo por extracción requiere
pdfjs-dist(y@napi-rs/canvaspara el renderizado de imágenes).
Configuración
Detalles de salida
La herramienta devuelve texto encontent[0].text y metadatos estructurados en details.
Campos comunes de details:
model: referencia del modelo resuelto (provider/model)native:truepara modo nativo del proveedor,falsepara respaldoattempts: intentos de respaldo que fallaron antes del éxito
- entrada de un solo PDF:
details.pdf - entrada de varios PDF:
details.pdfs[]con entradaspdf - metadatos de reescritura de ruta de sandbox (cuando corresponda):
rewrittenFrom
Comportamiento de error
- Falta entrada PDF: lanza
pdf required: provide a path or URL to a PDF document - Demasiados PDF: devuelve error estructurado en
details.error = "too_many_pdfs" - Esquema de referencia no admitido: devuelve
details.error = "unsupported_pdf_reference" - Modo nativo con
pages: lanza un error claropages is not supported with native PDF providers
Ejemplos
PDF único:Relacionado
- Resumen de herramientas — todas las herramientas de agente disponibles
- Referencia de configuración — configuración de pdfMaxBytesMb y pdfMaxPages