Інструмент PDF
pdf аналізує один або кілька PDF-документів і повертає текст.
Коротко про поведінку:
- Нативний режим провайдера для провайдерів моделей Anthropic і Google.
- Резервний режим витягування для інших провайдерів (спочатку витягування тексту, потім зображення сторінок за потреби).
- Підтримує один (
pdf) або кілька (pdfs) вхідних PDF, максимум 10 PDF за виклик.
Доступність
Інструмент реєструється лише тоді, коли OpenClaw може визначити конфігурацію моделі з підтримкою PDF для агента:agents.defaults.pdfModel- резервний перехід до
agents.defaults.imageModel - резервний перехід до визначеної моделі сесії/типової моделі агента
- якщо нативні PDF-провайдери мають автентифікацію, вони мають пріоритет над загальними резервними кандидатами image
pdf не надається.
Примітки щодо доступності:
- Ланцюжок резервного переходу враховує автентифікацію. Налаштований
provider/modelвраховується лише тоді, коли OpenClaw справді може автентифікувати цього провайдера для агента. - Нативні PDF-провайдери наразі — Anthropic і Google.
- Якщо визначений провайдер сесії/типовий провайдер уже має налаштовану модель vision/PDF, інструмент PDF повторно використовує її перед переходом до інших провайдерів з автентифікацією.
Довідка щодо вхідних даних
pdf(string): один шлях до PDF або URLpdfs(string[]): кілька шляхів до PDF або URL, до 10 загаломprompt(string): запит для аналізу, типовоAnalyze this PDF document.pages(string): фільтр сторінок на кшталт1-5або1,3,7-9model(string): необов’язкове перевизначення моделі (provider/model)maxBytesMb(number): обмеження розміру одного PDF у MB
pdfіpdfsоб’єднуються та дедуплікуються перед завантаженням.- Якщо не надано жодного PDF, інструмент повертає помилку.
pagesрозбирається як номери сторінок із початком від 1, дедуплікується, сортується та обрізається до налаштованого максимуму сторінок.maxBytesMbза замовчуванням дорівнюєagents.defaults.pdfMaxBytesMbабо10.
Підтримувані посилання на PDF
- локальний шлях до файлу (включно з розгортанням
~) - URL
file:// - URL
http://іhttps://
- Інші схеми URI (наприклад,
ftp://) відхиляються зunsupported_pdf_reference. - У режимі sandbox віддалені URL
http(s)відхиляються. - Якщо ввімкнено політику файлів лише для workspace, локальні шляхи до файлів поза дозволеними коренями відхиляються.
Режими виконання
Нативний режим провайдера
Нативний режим використовується для провайдерівanthropic і google.
Інструмент надсилає сирі байти PDF безпосередньо до API провайдерів.
Обмеження нативного режиму:
pagesне підтримується. Якщо його задано, інструмент повертає помилку.- Підтримується вхід із кількома PDF; кожен PDF надсилається як нативний блок документа / inline-частина PDF перед запитом.
Резервний режим витягування
Резервний режим використовується для ненативних провайдерів. Потік:- Витягує текст із вибраних сторінок (до
agents.defaults.pdfMaxPages, типово20). - Якщо довжина витягнутого тексту менша за
200символів, вибрані сторінки рендеряться в PNG-зображення і додаються. - Витягнутий вміст разом із запитом надсилається до вибраної моделі.
- Витягування зображень сторінок використовує бюджет пікселів
4,000,000. - Якщо цільова модель не підтримує введення зображень і немає тексту, який можна витягти, інструмент повертає помилку.
- Якщо витягування тексту успішне, але витягування зображень вимагало б vision для текстової моделі, OpenClaw відкидає відрендерені зображення та продовжує роботу з витягнутим текстом.
- Резервний режим витягування потребує
pdfjs-dist(і@napi-rs/canvasдля рендерингу зображень).
Config
Відомості про вивід
Інструмент повертає текст уcontent[0].text і структуровані метадані в details.
Поширені поля details:
model: визначене посилання на модель (provider/model)native:trueдля нативного режиму провайдера,falseдля резервного режимуattempts: резервні спроби, які завершилися невдачею до успішного виконання
- вхід із одним PDF:
details.pdf - вхід із кількома PDF:
details.pdfs[]із записамиpdf - метадані переписування шляху sandbox (де застосовується):
rewrittenFrom
Поведінка помилок
- Відсутній вхід PDF: генерує
pdf required: provide a path or URL to a PDF document - Забагато PDF: повертає структуровану помилку в
details.error = "too_many_pdfs" - Непідтримувана схема посилання: повертає
details.error = "unsupported_pdf_reference" - Нативний режим із
pages: генерує зрозумілу помилкуpages is not supported with native PDF providers
Приклади
Один PDF:Пов’язане
- Tools Overview — усі доступні інструменти агента
- Configuration Reference — конфігурація pdfMaxBytesMb і pdfMaxPages