Documentation Index
Fetch the complete documentation index at: https://docs.openclaw.ai/llms.txt
Use this file to discover all available pages before exploring further.
pdf аналізує один або кілька PDF-документів і повертає текст.
Коротка поведінка:
- Режим нативного провайдера для провайдерів моделей Anthropic і Google.
- Резервний режим вилучення для інших провайдерів (спочатку вилучення тексту, потім зображення сторінок за потреби).
- Підтримує один (
pdf) або кілька (pdfs) вхідних файлів, максимум 10 PDF за виклик.
Доступність
Інструмент реєструється лише тоді, коли OpenClaw може визначити конфігурацію моделі з підтримкою PDF для агента:agents.defaults.pdfModel- резервний варіант
agents.defaults.imageModel - резервний варіант визначеної для агента моделі сеансу/моделі за замовчуванням
- якщо нативні PDF-провайдери мають автентифікаційну підтримку, надавати їм перевагу перед загальними кандидатами резервного варіанта для зображень
pdf не надається.
Примітки щодо доступності:
- Резервний ланцюжок враховує автентифікацію. Налаштований
provider/modelвраховується лише якщо OpenClaw справді може автентифікувати цього провайдера для агента. - Нативні PDF-провайдери наразі: Anthropic і Google.
- Якщо визначений провайдер сеансу/за замовчуванням уже має налаштовану модель для зору/PDF, інструмент PDF повторно використовує її перед переходом до інших провайдерів з автентифікаційною підтримкою.
Довідник вхідних параметрів
Один шлях до PDF або URL.
Кілька шляхів до PDF або URL, загалом до 10.
Промпт для аналізу.
Фільтр сторінок на кшталт
1-5 або 1,3,7-9.Необов’язкове перевизначення моделі у формі
provider/model.Обмеження розміру для кожного PDF у МБ. За замовчуванням
agents.defaults.pdfMaxBytesMb або 10.pdfіpdfsоб’єднуються та дедуплікуються перед завантаженням.- Якщо вхідний PDF не надано, інструмент повертає помилку.
pagesрозбирається як номери сторінок із нумерацією від 1, дедуплікується, сортується та обмежується налаштованою максимальною кількістю сторінок.maxBytesMbза замовчуванням дорівнюєagents.defaults.pdfMaxBytesMbабо10.
Підтримувані посилання на PDF
- шлях до локального файлу (включно з розгортанням
~) - URL
file:// - URL
http://іhttps:// - керовані OpenClaw вхідні посилання, як-от
media://inbound/<id>
- Інші схеми URI (наприклад,
ftp://) відхиляються зunsupported_pdf_reference. - У режимі пісочниці віддалені URL
http(s)відхиляються. - Коли ввімкнено файлову політику лише для робочого простору, локальні шляхи до файлів поза дозволеними коренями відхиляються.
- Керовані вхідні посилання та відтворені шляхи в сховищі вхідних медіа OpenClaw дозволені за файлової політики лише для робочого простору.
Режими виконання
Режим нативного провайдера
Нативний режим використовується для провайдерівanthropic і google.
Інструмент надсилає необроблені байти PDF безпосередньо до API провайдера.
Обмеження нативного режиму:
pagesне підтримується. Якщо задано, інструмент повертає помилку.- Вхід із кількома PDF підтримується; кожен PDF надсилається як нативний блок документа / вбудована PDF-частина перед промптом.
Резервний режим вилучення
Резервний режим використовується для ненативних провайдерів. Потік:- Вилучити текст із вибраних сторінок (до
agents.defaults.pdfMaxPages, за замовчуванням20). - Якщо довжина вилученого тексту менша за
200символів, відрендерити вибрані сторінки в PNG-зображення та включити їх. - Надіслати вилучений вміст разом із промптом до вибраної моделі.
- Вилучення зображень сторінок використовує піксельний бюджет
4,000,000. - Якщо цільова модель не підтримує вхідні зображення та немає тексту, який можна вилучити, інструмент повертає помилку.
- Якщо вилучення тексту успішне, але вилучення зображень вимагало б зору на текстовій моделі, OpenClaw відкидає відрендерені зображення та продовжує з вилученим текстом.
- Резервний режим вилучення використовує вбудований Plugin
document-extract. Plugin володієpdfjs-dist;@napi-rs/canvasвикористовується лише коли доступний резервний рендеринг зображень.
Конфігурація
Деталі виводу
Інструмент повертає текст уcontent[0].text і структуровані метадані в details.
Поширені поля details:
model: визначене посилання на модель (provider/model)native:trueдля режиму нативного провайдера,falseдля резервного режимуattempts: резервні спроби, що завершилися невдачею до успіху
- вхід з одним PDF:
details.pdf - вхід із кількома PDF:
details.pdfs[]із записамиpdf - метадані переписування шляху пісочниці (коли застосовно):
rewrittenFrom
Поведінка помилок
- Вхідний PDF відсутній: викидає
pdf required: provide a path or URL to a PDF document - Забагато PDF: повертає структуровану помилку в
details.error = "too_many_pdfs" - Непідтримувана схема посилання: повертає
details.error = "unsupported_pdf_reference" - Нативний режим із
pages: викидає зрозумілу помилкуpages is not supported with native PDF providers
Приклади
Один PDF:Пов’язане
- Огляд інструментів - усі доступні інструменти агента
- Довідник із конфігурації - конфігурація pdfMaxBytesMb і pdfMaxPages