Narzędzie PDF
pdf analizuje jeden lub więcej dokumentów PDF i zwraca tekst.
Szybki opis działania:
- Natywny tryb dostawcy dla dostawców modeli Anthropic i Google.
- Zapasowy tryb ekstrakcji dla innych dostawców (najpierw ekstrakcja tekstu, a potem obrazy stron, gdy to potrzebne).
- Obsługuje pojedyncze (
pdf) lub wielokrotne (pdfs) wejście, maksymalnie 10 plików PDF na jedno wywołanie.
Dostępność
Narzędzie jest rejestrowane tylko wtedy, gdy OpenClaw może rozwiązać konfigurację modelu obsługującego PDF dla agenta:agents.defaults.pdfModel- fallback do
agents.defaults.imageModel - fallback do rozwiązanego modelu sesji/domyślnego agenta
- jeśli natywni dostawcy PDF są wspierani przez uwierzytelnianie, preferuj ich przed ogólnymi kandydatami zapasowymi dla obrazów
pdf nie jest udostępniane.
Uwagi dotyczące dostępności:
- Łańcuch fallback jest świadomy uwierzytelniania. Skonfigurowany
provider/modelliczy się tylko wtedy, gdy OpenClaw może rzeczywiście uwierzytelnić tego dostawcę dla agenta. - Natywni dostawcy PDF to obecnie Anthropic i Google.
- Jeśli rozwiązany dostawca sesji/domyslny ma już skonfigurowany model vision/PDF, narzędzie PDF używa go ponownie przed przejściem do innych dostawców wspieranych przez uwierzytelnianie.
Opis wejścia
pdf(string): jedna ścieżka lub URL PDFpdfs(string[]): wiele ścieżek lub URL-i PDF, maksymalnie 10 łącznieprompt(string): prompt analizy, domyślnieAnalyze this PDF document.pages(string): filtr stron, taki jak1-5lub1,3,7-9model(string): opcjonalne nadpisanie modelu (provider/model)maxBytesMb(number): limit rozmiaru na PDF w MB
pdfipdfssą scalane i deduplikowane przed ładowaniem.- Jeśli nie podano żadnego wejścia PDF, narzędzie zwraca błąd.
pagesjest parsowane jako numery stron od 1, deduplikowane, sortowane i ograniczane do skonfigurowanego maksimum stron.maxBytesMbdomyślnie przyjmujeagents.defaults.pdfMaxBytesMblub10.
Obsługiwane odwołania do PDF
- lokalna ścieżka pliku (w tym rozwijanie
~) - URL
file:// - URL
http://ihttps://
- Inne schematy URI (na przykład
ftp://) są odrzucane zunsupported_pdf_reference. - W trybie sandbox zdalne URL-e
http(s)są odrzucane. - Przy włączonej polityce plików ograniczonej tylko do workspace lokalne ścieżki plików spoza dozwolonych katalogów głównych są odrzucane.
Tryby wykonania
Natywny tryb dostawcy
Tryb natywny jest używany dla dostawcówanthropic i google.
Narzędzie wysyła surowe bajty PDF bezpośrednio do API dostawców.
Limity trybu natywnego:
pagesnie jest obsługiwane. Jeśli zostanie ustawione, narzędzie zwraca błąd.- Obsługiwane jest wejście z wieloma PDF; każdy PDF jest wysyłany jako natywny blok dokumentu / wbudowana część PDF przed promptem.
Zapasowy tryb ekstrakcji
Tryb zapasowy jest używany dla dostawców nienatywnych. Przepływ:- Wyodrębnij tekst z wybranych stron (do
agents.defaults.pdfMaxPages, domyślnie20). - Jeśli długość wyodrębnionego tekstu jest mniejsza niż
200znaków, wyrenderuj wybrane strony do obrazów PNG i dołącz je. - Wyślij wyodrębnioną zawartość wraz z promptem do wybranego modelu.
- Ekstrakcja obrazów stron używa budżetu pikseli
4,000,000. - Jeśli model docelowy nie obsługuje wejścia obrazów i nie ma tekstu możliwego do wyodrębnienia, narzędzie zwraca błąd.
- Jeśli ekstrakcja tekstu się powiedzie, ale ekstrakcja obrazów wymagałaby vision w modelu obsługującym tylko tekst, OpenClaw usuwa wyrenderowane obrazy i kontynuuje z wyodrębnionym tekstem.
- Zapasowy tryb ekstrakcji wymaga
pdfjs-dist(oraz@napi-rs/canvasdo renderowania obrazów).
Konfiguracja
Szczegóły wyjścia
Narzędzie zwraca tekst wcontent[0].text oraz uporządkowane metadane w details.
Typowe pola details:
model: rozwiązany ref modelu (provider/model)native:truedla natywnego trybu dostawcy,falsedla fallbackuattempts: nieudane próby fallbacku przed powodzeniem
- pojedyncze wejście PDF:
details.pdf - wiele wejść PDF:
details.pdfs[]z wpisamipdf - metadane przepisania ścieżki sandboxa (gdy dotyczy):
rewrittenFrom
Zachowanie błędów
- Brak wejścia PDF: zgłasza
pdf required: provide a path or URL to a PDF document - Za dużo plików PDF: zwraca uporządkowany błąd w
details.error = "too_many_pdfs" - Nieobsługiwany schemat odwołania: zwraca
details.error = "unsupported_pdf_reference" - Tryb natywny z
pages: zgłasza czytelny błądpages is not supported with native PDF providers
Przykłady
Pojedynczy PDF:Powiązane
- Przegląd narzędzi — wszystkie dostępne narzędzia agenta
- Configuration Reference — konfiguracja pdfMaxBytesMb i pdfMaxPages