Documentation Index
Fetch the complete documentation index at: https://docs.openclaw.ai/llms.txt
Use this file to discover all available pages before exploring further.
pdf analizuje jeden lub więcej dokumentów PDF i zwraca tekst.
Szybkie zachowanie:
- Tryb natywny dostawcy dla dostawców modeli Anthropic i Google.
- Tryb awaryjnego wyodrębniania dla innych dostawców (najpierw wyodrębnia tekst, a następnie obrazy stron, gdy jest to potrzebne).
- Obsługuje pojedyncze (
pdf) lub wielokrotne (pdfs) dane wejściowe, maksymalnie 10 plików PDF na wywołanie.
Dostępność
Narzędzie jest rejestrowane tylko wtedy, gdy OpenClaw może rozpoznać konfigurację modelu obsługującego PDF dla agenta:agents.defaults.pdfModel- awaryjnie
agents.defaults.imageModel - awaryjnie rozpoznany model sesji/domyślny agenta
- jeśli natywni dostawcy PDF są oparci na uwierzytelnianiu, preferuj ich przed ogólnymi kandydatami awaryjnymi obsługującymi obrazy
pdf nie jest udostępniane.
Uwagi dotyczące dostępności:
- Łańcuch awaryjny uwzględnia uwierzytelnianie. Skonfigurowany
provider/modelliczy się tylko wtedy, gdy OpenClaw może faktycznie uwierzytelnić tego dostawcę dla agenta. - Natywni dostawcy PDF to obecnie Anthropic i Google.
- Jeśli rozpoznany dostawca sesji/domyślny ma już skonfigurowany model vision/PDF, narzędzie PDF używa go ponownie przed przejściem awaryjnym do innych dostawców opartych na uwierzytelnianiu.
Odwołanie do danych wejściowych
Jedna ścieżka lub URL do pliku PDF.
Wiele ścieżek lub URL-i do plików PDF, łącznie do 10.
Prompt analizy.
Filtr stron, taki jak
1-5 lub 1,3,7-9.Opcjonalne nadpisanie modelu w formie
provider/model.Limit rozmiaru na plik PDF w MB. Domyślnie
agents.defaults.pdfMaxBytesMb lub 10.pdfipdfssą scalane i deduplikowane przed wczytaniem.- Jeśli nie podano żadnego wejścia PDF, narzędzie zgłasza błąd.
pagesjest parsowane jako numery stron liczone od 1, deduplikowane, sortowane i ograniczane do skonfigurowanej maksymalnej liczby stron.maxBytesMbdomyślnie przyjmujeagents.defaults.pdfMaxBytesMblub10.
Obsługiwane odwołania do PDF
- lokalna ścieżka pliku (w tym rozwinięcie
~) - URL
file:// - URL
http://ihttps:// - zarządzane przez OpenClaw odwołania przychodzące, takie jak
media://inbound/<id>
- Inne schematy URI (na przykład
ftp://) są odrzucane zunsupported_pdf_reference. - W trybie piaskownicy zdalne URL-e
http(s)są odrzucane. - Przy włączonej polityce plików ograniczonej do obszaru roboczego lokalne ścieżki plików poza dozwolonymi katalogami głównymi są odrzucane.
- Zarządzane odwołania przychodzące i odtworzone ścieżki w magazynie mediów przychodzących OpenClaw są dozwolone przy polityce plików ograniczonej do obszaru roboczego.
Tryby wykonania
Tryb natywny dostawcy
Tryb natywny jest używany dla dostawcówanthropic i google.
Narzędzie wysyła surowe bajty PDF bezpośrednio do API dostawcy.
Limity trybu natywnego:
pagesnie jest obsługiwane. Jeśli jest ustawione, narzędzie zwraca błąd.- Wejście z wieloma plikami PDF jest obsługiwane; każdy PDF jest wysyłany jako natywny blok dokumentu / część PDF inline przed promptem.
Tryb awaryjnego wyodrębniania
Tryb awaryjny jest używany dla dostawców nienatywnych. Przepływ:- Wyodrębnij tekst z wybranych stron (do
agents.defaults.pdfMaxPages, domyślnie20). - Jeśli długość wyodrębnionego tekstu jest mniejsza niż
200znaków, renderuj wybrane strony do obrazów PNG i dołącz je. - Wyślij wyodrębnioną zawartość wraz z promptem do wybranego modelu.
- Wyodrębnianie obrazów stron używa budżetu pikseli
4,000,000. - Jeśli model docelowy nie obsługuje danych wejściowych obrazu i nie ma tekstu możliwego do wyodrębnienia, narzędzie zgłasza błąd.
- Jeśli wyodrębnianie tekstu się powiedzie, ale wyodrębnianie obrazów wymagałoby vision w modelu tylko tekstowym, OpenClaw pomija wyrenderowane obrazy i kontynuuje z wyodrębnionym tekstem.
- Awaryjne wyodrębnianie używa dołączonego Plugin
document-extract. Plugin jest właścicielempdfjs-dist;@napi-rs/canvasjest używany tylko wtedy, gdy dostępny jest awaryjny rendering obrazów.
Konfiguracja
Szczegóły wyjścia
Narzędzie zwraca tekst wcontent[0].text oraz ustrukturyzowane metadane w details.
Typowe pola details:
model: rozpoznane odwołanie do modelu (provider/model)native:truedla trybu natywnego dostawcy,falsedla trybu awaryjnegoattempts: próby awaryjne, które zakończyły się niepowodzeniem przed sukcesem
- pojedyncze wejście PDF:
details.pdf - wiele wejść PDF:
details.pdfs[]z wpisamipdf - metadane przepisywania ścieżki piaskownicy (gdy ma zastosowanie):
rewrittenFrom
Zachowanie błędów
- Brak wejścia PDF: zgłasza
pdf required: provide a path or URL to a PDF document - Zbyt wiele plików PDF: zwraca ustrukturyzowany błąd w
details.error = "too_many_pdfs" - Nieobsługiwany schemat odwołania: zwraca
details.error = "unsupported_pdf_reference" - Tryb natywny z
pages: zgłasza czytelny błądpages is not supported with native PDF providers
Przykłady
Pojedynczy PDF:Powiązane
- Przegląd narzędzi - wszystkie dostępne narzędzia agenta
- Odwołanie do konfiguracji - konfiguracja pdfMaxBytesMb i pdfMaxPages