PDF-Tool
pdf analysiert ein oder mehrere PDF-Dokumente und gibt Text zurück.
Kurzüberblick zum Verhalten:
- Nativer Provider-Modus für Modell-Provider von Anthropic und Google.
- Extraktions-Fallback-Modus für andere Provider (zuerst Text extrahieren, dann bei Bedarf Seitenbilder).
- Unterstützt einzelne (
pdf) oder mehrere (pdfs) Eingaben, maximal 10 PDFs pro Aufruf.
Verfügbarkeit
Das Tool wird nur registriert, wenn OpenClaw eine PDF-fähige Modellkonfiguration für den Agent auflösen kann:agents.defaults.pdfModel- Fallback auf
agents.defaults.imageModel - Fallback auf das aufgelöste Sitzungs-/Standardmodell des Agent
- wenn native PDF-Provider authentifizierungsbasiert sind, werden sie vor generischen Image-Fallback-Kandidaten bevorzugt
pdf nicht bereitgestellt.
Hinweise zur Verfügbarkeit:
- Die Fallback-Kette ist Auth-bewusst. Ein konfiguriertes
provider/modelzählt nur, wenn OpenClaw diesen Provider für den Agent tatsächlich authentifizieren kann. - Native PDF-Provider sind derzeit Anthropic und Google.
- Wenn der aufgelöste Sitzungs-/Standard-Provider bereits ein konfiguriertes Vision-/PDF- Modell hat, verwendet das PDF-Tool dieses wieder, bevor auf andere authentifizierungsbasierte Provider zurückgegriffen wird.
Eingabereferenz
pdf(string): ein PDF-Pfad oder eine URLpdfs(string[]): mehrere PDF-Pfade oder URLs, insgesamt bis zu 10prompt(string): Analyse-Prompt, StandardAnalyze this PDF document.pages(string): Seitenfilter wie1-5oder1,3,7-9model(string): optionale Modellüberschreibung (provider/model)maxBytesMb(number): Größenlimit pro PDF in MB
pdfundpdfswerden vor dem Laden zusammengeführt und dedupliziert.- Wenn keine PDF-Eingabe angegeben wird, gibt das Tool einen Fehler zurück.
pageswird als 1-basierte Seitennummern geparst, dedupliziert, sortiert und auf die konfigurierte maximale Seitenzahl begrenzt.maxBytesMbist standardmäßigagents.defaults.pdfMaxBytesMboder10.
Unterstützte PDF-Referenzen
- lokaler Dateipfad (einschließlich
~-Erweiterung) file://-URLhttp://- undhttps://-URL
- Andere URI-Schemata (zum Beispiel
ftp://) werden mitunsupported_pdf_referenceabgelehnt. - Im Sandbox-Modus werden entfernte
http(s)-URLs abgelehnt. - Wenn die Datei-Richtlinie nur für den Workspace aktiviert ist, werden lokale Dateipfade außerhalb der erlaubten Wurzeln abgelehnt.
Ausführungsmodi
Nativer Provider-Modus
Der native Modus wird für die Provideranthropic und google verwendet.
Das Tool sendet rohe PDF-Bytes direkt an Provider-APIs.
Grenzen des nativen Modus:
pageswird nicht unterstützt. Wenn es gesetzt ist, gibt das Tool einen Fehler zurück.- Mehrere PDFs als Eingabe werden unterstützt; jedes PDF wird vor dem Prompt als nativer Dokumentblock / inline-PDF-Teil gesendet.
Extraktions-Fallback-Modus
Der Fallback-Modus wird für nicht-native Provider verwendet. Ablauf:- Text aus ausgewählten Seiten extrahieren (bis zu
agents.defaults.pdfMaxPages, Standard20). - Wenn die Länge des extrahierten Texts unter
200Zeichen liegt, ausgewählte Seiten als PNG-Bilder rendern und hinzufügen. - Extrahierten Inhalt plus Prompt an das ausgewählte Modell senden.
- Die Extraktion von Seitenbildern verwendet ein Pixelbudget von
4,000,000. - Wenn das Zielmodell keine Bildeingabe unterstützt und kein extrahierbarer Text vorhanden ist, gibt das Tool einen Fehler zurück.
- Wenn die Textextraktion erfolgreich ist, die Bildextraktion aber Vision für ein reines Textmodell erfordern würde, entfernt OpenClaw die gerenderten Bilder und fährt mit dem extrahierten Text fort.
- Der Extraktions-Fallback erfordert
pdfjs-dist(und@napi-rs/canvasfür das Rendern von Bildern).
Konfiguration
Ausgabedetails
Das Tool gibt Text incontent[0].text und strukturierte Metadaten in details zurück.
Häufige Felder in details:
model: aufgelöste Modellreferenz (provider/model)native:truefür nativen Provider-Modus,falsefür Fallbackattempts: fehlgeschlagene Fallback-Versuche vor dem Erfolg
- einzelne PDF-Eingabe:
details.pdf - mehrere PDF-Eingaben:
details.pdfs[]mitpdf-Einträgen - Metadaten zur Umschreibung von Sandbox-Pfaden (falls zutreffend):
rewrittenFrom
Fehlerverhalten
- Fehlende PDF-Eingabe: wirft
pdf required: provide a path or URL to a PDF document - Zu viele PDFs: gibt einen strukturierten Fehler in
details.error = "too_many_pdfs"zurück - Nicht unterstütztes Referenzschema: gibt
details.error = "unsupported_pdf_reference"zurück - Nativer Modus mit
pages: wirft einen klaren Fehlerpages is not supported with native PDF providers
Beispiele
Einzelnes PDF:Verwandt
- Tools Overview — alle verfügbaren Agent-Tools
- Configuration Reference — Konfiguration für pdfMaxBytesMb und pdfMaxPages