Tools
PDF-Tool
pdf analysiert ein oder mehrere PDF-Dokumente und gibt Text zurück.
Kurzverhalten:
- Nativer Provider-Modus für Anthropic- und Google-Model-Provider.
- Extraktions-Fallback-Modus für andere Provider (zuerst Text extrahieren, dann bei Bedarf Seitenbilder).
- Unterstützt einzelne (
pdf) oder mehrere (pdfs) Eingaben, maximal 10 PDFs pro Aufruf.
Verfügbarkeit
Das Tool wird nur registriert, wenn OpenClaw eine PDF-fähige Modellkonfiguration für den Agenten auflösen kann:
agents.defaults.pdfModel- Fallback auf
agents.defaults.imageModel - Fallback auf das aufgelöste Sitzungs-/Standardmodell des Agenten
- Wenn native PDF-Provider authentifizierungsbasiert verfügbar sind, werden sie generischen Kandidaten für den Bild-Fallback vorgezogen
Wenn kein verwendbares Modell aufgelöst werden kann, wird das Tool pdf nicht bereitgestellt.
Hinweise zur Verfügbarkeit:
- Die Fallback-Kette berücksichtigt Authentifizierung. Ein konfiguriertes
provider/modelzählt nur, wenn OpenClaw diesen Provider für den Agenten tatsächlich authentifizieren kann. - Native PDF-Provider sind derzeit Anthropic und Google.
- Wenn der aufgelöste Sitzungs-/Standard-Provider bereits ein konfiguriertes Vision-/PDF- Modell hat, verwendet das PDF-Tool dieses erneut, bevor es auf andere authentifizierungsbasierte Provider zurückfällt.
Eingabereferenz
pdfstringEin PDF-Pfad oder eine URL.
pdfsstring[]Mehrere PDF-Pfade oder URLs, insgesamt bis zu 10.
promptstringdefault: Analyze this PDF document.Analyse-Prompt.
pagesstringSeitenfilter wie 1-5 oder 1,3,7-9.
passwordstringPasswort für verschlüsselte PDFs im Extraktions-Fallback-Modus.
modelstringOptionale Modellüberschreibung in der Form provider/model.
maxBytesMbnumberGrößenlimit pro PDF in MB. Standardwert ist agents.defaults.pdfMaxBytesMb oder 10.
Eingabehinweise:
pdfundpdfswerden vor dem Laden zusammengeführt und dedupliziert.- Wenn keine PDF-Eingabe angegeben ist, gibt das Tool einen Fehler aus.
pageswird als 1-basierte Seitenzahlen geparst, dedupliziert, sortiert und auf die konfigurierte maximale Seitenanzahl begrenzt.passwordgilt für jedes PDF in der Anfrage und wird nur vom Extraktions-Fallback-Modus verwendet.maxBytesMbverwendet standardmäßigagents.defaults.pdfMaxBytesMboder10.
Unterstützte PDF-Referenzen
- lokaler Dateipfad (einschließlich
~-Erweiterung) file://-URLhttp://- undhttps://-URL- von OpenClaw verwaltete eingehende Refs wie
media://inbound/<id>
Hinweise zu Referenzen:
- Andere URI-Schemata (zum Beispiel
ftp://) werden mitunsupported_pdf_referenceabgelehnt. - Im Sandbox-Modus werden Remote-
http(s)-URLs abgelehnt. - Bei aktivierter Workspace-only-Dateirichtlinie werden lokale Dateipfade außerhalb erlaubter Wurzeln abgelehnt.
- Verwaltete eingehende Refs und wiedergegebene Pfade unter OpenClaws Speicher für eingehende Medien sind mit Workspace-only-Dateirichtlinie erlaubt.
Ausführungsmodi
Nativer Provider-Modus
Der native Modus wird für Provider anthropic und google verwendet.
Das Tool sendet rohe PDF-Bytes direkt an Provider-APIs.
Einschränkungen im nativen Modus:
pageswird nicht unterstützt. Wenn gesetzt, gibt das Tool einen Fehler zurück.passwordwird nicht unterstützt. Verwenden Sie ein nicht-natives Modell, um verschlüsselte PDFs zu analysieren.- Mehrere PDF-Eingaben werden unterstützt; jedes PDF wird vor dem Prompt als nativer Dokumentblock / Inline-PDF-Teil gesendet.
Extraktions-Fallback-Modus
Der Fallback-Modus wird für nicht-native Provider verwendet.
Ablauf:
- Text aus ausgewählten Seiten extrahieren (bis zu
agents.defaults.pdfMaxPages, Standardwert20). - Wenn die Länge des extrahierten Texts unter
200Zeichen liegt, ausgewählte Seiten als PNG-Bilder rendern und einschließen. - Extrahierten Inhalt plus Prompt an das ausgewählte Modell senden.
Fallback-Details:
- Die Extraktion von Seitenbildern verwendet ein Pixelbudget von
4,000,000. - Verschlüsselte PDFs können mit dem Top-Level-Parameter
passwordgeöffnet werden. - Wenn das Zielmodell keine Bildeingabe unterstützt und kein extrahierbarer Text vorhanden ist, gibt das Tool einen Fehler aus.
- Wenn die Textextraktion erfolgreich ist, die Bildextraktion auf einem reinen Textmodell jedoch Vision erfordern würde, verwirft OpenClaw die gerenderten Bilder und fährt mit dem extrahierten Text fort.
- Der Extraktions-Fallback verwendet das gebündelte Plugin
document-extract. Das Plugin besitztclawpdf, das Textextraktion und Bildrendering über PDFium WebAssembly bereitstellt.
Konfiguration
{ agents: { defaults: { pdfModel: { primary: "anthropic/claude-opus-4-6", fallbacks: ["openai/gpt-5.4-mini"], }, pdfMaxBytesMb: 10, pdfMaxPages: 20, }, },}Weitere Felddetails finden Sie in der Konfigurationsreferenz.
Ausgabedetails
Das Tool gibt Text in content[0].text und strukturierte Metadaten in details zurück.
Häufige details-Felder:
model: aufgelöste Modellreferenz (provider/model)native:truefür nativen Provider-Modus,falsefür Fallbackattempts: Fallback-Versuche, die vor dem Erfolg fehlgeschlagen sind
Pfadfelder:
- einzelne PDF-Eingabe:
details.pdf - mehrere PDF-Eingaben:
details.pdfs[]mitpdf-Einträgen - Metadaten zur Sandbox-Pfadumschreibung (falls zutreffend):
rewrittenFrom
Fehlerverhalten
- Fehlende PDF-Eingabe: wirft
pdf required: provide a path or URL to a PDF document - Zu viele PDFs: gibt strukturierten Fehler in
details.error = "too_many_pdfs"zurück - Nicht unterstütztes Referenzschema: gibt
details.error = "unsupported_pdf_reference"zurück - Nativer Modus mit
pages: wirft eindeutigen Fehlerpages is not supported with native PDF providers
Beispiele
Einzelnes PDF:
{ "pdf": "/tmp/report.pdf", "prompt": "Summarize this report in 5 bullets"}Mehrere PDFs:
{ "pdfs": ["/tmp/q1.pdf", "/tmp/q2.pdf"], "prompt": "Compare risks and timeline changes across both documents"}Fallback-Modell mit Seitenfilter:
{ "pdf": "https://example.com/report.pdf", "pages": "1-3,7", "model": "openai/gpt-5.4-mini", "prompt": "Extract only customer-impacting incidents"}Verschlüsseltes PDF mit Extraktions-Fallback:
{ "pdf": "/tmp/locked.pdf", "password": "example-password", "model": "openai/gpt-5.4-mini", "prompt": "Summarize this contract"}Verwandt
- Tools-Übersicht - alle verfügbaren Agent-Tools
- Konfigurationsreferenz - Konfiguration von pdfMaxBytesMb und pdfMaxPages