strumento PDF
pdf analizza uno o più documenti PDF e restituisce testo.
Comportamento rapido:
- Modalità provider nativa per i provider di modelli Anthropic e Google.
- Modalità fallback di estrazione per gli altri provider (prima estrae il testo, poi le immagini delle pagine quando necessario).
- Supporta input singolo (
pdf) o multiplo (pdfs), massimo 10 PDF per chiamata.
Disponibilità
Lo strumento viene registrato solo quando OpenClaw può risolvere una configurazione di modello compatibile con PDF per l’agente:agents.defaults.pdfModel- fallback a
agents.defaults.imageModel - fallback al modello di sessione/predefinito risolto dell’agente
- se i provider PDF nativi sono supportati da auth, vengono preferiti rispetto ai candidati generici di fallback per immagini
pdf non viene esposto.
Note sulla disponibilità:
- La catena di fallback è consapevole dell’auth. Un
provider/modelconfigurato conta solo se OpenClaw può effettivamente autenticare quel provider per l’agente. - I provider PDF nativi attualmente sono Anthropic e Google.
- Se il provider di sessione/predefinito risolto ha già un modello vision/PDF configurato, lo strumento PDF lo riutilizza prima di passare ad altri provider supportati da auth.
Riferimento input
pdf(string): un percorso o URL PDFpdfs(string[]): più percorsi o URL PDF, fino a 10 in totaleprompt(string): prompt di analisi, valore predefinitoAnalyze this PDF document.pages(string): filtro pagine come1-5o1,3,7-9model(string): override facoltativo del modello (provider/model)maxBytesMb(number): limite di dimensione per PDF in MB
pdfepdfsvengono uniti e deduplicati prima del caricamento.- Se non viene fornito alcun input PDF, lo strumento restituisce un errore.
pagesviene analizzato come numeri di pagina a base 1, deduplicati, ordinati e limitati al numero massimo di pagine configurato.maxBytesMbusa come valore predefinitoagents.defaults.pdfMaxBytesMboppure10.
Riferimenti PDF supportati
- percorso file locale (inclusa l’espansione di
~) - URL
file:// - URL
http://ehttps://
- Altri schemi URI (per esempio
ftp://) vengono rifiutati conunsupported_pdf_reference. - In modalità sandbox, gli URL remoti
http(s)vengono rifiutati. - Con la policy file limitata al workspace abilitata, i percorsi di file locali al di fuori delle radici consentite vengono rifiutati.
Modalità di esecuzione
Modalità provider nativa
La modalità nativa viene usata per i provideranthropic e google.
Lo strumento invia direttamente i byte PDF grezzi alle API del provider.
Limiti della modalità nativa:
pagesnon è supportato. Se impostato, lo strumento restituisce un errore.- L’input multi-PDF è supportato; ogni PDF viene inviato come blocco documento nativo / parte PDF inline prima del prompt.
Modalità fallback di estrazione
La modalità fallback viene usata per i provider non nativi. Flusso:- Estrae il testo dalle pagine selezionate (fino a
agents.defaults.pdfMaxPages, valore predefinito20). - Se la lunghezza del testo estratto è inferiore a
200caratteri, esegue il rendering delle pagine selezionate in immagini PNG e le include. - Invia il contenuto estratto più il prompt al modello selezionato.
- L’estrazione delle immagini di pagina usa un budget pixel di
4,000,000. - Se il modello di destinazione non supporta input immagine e non c’è testo estraibile, lo strumento restituisce un errore.
- Se l’estrazione del testo riesce ma l’estrazione delle immagini richiederebbe la vision su un modello solo testo, OpenClaw elimina le immagini renderizzate e continua con il testo estratto.
- Il fallback di estrazione richiede
pdfjs-dist(e@napi-rs/canvasper il rendering delle immagini).
Configurazione
Dettagli output
Lo strumento restituisce testo incontent[0].text e metadati strutturati in details.
Campi details comuni:
model: riferimento modello risolto (provider/model)native:trueper la modalità provider nativa,falseper il fallbackattempts: tentativi di fallback falliti prima del successo
- input PDF singolo:
details.pdf - input PDF multiplo:
details.pdfs[]con vocipdf - metadati di riscrittura del percorso sandbox (quando applicabile):
rewrittenFrom
Comportamento degli errori
- Input PDF mancante: genera
pdf required: provide a path or URL to a PDF document - Troppi PDF: restituisce un errore strutturato in
details.error = "too_many_pdfs" - Schema di riferimento non supportato: restituisce
details.error = "unsupported_pdf_reference" - Modalità nativa con
pages: genera un errore chiaropages is not supported with native PDF providers
Esempi
PDF singolo:Correlati
- Panoramica degli strumenti — tutti gli strumenti disponibili per gli agenti
- Riferimento configurazione — configurazione
pdfMaxBytesMbepdfMaxPages