Documentation Index
Fetch the complete documentation index at: https://docs.openclaw.ai/llms.txt
Use this file to discover all available pages before exploring further.
pdf analizza uno o più documenti PDF e restituisce testo.
Comportamento rapido:
- Modalità provider nativa per provider di modelli Anthropic e Google.
- Modalità fallback di estrazione per altri provider (estrae prima il testo, poi le immagini delle pagine quando necessario).
- Supporta input singolo (
pdf) o multiplo (pdfs), massimo 10 PDF per chiamata.
Disponibilità
Lo strumento viene registrato solo quando OpenClaw riesce a risolvere una configurazione di modello compatibile con PDF per l’agente:agents.defaults.pdfModel- fallback a
agents.defaults.imageModel - fallback al modello sessione/predefinito risolto dell’agente
- se i provider PDF nativi sono supportati da autenticazione, preferirli prima dei candidati fallback generici per immagini
pdf non viene esposto.
Note sulla disponibilità:
- La catena di fallback è consapevole dell’autenticazione. Un
provider/modelconfigurato conta solo se OpenClaw può effettivamente autenticare quel provider per l’agente. - I provider PDF nativi sono attualmente Anthropic e Google.
- Se il provider sessione/predefinito risolto ha già un modello vision/PDF configurato, lo strumento PDF lo riutilizza prima di ricorrere ad altri provider supportati da autenticazione.
Riferimento input
Un percorso o URL PDF.
Più percorsi o URL PDF, fino a 10 in totale.
Prompt di analisi.
Filtro pagine come
1-5 o 1,3,7-9.Override opzionale del modello nel formato
provider/model.Limite dimensione per PDF in MB. Valore predefinito:
agents.defaults.pdfMaxBytesMb o 10.pdfepdfsvengono uniti e deduplicati prima del caricamento.- Se non viene fornito alcun input PDF, lo strumento restituisce un errore.
pagesviene interpretato come numeri di pagina a base 1, deduplicato, ordinato e limitato al massimo di pagine configurato.maxBytesMbusa come valore predefinitoagents.defaults.pdfMaxBytesMbo10.
Riferimenti PDF supportati
- percorso file locale (inclusa l’espansione di
~) - URL
file:// - URL
http://ehttps:// - riferimenti inbound gestiti da OpenClaw come
media://inbound/<id>
- Altri schemi URI (per esempio
ftp://) vengono rifiutati conunsupported_pdf_reference. - In modalità sandbox, gli URL remoti
http(s)vengono rifiutati. - Con la policy file solo workspace abilitata, i percorsi file locali fuori dalle radici consentite vengono rifiutati.
- I riferimenti inbound gestiti e i percorsi riprodotti nell’archivio media inbound di OpenClaw sono consentiti con la policy file solo workspace.
Modalità di esecuzione
Modalità provider nativa
La modalità nativa viene usata per i provideranthropic e google.
Lo strumento invia i byte PDF grezzi direttamente alle API del provider.
Limiti della modalità nativa:
pagesnon è supportato. Se impostato, lo strumento restituisce un errore.- L’input multi-PDF è supportato; ogni PDF viene inviato come blocco documento nativo / parte PDF inline prima del prompt.
Modalità fallback di estrazione
La modalità fallback viene usata per provider non nativi. Flusso:- Estrae il testo dalle pagine selezionate (fino a
agents.defaults.pdfMaxPages, valore predefinito20). - Se la lunghezza del testo estratto è inferiore a
200caratteri, renderizza le pagine selezionate come immagini PNG e le include. - Invia il contenuto estratto più il prompt al modello selezionato.
- L’estrazione delle immagini delle pagine usa un budget pixel di
4,000,000. - Se il modello di destinazione non supporta input immagine e non c’è testo estraibile, lo strumento restituisce un errore.
- Se l’estrazione del testo riesce ma l’estrazione delle immagini richiederebbe vision su un modello solo testo, OpenClaw elimina le immagini renderizzate e prosegue con il testo estratto.
- Il fallback di estrazione usa il Plugin
document-extractincluso. Il Plugin possiedepdfjs-dist;@napi-rs/canvasviene usato solo quando è disponibile il fallback di rendering immagini.
Configurazione
Dettagli output
Lo strumento restituisce testo incontent[0].text e metadati strutturati in details.
Campi details comuni:
model: riferimento modello risolto (provider/model)native:trueper modalità provider nativa,falseper fallbackattempts: tentativi di fallback non riusciti prima del successo
- input PDF singolo:
details.pdf - input PDF multiplo:
details.pdfs[]con vocipdf - metadati di riscrittura percorso sandbox (quando applicabile):
rewrittenFrom
Comportamento degli errori
- Input PDF mancante: genera
pdf required: provide a path or URL to a PDF document - Troppi PDF: restituisce errore strutturato in
details.error = "too_many_pdfs" - Schema riferimento non supportato: restituisce
details.error = "unsupported_pdf_reference" - Modalità nativa con
pages: genera un errore chiaropages is not supported with native PDF providers
Esempi
PDF singolo:Correlati
- Panoramica strumenti - tutti gli strumenti disponibili dell’agente
- Riferimento configurazione - configurazione pdfMaxBytesMb e pdfMaxPages