Outil PDF
pdf analyse un ou plusieurs documents PDF et renvoie du texte.
Comportement rapide :
- Mode fournisseur natif pour les fournisseurs de modèles Anthropic et Google.
- Mode de repli par extraction pour les autres fournisseurs (extraire d’abord le texte, puis les images des pages si nécessaire).
- Prend en charge une entrée unique (
pdf) ou multiple (pdfs), avec un maximum de 10 PDF par appel.
Disponibilité
L’outil n’est enregistré que lorsque OpenClaw peut résoudre une configuration de modèle compatible PDF pour l’agent :agents.defaults.pdfModel- repli sur
agents.defaults.imageModel - repli sur le modèle de session/par défaut résolu de l’agent
- si les fournisseurs PDF natifs sont adossés à une authentification, les préférer avant les candidats génériques de repli d’image
pdf n’est pas exposé.
Notes sur la disponibilité :
- La chaîne de repli tient compte de l’authentification. Un
provider/modelconfiguré ne compte que si OpenClaw peut effectivement authentifier ce fournisseur pour l’agent. - Les fournisseurs PDF natifs sont actuellement Anthropic et Google.
- Si le fournisseur de session/par défaut résolu dispose déjà d’un modèle vision/PDF configuré, l’outil PDF le réutilise avant de se replier sur d’autres fournisseurs adossés à une authentification.
Référence des entrées
pdf(string) : un chemin ou une URL de PDFpdfs(string[]) : plusieurs chemins ou URL de PDF, jusqu’à 10 au totalprompt(string) : prompt d’analyse, par défautAnalyze this PDF document.pages(string) : filtre de pages comme1-5ou1,3,7-9model(string) : remplacement de modèle facultatif (provider/model)maxBytesMb(number) : limite de taille par PDF en Mo
pdfetpdfssont fusionnés et dédupliqués avant le chargement.- Si aucune entrée PDF n’est fournie, l’outil renvoie une erreur.
pagesest analysé comme des numéros de page à base 1, dédupliqués, triés et limités au nombre maximal de pages configuré.maxBytesMba pour valeur par défautagents.defaults.pdfMaxBytesMbou10.
Références PDF prises en charge
- chemin de fichier local (y compris l’expansion de
~) - URL
file:// - URL
http://ethttps://
- Les autres schémas d’URI (par exemple
ftp://) sont rejetés avecunsupported_pdf_reference. - En mode sandbox, les URL distantes
http(s)sont rejetées. - Lorsque la politique de fichiers limitée au workspace est activée, les chemins de fichiers locaux en dehors des racines autorisées sont rejetés.
Modes d’exécution
Mode fournisseur natif
Le mode natif est utilisé pour les fournisseursanthropic et google.
L’outil envoie directement les octets bruts du PDF aux API des fournisseurs.
Limites du mode natif :
pagesn’est pas pris en charge. S’il est défini, l’outil renvoie une erreur.- L’entrée multi-PDF est prise en charge ; chaque PDF est envoyé comme bloc de document natif / partie PDF en ligne avant le prompt.
Mode de repli par extraction
Le mode de repli est utilisé pour les fournisseurs non natifs. Flux :- Extraire le texte des pages sélectionnées (jusqu’à
agents.defaults.pdfMaxPages, valeur par défaut20). - Si la longueur du texte extrait est inférieure à
200caractères, rendre les pages sélectionnées en images PNG et les inclure. - Envoyer le contenu extrait plus le prompt au modèle sélectionné.
- L’extraction d’images de page utilise un budget de pixels de
4,000,000. - Si le modèle cible ne prend pas en charge l’entrée image et qu’il n’y a pas de texte extractible, l’outil renvoie une erreur.
- Si l’extraction de texte réussit mais que l’extraction d’images nécessiterait la vision sur un modèle texte seul, OpenClaw supprime les images rendues et continue avec le texte extrait.
- Le repli par extraction nécessite
pdfjs-dist(et@napi-rs/canvaspour le rendu d’image).
Configuration
Détails de sortie
L’outil renvoie du texte danscontent[0].text et des métadonnées structurées dans details.
Champs details courants :
model: référence du modèle résolu (provider/model)native:truepour le mode fournisseur natif,falsepour le repliattempts: tentatives de repli ayant échoué avant le succès
- entrée PDF unique :
details.pdf - entrées PDF multiples :
details.pdfs[]avec des entréespdf - métadonnées de réécriture de chemin sandbox (le cas échéant) :
rewrittenFrom
Comportement en cas d’erreur
- Entrée PDF manquante : lève
pdf required: provide a path or URL to a PDF document - Trop de PDF : renvoie une erreur structurée dans
details.error = "too_many_pdfs" - Schéma de référence non pris en charge : renvoie
details.error = "unsupported_pdf_reference" - Mode natif avec
pages: lève une erreur clairepages is not supported with native PDF providers
Exemples
PDF unique :Liens associés
- Vue d’ensemble des outils — tous les outils d’agent disponibles
- Référence de configuration — configuration
pdfMaxBytesMbetpdfMaxPages