Documentation Index
Fetch the complete documentation index at: https://docs.openclaw.ai/llms.txt
Use this file to discover all available pages before exploring further.
pdf analyse un ou plusieurs documents PDF et renvoie du texte.
Comportement rapide :
- Mode fournisseur natif pour les fournisseurs de modèles Anthropic et Google.
- Mode de repli par extraction pour les autres fournisseurs (extraire d’abord le texte, puis les images des pages si nécessaire).
- Prend en charge une entrée unique (
pdf) ou multiple (pdfs), avec un maximum de 10 PDF par appel.
Disponibilité
L’outil n’est enregistré que lorsque OpenClaw peut résoudre une configuration de modèle compatible PDF pour l’agent :agents.defaults.pdfModel- repli vers
agents.defaults.imageModel - repli vers le modèle de session/par défaut résolu de l’agent
- si les fournisseurs PDF natifs sont appuyés par l’authentification, les préférer aux candidats de repli d’image génériques
pdf n’est pas exposé.
Notes de disponibilité :
- La chaîne de repli tient compte de l’authentification. Un
provider/modelconfiguré ne compte que si OpenClaw peut réellement authentifier ce fournisseur pour l’agent. - Les fournisseurs PDF natifs sont actuellement Anthropic et Google.
- Si le fournisseur de session/par défaut résolu dispose déjà d’un modèle vision/PDF configuré, l’outil PDF le réutilise avant de se rabattre sur d’autres fournisseurs appuyés par l’authentification.
Référence des entrées
Un chemin ou une URL de PDF.
Plusieurs chemins ou URL de PDF, jusqu’à 10 au total.
Invite d’analyse.
Filtre de pages comme
1-5 ou 1,3,7-9.Remplacement facultatif du modèle sous la forme
provider/model.Limite de taille par PDF en Mo. Par défaut,
agents.defaults.pdfMaxBytesMb ou 10.pdfetpdfssont fusionnés et dédupliqués avant le chargement.- Si aucune entrée PDF n’est fournie, l’outil renvoie une erreur.
pagesest analysé comme des numéros de page en base 1, dédupliqués, triés et bornés au nombre maximal de pages configuré.maxBytesMbvaut par défautagents.defaults.pdfMaxBytesMbou10.
Références PDF prises en charge
- chemin de fichier local (avec extension de
~) - URL
file:// - URL
http://ethttps:// - références entrantes gérées par OpenClaw comme
media://inbound/<id>
- Les autres schémas d’URI (par exemple
ftp://) sont rejetés avecunsupported_pdf_reference. - En mode sandbox, les URL
http(s)distantes sont rejetées. - Lorsque la politique de fichiers limitée à l’espace de travail est activée, les chemins de fichiers locaux hors des racines autorisées sont rejetés.
- Les références entrantes gérées et les chemins rejoués sous le magasin de médias entrants d’OpenClaw sont autorisés avec la politique de fichiers limitée à l’espace de travail.
Modes d’exécution
Mode fournisseur natif
Le mode natif est utilisé pour les fournisseursanthropic et google.
L’outil envoie les octets PDF bruts directement aux API des fournisseurs.
Limites du mode natif :
pagesn’est pas pris en charge. S’il est défini, l’outil renvoie une erreur.- L’entrée multi-PDF est prise en charge ; chaque PDF est envoyé comme bloc de document natif / partie PDF intégrée avant l’invite.
Mode de repli par extraction
Le mode de repli est utilisé pour les fournisseurs non natifs. Flux :- Extraire le texte des pages sélectionnées (jusqu’à
agents.defaults.pdfMaxPages,20par défaut). - Si la longueur du texte extrait est inférieure à
200caractères, convertir les pages sélectionnées en images PNG et les inclure. - Envoyer le contenu extrait avec l’invite au modèle sélectionné.
- L’extraction d’images de page utilise un budget de pixels de
4,000,000. - Si le modèle cible ne prend pas en charge l’entrée image et qu’il n’existe aucun texte extractible, l’outil renvoie une erreur.
- Si l’extraction de texte réussit mais que l’extraction d’images nécessiterait la vision sur un modèle texte uniquement, OpenClaw supprime les images rendues et continue avec le texte extrait.
- Le repli par extraction utilise le Plugin
document-extractfourni. Le Plugin possèdepdfjs-dist;@napi-rs/canvasn’est utilisé que lorsque le repli de rendu d’images est disponible.
Configuration
Détails de sortie
L’outil renvoie du texte danscontent[0].text et des métadonnées structurées dans details.
Champs details courants :
model: référence de modèle résolue (provider/model)native:truepour le mode fournisseur natif,falsepour le repliattempts: tentatives de repli ayant échoué avant la réussite
- entrée PDF unique :
details.pdf - plusieurs entrées PDF :
details.pdfs[]avec des entréespdf - métadonnées de réécriture de chemin sandbox (le cas échéant) :
rewrittenFrom
Comportement en cas d’erreur
- Entrée PDF manquante : lève
pdf required: provide a path or URL to a PDF document - Trop de PDF : renvoie une erreur structurée dans
details.error = "too_many_pdfs" - Schéma de référence non pris en charge : renvoie
details.error = "unsupported_pdf_reference" - Mode natif avec
pages: lève une erreur clairepages is not supported with native PDF providers
Exemples
PDF unique :Connexe
- Vue d’ensemble des outils - tous les outils d’agent disponibles
- Référence de configuration - configuration pdfMaxBytesMb et pdfMaxPages