أداة PDF
تقومpdf بتحليل مستند PDF واحد أو أكثر وتعيد النص.
السلوك السريع:
- وضع المزوّد الأصلي لمزوّدي النماذج Anthropic وGoogle.
- وضع الرجوع إلى الاستخراج للمزوّدين الآخرين (استخراج النص أولًا، ثم صور الصفحات عند الحاجة).
- يدعم إدخالًا فرديًا (
pdf) أو متعددًا (pdfs) بحد أقصى 10 ملفات PDF لكل استدعاء.
التوفّر
لا تُسجَّل الأداة إلا عندما يتمكن OpenClaw من حل إعداد نموذج قادر على PDF للوكيل:agents.defaults.pdfModel- الرجوع إلى
agents.defaults.imageModel - الرجوع إلى النموذج المحلول للجلسة/الافتراضي الخاص بالوكيل
- إذا كانت مزوّدات PDF الأصلية مدعومة بالمصادقة، ففضّلها قبل المرشحين العامين للرجوع إلى الصور
pdf.
ملاحظات التوفّر:
- سلسلة الرجوع مدركة للمصادقة. لا يُحتسب
provider/modelالمهيأ إلا إذا كان OpenClaw قادرًا فعليًا على مصادقة ذلك المزوّد لذلك الوكيل. - مزوّدو PDF الأصليون حاليًا هم Anthropic وGoogle.
- إذا كان المزوّد المحلول للجلسة/الافتراضي يملك بالفعل نموذج رؤية/PDF مهيأ، فإن أداة PDF تعيد استخدامه قبل الرجوع إلى مزوّدين آخرين مدعومين بالمصادقة.
مرجع الإدخال
pdf(string): مسار PDF واحد أو URL واحدpdfs(string[]): عدة مسارات PDF أو عناوين URL، حتى 10 إجمالًاprompt(string): مطالبة التحليل، والقيمة الافتراضيةAnalyze this PDF document.pages(string): مرشح صفحات مثل1-5أو1,3,7-9model(string): تجاوز اختياري للنموذج (provider/model)maxBytesMb(number): حد الحجم لكل PDF بالميغابايت
- يتم دمج
pdfوpdfsوإزالة التكرار قبل التحميل. - إذا لم يتم توفير أي إدخال PDF، تُرجع الأداة خطأ.
- يتم تحليل
pagesباعتبارها أرقام صفحات تبدأ من 1، مع إزالة التكرار، والفرز، وتقييدها بالحد الأقصى المهيأ للصفحات. - القيمة الافتراضية لـ
maxBytesMbهيagents.defaults.pdfMaxBytesMbأو10.
مراجع PDF المدعومة
- مسار ملف محلي (بما في ذلك توسيع
~) - عنوان URL من نوع
file:// - عنوان URL من نوع
http://وhttps://
- تُرفض مخططات URI الأخرى (مثل
ftp://) معunsupported_pdf_reference. - في وضع sandbox، تُرفض عناوين URL البعيدة من نوع
http(s). - عند تفعيل سياسة الملفات الخاصة بمساحة العمل فقط، تُرفض مسارات الملفات المحلية خارج الجذور المسموح بها.
أوضاع التنفيذ
وضع المزوّد الأصلي
يُستخدم الوضع الأصلي مع المزوّدanthropic وgoogle.
ترسل الأداة بايتات PDF الخام مباشرةً إلى واجهات برمجة التطبيقات الخاصة بالمزوّد.
حدود الوضع الأصلي:
pagesغير مدعوم. إذا تم تعيينه، تُرجع الأداة خطأ.- إدخال PDF المتعدد مدعوم؛ ويُرسل كل PDF ككتلة مستند أصلية / جزء PDF مضمن قبل المطالبة.
وضع الرجوع إلى الاستخراج
يُستخدم وضع الرجوع للمزوّدين غير الأصليين. التدفق:- استخراج النص من الصفحات المحددة (حتى
agents.defaults.pdfMaxPages، والقيمة الافتراضية20). - إذا كان طول النص المستخرج أقل من
200حرف، تُعرض الصفحات المحددة كصور PNG وتُضمَّن. - إرسال المحتوى المستخرج مع المطالبة إلى النموذج المحدد.
- يستخدم استخراج صور الصفحات ميزانية بكسلات قدرها
4,000,000. - إذا لم يكن النموذج المستهدف يدعم إدخال الصور ولم يوجد نص قابل للاستخراج، تُرجع الأداة خطأ.
- إذا نجح استخراج النص لكن استخراج الصور يتطلب رؤية في نموذج نصي فقط، فإن OpenClaw يسقط الصور المعروضة ويتابع باستخدام النص المستخرج.
- يتطلب الرجوع إلى الاستخراج
pdfjs-dist(و@napi-rs/canvasلعرض الصور).
الإعدادات
تفاصيل المخرجات
تعيد الأداة النص فيcontent[0].text والبيانات الوصفية المنظمة في details.
حقول details الشائعة:
model: مرجع النموذج المحلول (provider/model)native: القيمةtrueلوضع المزوّد الأصلي، وfalseلوضع الرجوعattempts: محاولات الرجوع التي فشلت قبل النجاح
- إدخال PDF واحد:
details.pdf - عدة ملفات PDF:
details.pdfs[]مع إدخالاتpdf - بيانات وصفية لإعادة كتابة مسار sandbox (عند الاقتضاء):
rewrittenFrom
سلوك الأخطاء
- إدخال PDF مفقود: يطرح
pdf required: provide a path or URL to a PDF document - عدد كبير جدًا من ملفات PDF: يُرجع خطأ منظمًا في
details.error = "too_many_pdfs" - مخطط مرجع غير مدعوم: يُرجع
details.error = "unsupported_pdf_reference" - الوضع الأصلي مع
pages: يطرح خطأ واضحًاpages is not supported with native PDF providers
أمثلة
ملف PDF واحد:ذو صلة
- نظرة عامة على الأدوات — جميع أدوات الوكلاء المتاحة
- مرجع الإعدادات — إعدادا pdfMaxBytesMb وpdfMaxPages