Tools
أداة PDF
pdf يحلل مستند PDF واحدًا أو أكثر ويعيد النص.
السلوك السريع:
- وضع المزوّد الأصلي لمزوّدي النماذج Anthropic وGoogle.
- وضع الرجوع إلى الاستخراج للمزوّدين الآخرين (استخراج النص أولًا، ثم صور الصفحات عند الحاجة).
- يدعم إدخالًا منفردًا (
pdf) أو متعددًا (pdfs)، بحد أقصى 10 ملفات PDF لكل استدعاء.
التوفّر
لا تُسجَّل الأداة إلا عندما يتمكّن OpenClaw من حل إعداد نموذج قادر على PDF للوكيل:
agents.defaults.pdfModel- الرجوع إلى
agents.defaults.imageModel - الرجوع إلى نموذج الجلسة/النموذج الافتراضي المحلول للوكيل
- إذا كانت مزوّدات PDF الأصلية مدعومة بالمصادقة، فتفضَّل قبل مرشحي الرجوع العام إلى الصور
إذا تعذّر حل أي نموذج قابل للاستخدام، فلن تُعرَض أداة pdf.
ملاحظات التوفّر:
- سلسلة الرجوع مدركة للمصادقة. لا يُحتسب
provider/modelمكوَّن إلا إذا كان OpenClaw يستطيع فعلًا مصادقة ذلك المزوّد للوكيل. - مزوّدا PDF الأصليان حاليًا هما Anthropic وGoogle.
- إذا كان مزوّد الجلسة/المزوّد الافتراضي المحلول لديه بالفعل نموذج رؤية/PDF مكوَّن، تعيد أداة PDF استخدامه قبل الرجوع إلى مزوّدين آخرين مدعومين بالمصادقة.
مرجع الإدخال
pdfstringمسار PDF واحد أو URL واحد.
pdfsstring[]مسارات PDF أو URLs متعددة، حتى 10 إجمالًا.
promptstringdefault: Analyze this PDF document.موجّه التحليل.
pagesstringمرشح صفحات مثل 1-5 أو 1,3,7-9.
passwordstringكلمة مرور ملفات PDF المشفرة في وضع الرجوع إلى الاستخراج.
modelstringتجاوز اختياري للنموذج بصيغة provider/model.
maxBytesMbnumberحد الحجم لكل PDF بالميغابايت. يُضبط افتراضيًا على agents.defaults.pdfMaxBytesMb أو 10.
ملاحظات الإدخال:
- يُدمج
pdfوpdfsوتُزال التكرارات قبل التحميل. - إذا لم يُقدَّم أي إدخال PDF، تُرجع الأداة خطأ.
- يُفسَّر
pagesكأرقام صفحات تبدأ من 1، مع إزالة التكرارات والفرز والتقييد بالحد الأقصى المكوَّن للصفحات. - ينطبق
passwordعلى كل ملف PDF في الطلب ولا يستخدمه إلا وضع الرجوع إلى الاستخراج. - يُضبط
maxBytesMbافتراضيًا علىagents.defaults.pdfMaxBytesMbأو10.
مراجع PDF المدعومة
- مسار ملف محلي (بما في ذلك توسيع
~) - URL بنمط
file:// - URL بنمط
http://وhttps:// - مراجع واردة مُدارة بواسطة OpenClaw مثل
media://inbound/<id>
ملاحظات المراجع:
- تُرفض مخططات URI الأخرى (مثلًا
ftp://) معunsupported_pdf_reference. - في وضع sandbox، تُرفض URLs البعيدة عبر
http(s). - عند تفعيل سياسة الملفات الخاصة بمساحة العمل فقط، تُرفض مسارات الملفات المحلية خارج الجذور المسموح بها.
- يُسمح بالمراجع الواردة المُدارة والمسارات المُعادة تحت مخزن الوسائط الواردة في OpenClaw مع سياسة الملفات الخاصة بمساحة العمل فقط.
أوضاع التنفيذ
وضع المزوّد الأصلي
يُستخدم الوضع الأصلي للمزوّدين anthropic وgoogle.
ترسل الأداة بايتات PDF الخام مباشرة إلى APIs المزوّدين.
حدود الوضع الأصلي:
pagesغير مدعوم. إذا ضُبط، تُرجع الأداة خطأ.passwordغير مدعوم. استخدم نموذجًا غير أصلي لتحليل ملفات PDF المشفرة.- إدخال PDF متعدد مدعوم؛ يُرسل كل PDF ككتلة مستند أصلية / جزء PDF مضمن قبل الموجّه.
وضع الرجوع إلى الاستخراج
يُستخدم وضع الرجوع للمزوّدين غير الأصليين.
التدفق:
- استخراج النص من الصفحات المحددة (حتى
agents.defaults.pdfMaxPages، الافتراضي20). - إذا كان طول النص المستخرج أقل من
200حرف، تُعرض الصفحات المحددة كصور PNG وتُضمَّن. - إرسال المحتوى المستخرج مع الموجّه إلى النموذج المحدد.
تفاصيل الرجوع:
- يستخدم استخراج صور الصفحات ميزانية بكسلات قدرها
4,000,000. - يمكن فتح ملفات PDF المشفرة باستخدام معامل المستوى الأعلى
password. - إذا كان النموذج المستهدف لا يدعم إدخال الصور ولا يوجد نص قابل للاستخراج، تُرجع الأداة خطأ.
- إذا نجح استخراج النص لكن استخراج الصور سيتطلب رؤية على نموذج نصي فقط، يتجاهل OpenClaw الصور المعروضة ويتابع باستخدام النص المستخرج.
- يستخدم الرجوع إلى الاستخراج Plugin
document-extractالمضمّن. يمتلك هذا Pluginclawpdf، الذي يوفر استخراج النص وعرض الصور عبر PDFium WebAssembly.
الإعداد
{ agents: { defaults: { pdfModel: { primary: "anthropic/claude-opus-4-6", fallbacks: ["openai/gpt-5.4-mini"], }, pdfMaxBytesMb: 10, pdfMaxPages: 20, }, },}راجع مرجع الإعداد لتفاصيل الحقول الكاملة.
تفاصيل الإخراج
تُرجع الأداة النص في content[0].text والبيانات الوصفية المنظمة في details.
حقول details الشائعة:
model: مرجع النموذج المحلول (provider/model)native:trueلوضع المزوّد الأصلي، وfalseللرجوعattempts: محاولات الرجوع التي فشلت قبل النجاح
حقول المسار:
- إدخال PDF واحد:
details.pdf - إدخالات PDF متعددة:
details.pdfs[]مع مدخلاتpdf - بيانات وصفية لإعادة كتابة مسار sandbox (عند الانطباق):
rewrittenFrom
سلوك الأخطاء
- إدخال PDF مفقود: يرمي
pdf required: provide a path or URL to a PDF document - عدد ملفات PDF كبير جدًا: يُرجع خطأ منظمًا في
details.error = "too_many_pdfs" - مخطط مرجع غير مدعوم: يُرجع
details.error = "unsupported_pdf_reference" - الوضع الأصلي مع
pages: يرمي خطأ واضحًاpages is not supported with native PDF providers
أمثلة
PDF واحد:
{ "pdf": "/tmp/report.pdf", "prompt": "Summarize this report in 5 bullets"}ملفات PDF متعددة:
{ "pdfs": ["/tmp/q1.pdf", "/tmp/q2.pdf"], "prompt": "Compare risks and timeline changes across both documents"}نموذج رجوع مع مرشح صفحات:
{ "pdf": "https://example.com/report.pdf", "pages": "1-3,7", "model": "openai/gpt-5.4-mini", "prompt": "Extract only customer-impacting incidents"}PDF مشفر مع الرجوع إلى الاستخراج:
{ "pdf": "/tmp/locked.pdf", "password": "example-password", "model": "openai/gpt-5.4-mini", "prompt": "Summarize this contract"}ذو صلة
- نظرة عامة على الأدوات - كل أدوات الوكيل المتاحة
- مرجع الإعداد - إعداد pdfMaxBytesMb وpdfMaxPages