Tools

أداة PDF

pdf يحلل مستند PDF واحدًا أو أكثر ويعيد النص.

السلوك السريع:

  • وضع المزوّد الأصلي لمزوّدي النماذج Anthropic وGoogle.
  • وضع الرجوع إلى الاستخراج للمزوّدين الآخرين (استخراج النص أولًا، ثم صور الصفحات عند الحاجة).
  • يدعم إدخالًا منفردًا (pdf) أو متعددًا (pdfs)، بحد أقصى 10 ملفات PDF لكل استدعاء.

التوفّر

لا تُسجَّل الأداة إلا عندما يتمكّن OpenClaw من حل إعداد نموذج قادر على PDF للوكيل:

  1. agents.defaults.pdfModel
  2. الرجوع إلى agents.defaults.imageModel
  3. الرجوع إلى نموذج الجلسة/النموذج الافتراضي المحلول للوكيل
  4. إذا كانت مزوّدات PDF الأصلية مدعومة بالمصادقة، فتفضَّل قبل مرشحي الرجوع العام إلى الصور

إذا تعذّر حل أي نموذج قابل للاستخدام، فلن تُعرَض أداة pdf.

ملاحظات التوفّر:

  • سلسلة الرجوع مدركة للمصادقة. لا يُحتسب provider/model مكوَّن إلا إذا كان OpenClaw يستطيع فعلًا مصادقة ذلك المزوّد للوكيل.
  • مزوّدا PDF الأصليان حاليًا هما Anthropic وGoogle.
  • إذا كان مزوّد الجلسة/المزوّد الافتراضي المحلول لديه بالفعل نموذج رؤية/PDF مكوَّن، تعيد أداة PDF استخدامه قبل الرجوع إلى مزوّدين آخرين مدعومين بالمصادقة.

مرجع الإدخال

pdfstring

مسار PDF واحد أو URL واحد.

pdfsstring[]

مسارات PDF أو URLs متعددة، حتى 10 إجمالًا.

promptstringdefault: Analyze this PDF document.

موجّه التحليل.

pagesstring

مرشح صفحات مثل 1-5 أو 1,3,7-9.

passwordstring

كلمة مرور ملفات PDF المشفرة في وضع الرجوع إلى الاستخراج.

modelstring

تجاوز اختياري للنموذج بصيغة provider/model.

maxBytesMbnumber

حد الحجم لكل PDF بالميغابايت. يُضبط افتراضيًا على agents.defaults.pdfMaxBytesMb أو 10.

ملاحظات الإدخال:

  • يُدمج pdf وpdfs وتُزال التكرارات قبل التحميل.
  • إذا لم يُقدَّم أي إدخال PDF، تُرجع الأداة خطأ.
  • يُفسَّر pages كأرقام صفحات تبدأ من 1، مع إزالة التكرارات والفرز والتقييد بالحد الأقصى المكوَّن للصفحات.
  • ينطبق password على كل ملف PDF في الطلب ولا يستخدمه إلا وضع الرجوع إلى الاستخراج.
  • يُضبط maxBytesMb افتراضيًا على agents.defaults.pdfMaxBytesMb أو 10.

مراجع PDF المدعومة

  • مسار ملف محلي (بما في ذلك توسيع ~)
  • URL بنمط file://
  • URL بنمط http:// وhttps://
  • مراجع واردة مُدارة بواسطة OpenClaw مثل media://inbound/<id>

ملاحظات المراجع:

  • تُرفض مخططات URI الأخرى (مثلًا ftp://) مع unsupported_pdf_reference.
  • في وضع sandbox، تُرفض URLs البعيدة عبر http(s).
  • عند تفعيل سياسة الملفات الخاصة بمساحة العمل فقط، تُرفض مسارات الملفات المحلية خارج الجذور المسموح بها.
  • يُسمح بالمراجع الواردة المُدارة والمسارات المُعادة تحت مخزن الوسائط الواردة في OpenClaw مع سياسة الملفات الخاصة بمساحة العمل فقط.

أوضاع التنفيذ

وضع المزوّد الأصلي

يُستخدم الوضع الأصلي للمزوّدين anthropic وgoogle. ترسل الأداة بايتات PDF الخام مباشرة إلى APIs المزوّدين.

حدود الوضع الأصلي:

  • pages غير مدعوم. إذا ضُبط، تُرجع الأداة خطأ.
  • password غير مدعوم. استخدم نموذجًا غير أصلي لتحليل ملفات PDF المشفرة.
  • إدخال PDF متعدد مدعوم؛ يُرسل كل PDF ككتلة مستند أصلية / جزء PDF مضمن قبل الموجّه.

وضع الرجوع إلى الاستخراج

يُستخدم وضع الرجوع للمزوّدين غير الأصليين.

التدفق:

  1. استخراج النص من الصفحات المحددة (حتى agents.defaults.pdfMaxPages، الافتراضي 20).
  2. إذا كان طول النص المستخرج أقل من 200 حرف، تُعرض الصفحات المحددة كصور PNG وتُضمَّن.
  3. إرسال المحتوى المستخرج مع الموجّه إلى النموذج المحدد.

تفاصيل الرجوع:

  • يستخدم استخراج صور الصفحات ميزانية بكسلات قدرها 4,000,000.
  • يمكن فتح ملفات PDF المشفرة باستخدام معامل المستوى الأعلى password.
  • إذا كان النموذج المستهدف لا يدعم إدخال الصور ولا يوجد نص قابل للاستخراج، تُرجع الأداة خطأ.
  • إذا نجح استخراج النص لكن استخراج الصور سيتطلب رؤية على نموذج نصي فقط، يتجاهل OpenClaw الصور المعروضة ويتابع باستخدام النص المستخرج.
  • يستخدم الرجوع إلى الاستخراج Plugin document-extract المضمّن. يمتلك هذا Plugin clawpdf، الذي يوفر استخراج النص وعرض الصور عبر PDFium WebAssembly.

الإعداد

json5
{  agents: {    defaults: {      pdfModel: {        primary: "anthropic/claude-opus-4-6",        fallbacks: ["openai/gpt-5.4-mini"],      },      pdfMaxBytesMb: 10,      pdfMaxPages: 20,    },  },}

راجع مرجع الإعداد لتفاصيل الحقول الكاملة.

تفاصيل الإخراج

تُرجع الأداة النص في content[0].text والبيانات الوصفية المنظمة في details.

حقول details الشائعة:

  • model: مرجع النموذج المحلول (provider/model)
  • native: true لوضع المزوّد الأصلي، وfalse للرجوع
  • attempts: محاولات الرجوع التي فشلت قبل النجاح

حقول المسار:

  • إدخال PDF واحد: details.pdf
  • إدخالات PDF متعددة: details.pdfs[] مع مدخلات pdf
  • بيانات وصفية لإعادة كتابة مسار sandbox (عند الانطباق): rewrittenFrom

سلوك الأخطاء

  • إدخال PDF مفقود: يرمي pdf required: provide a path or URL to a PDF document
  • عدد ملفات PDF كبير جدًا: يُرجع خطأ منظمًا في details.error = "too_many_pdfs"
  • مخطط مرجع غير مدعوم: يُرجع details.error = "unsupported_pdf_reference"
  • الوضع الأصلي مع pages: يرمي خطأ واضحًا pages is not supported with native PDF providers

أمثلة

PDF واحد:

json
{  "pdf": "/tmp/report.pdf",  "prompt": "Summarize this report in 5 bullets"}

ملفات PDF متعددة:

json
{  "pdfs": ["/tmp/q1.pdf", "/tmp/q2.pdf"],  "prompt": "Compare risks and timeline changes across both documents"}

نموذج رجوع مع مرشح صفحات:

json
{  "pdf": "https://example.com/report.pdf",  "pages": "1-3,7",  "model": "openai/gpt-5.4-mini",  "prompt": "Extract only customer-impacting incidents"}

PDF مشفر مع الرجوع إلى الاستخراج:

json
{  "pdf": "/tmp/locked.pdf",  "password": "example-password",  "model": "openai/gpt-5.4-mini",  "prompt": "Summarize this contract"}

ذو صلة

Was this useful?
On this page

On this page