Tools
เครื่องมือ PDF
pdf วิเคราะห์เอกสาร PDF หนึ่งรายการขึ้นไปและส่งคืนข้อความ
พฤติกรรมโดยย่อ:
- โหมดผู้ให้บริการแบบเนทีฟสำหรับผู้ให้บริการโมเดล Anthropic และ Google
- โหมดสำรองด้วยการแยกข้อมูลสำหรับผู้ให้บริการอื่น (แยกข้อความก่อน แล้วจึงใช้รูปภาพหน้าเมื่อจำเป็น)
- รองรับอินพุตแบบรายการเดียว (
pdf) หรือหลายรายการ (pdfs) สูงสุด 10 PDF ต่อการเรียกหนึ่งครั้ง
ความพร้อมใช้งาน
เครื่องมือนี้จะถูกลงทะเบียนเฉพาะเมื่อ OpenClaw สามารถแก้ค่า config โมเดลที่รองรับ PDF สำหรับเอเจนต์ได้:
agents.defaults.pdfModel- สำรองไปที่
agents.defaults.imageModel - สำรองไปที่โมเดลเซสชัน/ค่าเริ่มต้นที่แก้ค่าแล้วของเอเจนต์
- หากผู้ให้บริการ PDF แบบเนทีฟมีการรองรับด้วยการยืนยันตัวตน ให้เลือกก่อนตัวเลือกสำรองรูปภาพทั่วไป
หากไม่สามารถแก้ค่าโมเดลที่ใช้งานได้ เครื่องมือ pdf จะไม่ถูกเปิดเผย
หมายเหตุความพร้อมใช้งาน:
- เชนสำรองรับรู้การยืนยันตัวตน ค่า
provider/modelที่ตั้งค่าไว้จะนับเฉพาะเมื่อ OpenClaw สามารถยืนยันตัวตนกับผู้ให้บริการนั้นสำหรับเอเจนต์ได้จริง - ผู้ให้บริการ PDF แบบเนทีฟในปัจจุบันคือ Anthropic และ Google
- หากผู้ให้บริการเซสชัน/ค่าเริ่มต้นที่แก้ค่าแล้วมีโมเดล vision/PDF ที่ตั้งค่าไว้แล้ว เครื่องมือ PDF จะใช้โมเดลนั้นก่อนสำรองไปยังผู้ให้บริการอื่นที่รองรับด้วยการยืนยันตัวตน
อ้างอิงอินพุต
pdfstringพาธหรือ URL ของ PDF หนึ่งรายการ
pdfsstring[]พาธหรือ URL ของ PDF หลายรายการ รวมสูงสุด 10 รายการ
promptstringdefault: Analyze this PDF document.พรอมป์การวิเคราะห์
pagesstringตัวกรองหน้า เช่น 1-5 หรือ 1,3,7-9
passwordstringรหัสผ่านสำหรับ PDF ที่เข้ารหัสในโหมดสำรองด้วยการแยกข้อมูล
modelstringการแทนที่โมเดลแบบไม่บังคับในรูปแบบ provider/model
maxBytesMbnumberขีดจำกัดขนาดต่อ PDF เป็น MB ค่าเริ่มต้นคือ agents.defaults.pdfMaxBytesMb หรือ 10
หมายเหตุอินพุต:
pdfและpdfsจะถูกผสานและลบรายการซ้ำก่อนโหลด- หากไม่ได้ระบุอินพุต PDF เครื่องมือจะแจ้งข้อผิดพลาด
pagesจะถูกแยกวิเคราะห์เป็นหมายเลขหน้าแบบเริ่มที่ 1, ลบรายการซ้ำ, เรียงลำดับ และจำกัดให้อยู่ภายในจำนวนหน้าสูงสุดที่ตั้งค่าไว้passwordใช้กับ PDF ทุกไฟล์ในคำขอ และจะถูกใช้โดยโหมดสำรองด้วยการแยกข้อมูลเท่านั้นmaxBytesMbมีค่าเริ่มต้นเป็นagents.defaults.pdfMaxBytesMbหรือ10
การอ้างอิง PDF ที่รองรับ
- พาธไฟล์ในเครื่อง (รวมถึงการขยาย
~) - URL
file:// - URL
http://และhttps:// - refs ขาเข้าที่ OpenClaw จัดการ เช่น
media://inbound/<id>
หมายเหตุการอ้างอิง:
- URI scheme อื่น (เช่น
ftp://) จะถูกปฏิเสธด้วยunsupported_pdf_reference - ในโหมด sandbox, URL ระยะไกล
http(s)จะถูกปฏิเสธ - เมื่อเปิดใช้นโยบายไฟล์เฉพาะ workspace พาธไฟล์ในเครื่องที่อยู่นอก root ที่อนุญาตจะถูกปฏิเสธ
- refs ขาเข้าที่จัดการแล้วและพาธที่เล่นซ้ำภายใต้ media store ขาเข้าของ OpenClaw จะได้รับอนุญาตด้วยนโยบายไฟล์เฉพาะ workspace
โหมดการทำงาน
โหมดผู้ให้บริการแบบเนทีฟ
โหมดเนทีฟใช้สำหรับผู้ให้บริการ anthropic และ google
เครื่องมือจะส่งไบต์ PDF ดิบไปยัง API ของผู้ให้บริการโดยตรง
ข้อจำกัดของโหมดเนทีฟ:
- ไม่รองรับ
pagesหากตั้งค่าไว้ เครื่องมือจะส่งคืนข้อผิดพลาด - ไม่รองรับ
passwordใช้โมเดลที่ไม่ใช่เนทีฟเพื่อวิเคราะห์ PDF ที่เข้ารหัส - รองรับอินพุตหลาย PDF โดยแต่ละ PDF จะถูกส่งเป็นบล็อกเอกสารเนทีฟ / ส่วน PDF แบบ inline ก่อนพรอมป์
โหมดสำรองด้วยการแยกข้อมูล
โหมดสำรองใช้สำหรับผู้ให้บริการที่ไม่ใช่เนทีฟ
ลำดับงาน:
- แยกข้อความจากหน้าที่เลือก (สูงสุด
agents.defaults.pdfMaxPages, ค่าเริ่มต้น20) - หากความยาวข้อความที่แยกได้ต่ำกว่า
200อักขระ ให้เรนเดอร์หน้าที่เลือกเป็นรูปภาพ PNG และรวมเข้าไปด้วย - ส่งเนื้อหาที่แยกได้พร้อมพรอมป์ไปยังโมเดลที่เลือก
รายละเอียดโหมดสำรอง:
- การแยกรูปภาพหน้าจะใช้งบประมาณพิกเซล
4,000,000 - PDF ที่เข้ารหัสสามารถเปิดได้ด้วยพารามิเตอร์ระดับบนสุด
password - หากโมเดลเป้าหมายไม่รองรับอินพุตรูปภาพและไม่มีข้อความที่แยกได้ เครื่องมือจะแจ้งข้อผิดพลาด
- หากการแยกข้อความสำเร็จ แต่การแยกรูปภาพต้องใช้ vision บนโมเดลแบบข้อความเท่านั้น OpenClaw จะตัดรูปภาพที่เรนเดอร์ออกและดำเนินการต่อด้วยข้อความที่แยกได้
- โหมดสำรองด้วยการแยกข้อมูลใช้ Plugin
document-extractที่บันเดิลมา Plugin นี้เป็นเจ้าของclawpdfซึ่งให้การแยกข้อความและการเรนเดอร์รูปภาพผ่าน PDFium WebAssembly
Config
{ agents: { defaults: { pdfModel: { primary: "anthropic/claude-opus-4-6", fallbacks: ["openai/gpt-5.4-mini"], }, pdfMaxBytesMb: 10, pdfMaxPages: 20, }, },}ดู เอกสารอ้างอิงการกำหนดค่า สำหรับรายละเอียดฟิลด์ทั้งหมด
รายละเอียดเอาต์พุต
เครื่องมือส่งคืนข้อความใน content[0].text และ metadata แบบมีโครงสร้างใน details
ฟิลด์ details ทั่วไป:
model: ref โมเดลที่แก้ค่าแล้ว (provider/model)native:trueสำหรับโหมดผู้ให้บริการแบบเนทีฟ,falseสำหรับโหมดสำรองattempts: ความพยายามสำรองที่ล้มเหลวก่อนสำเร็จ
ฟิลด์พาธ:
- อินพุต PDF เดี่ยว:
details.pdf - อินพุต PDF หลายรายการ:
details.pdfs[]พร้อมรายการpdf - metadata การเขียนพาธใหม่ของ sandbox (เมื่อใช้ได้):
rewrittenFrom
พฤติกรรมข้อผิดพลาด
- อินพุต PDF หายไป: โยน
pdf required: provide a path or URL to a PDF document - PDF มากเกินไป: ส่งคืนข้อผิดพลาดแบบมีโครงสร้างใน
details.error = "too_many_pdfs" - scheme การอ้างอิงไม่รองรับ: ส่งคืน
details.error = "unsupported_pdf_reference" - โหมดเนทีฟพร้อม
pages: โยนข้อผิดพลาดที่ชัดเจนpages is not supported with native PDF providers
ตัวอย่าง
PDF เดี่ยว:
{ "pdf": "/tmp/report.pdf", "prompt": "Summarize this report in 5 bullets"}PDF หลายรายการ:
{ "pdfs": ["/tmp/q1.pdf", "/tmp/q2.pdf"], "prompt": "Compare risks and timeline changes across both documents"}โมเดลสำรองที่กรองหน้า:
{ "pdf": "https://example.com/report.pdf", "pages": "1-3,7", "model": "openai/gpt-5.4-mini", "prompt": "Extract only customer-impacting incidents"}PDF ที่เข้ารหัสพร้อมโหมดสำรองด้วยการแยกข้อมูล:
{ "pdf": "/tmp/locked.pdf", "password": "example-password", "model": "openai/gpt-5.4-mini", "prompt": "Summarize this contract"}ที่เกี่ยวข้อง
- ภาพรวมเครื่องมือ - เครื่องมือเอเจนต์ทั้งหมดที่พร้อมใช้งาน
- เอกสารอ้างอิงการกำหนดค่า - config pdfMaxBytesMb และ pdfMaxPages