Documentation Index
Fetch the complete documentation index at: https://docs.openclaw.ai/llms.txt
Use this file to discover all available pages before exploring further.
pdf วิเคราะห์เอกสาร PDF หนึ่งรายการหรือมากกว่า และส่งคืนข้อความ
พฤติกรรมโดยย่อ:
- โหมดผู้ให้บริการแบบเนทีฟสำหรับผู้ให้บริการโมเดล Anthropic และ Google
- โหมดสำรองด้วยการสกัดข้อมูลสำหรับผู้ให้บริการอื่น (สกัดข้อความก่อน จากนั้นใช้รูปภาพหน้าเมื่อจำเป็น)
- รองรับอินพุตรายการเดียว (
pdf) หรือหลายรายการ (pdfs) สูงสุด 10 PDF ต่อการเรียกหนึ่งครั้ง
ความพร้อมใช้งาน
เครื่องมือนี้จะถูกลงทะเบียนเฉพาะเมื่อ OpenClaw สามารถแก้ค่า config โมเดลที่รองรับ PDF สำหรับเอเจนต์ได้:agents.defaults.pdfModel- สำรองไปที่
agents.defaults.imageModel - สำรองไปที่โมเดลเซสชัน/ค่าเริ่มต้นที่แก้ค่าแล้วของเอเจนต์
- หากผู้ให้บริการ PDF แบบเนทีฟมีการยืนยันตัวตนรองรับ ให้เลือกก่อนตัวเลือกสำรองรูปภาพทั่วไป
pdf จะไม่ถูกเปิดเผย
หมายเหตุความพร้อมใช้งาน:
- ลำดับสำรองรับรู้สถานะการยืนยันตัวตน
provider/modelที่กำหนดค่าไว้จะนับเฉพาะเมื่อ OpenClaw สามารถยืนยันตัวตนกับผู้ให้บริการนั้นสำหรับเอเจนต์ได้จริง - ผู้ให้บริการ PDF แบบเนทีฟในปัจจุบันคือ Anthropic และ Google
- หากผู้ให้บริการเซสชัน/ค่าเริ่มต้นที่แก้ค่าแล้วมีโมเดล vision/PDF ที่กำหนดค่าไว้แล้ว เครื่องมือ PDF จะใช้โมเดลนั้นก่อนสำรองไปยังผู้ให้บริการ อื่นที่มีการยืนยันตัวตนรองรับ
อ้างอิงอินพุต
พาธหรือ URL ของ PDF หนึ่งรายการ
พาธหรือ URL ของ PDF หลายรายการ รวมสูงสุด 10 รายการ
พรอมป์การวิเคราะห์
ตัวกรองหน้า เช่น
1-5 หรือ 1,3,7-9การแทนที่โมเดลแบบไม่บังคับในรูปแบบ
provider/modelขีดจำกัดขนาดต่อ PDF เป็น MB ค่าเริ่มต้นคือ
agents.defaults.pdfMaxBytesMb หรือ 10pdfและpdfsจะถูกรวมและลบรายการซ้ำก่อนโหลด- หากไม่ได้ระบุอินพุต PDF เครื่องมือจะแจ้งข้อผิดพลาด
pagesจะถูกแยกวิเคราะห์เป็นหมายเลขหน้าแบบเริ่มนับจาก 1 ลบรายการซ้ำ เรียงลำดับ และจำกัดให้อยู่ภายในจำนวนหน้าสูงสุดที่กำหนดค่าไว้maxBytesMbมีค่าเริ่มต้นเป็นagents.defaults.pdfMaxBytesMbหรือ10
การอ้างอิง PDF ที่รองรับ
- พาธไฟล์ในเครื่อง (รวมถึงการขยาย
~) - URL
file:// - URL
http://และhttps:// - refs ขาเข้าที่ OpenClaw จัดการ เช่น
media://inbound/<id>
- รูปแบบ URI อื่น (เช่น
ftp://) จะถูกปฏิเสธด้วยunsupported_pdf_reference - ในโหมด sandbox, URL
http(s)ระยะไกลจะถูกปฏิเสธ - เมื่อเปิดใช้นโยบายไฟล์แบบเฉพาะพื้นที่ทำงาน พาธไฟล์ในเครื่องที่อยู่นอก root ที่อนุญาตจะถูกปฏิเสธ
- refs ขาเข้าที่จัดการแล้วและพาธที่เล่นซ้ำภายใต้คลังสื่อขาเข้าของ OpenClaw จะได้รับอนุญาตเมื่อใช้นโยบายไฟล์แบบเฉพาะพื้นที่ทำงาน
โหมดการดำเนินการ
โหมดผู้ให้บริการแบบเนทีฟ
โหมดเนทีฟใช้สำหรับผู้ให้บริการanthropic และ google
เครื่องมือจะส่งไบต์ PDF ดิบไปยัง API ของผู้ให้บริการโดยตรง
ข้อจำกัดของโหมดเนทีฟ:
- ไม่รองรับ
pagesหากตั้งค่าไว้ เครื่องมือจะส่งคืนข้อผิดพลาด - รองรับอินพุตหลาย PDF โดยแต่ละ PDF จะถูกส่งเป็นบล็อกเอกสารเนทีฟ / ส่วน PDF แบบอินไลน์ก่อนพรอมป์
โหมดสำรองด้วยการสกัดข้อมูล
โหมดสำรองใช้สำหรับผู้ให้บริการที่ไม่ใช่เนทีฟ ลำดับการทำงาน:- สกัดข้อความจากหน้าที่เลือก (สูงสุด
agents.defaults.pdfMaxPagesค่าเริ่มต้น20) - หากความยาวข้อความที่สกัดได้น้อยกว่า
200อักขระ ให้เรนเดอร์หน้าที่เลือกเป็นรูปภาพ PNG และรวมเข้าไปด้วย - ส่งเนื้อหาที่สกัดได้พร้อมพรอมป์ไปยังโมเดลที่เลือก
- การสกัดรูปภาพหน้าจะใช้งบประมาณพิกเซล
4,000,000 - หากโมเดลเป้าหมายไม่รองรับอินพุตรูปภาพและไม่มีข้อความที่สกัดได้ เครื่องมือจะแจ้งข้อผิดพลาด
- หากการสกัดข้อความสำเร็จ แต่การสกัดรูปภาพจำเป็นต้องใช้ vision บนโมเดล ที่รับเฉพาะข้อความ OpenClaw จะทิ้งรูปภาพที่เรนเดอร์แล้วและดำเนินการต่อด้วย ข้อความที่สกัดได้
- โหมดสำรองด้วยการสกัดข้อมูลใช้ Plugin
document-extractที่รวมมาให้ Plugin เป็นเจ้าของpdfjs-dist;@napi-rs/canvasจะถูกใช้เฉพาะเมื่อการสำรองด้วยการเรนเดอร์รูปภาพ พร้อมใช้งาน
Config
รายละเอียดเอาต์พุต
เครื่องมือส่งคืนข้อความในcontent[0].text และ metadata แบบมีโครงสร้างใน details
ฟิลด์ details ทั่วไป:
model: ref โมเดลที่แก้ค่าแล้ว (provider/model)native:trueสำหรับโหมดผู้ให้บริการแบบเนทีฟ,falseสำหรับโหมดสำรองattempts: ความพยายามสำรองที่ล้มเหลวก่อนสำเร็จ
- อินพุต PDF รายการเดียว:
details.pdf - อินพุต PDF หลายรายการ:
details.pdfs[]พร้อมรายการpdf - metadata การเขียนพาธใหม่ของ sandbox (เมื่อเกี่ยวข้อง):
rewrittenFrom
พฤติกรรมข้อผิดพลาด
- อินพุต PDF ขาดหาย: โยนข้อผิดพลาด
pdf required: provide a path or URL to a PDF document - PDF มากเกินไป: ส่งคืนข้อผิดพลาดแบบมีโครงสร้างใน
details.error = "too_many_pdfs" - รูปแบบการอ้างอิงไม่รองรับ: ส่งคืน
details.error = "unsupported_pdf_reference" - โหมดเนทีฟพร้อม
pages: โยนข้อผิดพลาดpages is not supported with native PDF providersที่ชัดเจน
ตัวอย่าง
PDF รายการเดียว:ที่เกี่ยวข้อง
- ภาพรวมเครื่องมือ - เครื่องมือเอเจนต์ทั้งหมดที่พร้อมใช้งาน
- ข้อมูลอ้างอิงการกำหนดค่า - config pdfMaxBytesMb และ pdfMaxPages