Tools
PDF aracı
pdf, bir veya daha fazla PDF belgesini analiz eder ve metin döndürür.
Hızlı davranış:
- Anthropic ve Google model sağlayıcıları için yerel sağlayıcı modu.
- Diğer sağlayıcılar için çıkarma geri dönüş modu (önce metni, gerektiğinde sayfa görüntülerini çıkarır).
- Tek (
pdf) veya çoklu (pdfs) girişi destekler; çağrı başına en fazla 10 PDF.
Kullanılabilirlik
Araç yalnızca OpenClaw, ajan için PDF özellikli bir model yapılandırmasını çözümleyebildiğinde kaydedilir:
agents.defaults.pdfModelagents.defaults.imageModeldeğerine geri dönüş- ajanın çözümlenmiş oturum/varsayılan modeline geri dönüş
- yerel PDF sağlayıcıları kimlik doğrulama destekliyse, genel görüntü geri dönüş adaylarından önce onları tercih et
Kullanılabilir bir model çözümlenemezse pdf aracı sunulmaz.
Kullanılabilirlik notları:
- Geri dönüş zinciri kimlik doğrulamanın farkındadır. Yapılandırılmış bir
provider/modelyalnızca OpenClaw o sağlayıcıda ajan için gerçekten kimlik doğrulayabiliyorsa sayılır. - Yerel PDF sağlayıcıları şu anda Anthropic ve Googledır.
- Çözümlenmiş oturum/varsayılan sağlayıcının zaten yapılandırılmış bir görme/PDF modeli varsa PDF aracı, diğer kimlik doğrulama destekli sağlayıcılara geri dönmeden önce bunu yeniden kullanır.
Girdi referansı
pdfstringBir PDF yolu veya URL'si.
pdfsstring[]Toplamda en fazla 10 olmak üzere birden fazla PDF yolu veya URL'si.
promptstringdefault: Analyze this PDF document.Analiz istemi.
pagesstring1-5 veya 1,3,7-9 gibi sayfa filtresi.
passwordstringÇıkarma geri dönüş modunda şifrelenmiş PDF'ler için parola.
modelstringprovider/model biçiminde isteğe bağlı model geçersiz kılması.
maxBytesMbnumberPDF başına MB cinsinden boyut sınırı. Varsayılan olarak agents.defaults.pdfMaxBytesMb veya 10 kullanılır.
Girdi notları:
pdfvepdfs, yüklemeden önce birleştirilir ve yinelenenler kaldırılır.- PDF girdisi sağlanmazsa araç hata verir.
pages, 1 tabanlı sayfa numaraları olarak ayrıştırılır; yinelenenler kaldırılır, sıralanır ve yapılandırılmış maksimum sayfa sayısına sınırlandırılır.password, istekteki her PDF için geçerlidir ve yalnızca çıkarma geri dönüş modu tarafından kullanılır.maxBytesMbvarsayılan olarakagents.defaults.pdfMaxBytesMbveya10kullanır.
Desteklenen PDF referansları
- yerel dosya yolu (
~genişletmesi dahil) file://URL'sihttp://vehttps://URL'simedia://inbound/<id>gibi OpenClaw tarafından yönetilen gelen referanslar
Referans notları:
- Diğer URI şemaları (örneğin
ftp://)unsupported_pdf_referenceile reddedilir. - Sandbox modunda, uzak
http(s)URL'leri reddedilir. - Yalnızca çalışma alanı dosya ilkesi etkinleştirildiğinde, izin verilen köklerin dışındaki yerel dosya yolları reddedilir.
- OpenClaw'ın gelen medya deposu altındaki yönetilen gelen referanslara ve yeniden oynatılan yollara, yalnızca çalışma alanı dosya ilkesiyle izin verilir.
Çalıştırma modları
Yerel sağlayıcı modu
Yerel mod, anthropic ve google sağlayıcıları için kullanılır.
Araç, ham PDF baytlarını doğrudan sağlayıcı API'lerine gönderir.
Yerel mod sınırları:
pagesdesteklenmez. Ayarlanırsa araç hata döndürür.passworddesteklenmez. Şifrelenmiş PDF'leri analiz etmek için yerel olmayan bir model kullanın.- Çoklu PDF girdisi desteklenir; her PDF, istemden önce yerel belge bloğu / satır içi PDF parçası olarak gönderilir.
Çıkarma geri dönüş modu
Geri dönüş modu, yerel olmayan sağlayıcılar için kullanılır.
Akış:
- Seçilen sayfalardan metin çıkar (
agents.defaults.pdfMaxPagesdeğerine kadar, varsayılan20). - Çıkarılan metin uzunluğu
200karakterin altındaysa, seçilen sayfaları PNG görüntülerine dönüştür ve dahil et. - Çıkarılan içeriği ve istemi seçilen modele gönder.
Geri dönüş ayrıntıları:
- Sayfa görüntüsü çıkarma,
4,000,000piksel bütçesi kullanır. - Şifrelenmiş PDF'ler üst düzey
passwordparametresiyle açılabilir. - Hedef model görüntü girişini desteklemiyorsa ve çıkarılabilir metin yoksa araç hata verir.
- Metin çıkarma başarılı olursa ancak görüntü çıkarma yalnızca metin destekleyen bir modelde görme gerektirirse, OpenClaw oluşturulan görüntüleri bırakır ve çıkarılan metinle devam eder.
- Çıkarma geri dönüşü, paketlenmiş
document-extractPlugin'ini kullanır. Plugin, PDFium WebAssembly aracılığıyla metin çıkarma ve görüntü oluşturma sağlayanclawpdföğesinin sahibidir.
Yapılandırma
{ agents: { defaults: { pdfModel: { primary: "anthropic/claude-opus-4-6", fallbacks: ["openai/gpt-5.4-mini"], }, pdfMaxBytesMb: 10, pdfMaxPages: 20, }, },}Tüm alan ayrıntıları için Yapılandırma Referansı bölümüne bakın.
Çıktı ayrıntıları
Araç, metni content[0].text içinde ve yapılandırılmış meta verileri details içinde döndürür.
Yaygın details alanları:
model: çözümlenmiş model referansı (provider/model)native: yerel sağlayıcı modu içintrue, geri dönüş içinfalseattempts: başarıdan önce başarısız olan geri dönüş denemeleri
Yol alanları:
- tek PDF girdisi:
details.pdf - birden fazla PDF girdisi:
pdfgirdileriyledetails.pdfs[] - sandbox yolu yeniden yazma meta verileri (geçerli olduğunda):
rewrittenFrom
Hata davranışı
- Eksik PDF girdisi:
pdf required: provide a path or URL to a PDF documentfırlatır - Çok fazla PDF:
details.error = "too_many_pdfs"içinde yapılandırılmış hata döndürür - Desteklenmeyen referans şeması:
details.error = "unsupported_pdf_reference"döndürür pagesile yerel mod: açık birpages is not supported with native PDF providershatası fırlatır
Örnekler
Tek PDF:
{ "pdf": "/tmp/report.pdf", "prompt": "Summarize this report in 5 bullets"}Birden fazla PDF:
{ "pdfs": ["/tmp/q1.pdf", "/tmp/q2.pdf"], "prompt": "Compare risks and timeline changes across both documents"}Sayfa filtreli geri dönüş modeli:
{ "pdf": "https://example.com/report.pdf", "pages": "1-3,7", "model": "openai/gpt-5.4-mini", "prompt": "Extract only customer-impacting incidents"}Çıkarma geri dönüşüyle şifrelenmiş PDF:
{ "pdf": "/tmp/locked.pdf", "password": "example-password", "model": "openai/gpt-5.4-mini", "prompt": "Summarize this contract"}İlgili
- Araçlara Genel Bakış - kullanılabilir tüm ajan araçları
- Yapılandırma Referansı - pdfMaxBytesMb ve pdfMaxPages yapılandırması