PDF 도구
pdf는 하나 이상의 PDF 문서를 분석하고 텍스트를 반환합니다.
빠른 동작 개요:
- Anthropic 및 Google 모델 제공자를 위한 기본 제공자 모드
- 다른 제공자를 위한 추출 폴백 모드(먼저 텍스트를 추출하고, 필요할 때 페이지 이미지를 사용)
- 단일(
pdf) 또는 다중(pdfs) 입력 지원, 호출당 최대 10개 PDF
사용 가능 여부
OpenClaw가 에이전트에 대해 PDF 가능한 모델 구성을 확인할 수 있을 때만 이 도구가 등록됩니다:agents.defaults.pdfModel- 폴백으로
agents.defaults.imageModel - 폴백으로 에이전트의 확인된 세션/기본 모델
- 기본 PDF 제공자가 인증 기반이면 일반 이미지 폴백 후보보다 먼저 우선
pdf 도구는 노출되지 않습니다.
사용 가능 여부 참고 사항:
- 폴백 체인은 인증을 인식합니다. 구성된
provider/model은 OpenClaw가 실제로 해당 에이전트에 대해 그 제공자를 인증할 수 있을 때만 유효합니다. - 현재 기본 PDF 제공자는 Anthropic 및 Google입니다.
- 확인된 세션/기본 제공자에 이미 구성된 vision/PDF 모델이 있으면 PDF 도구는 다른 인증 기반 제공자로 폴백하기 전에 이를 재사용합니다.
입력 참조
pdf(string): 하나의 PDF 경로 또는 URLpdfs(string[]): 여러 PDF 경로 또는 URL, 총 최대 10개prompt(string): 분석 프롬프트, 기본값Analyze this PDF document.pages(string):1-5또는1,3,7-9같은 페이지 필터model(string): 선택적 모델 재정의(provider/model)maxBytesMb(number): PDF당 MB 단위 크기 상한
pdf와pdfs는 로드 전에 병합되고 중복 제거됩니다.- PDF 입력이 제공되지 않으면 도구는 오류를 반환합니다.
pages는 1부터 시작하는 페이지 번호로 파싱되며, 중복 제거, 정렬, 그리고 구성된 최대 페이지 수로 제한됩니다.maxBytesMb의 기본값은agents.defaults.pdfMaxBytesMb또는10입니다.
지원되는 PDF 참조
- 로컬 파일 경로(
~확장 포함) file://URLhttp://및https://URL
- 다른 URI 스킴(예:
ftp://)은unsupported_pdf_reference와 함께 거부됩니다. - 샌드박스 모드에서는 원격
http(s)URL이 거부됩니다. - workspace-only 파일 정책이 활성화되면 허용된 루트 밖의 로컬 파일 경로는 거부됩니다.
실행 모드
기본 제공자 모드
기본 모드는 제공자anthropic 및 google에 사용됩니다.
이 도구는 원시 PDF 바이트를 제공자 API로 직접 전송합니다.
기본 모드 제한:
pages는 지원되지 않습니다. 설정되면 도구는 오류를 반환합니다.- 다중 PDF 입력이 지원되며, 각 PDF는 프롬프트 전에 기본 문서 블록 / 인라인 PDF 파트로 전송됩니다.
추출 폴백 모드
폴백 모드는 기본이 아닌 제공자에 사용됩니다. 흐름:- 선택한 페이지에서 텍스트를 추출합니다(
agents.defaults.pdfMaxPages까지, 기본값20). - 추출된 텍스트 길이가
200자 미만이면 선택한 페이지를 PNG 이미지로 렌더링해 포함합니다. - 추출된 콘텐츠와 프롬프트를 선택한 모델로 전송합니다.
- 페이지 이미지 추출에는
4,000,000픽셀 예산이 사용됩니다. - 대상 모델이 이미지 입력을 지원하지 않고 추출 가능한 텍스트도 없으면 도구는 오류를 반환합니다.
- 텍스트 추출에 성공했지만 이미지 추출에 텍스트 전용 모델에서 vision이 필요하다면 OpenClaw는 렌더링된 이미지를 제거하고 추출된 텍스트만으로 계속 진행합니다.
- 추출 폴백에는
pdfjs-dist가 필요합니다(이미지 렌더링에는@napi-rs/canvas도 필요).
설정
출력 세부 정보
도구는content[0].text에 텍스트를 반환하고 details에 구조화된 메타데이터를 반환합니다.
일반적인 details 필드:
model: 확인된 모델 참조(provider/model)native: 기본 제공자 모드이면true, 폴백이면falseattempts: 성공 전에 실패한 폴백 시도
- 단일 PDF 입력:
details.pdf - 다중 PDF 입력:
details.pdfs[]내pdf항목 - 샌드박스 경로 재작성 메타데이터(해당하는 경우):
rewrittenFrom
오류 동작
- PDF 입력 누락:
pdf required: provide a path or URL to a PDF document발생 - PDF가 너무 많음:
details.error = "too_many_pdfs"에 구조화된 오류 반환 - 지원되지 않는 참조 스킴:
details.error = "unsupported_pdf_reference"반환 pages가 있는 기본 모드:pages is not supported with native PDF providers라는 명확한 오류 발생