Documentation Index
Fetch the complete documentation index at: https://docs.openclaw.ai/llms.txt
Use this file to discover all available pages before exploring further.
Hỗ trợ hình ảnh & phương tiện (2025-12-05)
Kênh WhatsApp chạy qua Baileys Web. Tài liệu này ghi lại các quy tắc xử lý phương tiện hiện tại cho gửi, Gateway và phản hồi của tác tử.Mục tiêu
- Gửi phương tiện kèm chú thích tùy chọn qua
openclaw message send --media. - Cho phép phản hồi tự động từ hộp thư đến web bao gồm phương tiện cùng với văn bản.
- Giữ giới hạn theo từng loại hợp lý và dễ dự đoán.
Bề mặt CLI
openclaw message send --media <path-or-url> [--message <caption>]--medialà tùy chọn; chú thích có thể trống khi gửi chỉ có phương tiện.--dry-runin payload đã được phân giải;--jsonxuất{ channel, to, messageId, mediaUrl, caption }.
Hành vi kênh WhatsApp Web
- Đầu vào: đường dẫn tệp cục bộ hoặc URL HTTP(S).
- Luồng: tải vào một Buffer, phát hiện loại phương tiện và dựng payload đúng:
- Hình ảnh: đổi kích thước & nén lại thành JPEG (cạnh tối đa 2048px) nhắm đến
channels.whatsapp.mediaMaxMb(mặc định: 50 MB). - Âm thanh/Giọng nói/Video: chuyển tiếp nguyên trạng tối đa 16 MB; âm thanh được gửi dưới dạng ghi chú thoại (
ptt: true). - Tài liệu: mọi nội dung khác, tối đa 100 MB, giữ nguyên tên tệp khi có.
- Hình ảnh: đổi kích thước & nén lại thành JPEG (cạnh tối đa 2048px) nhắm đến
- Phát lại kiểu GIF trên WhatsApp: gửi MP4 với
gifPlayback: true(CLI:--gif-playback) để ứng dụng di động lặp nội tuyến. - Phát hiện MIME ưu tiên byte nhận diện, sau đó đến header, rồi phần mở rộng tệp.
- Chú thích đến từ
--messagehoặcreply.text; cho phép chú thích trống. - Ghi log: chế độ không chi tiết hiển thị
↩️/✅; chế độ chi tiết bao gồm kích thước và đường dẫn/URL nguồn.
Pipeline phản hồi tự động
getReplyFromConfigtrả về{ text?, mediaUrl?, mediaUrls? }.- Khi có phương tiện, trình gửi web phân giải đường dẫn cục bộ hoặc URL bằng cùng pipeline như
openclaw message send. - Nếu được cung cấp, nhiều mục phương tiện sẽ được gửi tuần tự.
Phương tiện đầu vào cho lệnh (Pi)
- Khi thông điệp web đầu vào bao gồm phương tiện, OpenClaw tải xuống một tệp tạm và cung cấp các biến tạo mẫu:
{{MediaUrl}}URL giả cho phương tiện đầu vào.{{MediaPath}}đường dẫn tạm cục bộ được ghi trước khi chạy lệnh.
- Khi sandbox Docker theo phiên được bật, phương tiện đầu vào được sao chép vào workspace sandbox và
MediaPath/MediaUrlđược viết lại thành một đường dẫn tương đối nhưmedia/inbound/<filename>. - Hiểu phương tiện (nếu được cấu hình qua
tools.media.*hoặctools.media.modelsdùng chung) chạy trước tạo mẫu và có thể chèn các khối[Image],[Audio]và[Video]vàoBody.- Âm thanh đặt
{{Transcript}}và dùng bản ghi âm cho phân tích cú pháp lệnh để lệnh slash vẫn hoạt động. - Mô tả video và hình ảnh giữ nguyên mọi văn bản chú thích để phân tích cú pháp lệnh.
- Nếu mô hình hình ảnh chính đang hoạt động đã hỗ trợ thị giác nguyên bản, OpenClaw bỏ qua khối tóm tắt
[Image]và thay vào đó truyền hình ảnh gốc cho mô hình.
- Âm thanh đặt
- Theo mặc định, chỉ tệp đính kèm hình ảnh/âm thanh/video khớp đầu tiên được xử lý; đặt
tools.media.<cap>.attachmentsđể xử lý nhiều tệp đính kèm.
Giới hạn & lỗi
Giới hạn gửi đi (gửi qua WhatsApp web)- Hình ảnh: tối đa
channels.whatsapp.mediaMaxMb(mặc định: 50 MB) sau khi nén lại. - Âm thanh/giọng nói/video: giới hạn 16 MB; tài liệu: giới hạn 100 MB.
- Phương tiện quá lớn hoặc không đọc được → lỗi rõ ràng trong log và phản hồi bị bỏ qua.
- Mặc định hình ảnh: 10 MB (
tools.media.image.maxBytes). - Mặc định âm thanh: 20 MB (
tools.media.audio.maxBytes). - Mặc định video: 50 MB (
tools.media.video.maxBytes). - Phương tiện quá lớn sẽ bỏ qua bước hiểu, nhưng phản hồi vẫn tiếp tục với phần thân gốc.
Ghi chú cho kiểm thử
- Bao phủ các luồng gửi + phản hồi cho các trường hợp hình ảnh/âm thanh/tài liệu.
- Xác thực nén lại cho hình ảnh (giới hạn kích thước) và cờ ghi chú thoại cho âm thanh.
- Đảm bảo phản hồi nhiều phương tiện được tỏa ra thành các lần gửi tuần tự.