Deepgram là một API chuyển giọng nói thành văn bản. Trong OpenClaw, nó được dùng để phiên âm âm thanh/ghi chú thoại gửi đến thông quaDocumentation Index
Fetch the complete documentation index at: https://docs.openclaw.ai/llms.txt
Use this file to discover all available pages before exploring further.
tools.media.audio và cho STT phát trực tuyến của Voice Call thông qua plugins.entries.voice-call.config.streaming.
Đối với phiên âm theo lô, OpenClaw tải toàn bộ tệp âm thanh lên Deepgram và chèn bản phiên âm vào quy trình trả lời ({{Transcript}} + khối [Audio]). Đối với phát trực tuyến Voice Call, OpenClaw chuyển tiếp các khung G.711 u-law trực tiếp qua endpoint WebSocket listen của Deepgram và phát ra bản phiên âm một phần hoặc cuối cùng khi Deepgram trả về.
| Chi tiết | Giá trị |
|---|---|
| Trang web | deepgram.com |
| Tài liệu | developers.deepgram.com |
| Xác thực | DEEPGRAM_API_KEY |
| Mô hình mặc định | nova-3 |
Bắt đầu
Tùy chọn cấu hình
| Tùy chọn | Đường dẫn | Mô tả |
|---|---|---|
model | tools.media.audio.models[].model | ID mô hình Deepgram (mặc định: nova-3) |
language | tools.media.audio.models[].language | Gợi ý ngôn ngữ (tùy chọn) |
detect_language | tools.media.audio.providerOptions.deepgram.detect_language | Bật phát hiện ngôn ngữ (tùy chọn) |
punctuate | tools.media.audio.providerOptions.deepgram.punctuate | Bật dấu câu (tùy chọn) |
smart_format | tools.media.audio.providerOptions.deepgram.smart_format | Bật định dạng thông minh (tùy chọn) |
- With language hint
- With Deepgram options
STT phát trực tuyến Voice Call
Plugindeepgram đi kèm cũng đăng ký một nhà cung cấp phiên âm thời gian thực cho Plugin Voice Call.
| Thiết lập | Đường dẫn cấu hình | Mặc định |
|---|---|---|
| Khóa API | plugins.entries.voice-call.config.streaming.providers.deepgram.apiKey | Dự phòng về DEEPGRAM_API_KEY |
| Mô hình | ...deepgram.model | nova-3 |
| Ngôn ngữ | ...deepgram.language | (chưa đặt) |
| Mã hóa | ...deepgram.encoding | mulaw |
| Tốc độ mẫu | ...deepgram.sampleRate | 8000 |
| Ngắt cuối đoạn | ...deepgram.endpointingMs | 800 |
| Kết quả tạm thời | ...deepgram.interimResults | true |
Voice Call nhận âm thanh điện thoại dưới dạng G.711 u-law 8 kHz. Nhà cung cấp phát trực tuyến Deepgram mặc định dùng
encoding: "mulaw" và sampleRate: 8000, vì vậy có thể chuyển tiếp trực tiếp các khung phương tiện Twilio.Ghi chú
Authentication
Authentication
Xác thực tuân theo thứ tự xác thực nhà cung cấp tiêu chuẩn.
DEEPGRAM_API_KEY là cách đơn giản nhất.Proxy and custom endpoints
Proxy and custom endpoints
Ghi đè endpoint hoặc header bằng
tools.media.audio.baseUrl và tools.media.audio.headers khi dùng proxy.Output behavior
Output behavior
Đầu ra tuân theo cùng các quy tắc âm thanh như những nhà cung cấp khác (giới hạn kích thước, thời gian chờ, chèn bản phiên âm).
Liên quan
Media tools
Tổng quan về quy trình xử lý âm thanh, hình ảnh và video.
Configuration
Tham chiếu cấu hình đầy đủ, bao gồm các thiết lập công cụ phương tiện.
Troubleshooting
Các sự cố thường gặp và bước gỡ lỗi.
FAQ
Các câu hỏi thường gặp về thiết lập OpenClaw.