Deepgram(音频转录)
Deepgram 是一个语音转文本 API。在 OpenClaw 中,它用于通过tools.media.audio 进行入站音频/语音便笺转录。
启用后,OpenClaw 会将音频文件上传到 Deepgram,并将转录文本注入回复流水线中({{Transcript}} + [Audio] 区块)。这不是流式传输;它使用预录音转录端点。
| 详情 | 值 |
|---|---|
| 网站 | deepgram.com |
| 文档 | developers.deepgram.com |
| 认证 | DEEPGRAM_API_KEY |
| 默认模型 | nova-3 |
入门指南
配置选项
| 选项 | 路径 | 说明 |
|---|---|---|
model | tools.media.audio.models[].model | Deepgram 模型 ID(默认:nova-3) |
language | tools.media.audio.models[].language | 语言提示(可选) |
detect_language | tools.media.audio.providerOptions.deepgram.detect_language | 启用语言检测(可选) |
punctuate | tools.media.audio.providerOptions.deepgram.punctuate | 启用标点(可选) |
smart_format | tools.media.audio.providerOptions.deepgram.smart_format | 启用智能格式化(可选) |
- 带语言提示
- 带 Deepgram 选项
说明
身份验证
身份验证
身份验证遵循标准的提供商认证顺序。
DEEPGRAM_API_KEY 是最简单的方式。代理和自定义端点
代理和自定义端点
使用代理时,可通过
tools.media.audio.baseUrl 和 tools.media.audio.headers 覆盖端点或请求头。输出行为
输出行为
输出遵循与其他提供商相同的音频规则(大小上限、超时、转录文本注入)。
Deepgram 转录仅支持预录音(不是实时分块流式传输)。OpenClaw 会上传完整的音频文件,并在将其注入对话之前等待完整的转录结果。
相关内容
媒体工具
音频、图像和视频处理流水线概览。
配置
完整的配置参考,包括媒体工具设置。
故障排除
常见问题和调试步骤。
常见问题
关于 OpenClaw 设置的常见问题。