Deepgram (오디오 전사)
Deepgram은 speech-to-text API입니다. OpenClaw에서는tools.media.audio를 통한 인바운드 오디오/음성 노트 전사에 사용됩니다.
활성화되면 OpenClaw는 오디오 파일을 Deepgram에 업로드하고 전사문을 응답 파이프라인({{Transcript}} + [Audio] 블록)에 주입합니다. 이는 스트리밍이 아니며,
사전 녹음 전사 엔드포인트를 사용합니다.
| 세부 정보 | 값 |
|---|---|
| 웹사이트 | deepgram.com |
| 문서 | developers.deepgram.com |
| 인증 | DEEPGRAM_API_KEY |
| 기본 모델 | nova-3 |
시작하기
구성 옵션
| 옵션 | 경로 | 설명 |
|---|---|---|
model | tools.media.audio.models[].model | Deepgram 모델 id(기본값: nova-3) |
language | tools.media.audio.models[].language | 언어 힌트(선택 사항) |
detect_language | tools.media.audio.providerOptions.deepgram.detect_language | 언어 감지 활성화(선택 사항) |
punctuate | tools.media.audio.providerOptions.deepgram.punctuate | 문장 부호 활성화(선택 사항) |
smart_format | tools.media.audio.providerOptions.deepgram.smart_format | 스마트 서식 활성화(선택 사항) |
- 언어 힌트와 함께
- Deepgram 옵션과 함께
참고사항
인증
인증
인증은 표준 프로바이더 인증 순서를 따릅니다.
DEEPGRAM_API_KEY가
가장 간단한 경로입니다.프록시 및 사용자 지정 엔드포인트
프록시 및 사용자 지정 엔드포인트
프록시를 사용하는 경우
tools.media.audio.baseUrl 및
tools.media.audio.headers로 엔드포인트 또는 헤더를 재정의하세요.출력 동작
출력 동작
출력은 다른 프로바이더와 동일한 오디오 규칙(크기 제한, 타임아웃,
전사문 주입)을 따릅니다.
Deepgram 전사는 사전 녹음 전용입니다(실시간 스트리밍 아님). OpenClaw는
전체 오디오 파일을 업로드하고, 전체 전사문을 대화에 주입하기 전에
완료될 때까지 기다립니다.
관련 문서
미디어 도구
오디오, 이미지, 비디오 처리 파이프라인 개요.
구성
미디어 도구 설정을 포함한 전체 구성 참조.
문제 해결
일반적인 문제와 디버깅 단계.
FAQ
OpenClaw 설정에 관한 자주 묻는 질문.