Deepgram은 speech-to-text API입니다. OpenClaw에서는Documentation Index
Fetch the complete documentation index at: https://docs.openclaw.ai/llms.txt
Use this file to discover all available pages before exploring further.
tools.media.audio를 통한 인바운드 오디오/음성 노트 transcription과
plugins.entries.voice-call.config.streaming을 통한 Voice Call 스트리밍 STT에 사용됩니다.
배치 transcription의 경우, OpenClaw는 전체 오디오 파일을 Deepgram에 업로드하고
transcript를 응답 파이프라인에 주입합니다({{Transcript}} +
[Audio] 블록). Voice Call 스트리밍의 경우, OpenClaw는 실시간 G.711
u-law 프레임을 Deepgram의 WebSocket listen 엔드포인트로 전달하고,
Deepgram이 반환하는 partial 또는 final transcript를 내보냅니다.
| 상세 | 값 |
|---|---|
| 웹사이트 | deepgram.com |
| 문서 | developers.deepgram.com |
| 인증 | DEEPGRAM_API_KEY |
| 기본 모델 | nova-3 |
시작하기
구성 옵션
| 옵션 | 경로 | 설명 |
|---|---|---|
model | tools.media.audio.models[].model | Deepgram 모델 id (기본값: nova-3) |
language | tools.media.audio.models[].language | 언어 힌트 (선택 사항) |
detect_language | tools.media.audio.providerOptions.deepgram.detect_language | 언어 감지 활성화 (선택 사항) |
punctuate | tools.media.audio.providerOptions.deepgram.punctuate | 문장 부호 활성화 (선택 사항) |
smart_format | tools.media.audio.providerOptions.deepgram.smart_format | 스마트 서식 활성화 (선택 사항) |
- 언어 힌트 포함
- Deepgram 옵션 포함
Voice Call 스트리밍 STT
번들deepgram Plugin은 Voice Call Plugin용 실시간 transcription provider도 등록합니다.
| 설정 | config 경로 | 기본값 |
|---|---|---|
| API 키 | plugins.entries.voice-call.config.streaming.providers.deepgram.apiKey | DEEPGRAM_API_KEY로 폴백 |
| 모델 | ...deepgram.model | nova-3 |
| 언어 | ...deepgram.language | (unset) |
| 인코딩 | ...deepgram.encoding | mulaw |
| 샘플 레이트 | ...deepgram.sampleRate | 8000 |
| Endpointing | ...deepgram.endpointingMs | 800 |
| Interim 결과 | ...deepgram.interimResults | true |
Voice Call은 전화 음성을 8 kHz G.711 u-law로 받습니다. Deepgram
스트리밍 provider는 기본적으로
encoding: "mulaw"와 sampleRate: 8000을 사용하므로,
Twilio 미디어 프레임을 직접 전달할 수 있습니다.참고
인증
인증
인증은 표준 provider auth 순서를 따릅니다. 가장 간단한 경로는
DEEPGRAM_API_KEY입니다.프록시 및 사용자 지정 엔드포인트
프록시 및 사용자 지정 엔드포인트
proxy를 사용하는 경우
tools.media.audio.baseUrl과
tools.media.audio.headers로 엔드포인트나 헤더를 override하세요.출력 동작
출력 동작
출력은 다른 provider와 동일한 오디오 규칙(크기 제한, 타임아웃,
transcript 주입)을 따릅니다.
관련 항목
미디어 도구
오디오, 이미지, 비디오 처리 파이프라인 개요.
구성
미디어 도구 설정을 포함한 전체 config 참조.
문제 해결
일반적인 문제와 디버깅 단계.
FAQ
OpenClaw 설정에 관한 자주 묻는 질문.