메인 콘텐츠로 건너뛰기

Deepgram (오디오 전사)

Deepgram은 speech-to-text API입니다. OpenClaw에서는 tools.media.audio를 통한 인바운드 오디오/음성 노트 전사에 사용됩니다. 활성화되면 OpenClaw는 오디오 파일을 Deepgram에 업로드하고 전사문을 응답 파이프라인({{Transcript}} + [Audio] 블록)에 주입합니다. 이는 스트리밍이 아니며, 사전 녹음 전사 엔드포인트를 사용합니다.
세부 정보
웹사이트deepgram.com
문서developers.deepgram.com
인증DEEPGRAM_API_KEY
기본 모델nova-3

시작하기

1

API 키 설정

Deepgram API 키를 환경에 추가하세요:
DEEPGRAM_API_KEY=dg_...
2

오디오 프로바이더 활성화

{
  tools: {
    media: {
      audio: {
        enabled: true,
        models: [{ provider: "deepgram", model: "nova-3" }],
      },
    },
  },
}
3

음성 노트 전송

연결된 아무 채널에서나 오디오 메시지를 보내세요. OpenClaw가 Deepgram을 통해 이를 전사하고 전사문을 응답 파이프라인에 주입합니다.

구성 옵션

옵션경로설명
modeltools.media.audio.models[].modelDeepgram 모델 id(기본값: nova-3)
languagetools.media.audio.models[].language언어 힌트(선택 사항)
detect_languagetools.media.audio.providerOptions.deepgram.detect_language언어 감지 활성화(선택 사항)
punctuatetools.media.audio.providerOptions.deepgram.punctuate문장 부호 활성화(선택 사항)
smart_formattools.media.audio.providerOptions.deepgram.smart_format스마트 서식 활성화(선택 사항)
{
  tools: {
    media: {
      audio: {
        enabled: true,
        models: [{ provider: "deepgram", model: "nova-3", language: "en" }],
      },
    },
  },
}

참고사항

인증은 표준 프로바이더 인증 순서를 따릅니다. DEEPGRAM_API_KEY가 가장 간단한 경로입니다.
프록시를 사용하는 경우 tools.media.audio.baseUrltools.media.audio.headers로 엔드포인트 또는 헤더를 재정의하세요.
출력은 다른 프로바이더와 동일한 오디오 규칙(크기 제한, 타임아웃, 전사문 주입)을 따릅니다.
Deepgram 전사는 사전 녹음 전용입니다(실시간 스트리밍 아님). OpenClaw는 전체 오디오 파일을 업로드하고, 전체 전사문을 대화에 주입하기 전에 완료될 때까지 기다립니다.

관련 문서

미디어 도구

오디오, 이미지, 비디오 처리 파이프라인 개요.

구성

미디어 도구 설정을 포함한 전체 구성 참조.

문제 해결

일반적인 문제와 디버깅 단계.

FAQ

OpenClaw 설정에 관한 자주 묻는 질문.