公式 Discord Gateway 経由で DM とギルドチャンネルに対応しています。Documentation Index
Fetch the complete documentation index at: https://docs.openclaw.ai/llms.txt
Use this file to discover all available pages before exploring further.
ペアリング
スラッシュコマンド
チャンネルのトラブルシューティング
クイックセットアップ
Bot を含む新しいアプリケーションを作成し、その Bot を自分のサーバーに追加して、OpenClaw にペアリングする必要があります。自分専用のプライベートサーバーに Bot を追加することをおすすめします。まだ持っていない場合は、先に作成してください(自分で作成 > 自分と友達のため を選びます)。Discord アプリケーションと Bot を作成する
特権インテントを有効にする
- メッセージコンテンツインテント(必須)
- サーバーメンバーインテント(推奨。ロール許可リストと名前から ID への照合に必要)
- プレゼンスインテント(任意。プレゼンス更新にのみ必要)
Bot トークンをコピーする
招待 URL を生成し、Bot をサーバーに追加する
botapplications.commands
- チャンネルを見る テキスト権限
- メッセージを送信
- メッセージ履歴を読む
- 埋め込みリンク
- ファイルを添付
- リアクションを追加(任意)
開発者モードを有効にして ID を収集する
- ユーザー設定(アバターの横の歯車アイコン)をクリック → 詳細設定 → 開発者モード をオン
- サイドバーの サーバーアイコン を右クリック → サーバー ID をコピー
- 自分のアバター を右クリック → ユーザー ID をコピー
サーバーメンバーからの DM を許可する
Bot トークンを安全に設定する(チャットで送らない)
openclaw gateway run プロセスを停止して再起動します。
マネージドサービスのインストールでは、DISCORD_BOT_TOKEN が存在するシェルから openclaw gateway install を実行するか、変数を ~/.openclaw/.env に保存して、再起動後にサービスが env SecretRef を解決できるようにします。
ホストが Discord の起動時アプリケーション検索でブロックされる、またはレート制限される場合は、Developer Portal から Discord アプリケーション/クライアント ID を設定して、起動時にその REST 呼び出しをスキップできるようにします。デフォルトアカウントには channels.discord.applicationId を使い、複数の Discord Bot を実行する場合は channels.discord.accounts.<accountId>.applicationId を使います。OpenClaw を設定してペアリングする
- エージェントに依頼
- CLI / 設定
「Discord Bot トークンはすでに設定に入れました。ユーザー ID<user_id>とサーバー ID<server_id>で Discord セットアップを完了してください。」
DISCORD_BOT_TOKEN はデフォルトアカウントにのみ使われます。
有効な 2 つの Discord アカウントが同じ Bot トークンに解決される場合、OpenClaw はそのトークンに対して Gateway モニターを 1 つだけ起動します。設定由来のトークンはデフォルトの env フォールバックより優先されます。それ以外の場合は最初に有効化されたアカウントが優先され、重複アカウントは無効として報告されます。
高度なアウトバウンド呼び出し(メッセージツール/チャンネルアクション)では、呼び出しごとの明示的な token がその呼び出しに使われます。これは送信と read/probe スタイルのアクション(たとえば read/search/fetch/thread/pins/permissions)に適用されます。アカウントポリシー/リトライ設定は、アクティブなランタイムスナップショットで選択されたアカウントから引き続き取得されます。推奨: ギルドワークスペースをセットアップする
DM が動作したら、Discord サーバーを完全なワークスペースとしてセットアップできます。各チャンネルには独自のコンテキストを持つ独自のエージェントセッションが割り当てられます。これは、自分と Bot だけがいるプライベートサーバーにおすすめです。サーバーをギルド許可リストに追加する
- エージェントに依頼
- 設定
「私の Discord サーバー ID <server_id> をギルド許可リストに追加してください」
@mention なしの応答を許可する
message ツールで明示的に送信する必要があるため、エージェントはデフォルトでは待機し、チャンネル返信が有用だと判断した場合にのみ投稿できます。つまり、選択したモデルは確実にツールを呼び出せる必要があります。Discord で入力中表示が出て、ログにトークン使用量があるのに投稿メッセージがない場合は、セッションログで didSendViaMessagingTool: false を含むアシスタントテキストを確認してください。これは、モデルが message(action=send) を呼び出す代わりに、非公開の最終回答を生成したことを意味します。より強力なツール呼び出しモデルに切り替えるか、下の設定を使って従来の自動最終返信を復元してください。- エージェントに依頼
- 設定
「@mention されなくても、このサーバーでエージェントが応答できるようにしてください」
#coding、#home、#research、またはワークフローに合う任意のチャンネルを設定できます。
ランタイムモデル
- Gateway が Discord 接続を所有します。
- 返信ルーティングは決定的です。Discord の受信返信は Discord に返されます。
- Discord のギルド/チャンネルメタデータは、ユーザーに見える返信プレフィックスとしてではなく、信頼されないコンテキストとしてモデルプロンプトに追加されます。モデルがそのエンベロープをコピーして返した場合、OpenClaw は送信返信と以後の再生コンテキストから、コピーされたメタデータを取り除きます。
- デフォルトでは(
session.dmScope=main)、ダイレクトチャットはエージェントのメインセッション(agent:main:main)を共有します。 - ギルドチャンネルは分離されたセッションキー(
agent:<agentId>:discord:channel:<channelId>)です。 - グループ DM はデフォルトで無視されます(
channels.discord.dm.groupEnabled=false)。 - ネイティブスラッシュコマンドは、分離されたコマンドセッション(
agent:<agentId>:discord:slash:<userId>)で実行されますが、ルーティング先の会話セッションにCommandTargetSessionKeyを引き続き渡します。 - Discord へのテキストのみの Cron/Heartbeat 通知配信は、最終的にアシスタントに見える回答を一度だけ使います。メディアと構造化コンポーネントペイロードは、エージェントが複数の配信可能ペイロードを出力する場合、複数メッセージのままです。
フォーラムチャンネル
Discord のフォーラムチャンネルとメディアチャンネルはスレッド投稿のみを受け付けます。OpenClaw はそれらを作成する方法を 2 つサポートします。- フォーラムの親(
channel:<forumId>)にメッセージを送信して、スレッドを自動作成します。スレッドタイトルには、メッセージの最初の空でない行が使われます。 openclaw message thread createを使って、スレッドを直接作成します。フォーラムチャンネルでは--message-idを渡さないでください。
channel:<threadId>)に送信してください。
インタラクティブコンポーネント
OpenClaw は、エージェントメッセージ向けに Discord components v2 コンテナをサポートします。components ペイロードを指定してメッセージツールを使います。インタラクション結果は通常の受信メッセージとしてエージェントにルーティングされ、既存の Discord replyToMode 設定に従います。
サポートされるブロック:
text、section、separator、actions、media-gallery、file- アクション行では、最大 5 個のボタンまたは単一の選択メニューを使用できます
- 選択タイプ:
string、user、role、mentionable、channel
components.reusable=true を設定します。
ボタンをクリックできるユーザーを制限するには、そのボタンに allowedUsers を設定します(Discord ユーザー ID、タグ、または *)。設定されている場合、一致しないユーザーにはエフェメラルな拒否が届きます。
/model と /models スラッシュコマンドは、プロバイダー、モデル、互換ランタイムのドロップダウンと送信ステップを備えたインタラクティブなモデルピッカーを開きます。/models add は非推奨であり、チャットからモデルを登録する代わりに非推奨メッセージを返すようになりました。ピッカーの返信はエフェメラルで、呼び出したユーザーのみが使用できます。Discord の選択メニューは 25 個のオプションに制限されているため、openai-codex や vllm など選択したプロバイダーについてのみ、動的に検出されたモデルをピッカーに表示したい場合は、provider/* エントリを agents.defaults.models に追加してください。
ファイル添付:
fileブロックは添付参照(attachment://<filename>)を指す必要がありますmedia/path/filePath(単一ファイル)で添付を提供します。複数ファイルにはmedia-galleryを使います- アップロード名を添付参照と一致させる必要がある場合は、
filenameを使って上書きします
- 最大 5 個のフィールドを持つ
components.modalを追加します - フィールドタイプ:
text、checkbox、radio、select、role-select、user-select - OpenClaw はトリガーボタンを自動的に追加します
アクセス制御とルーティング
- DM ポリシー
- アクセスグループ
- ギルドポリシー
- メンションとグループ DM
channels.discord.dmPolicy は DM アクセスを制御します。channels.discord.allowFrom は正規の DM 許可リストです。pairing(デフォルト)allowlistopen(channels.discord.allowFromに"*"が含まれている必要があります)disabled
pairing モードではペアリングを促されます)。マルチアカウントの優先順位:channels.discord.accounts.default.allowFromはdefaultアカウントにのみ適用されます。- 1 つのアカウントでは、
allowFromがレガシーのdm.allowFromより優先されます。 - 名前付きアカウントは、独自の
allowFromとレガシーのdm.allowFromが未設定の場合、channels.discord.allowFromを継承します。 - 名前付きアカウントは
channels.discord.accounts.default.allowFromを継承しません。
channels.discord.dm.policy と channels.discord.dm.allowFrom は互換性のために引き続き読み取られます。openclaw doctor --fix は、アクセスを変更せずに実行できる場合、それらを dmPolicy と allowFrom に移行します。配信用の DM ターゲット形式:user:<id><@id>メンション
allowFrom に列挙されている ID は、互換性のためにユーザー DM ターゲットとして扱われます。ロールベースのエージェントルーティング
Discord ギルドメンバーをロール ID に基づいて別のエージェントへルーティングするには、bindings[].match.roles を使います。ロールベースのバインディングはロール ID のみを受け付け、ピアまたは親ピアのバインディングの後、ギルドのみのバインディングの前に評価されます。バインディングが他の照合フィールド(たとえば peer + guildId + roles)も設定している場合、設定されたすべてのフィールドが一致する必要があります。
ネイティブコマンドとコマンド認可
commands.nativeのデフォルトは"auto"で、Discord では有効です。- チャンネルごとの上書き:
channels.discord.commands.native。 commands.native=falseは、起動時の Discord スラッシュコマンド登録とクリーンアップをスキップします。以前に登録されたコマンドは、Discord アプリから削除するまで Discord に表示されたままになる場合があります。- ネイティブコマンド認証は、通常のメッセージ処理と同じ Discord の許可リスト/ポリシーを使用します。
- 権限のないユーザーにも、コマンドが Discord UI に表示される場合があります。実行時には引き続き OpenClaw 認証が適用され、“not authorized” が返されます。
ephemeral: true
機能の詳細
Reply tags and native replies
Reply tags and native replies
Live stream preview
Live stream preview
channels.discord.streaming は off | partial | block | progress (デフォルト) を受け取ります。progress は編集可能なステータス下書きを 1 つ保持し、最終配信までツール進捗で更新します。共有の開始ラベルは流れる行なので、十分な作業が表示されると他の内容と同様にスクロールして見えなくなります。streamMode はレガシーランタイムエイリアスです。永続化された設定を正規キーに書き換えるには、openclaw doctor --fix を実行してください。Discord のプレビュー編集を無効にするには、channels.discord.streaming.mode を off に設定します。Discord のブロックストリーミングが明示的に有効な場合、OpenClaw は二重ストリーミングを避けるためプレビューストリームをスキップします。partialは、トークンの到着に応じて単一のプレビューメッセージを編集します。blockは下書きサイズのチャンクを出力します (サイズと区切り位置の調整にはdraftChunkを使用し、textChunkLimitにクランプされます)。- メディア、エラー、明示的返信の最終応答は、保留中のプレビュー編集をキャンセルします。
streaming.preview.toolProgress(デフォルトtrue) は、ツール/進捗の更新でプレビューメッセージを再利用するかどうかを制御します。- ツール/進捗行は、利用可能な場合、コンパクトな絵文字 + タイトル + 詳細としてレンダリングされます。例:
🛠️ Bash: run testsまたは🔎 Web Search: for "query"。 streaming.preview.commandText/streaming.progress.commandTextは、コンパクトな進捗行のコマンド/実行詳細を制御します:raw(デフォルト) またはstatus(ツールラベルのみ)。
block ストリーミングが明示的に有効な場合、OpenClaw は二重ストリーミングを避けるためプレビューストリームをスキップします。History, context, and thread behavior
History, context, and thread behavior
channels.discord.historyLimitのデフォルトは20- フォールバック:
messages.groupChat.historyLimit 0で無効化
channels.discord.dmHistoryLimitchannels.discord.dms["<user_id>"].historyLimit
- Discord スレッドはチャンネルセッションとしてルーティングされ、上書きされない限り親チャンネル設定を継承します。
- スレッドセッションは、モデルのみのフォールバックとして、親チャンネルのセッションレベルの
/model選択を継承します。スレッドローカルの/model選択は引き続き優先され、トランスクリプト継承が有効でない限り、親のトランスクリプト履歴はコピーされません。 channels.discord.thread.inheritParent(デフォルトfalse) は、新しい自動スレッドで親トランスクリプトからのシードを有効にします。アカウントごとの上書きはchannels.discord.accounts.<id>.thread.inheritParent配下にあります。- メッセージツールのリアクションは、
user:<id>DM ターゲットを解決できます。 guilds.<guild>.channels.<channel>.requireMention: falseは、返信段階のアクティベーションフォールバック中も保持されます。
Thread-bound sessions for subagents
Thread-bound sessions for subagents
/focus <target>現在/新規スレッドをサブエージェント/セッションターゲットにバインド/unfocus現在のスレッドバインドを削除/agentsアクティブな実行とバインド状態を表示/session idle <duration|off>フォーカス済みバインドの非アクティブ時自動アンフォーカスを確認/更新/session max-age <duration|off>フォーカス済みバインドの厳格な最大有効期間を確認/更新
session.threadBindings.*はグローバルデフォルトを設定します。channels.discord.threadBindings.*は Discord の動作を上書きします。spawnSessionsは、sessions_spawn({ thread: true })と ACP スレッドスポーンでのスレッド自動作成/バインドを制御します。デフォルト:true。defaultSpawnContextは、スレッドバインドされたスポーンのネイティブサブエージェントコンテキストを制御します。デフォルト:"fork"。- 非推奨の
spawnSubagentSessions/spawnAcpSessionsキーはopenclaw doctor --fixによって移行されます。 - アカウントでスレッドバインドが無効な場合、
/focusと関連するスレッドバインド操作は利用できません。
Persistent ACP channel bindings
Persistent ACP channel bindings
bindings[]にtype: "acp"とmatch.channel: "discord"を指定
/acp spawn codex --bind hereは、現在のチャンネルまたはスレッドをその場でバインドし、以後のメッセージを同じ ACP セッションに保持します。スレッドメッセージは親チャンネルのバインドを継承します。- バインドされたチャンネルまたはスレッドでは、
/newと/resetは同じ ACP セッションをその場でリセットします。一時的なスレッドバインドは、アクティブな間ターゲット解決を上書きできます。 spawnSessionsは、--thread auto|hereによる子スレッドの作成/バインドを制御します。
Reaction notifications
Reaction notifications
offown(デフォルト)allallowlist(guilds.<id>.usersを使用)
Ack reactions
Ack reactions
ackReaction は、OpenClaw が受信メッセージを処理している間、確認用の絵文字を送信します。解決順序:channels.discord.accounts.<accountId>.ackReactionchannels.discord.ackReactionmessages.ackReaction- エージェント ID 絵文字フォールバック (
agents.list[].identity.emoji、なければ ”👀”)
- Discord は Unicode 絵文字またはカスタム絵文字名を受け付けます。
- チャンネルまたはアカウントのリアクションを無効にするには
""を使用します。
Config writes
Config writes
/config set|unset フローに影響します (コマンド機能が有効な場合)。無効化:Gateway proxy
Gateway proxy
channels.discord.proxy を使って HTTP(S) プロキシ経由でルーティングします。PluralKit support
PluralKit support
- 許可リストでは
pk:<memberId>を使用できます - メンバー表示名は、
channels.discord.dangerouslyAllowNameMatching: trueの場合にのみ name/slug で照合されます - ルックアップは元のメッセージ ID を使用し、時間枠で制限されます
- ルックアップに失敗した場合、プロキシされたメッセージは bot メッセージとして扱われ、
allowBots=trueでない限り破棄されます
Outbound mention aliases
Outbound mention aliases
mentionAliases を使用します。キーは先頭の @ を含まないハンドル、値は Discord ユーザー ID です。不明なハンドル、@everyone、@here、Markdown コードスパン内のメンションは変更されません。Presence configuration
Presence configuration
- 0: プレイ中
- 1: 配信中(
activityUrlが必要) - 2: 聴取中
- 3: 視聴中
- 4: カスタム(アクティビティテキストをステータス状態として使用します。絵文字は任意です)
- 5: 競技中
autoPresence.healthyTextautoPresence.degradedTextautoPresence.exhaustedText({reason}プレースホルダーをサポート)
Discord での承認
Discord での承認
channels.discord.execApprovals.enabledchannels.discord.execApprovals.approvers(任意。可能な場合はcommands.ownerAllowFromにフォールバック)channels.discord.execApprovals.target(dm|channel|both、デフォルト:dm)agentFilter、sessionFilter、cleanupAfterResolve
enabled が未設定または "auto" で、execApprovals.approvers または commands.ownerAllowFrom から少なくとも 1 人の承認者を解決できる場合、Discord はネイティブの実行承認を自動的に有効化します。Discord は、チャンネルの allowFrom、従来の dm.allowFrom、またはダイレクトメッセージの defaultTo から実行承認者を推測しません。Discord をネイティブ承認クライアントとして明示的に無効化するには、enabled: false を設定します。/diagnostics や /export-trajectory など、機密性の高いオーナー専用グループコマンドでは、OpenClaw は承認プロンプトと最終結果を非公開で送信します。呼び出したオーナーに Discord オーナールートがある場合はまず Discord DM を試し、それが利用できない場合は Telegram など、commands.ownerAllowFrom から最初に利用可能なオーナールートにフォールバックします。target が channel または both の場合、承認プロンプトはチャンネルに表示されます。解決済みの承認者だけがボタンを使用できます。他のユーザーには一時的な拒否が返されます。承認プロンプトにはコマンドテキストが含まれるため、チャンネル配信は信頼済みチャンネルでのみ有効化してください。セッションキーからチャンネル ID を導出できない場合、OpenClaw は DM 配信にフォールバックします。Discord は、他のチャットチャンネルで使われる共有承認ボタンもレンダリングします。ネイティブ Discord アダプターは主に、承認者への DM ルーティングとチャンネルへのファンアウトを追加します。
これらのボタンが存在する場合、それらが主要な承認 UX です。OpenClaw
は、ツール結果がチャット承認を利用できない、または手動承認が唯一の経路であると示す場合にのみ、手動の /approve コマンドを含めるべきです。
Discord ネイティブ承認ランタイムがアクティブでない場合、OpenClaw は
ローカルの決定論的な /approve <id> <decision> プロンプトを表示したままにします。
ランタイムがアクティブでも、どのターゲットにもネイティブカードを配信できない場合、
OpenClaw は保留中の承認から正確な /approve
コマンドを含む、同じチャット内のフォールバック通知を送信します。Gateway 認証と承認解決は、共有 Gateway クライアント契約に従います(plugin: ID は plugin.approval.resolve を通じて解決され、その他の ID は exec.approval.resolve を通じて解決されます)。承認はデフォルトで 30 分後に期限切れになります。実行承認 を参照してください。ツールとアクションゲート
Discord メッセージアクションには、メッセージング、チャンネル管理、モデレーション、プレゼンス、メタデータアクションが含まれます。 主要な例:- メッセージング:
sendMessage、readMessages、editMessage、deleteMessage、threadReply - リアクション:
react、reactions、emojiList - モデレーション:
timeout、kick、ban - プレゼンス:
setPresence
event-create アクションは、スケジュール済みイベントのカバー画像を設定する任意の image パラメーター(URL またはローカルファイルパス)を受け取ります。
アクションゲートは channels.discord.actions.* の下にあります。
デフォルトのゲート動作:
| アクショングループ | デフォルト |
|---|---|
| reactions, messages, threads, pins, polls, search, memberInfo, roleInfo, channelInfo, channels, voiceStatus, events, stickers, emojiUploads, stickerUploads, permissions | 有効 |
| roles | 無効 |
| moderation | 無効 |
| presence | 無効 |
コンポーネント v2 UI
OpenClaw は実行承認とクロスコンテキストマーカーに Discord コンポーネント v2 を使用します。Discord メッセージアクションはカスタム UI 用のcomponents も受け取れます(高度。discord ツールを通じてコンポーネントペイロードを構築する必要があります)。一方、従来の embeds は引き続き利用できますが、推奨されません。
channels.discord.ui.components.accentColorは、Discord コンポーネントコンテナーで使われるアクセントカラー(16 進)を設定します。channels.discord.accounts.<id>.ui.components.accentColorでアカウントごとに設定します。- コンポーネント v2 が存在する場合、
embedsは無視されます。
音声
Discord には 2 つの異なる音声サーフェスがあります。リアルタイムの音声チャンネル(継続的な会話)と、音声メッセージ添付ファイル(波形プレビュー形式)です。Gateway は両方をサポートします。音声チャンネル
セットアップチェックリスト:- Discord Developer Portal で Message Content Intent を有効化します。
- ロール/ユーザー許可リストを使用する場合は、Server Members Intent を有効化します。
botとapplications.commandsスコープでボットを招待します。- 対象の音声チャンネルで Connect、Speak、Send Messages、Read Message History を付与します。
- ネイティブコマンド(
commands.nativeまたはchannels.discord.commands.native)を有効化します。 channels.discord.voiceを設定します。
/vc join|leave|status を使用します。このコマンドはアカウントのデフォルトエージェントを使用し、他の Discord コマンドと同じ許可リストおよびグループポリシールールに従います。
voice.ttsは、stt-ttsの音声再生のみに対してmessages.ttsを上書きします。リアルタイムモードではvoice.realtime.voiceを使用します。voice.modeは会話パスを制御します。デフォルトはagent-proxyです。リアルタイム音声フロントエンドがターンのタイミング、割り込み、再生を処理し、実質的な作業をopenclaw_agent_consultを通じてルーティング済みの OpenClaw エージェントに委任し、その結果をその話者からの入力済み Discord プロンプトのように扱います。stt-ttsは従来のバッチ STT と TTS のフローを維持します。bidiでは、OpenClaw の頭脳向けにopenclaw_agent_consultを公開しながら、リアルタイムモデルが直接会話できます。voice.agentSessionは、どの OpenClaw 会話が音声ターンを受け取るかを制御します。音声チャンネル自身のセッションを使う場合は未設定のままにするか、音声チャンネルを#maintainersのような既存 Discord テキストチャンネルセッションのマイク/スピーカー拡張として動作させるには{ mode: "target", target: "channel:<text-channel-id>" }を設定します。voice.modelは、Discord 音声応答とリアルタイム consult に対して OpenClaw エージェントの頭脳を上書きします。ルーティング済みエージェントモデルを継承する場合は未設定のままにします。これはvoice.realtime.modelとは別です。agent-proxyは音声をdiscord-voice経由でルーティングします。これにより話者とターゲットセッションに対する通常の所有者/ツール認可は保持されますが、Discord 音声が再生を所有するため、エージェントのttsツールは非表示になります。デフォルトでは、agent-proxyは所有者話者の consult に所有者相当の完全なツールアクセスを付与し(voice.realtime.toolPolicy: "owner")、実質的な回答の前に OpenClaw エージェントへ consult することを強く優先します(voice.realtime.consultPolicy: "always")。そのデフォルトのalwaysモードでは、リアルタイム層は consult の回答前に埋め草を自動発話しません。音声をキャプチャして文字起こしし、その後ルーティング済み OpenClaw の回答を発話します。Discord が最初の回答を再生中に複数の強制 consult 回答が完了した場合、後続の正確な発話回答は文の途中で音声を置き換えるのではなく、再生がアイドルになるまでキューに入れられます。stt-ttsモードでは、STT はtools.media.audioを使用します。voice.modelは文字起こしに影響しません。- リアルタイムモードでは、
voice.realtime.provider、voice.realtime.model、voice.realtime.voiceがリアルタイム音声セッションを構成します。OpenAI Realtime 2 と Codex の頭脳を使う場合は、voice.realtime.model: "gpt-realtime-2"とvoice.model: "openai-codex/gpt-5.5"を使用します。 - OpenAI リアルタイムプロバイダーは、現在の Realtime 2 イベント名と、出力音声およびトランスクリプトイベント向けの従来の Codex 互換エイリアスを受け入れるため、互換プロバイダースナップショットが変化してもアシスタント音声を落とさずに済みます。
voice.realtime.bargeInは、Discord の話者開始イベントがアクティブなリアルタイム再生を割り込むかどうかを制御します。未設定の場合は、リアルタイムプロバイダーの入力音声割り込み設定に従います。voice.realtime.minBargeInAudioEndMsは、OpenAI リアルタイム barge-in が音声を切り詰める前に必要な最小アシスタント再生時間を制御します。デフォルト:250。エコーの少ない部屋では即時割り込みのために0を設定し、エコーが多いスピーカー構成では値を上げます。- Discord 再生で OpenAI 音声を使う場合は、
voice.tts.provider: "openai"を設定し、voice.tts.openai.voiceまたはvoice.tts.providers.openai.voiceで Text-to-speech 音声を選択します。現在の OpenAI TTS モデルでは、cedarは男性的な響きのよい選択肢です。 - チャンネルごとの Discord
systemPrompt上書きは、その音声チャンネルの音声トランスクリプトターンに適用されます。 - 音声トランスクリプトターンは、Discord
allowFrom(またはdm.allowFrom)から所有者ステータスを派生します。非所有者の話者は所有者専用ツール(例:gatewayとcron)にアクセスできません。 - Discord 音声はテキスト専用構成ではオプトインです。
/vcコマンド、音声ランタイム、GuildVoiceStatesGateway インテントを有効にするには、channels.discord.voice.enabled=trueを設定します(または既存のchannels.discord.voiceブロックを維持します)。 channels.discord.intents.voiceStatesは、音声状態インテント購読を明示的に上書きできます。インテントを有効な音声有効化状態に従わせる場合は未設定のままにします。voice.autoJoinに同じギルドのエントリが複数ある場合、OpenClaw はそのギルドで最後に構成されたチャンネルに参加します。voice.allowedChannelsは任意の常駐先許可リストです。未設定のままにすると、認可済みの任意の Discord 音声チャンネルへの/vc joinを許可します。設定した場合、/vc join、起動時の自動参加、ボットの音声状態移動は、列挙された{ guildId, channelId }エントリに制限されます。空配列に設定すると、すべての Discord 音声参加を拒否します。Discord がボットを許可リスト外へ移動した場合、OpenClaw はそのチャンネルを退出し、利用可能な構成済み自動参加ターゲットに再参加します。voice.daveEncryptionとvoice.decryptionFailureToleranceは、@discordjs/voiceの参加オプションにそのまま渡されます。@discordjs/voiceのデフォルトは、未設定の場合daveEncryption=trueとdecryptionFailureTolerance=24です。- OpenClaw は Discord 音声受信用に純 JS の
opusscriptデコーダーをデフォルトで使用します。任意のネイティブ@discordjs/opusパッケージは、リポジトリの pnpm install ポリシーにより無視されるため、通常のインストール、Docker レーン、無関係なテストでネイティブ addon がコンパイルされることはありません。専用の音声パフォーマンスホストでは、ネイティブ addon をインストールした後にOPENCLAW_DISCORD_OPUS_DECODER=nativeでオプトインできます。 voice.connectTimeoutMsは、/vc joinと自動参加試行の初期@discordjs/voiceReady 待機を制御します。デフォルト:30000。voice.reconnectGraceMsは、切断された音声セッションが再接続を開始するまで OpenClaw が待機する時間を制御し、その後破棄します。デフォルト:15000。stt-ttsモードでは、別のユーザーが話し始めただけでは音声再生は停止しません。フィードバックループを避けるため、TTS の再生中は OpenClaw は新しい音声キャプチャを無視します。次のターンでは再生完了後に話してください。リアルタイムモードでは、話者開始を barge-in シグナルとしてリアルタイムプロバイダーへ転送します。- リアルタイムモードでは、スピーカーから開いたマイクへ入るエコーが barge-in のように見え、再生を割り込むことがあります。エコーが多い Discord ルームでは、入力音声で OpenAI が自動割り込みしないように
voice.realtime.providers.openai.interruptResponseOnInputAudio: falseを設定します。それでも Discord の話者開始イベントでアクティブな再生を割り込みたい場合は、voice.realtime.bargeIn: trueを追加します。OpenAI リアルタイムブリッジは、voice.realtime.minBargeInAudioEndMsより短い再生切り詰めをエコー/ノイズの可能性が高いものとして無視し、Discord 再生をクリアする代わりにスキップとしてログに記録します。 voice.captureSilenceGraceMsは、Discord が話者停止を報告してから、OpenClaw がその音声セグメントを STT 用に確定するまで待機する時間を制御します。デフォルト:2500。Discord が通常の間を途切れ途切れの部分トランスクリプトに分割する場合は、この値を上げます。- ElevenLabs が選択された TTS プロバイダーの場合、Discord 音声再生はストリーミング TTS を使用し、プロバイダー応答ストリームから開始します。ストリーミング対応のないプロバイダーは、合成された一時ファイルのパスにフォールバックします。
- OpenClaw は受信復号失敗も監視し、短時間のうちに失敗が繰り返された場合は、音声チャンネルを退出/再参加することで自動復旧します。
- 更新後に受信ログで
DecryptionFailed(UnencryptedWhenPassthroughDisabled)が繰り返し表示される場合は、依存関係レポートとログを収集してください。バンドルされた@discordjs/voice系には、discord.js issue #11419 を閉じた discord.js PR #11449 の upstream パディング修正が含まれています。 The operation was aborted受信イベントは、OpenClaw がキャプチャ済み話者セグメントを確定するときに想定されるものです。これは詳細診断であり、警告ではありません。- 詳細な Discord 音声ログには、受け入れられた各話者セグメントについて、境界付きの 1 行 STT トランスクリプトプレビューが含まれます。これにより、無制限のトランスクリプトテキストを出力せずに、ユーザー側とエージェント返信側の両方をデバッグで確認できます。
agent-proxyモードでは、強制 consult フォールバックは、...で終わるテキストやandのような末尾の接続詞など、不完全と思われるトランスクリプト断片に加えて、「すぐ戻ります」や「さようなら」のような明らかにアクション不要の締めの言葉をスキップします。これにより古いキュー済み回答を防いだ場合、ログにはforced agent consult skipped reason=...が表示されます。
node-gyp ソースビルドツールチェーンが必要になることがあります。
ネイティブ addon をインストールした後、次のコマンドで Gateway を起動します。
discord voice: opus decoder: @discordjs/opus が表示されるはずです。env オプトインがない場合、またはネイティブ addon が見つからないかホストで読み込めない場合、OpenClaw は discord voice: opus decoder: opusscript をログに記録し、純 JS フォールバック経由で音声受信を継続します。
STT と TTS のパイプライン:
- Discord PCM キャプチャは WAV 一時ファイルに変換されます。
tools.media.audioが STT を処理します。例:openai/gpt-4o-mini-transcribe。- トランスクリプトは Discord 入口とルーティングを通じて送信され、その間、応答 LLM は音声出力ポリシーで実行されます。このポリシーは、Discord 音声が最終 TTS 再生を所有するため、エージェントの
ttsツールを非表示にし、返却テキストを求めます。 voice.modelが設定されている場合、この音声チャンネルターンの応答 LLM のみを上書きします。voice.ttsはmessages.ttsの上にマージされます。ストリーミング対応プロバイダーはプレイヤーへ直接フィードし、それ以外の場合は生成された音声ファイルが参加済みチャンネルで再生されます。
voice.agentSession ブロックがない場合、各音声チャンネルは独自のルーティング済み OpenClaw セッションを取得します。たとえば、/vc join channel:234567890123456789 はその Discord 音声チャンネルのセッションと会話します。リアルタイムモデルは音声フロントエンドにすぎません。実質的なリクエストは構成済み OpenClaw エージェントへ渡されます。リアルタイムモデルが consult ツールを呼ばずに最終トランスクリプトを生成した場合でも、デフォルトがエージェントと話すように動作するよう、OpenClaw はフォールバックとして consult を強制します。
従来の STT と TTS の例:
agent-proxy モードでは、ボットは構成済み音声チャンネルに参加しますが、OpenClaw エージェントターンはターゲットチャンネルの通常のルーティング済みセッションとエージェントを使用します。リアルタイム音声セッションは返却された結果を音声チャンネルへ話します。スーパーバイザーエージェントは、適切なアクションであれば個別の Discord メッセージを送信することも含め、ツールポリシーに従って通常のメッセージツールを引き続き使用できます。
便利なターゲット形式:
target: "channel:123456789012345678"は Discord テキストチャンネルセッション経由でルーティングします。target: "123456789012345678"はチャンネルターゲットとして扱われます。target: "dm:123456789012345678"またはtarget: "user:123456789012345678"は、そのダイレクトメッセージセッション経由でルーティングします。
bargeIn: true により、次のキャプチャ済みターンが OpenAI に届く前に Discord の話者開始イベントとすでにアクティブな話者音声で、アクティブなリアルタイム応答をキャンセルできるようにします。audioEndMs が minBargeInAudioEndMs 未満の非常に早い割り込みシグナルは、エコーまたはノイズの可能性が高いものとして扱われ無視されるため、モデルは最初の再生フレームで途切れません。
想定される音声ログ:
- 参加時:
discord voice: joining ... voiceSession=... supervisorSession=... agentSessionMode=... voiceModel=... realtimeModel=... - リアルタイム開始時:
discord voice: realtime bridge starting ... autoRespond=false interruptResponse=false bargeIn=false minBargeInAudioEndMs=... - 話者音声時:
discord voice: realtime speaker turn opened ...、discord voice: realtime input audio started ... outputAudioMs=... outputActive=...、およびdiscord voice: realtime speaker turn closed ... chunks=... discordBytes=... realtimeBytes=... interruptedPlayback=... - 古い発話のスキップ時:
discord voice: realtime forced agent consult skipped reason=incomplete-transcript ...またはreason=non-actionable-closing ... - リアルタイム応答完了時:
discord voice: realtime audio playback finishing reason=response.done ... audioMs=... chunks=... - 再生停止/リセット時:
discord voice: realtime audio playback stopped reason=... audioMs=... elapsedMs=... chunks=... - リアルタイム相談時:
discord voice: realtime consult requested ... voiceSession=... supervisorSession=... question=... - エージェント回答時:
discord voice: agent turn answer ... - 厳密な発話のキュー投入時:
discord voice: realtime exact speech queued ... queued=... outputAudioMs=... outputActive=...、続いてdiscord voice: realtime exact speech dequeued reason=player-idle ... - 割り込み検出時:
discord voice: realtime barge-in detected source=speaker-start ...またはdiscord voice: realtime barge-in detected source=active-speaker-audio ...、続いてdiscord voice: realtime barge-in requested reason=... outputAudioMs=... outputActive=... - リアルタイム割り込み時:
discord voice: realtime model interrupt requested client:response.cancel reason=barge-in、続いてdiscord voice: realtime model audio truncated client:conversation.item.truncate reason=barge-in audioEndMs=...またはdiscord voice: realtime model interrupt confirmed server:response.done status=cancelled ... - 無視されたエコー/ノイズ時:
discord voice: realtime model interrupt ignored client:conversation.item.truncate.skipped reason=barge-in audioEndMs=0 minAudioEndMs=250 - 無効な割り込み時:
discord voice: realtime capture ignored during playback (barge-in disabled) ... - アイドル再生時:
discord voice: realtime barge-in ignored reason=... outputActive=false ... playbackChunks=0
realtime audio playback startedは、Discord がアシスタント音声の再生を開始したことを意味します。ブリッジはこの時点から、アシスタント出力チャンク、Discord PCM バイト、プロバイダーのリアルタイムバイト、および合成音声の長さのカウントを開始します。realtime speaker turn openedは、Discord 話者がアクティブになったことを示します。再生がすでにアクティブでbargeInが有効な場合、その後にbarge-in detected source=speaker-startが続くことがあります。realtime input audio startedは、その話者ターンで最初の実際の音声フレームを受信したことを示します。ここでoutputActive=trueまたはゼロでないoutputAudioMsがある場合、アシスタント再生がまだアクティブな間にマイクが入力を送信していることを意味します。barge-in detected source=active-speaker-audioは、アシスタント再生がアクティブな間に OpenClaw がライブ話者音声を検出したことを意味します。これは、有用な音声を伴わない Discord 話者開始イベントと実際の割り込みを区別するのに役立ちます。barge-in requested reason=...は、OpenClaw がリアルタイムプロバイダーにアクティブな応答のキャンセルまたは切り詰めを依頼したことを意味します。outputAudioMs、outputActive、playbackChunksが含まれるため、割り込み前に実際にどれだけのアシスタント音声が再生されたかを確認できます。realtime audio playback stopped reason=...は、ローカル Discord 再生のリセット地点です。理由は、誰が再生を停止したかを示します:barge-in、player-idle、provider-clear-audio、forced-agent-consult、stream-close、またはsession-close。realtime speaker turn closedは、キャプチャされた入力ターンを要約します。chunks=0またはhasAudio=falseは、話者ターンは開いたが使用可能な音声がリアルタイムブリッジに届かなかったことを意味します。interruptedPlayback=trueは、その入力ターンがアシスタント出力と重なり、割り込みロジックをトリガーしたことを意味します。
outputAudioMs: ログ行の前にリアルタイムプロバイダーが生成したアシスタント音声の長さ。audioMs: 再生停止前に OpenClaw がカウントしたアシスタント音声の長さ。elapsedMs: 再生ストリームまたは話者ターンの開始から終了までの実時間。discordBytes: Discord 音声に送信、または Discord 音声から受信された 48 kHz ステレオ PCM バイト。realtimeBytes: リアルタイムプロバイダーに送信、またはリアルタイムプロバイダーから受信されたプロバイダー形式の PCM バイト。playbackChunks: アクティブな応答用に Discord へ転送されたアシスタント音声チャンク。sinceLastAudioMs: 最後にキャプチャされた話者音声フレームから話者ターン終了までの間隔。
source=active-speaker-audio、小さいoutputAudioMs、同じユーザーが近くにいる状態で即座に途切れる場合、通常はスピーカーエコーがマイクに入っていることを示します。voice.realtime.minBargeInAudioEndMsを上げる、スピーカー音量を下げる、ヘッドホンを使用する、またはvoice.realtime.providers.openai.interruptResponseOnInputAudio: falseを設定してください。source=speaker-startの後にspeaker turn closed ... hasAudio=falseが続く場合、Discord は話者開始を報告したが音声が OpenClaw に届かなかったことを意味します。これは一時的な Discord 音声イベント、ノイズゲートの挙動、またはクライアントが一瞬だけマイクをオンにしたことが原因の場合があります。- 近くに割り込みや
provider-clear-audioがないのにaudio playback stopped reason=stream-closeが出る場合、ローカル Discord 再生ストリームが予期せず終了したことを意味します。直前のプロバイダーおよび Discord プレイヤーログを確認してください。 capture ignored during playback (barge-in disabled)は、アシスタント音声がアクティブな間に OpenClaw が意図的に入力を破棄したことを意味します。発話で再生を割り込みたい場合は、voice.realtime.bargeInを有効にしてください。barge-in ignored ... outputActive=falseは、Discord またはプロバイダーの VAD が発話を報告したが、OpenClaw には割り込む対象のアクティブな再生がなかったことを意味します。これによって音声が途切れることはありません。
voice.model の LLM ルート認証、tools.media.audio の STT 認証、messages.tts/voice.tts の TTS 認証、および voice.realtime.providers またはプロバイダーの通常の認証設定のリアルタイムプロバイダー認証。
音声メッセージ
Discord 音声メッセージは波形プレビューを表示し、OGG/Opus 音声を必要とします。OpenClaw は波形を自動生成しますが、検査と変換のために Gateway ホスト上のffmpeg と ffprobe が必要です。
- ローカルファイルパスを指定します (URL は拒否されます)。
- テキスト内容は省略します (Discord は同じペイロード内のテキスト + 音声メッセージを拒否します)。
- 任意の音声形式を受け付けます。OpenClaw は必要に応じて OGG/Opus に変換します。
トラブルシューティング
許可されていないインテントを使用した、またはボットがギルドメッセージを認識しない
許可されていないインテントを使用した、またはボットがギルドメッセージを認識しない
- Message Content Intent を有効にする
- ユーザー/メンバー解決に依存する場合は Server Members Intent を有効にする
- インテントを変更した後に Gateway を再起動する
ギルドメッセージが予期せずブロックされる
ギルドメッセージが予期せずブロックされる
groupPolicyを確認するchannels.discord.guilds配下のギルド許可リストを確認する- ギルドの
channelsマップが存在する場合、リストされたチャンネルのみが許可される requireMentionの挙動とメンションパターンを確認する
Require mention が false だがまだブロックされる
Require mention が false だがまだブロックされる
- 一致するギルド/チャンネル許可リストなしで
groupPolicy="allowlist"になっている requireMentionが誤った場所に設定されている (channels.discord.guildsまたはチャンネルエントリ配下である必要があります)- 送信者がギルド/チャンネルの
users許可リストによってブロックされている
長時間実行される Discord ターンまたは重複返信
長時間実行される Discord ターンまたは重複返信
Slow listener detected ...stuck session: sessionKey=agent:...:discord:... state=processing ...
- 単一アカウント:
channels.discord.eventQueue.listenerTimeout - 複数アカウント:
channels.discord.accounts.<accountId>.eventQueue.listenerTimeout - これは Discord Gateway リスナー処理のみを制御し、エージェントターンの寿命は制御しません
Gateway メタデータ検索タイムアウト警告
Gateway メタデータ検索タイムアウト警告
/gateway/bot メタデータを取得します。一時的な失敗時は Discord のデフォルト Gateway URL にフォールバックし、ログではレート制限されます。メタデータタイムアウトの調整項目:- 単一アカウント:
channels.discord.gatewayInfoTimeoutMs - 複数アカウント:
channels.discord.accounts.<accountId>.gatewayInfoTimeoutMs - 設定が未指定の場合の env フォールバック:
OPENCLAW_DISCORD_GATEWAY_INFO_TIMEOUT_MS - デフォルト:
30000(30 秒)、最大:120000
Gateway READY タイムアウトによる再起動
Gateway READY タイムアウトによる再起動
READY イベントを待機します。起動時スタガリングを伴う複数アカウント構成では、デフォルトより長い起動時 READY ウィンドウが必要な場合があります。READY タイムアウトの調整項目:- 起動時の単一アカウント:
channels.discord.gatewayReadyTimeoutMs - 起動時の複数アカウント:
channels.discord.accounts.<accountId>.gatewayReadyTimeoutMs - 設定が未指定の場合の起動時 env フォールバック:
OPENCLAW_DISCORD_READY_TIMEOUT_MS - 起動時デフォルト:
15000(15 秒)、最大:120000 - ランタイムの単一アカウント:
channels.discord.gatewayRuntimeReadyTimeoutMs - ランタイムの複数アカウント:
channels.discord.accounts.<accountId>.gatewayRuntimeReadyTimeoutMs - 設定が未指定の場合のランタイム env フォールバック:
OPENCLAW_DISCORD_RUNTIME_READY_TIMEOUT_MS - ランタイムデフォルト:
30000(30 秒)、最大:120000
権限監査の不一致
権限監査の不一致
channels status --probe の権限チェックは数値チャンネル ID に対してのみ機能します。スラッグキーを使用している場合、ランタイム照合は引き続き機能する可能性がありますが、プローブは権限を完全には検証できません。DM とペアリングの問題
DM とペアリングの問題
- DM 無効:
channels.discord.dm.enabled=false - DM ポリシー無効:
channels.discord.dmPolicy="disabled"(レガシー:channels.discord.dm.policy) pairingモードでペアリング承認待ち
ボット間ループ
ボット間ループ
音声 STT が DecryptionFailed(...) で途切れる
音声 STT が DecryptionFailed(...) で途切れる
- Discord 音声受信の復旧ロジックが含まれるように、OpenClaw を最新の状態に保つ (
openclaw update) channels.discord.voice.daveEncryption=true(デフォルト) を確認するchannels.discord.voice.decryptionFailureTolerance=24(アップストリームのデフォルト) から始め、必要な場合のみ調整する- ログで次を確認する:
discord voice: DAVE decrypt failures detecteddiscord voice: repeated decrypt failures; attempting rejoin
- 自動再参加後も失敗が続く場合は、ログを収集し、discord.js #11419 と discord.js #11449 のアップストリーム DAVE 受信履歴と比較する
設定リファレンス
主要リファレンス: 設定リファレンス - Discord。重要度の高い Discord フィールド
重要度の高い Discord フィールド
- 起動/認証:
enabled,token,accounts.*,allowBots - ポリシー:
groupPolicy,dm.*,guilds.*,guilds.*.channels.* - コマンド:
commands.native,commands.useAccessGroups,configWrites,slashCommand.* - イベントキュー:
eventQueue.listenerTimeout(リスナーの予算),eventQueue.maxQueueSize,eventQueue.maxConcurrency - Gateway:
gatewayInfoTimeoutMs,gatewayReadyTimeoutMs,gatewayRuntimeReadyTimeoutMs - 返信/履歴:
replyToMode,historyLimit,dmHistoryLimit,dms.*.historyLimit - 配信:
textChunkLimit,chunkMode,maxLinesPerMessage - ストリーミング:
streaming(レガシーエイリアス:streamMode),streaming.preview.toolProgress,draftChunk,blockStreaming,blockStreamingCoalesce - メディア/再試行:
mediaMaxMb(送信 Discord アップロードを制限、デフォルト100MB),retry - アクション:
actions.* - プレゼンス:
activity,status,activityType,activityUrl - UI:
ui.components.accentColor - 機能:
threadBindings, トップレベルbindings[](type: "acp"),pluralkit,execApprovals,intents,agentComponents,heartbeat,responsePrefix
安全性と運用
- ボットトークンはシークレットとして扱う (管理された環境では
DISCORD_BOT_TOKENを推奨)。 - Discord 権限は最小権限で付与する。
- コマンドのデプロイ/状態が古い場合は、gateway を再起動し、
openclaw channels status --probeで再確認する。