Prêt pour les DM et les canaux de guilde via le Gateway Discord officiel.Documentation Index
Fetch the complete documentation index at: https://docs.openclaw.ai/llms.txt
Use this file to discover all available pages before exploring further.
Pairing
Slash commands
Channel troubleshooting
Configuration rapide
Vous devrez créer une nouvelle application avec un bot, ajouter le bot à votre serveur et l’appairer à OpenClaw. Nous vous recommandons d’ajouter votre bot à votre propre serveur privé. Si vous n’en avez pas encore, créez-en un d’abord (choisissez Create My Own > For me and my friends).Create a Discord application and bot
Enable privileged intents
- Message Content Intent (obligatoire)
- Server Members Intent (recommandé ; obligatoire pour les listes d’autorisation de rôles et la correspondance nom-vers-ID)
- Presence Intent (facultatif ; nécessaire uniquement pour les mises à jour de présence)
Copy your bot token
Generate an invite URL and add the bot to your server
botapplications.commands
- Voir les canaux Text Permissions
- Envoyer des messages
- Lire l’historique des messages
- Intégrer des liens
- Joindre des fichiers
- Ajouter des réactions (facultatif)
Enable Developer Mode and collect your IDs
- Cliquez sur User Settings (icône d’engrenage à côté de votre avatar) → Advanced → activez Developer Mode
- Faites un clic droit sur l’icône de votre serveur dans la barre latérale → Copy Server ID
- Faites un clic droit sur votre propre avatar → Copy User ID
Allow DMs from server members
Set your bot token securely (do not send it in chat)
openclaw gateway run.
Pour les installations de services gérés, exécutez openclaw gateway install depuis un shell où DISCORD_BOT_TOKEN est présent, ou stockez la variable dans ~/.openclaw/.env, afin que le service puisse résoudre le SecretRef d’environnement après le redémarrage.
Si votre hôte est bloqué ou limité par le lookup d’application au démarrage de Discord, définissez l’ID d’application/client Discord depuis le portail développeur afin que le démarrage puisse ignorer cet appel REST. Utilisez channels.discord.applicationId pour le compte par défaut, ou channels.discord.accounts.<accountId>.applicationId lorsque vous exécutez plusieurs bots Discord.Configure OpenClaw and pair
- Ask your agent
- CLI / config
« J’ai déjà défini mon token de bot Discord dans la config. Veuillez terminer la configuration Discord avec l’User ID<user_id>et le Server ID<server_id>. »
Approve first DM pairing
- Ask your agent
- CLI
« Approuve ce code d’appairage Discord : <CODE> »
DISCORD_BOT_TOKEN est uniquement utilisé pour le compte par défaut.
Si deux comptes Discord activés se résolvent vers le même token de bot, OpenClaw ne démarre qu’un seul moniteur de gateway pour ce token. Un token issu de la config l’emporte sur le repli d’environnement par défaut ; sinon, le premier compte activé l’emporte et le compte dupliqué est signalé comme désactivé.
Pour les appels sortants avancés (outil de message/actions de canal), un token explicite par appel est utilisé pour cet appel. Cela s’applique aux actions d’envoi et de lecture/sondage (par exemple lecture/recherche/récupération/fil/épingles/autorisations). Les paramètres de politique/réessai du compte proviennent toujours du compte sélectionné dans l’instantané d’exécution actif.Recommandé : configurer un espace de travail de guilde
Une fois les DM fonctionnels, vous pouvez configurer votre serveur Discord comme un espace de travail complet où chaque canal obtient sa propre session d’agent avec son propre contexte. C’est recommandé pour les serveurs privés où il n’y a que vous et votre bot.Add your server to the guild allowlist
- Ask your agent
- Config
« Ajoute mon Server ID Discord <server_id> à la liste d’autorisation de guilde »
Allow responses without @mention
message, afin que l’agent puisse observer par défaut et ne publier que lorsqu’il décide qu’une réponse dans le canal est utile.Cela signifie que le modèle sélectionné doit appeler les outils de manière fiable. Si Discord affiche la saisie en cours et que les journaux indiquent une utilisation de tokens mais qu’aucun message n’est publié, vérifiez dans le journal de session la présence de texte d’assistant avec didSendViaMessagingTool: false. Cela signifie que le modèle a produit une réponse finale privée au lieu d’appeler message(action=send). Passez à un modèle plus performant pour l’appel d’outils, ou utilisez la config ci-dessous pour restaurer les réponses finales automatiques héritées.- Ask your agent
- Config
« Autorise mon agent à répondre sur ce serveur sans devoir être @mentionné »
Plan for memory in guild channels
- Ask your agent
- Manual
« Lorsque je pose des questions dans des canaux Discord, utilise memory_search ou memory_get si tu as besoin du contexte à long terme de MEMORY.md. »
#coding, #home, #research, ou tout autre canal adapté à votre workflow.
Modèle d’exécution
- Le Gateway possède la connexion Discord.
- Le routage des réponses est déterministe : les réponses entrantes Discord repartent vers Discord.
- Les métadonnées de guilde/canal Discord sont ajoutées au prompt du modèle comme contexte non fiable, et non comme préfixe de réponse visible par l’utilisateur. Si un modèle recopie cette enveloppe, OpenClaw retire les métadonnées copiées des réponses sortantes et du futur contexte de relecture.
- Par défaut (
session.dmScope=main), les chats directs partagent la session principale de l’agent (agent:main:main). - Les canaux de guilde sont des clés de session isolées (
agent:<agentId>:discord:channel:<channelId>). - Les DM de groupe sont ignorés par défaut (
channels.discord.dm.groupEnabled=false). - Les commandes slash natives s’exécutent dans des sessions de commande isolées (
agent:<agentId>:discord:slash:<userId>), tout en portant encoreCommandTargetSessionKeyvers la session de conversation routée. - La livraison des annonces cron/heartbeat textuelles vers Discord utilise une seule fois la réponse finale visible par l’assistant. Les médias et les charges utiles de composants structurés restent en plusieurs messages lorsque l’agent émet plusieurs charges utiles livrables.
Canaux de forum
Les canaux de forum et de médias Discord n’acceptent que les publications de fil. OpenClaw prend en charge deux façons de les créer :- Envoyez un message au parent du forum (
channel:<forumId>) pour créer automatiquement un fil. Le titre du fil utilise la première ligne non vide de votre message. - Utilisez
openclaw message thread createpour créer un fil directement. Ne transmettez pas--message-idpour les canaux de forum.
channel:<threadId>).
Composants interactifs
OpenClaw prend en charge les conteneurs de composants Discord v2 pour les messages d’agent. Utilisez l’outil de message avec une charge utilecomponents. Les résultats d’interaction sont routés vers l’agent comme des messages entrants normaux et suivent les paramètres Discord replyToMode existants.
Blocs pris en charge :
text,section,separator,actions,media-gallery,file- Les lignes d’actions autorisent jusqu’à 5 boutons ou un seul menu de sélection
- Types de sélection :
string,user,role,mentionable,channel
components.reusable=true pour permettre aux boutons, sélections et formulaires d’être utilisés plusieurs fois jusqu’à leur expiration.
Pour restreindre qui peut cliquer sur un bouton, définissez allowedUsers sur ce bouton (ID utilisateur Discord, tags ou *). Lorsque c’est configuré, les utilisateurs non correspondants reçoivent un refus éphémère.
Les commandes slash /model et /models ouvrent un sélecteur de modèle interactif avec des menus déroulants de fournisseur, modèle et runtime compatible, plus une étape Soumettre. /models add est obsolète et renvoie désormais un message d’obsolescence au lieu d’enregistrer des modèles depuis le chat. La réponse du sélecteur est éphémère et seul l’utilisateur qui l’a invoquée peut l’utiliser. Les menus de sélection Discord sont limités à 25 options ; ajoutez donc des entrées provider/* à agents.defaults.models lorsque vous voulez que le sélecteur affiche les modèles découverts dynamiquement uniquement pour des fournisseurs sélectionnés comme openai-codex ou vllm.
Pièces jointes de fichier :
- Les blocs
filedoivent pointer vers une référence de pièce jointe (attachment://<filename>) - Fournissez la pièce jointe via
media/path/filePath(fichier unique) ; utilisezmedia-gallerypour plusieurs fichiers - Utilisez
filenamepour remplacer le nom de téléversement lorsqu’il doit correspondre à la référence de pièce jointe
- Ajoutez
components.modalavec jusqu’à 5 champs - Types de champs :
text,checkbox,radio,select,role-select,user-select - OpenClaw ajoute automatiquement un bouton déclencheur
Contrôle d’accès et routage
- DM policy
- Access groups
- Guild policy
- Mentions and group DMs
channels.discord.dmPolicy contrôle l’accès aux DM. channels.discord.allowFrom est la liste d’autorisation canonique des DM.pairing(par défaut)allowlistopen(nécessite quechannels.discord.allowFrominclue"*")disabled
pairing).Priorité multi-comptes :channels.discord.accounts.default.allowFroms’applique uniquement au comptedefault.- Pour un compte,
allowFromprévaut sur l’anciendm.allowFrom. - Les comptes nommés héritent de
channels.discord.allowFromlorsque leur propreallowFromet l’anciendm.allowFromne sont pas définis. - Les comptes nommés n’héritent pas de
channels.discord.accounts.default.allowFrom.
channels.discord.dm.policy et channels.discord.dm.allowFrom sont encore lus pour compatibilité. openclaw doctor --fix les migre vers dmPolicy et allowFrom lorsqu’il peut le faire sans modifier l’accès.Format de cible DM pour la livraison :user:<id>- mention
<@id>
allowFrom DM effectif du compte sont traités comme des cibles de DM utilisateur pour compatibilité.Routage d’agent basé sur les rôles
Utilisezbindings[].match.roles pour router les membres de guilde Discord vers différents agents par ID de rôle. Les liaisons basées sur les rôles acceptent uniquement les ID de rôle et sont évaluées après les liaisons pair ou pair parent, et avant les liaisons limitées à la guilde. Si une liaison définit aussi d’autres champs de correspondance (par exemple peer + guildId + roles), tous les champs configurés doivent correspondre.
Commandes natives et authentification des commandes
commands.nativevaut par défaut"auto"et est activé pour Discord.- Remplacement par canal :
channels.discord.commands.native. commands.native=falseignore l’enregistrement et le nettoyage des commandes slash Discord au démarrage. Les commandes précédemment enregistrées peuvent rester visibles dans Discord jusqu’à ce que vous les supprimiez de l’application Discord.- L’authentification des commandes natives utilise les mêmes listes d’autorisation/politiques Discord que le traitement normal des messages.
- Les commandes peuvent toujours être visibles dans l’interface Discord pour les utilisateurs qui ne sont pas autorisés ; l’exécution applique toujours l’authentification OpenClaw et renvoie « non autorisé ».
ephemeral: true
Détails de la fonctionnalité
Étiquettes de réponse et réponses natives
Étiquettes de réponse et réponses natives
[[reply_to_current]][[reply_to:<id>]]
channels.discord.replyToMode :off(par défaut)firstallbatched
off désactive le fil de réponses implicite. Les étiquettes explicites [[reply_to_*]] sont toujours respectées.
first attache toujours la référence de réponse native implicite au premier message Discord sortant du tour.
batched attache uniquement la référence de réponse native implicite de Discord lorsque le
tour entrant était un lot temporisé de plusieurs messages. C’est utile
lorsque vous souhaitez des réponses natives surtout pour les discussions en rafale ambiguës, pas pour chaque
tour à message unique.Les ID de message sont exposés dans le contexte/l’historique afin que les agents puissent cibler des messages spécifiques.Aperçu de flux en direct
Aperçu de flux en direct
channels.discord.streaming accepte off | partial | block | progress (par défaut). progress conserve un brouillon d’état modifiable et le met à jour avec la progression des outils jusqu’à la livraison finale ; le libellé de démarrage partagé est une ligne défilante, il disparaît donc comme le reste dès qu’assez de travail apparaît. streamMode est un alias d’exécution historique. Exécutez openclaw doctor --fix pour réécrire la configuration persistée vers la clé canonique.Définissez channels.discord.streaming.mode sur off pour désactiver les modifications d’aperçu Discord. Si la diffusion par blocs Discord est explicitement activée, OpenClaw ignore le flux d’aperçu afin d’éviter une double diffusion.partialmodifie un seul message d’aperçu à mesure que les jetons arrivent.blockémet des fragments de la taille d’un brouillon (utilisezdraftChunkpour ajuster la taille et les points de rupture, limités partextChunkLimit).- Les finales avec média, erreur ou réponse explicite annulent les modifications d’aperçu en attente.
streaming.preview.toolProgress(par défauttrue) contrôle si les mises à jour d’outil/progression réutilisent le message d’aperçu.- Les lignes d’outil/progression s’affichent sous forme compacte avec emoji + titre + détail lorsque disponible, par exemple
🛠️ Bash: run testsou🔎 Web Search: for "query". streaming.preview.commandText/streaming.progress.commandTextcontrôle le détail des commandes/exécutions dans les lignes de progression compactes :raw(par défaut) oustatus(libellé d’outil uniquement).
block est explicitement activée, OpenClaw ignore le flux d’aperçu afin d’éviter une double diffusion.Historique, contexte et comportement des fils
Historique, contexte et comportement des fils
channels.discord.historyLimitvaleur par défaut20- solution de repli :
messages.groupChat.historyLimit 0désactive
channels.discord.dmHistoryLimitchannels.discord.dms["<user_id>"].historyLimit
- Les fils Discord sont routés comme des sessions de canal et héritent de la configuration du canal parent, sauf remplacement.
- Les sessions de fil héritent de la sélection
/modelau niveau de la session du canal parent comme repli limité au modèle ; les sélections/modellocales au fil restent prioritaires et l’historique de transcription parent n’est pas copié sauf si l’héritage de transcription est activé. channels.discord.thread.inheritParent(par défautfalse) fait en sorte que les nouveaux fils automatiques soient initialisés depuis la transcription parente. Les remplacements par compte se trouvent souschannels.discord.accounts.<id>.thread.inheritParent.- Les réactions de l’outil de messages peuvent résoudre les cibles de message privé
user:<id>. guilds.<guild>.channels.<channel>.requireMention: falseest préservé pendant le repli d’activation à l’étape de réponse.
Sessions liées à un fil pour les sous-agents
Sessions liées à un fil pour les sous-agents
/focus <target>lier le fil actuel/nouveau à une cible de sous-agent/session/unfocussupprimer la liaison du fil actuel/agentsafficher les exécutions actives et l’état de liaison/session idle <duration|off>inspecter/mettre à jour le désengagement automatique pour inactivité des liaisons focalisées/session max-age <duration|off>inspecter/mettre à jour l’âge maximal strict des liaisons focalisées
session.threadBindings.*définit les valeurs par défaut globales.channels.discord.threadBindings.*remplace le comportement de Discord.spawnSessionscontrôle la création/liaison automatique de fils poursessions_spawn({ thread: true })et les créations de fil ACP. Valeur par défaut :true.defaultSpawnContextcontrôle le contexte natif de sous-agent pour les créations liées à un fil. Valeur par défaut :"fork".- Les clés obsolètes
spawnSubagentSessions/spawnAcpSessionssont migrées paropenclaw doctor --fix. - Si les liaisons de fil sont désactivées pour un compte,
/focuset les opérations de liaison de fil associées ne sont pas disponibles.
Liaisons persistantes de canal ACP
Liaisons persistantes de canal ACP
bindings[]avectype: "acp"etmatch.channel: "discord"
/acp spawn codex --bind herelie le canal ou le fil actuel sur place et conserve les futurs messages sur la même session ACP. Les messages de fil héritent de la liaison du canal parent.- Dans un canal ou un fil lié,
/newet/resetréinitialisent la même session ACP sur place. Les liaisons de fil temporaires peuvent remplacer la résolution de cible tant qu’elles sont actives. spawnSessionscontrôle la création/liaison de fils enfants via--thread auto|here.
Notifications de réaction
Notifications de réaction
offown(par défaut)allallowlist(utiliseguilds.<id>.users)
Réactions d’accusé de réception
Réactions d’accusé de réception
ackReaction envoie un emoji d’accusé de réception pendant qu’OpenClaw traite un message entrant.Ordre de résolution :channels.discord.accounts.<accountId>.ackReactionchannels.discord.ackReactionmessages.ackReaction- repli vers l’emoji d’identité de l’agent (
agents.list[].identity.emoji, sinon ”👀”)
- Discord accepte les emoji Unicode ou les noms d’emoji personnalisés.
- Utilisez
""pour désactiver la réaction pour un canal ou un compte.
Écritures de configuration
Écritures de configuration
/config set|unset (lorsque les fonctionnalités de commande sont activées).Désactiver :Proxy Gateway
Proxy Gateway
channels.discord.proxy.Prise en charge de PluralKit
Prise en charge de PluralKit
- les listes d’autorisation peuvent utiliser
pk:<memberId> - les noms d’affichage des membres sont mis en correspondance par nom/slug uniquement lorsque
channels.discord.dangerouslyAllowNameMatching: true - les recherches utilisent l’ID de message d’origine et sont limitées par une fenêtre temporelle
- si la recherche échoue, les messages relayés sont traités comme des messages de bot et supprimés, sauf si
allowBots=true
Alias de mention sortants
Alias de mention sortants
mentionAliases lorsque les agents ont besoin de mentions sortantes déterministes pour des utilisateurs Discord connus. Les clés sont des identifiants sans le @ initial ; les valeurs sont des ID utilisateur Discord. Les identifiants inconnus, @everyone, @here et les mentions dans les spans de code Markdown restent inchangés.Configuration de présence
Configuration de présence
- 0: Joue
- 1: Diffuse en streaming (nécessite
activityUrl) - 2: Écoute
- 3: Regarde
- 4: Personnalisé (utilise le texte d’activité comme état de statut ; l’emoji est facultatif)
- 5: Participe à une compétition
autoPresence.healthyTextautoPresence.degradedTextautoPresence.exhaustedText(prend en charge l’espace réservé{reason})
Approbations dans Discord
Approbations dans Discord
channels.discord.execApprovals.enabledchannels.discord.execApprovals.approvers(facultatif ; se rabat surcommands.ownerAllowFromlorsque c’est possible)channels.discord.execApprovals.target(dm|channel|both, valeur par défaut :dm)agentFilter,sessionFilter,cleanupAfterResolve
enabled n’est pas défini ou vaut "auto" et qu’au moins un approbateur peut être résolu, soit depuis execApprovals.approvers, soit depuis commands.ownerAllowFrom. Discord ne déduit pas les approbateurs d’exécution à partir de allowFrom du canal, de l’ancien dm.allowFrom ni de defaultTo des messages directs. Définissez enabled: false pour désactiver explicitement Discord comme client d’approbation natif.Pour les commandes de groupe sensibles réservées au propriétaire, telles que /diagnostics et /export-trajectory, OpenClaw envoie les invites d’approbation et les résultats finaux en privé. Il essaie d’abord le message privé Discord lorsque le propriétaire appelant dispose d’une route de propriétaire Discord ; si elle n’est pas disponible, il se rabat sur la première route de propriétaire disponible depuis commands.ownerAllowFrom, comme Telegram.Lorsque target vaut channel ou both, l’invite d’approbation est visible dans le canal. Seuls les approbateurs résolus peuvent utiliser les boutons ; les autres utilisateurs reçoivent un refus éphémère. Les invites d’approbation incluent le texte de la commande ; n’activez donc la livraison dans le canal que dans des canaux de confiance. Si l’ID du canal ne peut pas être déduit de la clé de session, OpenClaw se rabat sur la livraison par message privé.Discord affiche également les boutons d’approbation partagés utilisés par les autres canaux de discussion. L’adaptateur Discord natif ajoute principalement le routage des messages privés aux approbateurs et la diffusion vers les canaux.
Lorsque ces boutons sont présents, ils constituent l’UX d’approbation principale ; OpenClaw
ne doit inclure une commande /approve manuelle que lorsque le résultat de l’outil indique
que les approbations par discussion sont indisponibles ou que l’approbation manuelle est la seule voie possible.
Si le runtime d’approbation natif de Discord n’est pas actif, OpenClaw garde visible
l’invite déterministe locale /approve <id> <decision>. Si le
runtime est actif mais qu’une carte native ne peut être livrée à aucune cible,
OpenClaw envoie dans la même discussion un avis de repli avec la commande /approve
exacte de l’approbation en attente.L’authentification Gateway et la résolution des approbations suivent le contrat partagé du client Gateway (les ID plugin: se résolvent via plugin.approval.resolve ; les autres ID via exec.approval.resolve). Les approbations expirent par défaut après 30 minutes.Voir Approbations d’exécution.Outils et barrières d’action
Les actions de message Discord incluent la messagerie, l’administration de canal, la modération, la présence et les actions de métadonnées. Exemples de base :- messagerie :
sendMessage,readMessages,editMessage,deleteMessage,threadReply - réactions :
react,reactions,emojiList - modération :
timeout,kick,ban - présence :
setPresence
event-create accepte un paramètre facultatif image (URL ou chemin de fichier local) pour définir l’image de couverture de l’événement planifié.
Les barrières d’action se trouvent sous channels.discord.actions.*.
Comportement par défaut des barrières :
| Groupe d’actions | Valeur par défaut |
|---|---|
| réactions, messages, fils, épingles, sondages, recherche, memberInfo, roleInfo, channelInfo, channels, voiceStatus, événements, stickers, emojiUploads, stickerUploads, permissions | activé |
| rôles | désactivé |
| modération | désactivé |
| présence | désactivé |
Interface utilisateur Components v2
OpenClaw utilise les composants Discord v2 pour les approbations d’exécution et les marqueurs intercontextes. Les actions de message Discord peuvent aussi acceptercomponents pour une interface utilisateur personnalisée (avancé ; nécessite de construire une charge utile de composant via l’outil discord), tandis que les anciens embeds restent disponibles mais ne sont pas recommandés.
channels.discord.ui.components.accentColordéfinit la couleur d’accentuation utilisée par les conteneurs de composants Discord (hexadécimal).- À définir par compte avec
channels.discord.accounts.<id>.ui.components.accentColor. embedsest ignoré lorsque les composants v2 sont présents.
Voix
Discord possède deux surfaces vocales distinctes : les canaux vocaux en temps réel (conversations continues) et les pièces jointes de messages vocaux (le format d’aperçu en forme d’onde). Le Gateway prend en charge les deux.Canaux vocaux
Liste de vérification de configuration :- Activez Message Content Intent dans le portail développeur Discord.
- Activez Server Members Intent lorsque des listes d’autorisation par rôle/utilisateur sont utilisées.
- Invitez le bot avec les portées
botetapplications.commands. - Accordez Connect, Speak, Send Messages et Read Message History dans le canal vocal cible.
- Activez les commandes natives (
commands.nativeouchannels.discord.commands.native). - Configurez
channels.discord.voice.
/vc join|leave|status pour contrôler les sessions. La commande utilise l’agent par défaut du compte et suit les mêmes règles de liste d’autorisation et de politique de groupe que les autres commandes Discord.
voice.ttsremplacemessages.ttsuniquement pour la lecture vocalestt-tts. Les modes temps réel utilisentvoice.realtime.voice.voice.modecontrôle le chemin de conversation. La valeur par défaut estagent-proxy: une interface vocale temps réel gère le minutage des tours, l’interruption et la lecture, délègue le travail de fond à l’agent OpenClaw routé viaopenclaw_agent_consult, puis traite le résultat comme une invite Discord saisie par ce locuteur.stt-ttsconserve l’ancien flux STT par lots plus TTS.bidipermet au modèle temps réel de converser directement tout en exposantopenclaw_agent_consultpour le cerveau OpenClaw.voice.agentSessioncontrôle quelle conversation OpenClaw reçoit les tours vocaux. Laissez-le non défini pour utiliser la session propre au canal vocal, ou définissez{ mode: "target", target: "channel:<text-channel-id>" }pour que le canal vocal agisse comme l’extension microphone/haut-parleur d’une session de canal texte Discord existante, comme#maintainers.voice.modelremplace le cerveau de l’agent OpenClaw pour les réponses vocales Discord et les consultations temps réel. Laissez-le non défini pour hériter du modèle d’agent routé. Il est distinct devoice.realtime.model.agent-proxyachemine la parole viadiscord-voice, ce qui préserve l’autorisation normale propriétaire/outil pour le locuteur et la session cible, mais masque l’outil agentttsparce que la voix Discord possède la lecture. Par défaut,agent-proxyaccorde à la consultation un accès complet aux outils équivalent au propriétaire pour les locuteurs propriétaires (voice.realtime.toolPolicy: "owner") et privilégie fortement la consultation de l’agent OpenClaw avant les réponses substantielles (voice.realtime.consultPolicy: "always"). Dans ce modealwayspar défaut, la couche temps réel ne prononce pas automatiquement de remplissage avant la réponse de consultation ; elle capture et transcrit la parole, puis prononce la réponse OpenClaw routée. Si plusieurs réponses de consultation forcée se terminent alors que Discord lit encore la première réponse, les réponses ultérieures en parole exacte sont mises en file d’attente jusqu’à ce que la lecture soit inactive au lieu de remplacer la parole en milieu de phrase.- En mode
stt-tts, STT utilisetools.media.audio;voice.modeln’affecte pas la transcription. - En modes temps réel,
voice.realtime.provider,voice.realtime.modeletvoice.realtime.voiceconfigurent la session audio temps réel. Pour OpenAI Realtime 2 plus le cerveau Codex, utilisezvoice.realtime.model: "gpt-realtime-2"etvoice.model: "openai-codex/gpt-5.5". - Le fournisseur temps réel OpenAI accepte les noms d’événements Realtime 2 actuels et les alias hérités compatibles avec Codex pour les événements d’audio de sortie et de transcription, afin que les instantanés de fournisseur compatibles puissent dériver sans perdre l’audio assistant.
voice.realtime.bargeIncontrôle si les événements Discord de début de parole interrompent la lecture temps réel active. Si non défini, il suit le paramètre d’interruption audio d’entrée du fournisseur temps réel.voice.realtime.minBargeInAudioEndMscontrôle la durée minimale de lecture de l’assistant avant qu’une interruption temps réel OpenAI tronque l’audio. Par défaut :250. Définissez0pour une interruption immédiate dans les salons avec peu d’écho, ou augmentez-la pour les configurations de haut-parleurs très sujettes à l’écho.- Pour une voix OpenAI lors de la lecture Discord, définissez
voice.tts.provider: "openai"et choisissez une voix Text-to-speech sousvoice.tts.openai.voiceouvoice.tts.providers.openai.voice.cedarest un bon choix à sonorité masculine sur le modèle TTS OpenAI actuel. - Les remplacements Discord
systemPromptpar canal s’appliquent aux tours de transcription vocale pour ce canal vocal. - Les tours de transcription vocale déduisent le statut propriétaire depuis Discord
allowFrom(oudm.allowFrom) ; les locuteurs non propriétaires ne peuvent pas accéder aux outils réservés aux propriétaires (par exemplegatewayetcron). - La voix Discord est optionnelle pour les configurations uniquement textuelles ; définissez
channels.discord.voice.enabled=true(ou conservez un blocchannels.discord.voiceexistant) pour activer les commandes/vc, le runtime vocal et l’intention GatewayGuildVoiceStates. channels.discord.intents.voiceStatespeut remplacer explicitement l’abonnement à l’intention d’état vocal. Laissez-le non défini pour que l’intention suive l’activation vocale effective.- Si
voice.autoJoincontient plusieurs entrées pour la même guilde, OpenClaw rejoint le dernier canal configuré pour cette guilde. voice.allowedChannelsest une liste d’autorisation de résidence facultative. Laissez-la non définie pour autoriser/vc joindans n’importe quel canal vocal Discord autorisé. Lorsqu’elle est définie,/vc join, la jonction automatique au démarrage et les déplacements d’état vocal du bot sont limités aux entrées{ guildId, channelId }listées. Définissez-la sur un tableau vide pour refuser toutes les jonctions vocales Discord. Si Discord déplace le bot en dehors de la liste d’autorisation, OpenClaw quitte ce canal et rejoint la cible d’auto-jonction configurée lorsqu’il en existe une.voice.daveEncryptionetvoice.decryptionFailureTolerancesont transmis aux options de jonction@discordjs/voice.- Les valeurs par défaut de
@discordjs/voicesontdaveEncryption=trueetdecryptionFailureTolerance=24si elles ne sont pas définies. - OpenClaw utilise par défaut le décodeur
opusscriptpur JS pour la réception vocale Discord. Le package natif facultatif@discordjs/opusest ignoré par la politique d’installation pnpm du dépôt, afin que les installations normales, les voies Docker et les tests sans rapport ne compilent pas d’addon natif. Les hôtes dédiés aux performances vocales peuvent l’activer avecOPENCLAW_DISCORD_OPUS_DECODER=nativeaprès avoir installé l’addon natif. voice.connectTimeoutMscontrôle l’attente initiale@discordjs/voiceReady pour les tentatives/vc joinet d’auto-jonction. Par défaut :30000.voice.reconnectGraceMscontrôle combien de temps OpenClaw attend qu’une session vocale déconnectée commence à se reconnecter avant de la détruire. Par défaut :15000.- En mode
stt-tts, la lecture vocale ne s’arrête pas simplement parce qu’un autre utilisateur commence à parler. Pour éviter les boucles de rétroaction, OpenClaw ignore la nouvelle capture vocale pendant que TTS est en cours de lecture ; parlez après la fin de la lecture pour le tour suivant. Les modes temps réel transmettent les débuts de parole comme signaux d’interruption au fournisseur temps réel. - En modes temps réel, l’écho des haut-parleurs dans un micro ouvert peut ressembler à une interruption et interrompre la lecture. Pour les salons Discord très sujets à l’écho, définissez
voice.realtime.providers.openai.interruptResponseOnInputAudio: falsepour empêcher OpenAI d’interrompre automatiquement sur l’audio d’entrée. Ajoutezvoice.realtime.bargeIn: truesi vous voulez toujours que les événements Discord de début de parole interrompent la lecture active. Le pont temps réel OpenAI ignore les troncatures de lecture plus courtes quevoice.realtime.minBargeInAudioEndMs, les considérant comme probablement dues à l’écho/au bruit, et les journalise comme ignorées au lieu d’effacer la lecture Discord. voice.captureSilenceGraceMscontrôle combien de temps OpenClaw attend après que Discord signale qu’un locuteur s’est arrêté avant de finaliser ce segment audio pour STT. Par défaut :2500; augmentez cette valeur si Discord découpe les pauses normales en transcriptions partielles saccadées.- Lorsque ElevenLabs est le fournisseur TTS sélectionné, la lecture vocale Discord utilise le TTS en streaming et démarre depuis le flux de réponse du fournisseur. Les fournisseurs sans prise en charge du streaming reviennent au chemin du fichier temporaire synthétisé.
- OpenClaw surveille également les échecs de déchiffrement de réception et récupère automatiquement en quittant/rejoignant le canal vocal après des échecs répétés dans une courte fenêtre.
- Si les journaux de réception affichent à répétition
DecryptionFailed(UnencryptedWhenPassthroughDisabled)après une mise à jour, collectez un rapport de dépendances et les journaux. La ligne@discordjs/voicegroupée inclut le correctif amont de remplissage depuis la PR discord.js #11449, qui a fermé l’issue discord.js #11419. - Les événements de réception
The operation was abortedsont attendus lorsque OpenClaw finalise un segment de locuteur capturé ; ce sont des diagnostics détaillés, pas des avertissements. - Les journaux vocaux Discord détaillés incluent un aperçu borné sur une ligne de la transcription STT pour chaque segment de locuteur accepté, afin que le débogage montre à la fois le côté utilisateur et le côté réponse de l’agent sans déverser de texte de transcription non borné.
- En mode
agent-proxy, le repli de consultation forcée ignore les fragments de transcription probablement incomplets, comme le texte se terminant par...ou un connecteur final commeand, ainsi que les clôtures manifestement non actionnables comme « je reviens tout de suite » ou « au revoir ». Les journaux affichentforced agent consult skipped reason=...lorsque cela empêche une réponse mise en file d’attente obsolète.
node-gyp.
Après avoir installé l’addon natif, démarrez le Gateway avec :
discord voice: opus decoder: @discordjs/opus. Sans l’activation par variable d’environnement, ou si l’addon natif est absent ou ne peut pas se charger sur l’hôte, OpenClaw journalise discord voice: opus decoder: opusscript et continue à recevoir la voix via le repli pur JS.
Pipeline STT plus TTS :
- La capture PCM Discord est convertie en fichier temporaire WAV.
tools.media.audiogère STT, par exempleopenai/gpt-4o-mini-transcribe.- La transcription est envoyée via l’entrée et le routage Discord pendant que le LLM de réponse s’exécute avec une politique de sortie vocale qui masque l’outil agent
ttset demande du texte retourné, parce que la voix Discord possède la lecture TTS finale. voice.model, lorsqu’il est défini, remplace uniquement le LLM de réponse pour ce tour de canal vocal.voice.ttsest fusionné par-dessusmessages.tts; les fournisseurs compatibles avec le streaming alimentent directement le lecteur, sinon le fichier audio résultant est lu dans le canal rejoint.
voice.agentSession, chaque canal vocal obtient sa propre session OpenClaw routée. Par exemple, /vc join channel:234567890123456789 parle à la session de ce canal vocal Discord. Le modèle temps réel n’est que l’interface vocale ; les demandes substantielles sont transmises à l’agent OpenClaw configuré. Si le modèle temps réel produit une transcription finale sans appeler l’outil de consultation, OpenClaw force la consultation comme repli afin que le comportement par défaut reste équivalent à parler à l’agent.
Exemple STT plus TTS hérité :
agent-proxy, le bot rejoint le canal vocal configuré, mais les tours de l’agent OpenClaw utilisent la session et l’agent routés normaux du canal cible. La session vocale temps réel prononce le résultat retourné dans le canal vocal. L’agent superviseur peut toujours utiliser les outils de message normaux selon sa politique d’outils, y compris envoyer un message Discord distinct si c’est l’action appropriée.
Formes de cible utiles :
target: "channel:123456789012345678"route via une session de canal texte Discord.target: "123456789012345678"est traité comme une cible de canal.target: "dm:123456789012345678"outarget: "user:123456789012345678"route via cette session de message direct.
bargeIn: true permet aux événements de début de prise de parole Discord et à l’audio d’un locuteur déjà actif d’annuler les réponses realtime actives avant que le tour capturé suivant n’atteigne OpenAI. Les signaux d’interruption très précoces avec audioEndMs inférieur à minBargeInAudioEndMs sont traités comme de l’écho ou du bruit probable et ignorés afin que le modèle ne s’interrompe pas dès la première trame de lecture.
Journaux vocaux attendus :
- À la connexion :
discord voice: joining ... voiceSession=... supervisorSession=... agentSessionMode=... voiceModel=... realtimeModel=... - Au démarrage realtime :
discord voice: realtime bridge starting ... autoRespond=false interruptResponse=false bargeIn=false minBargeInAudioEndMs=... - Sur l’audio du locuteur :
discord voice: realtime speaker turn opened ...,discord voice: realtime input audio started ... outputAudioMs=... outputActive=..., etdiscord voice: realtime speaker turn closed ... chunks=... discordBytes=... realtimeBytes=... interruptedPlayback=... - Sur la parole obsolète ignorée :
discord voice: realtime forced agent consult skipped reason=incomplete-transcript ...oureason=non-actionable-closing ... - À la fin de la réponse realtime :
discord voice: realtime audio playback finishing reason=response.done ... audioMs=... chunks=... - À l’arrêt ou à la réinitialisation de la lecture :
discord voice: realtime audio playback stopped reason=... audioMs=... elapsedMs=... chunks=... - Lors de la consultation realtime :
discord voice: realtime consult requested ... voiceSession=... supervisorSession=... question=... - Sur la réponse de l’agent :
discord voice: agent turn answer ... - Sur la parole exacte mise en file d’attente :
discord voice: realtime exact speech queued ... queued=... outputAudioMs=... outputActive=..., suivi dediscord voice: realtime exact speech dequeued reason=player-idle ... - Lors de la détection d’interruption :
discord voice: realtime barge-in detected source=speaker-start ...oudiscord voice: realtime barge-in detected source=active-speaker-audio ..., suivi dediscord voice: realtime barge-in requested reason=... outputAudioMs=... outputActive=... - Lors de l’interruption realtime :
discord voice: realtime model interrupt requested client:response.cancel reason=barge-in, suivi soit dediscord voice: realtime model audio truncated client:conversation.item.truncate reason=barge-in audioEndMs=..., soit dediscord voice: realtime model interrupt confirmed server:response.done status=cancelled ... - Sur l’écho ou le bruit ignoré :
discord voice: realtime model interrupt ignored client:conversation.item.truncate.skipped reason=barge-in audioEndMs=0 minAudioEndMs=250 - Lorsque l’interruption est désactivée :
discord voice: realtime capture ignored during playback (barge-in disabled) ... - Sur la lecture inactive :
discord voice: realtime barge-in ignored reason=... outputActive=false ... playbackChunks=0
realtime audio playback startedsignifie que Discord a commencé à lire l’audio de l’assistant. Le bridge commence à compter les fragments de sortie de l’assistant, les octets PCM Discord, les octets realtime du fournisseur et la durée audio synthétisée à partir de ce point.realtime speaker turn openedmarque l’activation d’un locuteur Discord. Si la lecture est déjà active et quebargeInest activé, cela peut être suivi debarge-in detected source=speaker-start.realtime input audio startedmarque la première trame audio réelle reçue pour ce tour de locuteur.outputActive=trueou unoutputAudioMsnon nul ici signifie que le micro envoie une entrée pendant que la lecture de l’assistant est encore active.barge-in detected source=active-speaker-audiosignifie qu’OpenClaw a détecté de l’audio de locuteur en direct pendant que la lecture de l’assistant était active. C’est utile pour distinguer une véritable interruption d’un événement de début de locuteur Discord sans audio utile.barge-in requested reason=...signifie qu’OpenClaw a demandé au fournisseur realtime d’annuler ou de tronquer la réponse active. Il inclutoutputAudioMs,outputActiveetplaybackChunksafin que vous puissiez voir quelle quantité d’audio de l’assistant avait réellement été lue avant l’interruption.realtime audio playback stopped reason=...est le point local de réinitialisation de la lecture Discord. La raison indique qui a arrêté la lecture :barge-in,player-idle,provider-clear-audio,forced-agent-consult,stream-closeousession-close.realtime speaker turn closedrésume le tour d’entrée capturé.chunks=0ouhasAudio=falsesignifie que le tour de locuteur s’est ouvert, mais qu’aucun audio exploitable n’a atteint le bridge realtime.interruptedPlayback=truesignifie que ce tour d’entrée a chevauché la sortie de l’assistant et déclenché la logique d’interruption.
outputAudioMs: durée audio de l’assistant générée par le fournisseur realtime avant la ligne de journal.audioMs: durée audio de l’assistant comptabilisée par OpenClaw avant l’arrêt de la lecture.elapsedMs: temps réel écoulé entre l’ouverture et la fermeture du flux de lecture ou du tour de locuteur.discordBytes: octets PCM stéréo 48 kHz envoyés à Discord voice ou reçus de celui-ci.realtimeBytes: octets PCM au format du fournisseur envoyés au fournisseur realtime ou reçus de celui-ci.playbackChunks: fragments audio de l’assistant transmis à Discord pour la réponse active.sinceLastAudioMs: intervalle entre la dernière trame audio de locuteur capturée et la fermeture du tour de locuteur.
- Une coupure immédiate avec
source=active-speaker-audio, un petitoutputAudioMset le même utilisateur à proximité indique généralement que l’écho du haut-parleur entre dans le micro. Augmentezvoice.realtime.minBargeInAudioEndMs, baissez le volume du haut-parleur, utilisez un casque ou définissezvoice.realtime.providers.openai.interruptResponseOnInputAudio: false. source=speaker-startsuivi despeaker turn closed ... hasAudio=falsesignifie que Discord a signalé un début de prise de parole, mais qu’aucun audio n’a atteint OpenClaw. Il peut s’agir d’un événement vocal Discord transitoire, d’un comportement de noise gate ou d’un client qui active brièvement le micro.audio playback stopped reason=stream-closesans interruption proche niprovider-clear-audiosignifie que le flux local de lecture Discord s’est terminé de manière inattendue. Vérifiez les journaux précédents du fournisseur et du lecteur Discord.capture ignored during playback (barge-in disabled)signifie qu’OpenClaw a volontairement ignoré l’entrée pendant que l’audio de l’assistant était actif. Activezvoice.realtime.bargeInsi vous voulez que la parole interrompe la lecture.barge-in ignored ... outputActive=falsesignifie que Discord ou le VAD du fournisseur a signalé de la parole, mais qu’OpenClaw n’avait aucune lecture active à interrompre. Cela ne devrait pas couper l’audio.
voice.model, authentification STT pour tools.media.audio, authentification TTS pour messages.tts/voice.tts, et authentification du fournisseur realtime pour voice.realtime.providers ou la configuration d’authentification normale du fournisseur.
Messages vocaux
Les messages vocaux Discord affichent un aperçu de forme d’onde et nécessitent de l’audio OGG/Opus. OpenClaw génère automatiquement la forme d’onde, mais a besoin deffmpeg et ffprobe sur l’hôte du Gateway pour inspecter et convertir.
- Fournissez un chemin de fichier local (les URL sont rejetées).
- Omettez le contenu textuel (Discord rejette le texte + message vocal dans la même charge utile).
- Tous les formats audio sont acceptés ; OpenClaw convertit en OGG/Opus si nécessaire.
Dépannage
Intents non autorisés utilisés ou bot ne voyant aucun message de guilde
Intents non autorisés utilisés ou bot ne voyant aucun message de guilde
- activez Message Content Intent
- activez Server Members Intent lorsque vous dépendez de la résolution utilisateur/membre
- redémarrez le Gateway après avoir modifié les intents
Messages de guilde bloqués de façon inattendue
Messages de guilde bloqués de façon inattendue
- vérifiez
groupPolicy - vérifiez la liste d’autorisation de guilde sous
channels.discord.guilds - si la map
channelsde guilde existe, seuls les canaux listés sont autorisés - vérifiez le comportement de
requireMentionet les motifs de mention
Mention requise à false mais toujours bloquée
Mention requise à false mais toujours bloquée
groupPolicy="allowlist"sans liste d’autorisation de guilde/canal correspondanterequireMentionconfiguré au mauvais endroit (doit se trouver souschannels.discord.guildsou dans l’entrée du canal)- expéditeur bloqué par la liste d’autorisation
usersde guilde/canal
Tours Discord longs ou réponses dupliquées
Tours Discord longs ou réponses dupliquées
Slow listener detected ...stuck session: sessionKey=agent:...:discord:... state=processing ...
- compte unique :
channels.discord.eventQueue.listenerTimeout - multi-compte :
channels.discord.accounts.<accountId>.eventQueue.listenerTimeout - ceci contrôle uniquement le travail des écouteurs du Gateway Discord, pas la durée de vie du tour de l’agent
Avertissements de délai d’expiration de recherche des métadonnées du Gateway
Avertissements de délai d’expiration de recherche des métadonnées du Gateway
/gateway/bot avant de se connecter. Les échecs transitoires reviennent à l’URL de Gateway par défaut de Discord et sont limités en fréquence dans les journaux.Réglages du délai d’expiration des métadonnées :- compte unique :
channels.discord.gatewayInfoTimeoutMs - multi-compte :
channels.discord.accounts.<accountId>.gatewayInfoTimeoutMs - variable d’environnement de secours lorsque la configuration n’est pas définie :
OPENCLAW_DISCORD_GATEWAY_INFO_TIMEOUT_MS - valeur par défaut :
30000(30 secondes), max :120000
Redémarrages dus au délai d’expiration READY du Gateway
Redémarrages dus au délai d’expiration READY du Gateway
READY du Gateway Discord au démarrage et après les reconnexions runtime. Les configurations multi-comptes avec étalement du démarrage peuvent nécessiter une fenêtre READY de démarrage plus longue que la valeur par défaut.Réglages du délai d’expiration READY :- démarrage compte unique :
channels.discord.gatewayReadyTimeoutMs - démarrage multi-compte :
channels.discord.accounts.<accountId>.gatewayReadyTimeoutMs - variable d’environnement de secours au démarrage lorsque la configuration n’est pas définie :
OPENCLAW_DISCORD_READY_TIMEOUT_MS - valeur par défaut au démarrage :
15000(15 secondes), max :120000 - runtime compte unique :
channels.discord.gatewayRuntimeReadyTimeoutMs - runtime multi-compte :
channels.discord.accounts.<accountId>.gatewayRuntimeReadyTimeoutMs - variable d’environnement de secours au runtime lorsque la configuration n’est pas définie :
OPENCLAW_DISCORD_RUNTIME_READY_TIMEOUT_MS - valeur par défaut au runtime :
30000(30 secondes), max :120000
Incohérences dans l’audit des autorisations
Incohérences dans l’audit des autorisations
channels status --probe ne fonctionnent que pour les identifiants numériques de canaux.Si vous utilisez des clés slug, la correspondance runtime peut toujours fonctionner, mais la sonde ne peut pas vérifier entièrement les autorisations.Problèmes de DM et d’appairage
Problèmes de DM et d’appairage
- DM désactivé :
channels.discord.dm.enabled=false - politique DM désactivée :
channels.discord.dmPolicy="disabled"(hérité :channels.discord.dm.policy) - attente de l’approbation d’appairage en mode
pairing
Boucles de bot à bot
Boucles de bot à bot
channels.discord.allowBots=true, utilisez des règles strictes de mention et de liste d’autorisation pour éviter les comportements en boucle.
Préférez channels.discord.allowBots="mentions" pour n’accepter que les messages de bots qui mentionnent le bot.Les transcriptions vocales STT échouent avec DecryptionFailed(...)
Les transcriptions vocales STT échouent avec DecryptionFailed(...)
- gardez OpenClaw à jour (
openclaw update) afin que la logique de récupération de réception vocale Discord soit présente - confirmez que
channels.discord.voice.daveEncryption=true(par défaut) - commencez avec
channels.discord.voice.decryptionFailureTolerance=24(valeur par défaut en amont) et ajustez uniquement si nécessaire - surveillez les journaux pour :
discord voice: DAVE decrypt failures detecteddiscord voice: repeated decrypt failures; attempting rejoin
- si les échecs continuent après la reconnexion automatique, collectez les journaux et comparez-les à l’historique de réception DAVE en amont dans discord.js #11419 et discord.js #11449
Référence de configuration
Référence principale : Référence de configuration - Discord.Champs Discord à fort signal
Champs Discord à fort signal
- démarrage/authentification :
enabled,token,accounts.*,allowBots - politique :
groupPolicy,dm.*,guilds.*,guilds.*.channels.* - commande :
commands.native,commands.useAccessGroups,configWrites,slashCommand.* - file d’événements :
eventQueue.listenerTimeout(budget de l’écouteur),eventQueue.maxQueueSize,eventQueue.maxConcurrency - gateway :
gatewayInfoTimeoutMs,gatewayReadyTimeoutMs,gatewayRuntimeReadyTimeoutMs - réponse/historique :
replyToMode,historyLimit,dmHistoryLimit,dms.*.historyLimit - livraison :
textChunkLimit,chunkMode,maxLinesPerMessage - streaming :
streaming(alias hérité :streamMode),streaming.preview.toolProgress,draftChunk,blockStreaming,blockStreamingCoalesce - média/nouvelle tentative :
mediaMaxMb(plafonne les téléversements Discord sortants, valeur par défaut100MB),retry - actions :
actions.* - présence :
activity,status,activityType,activityUrl - UI :
ui.components.accentColor - fonctionnalités :
threadBindings,bindings[]de premier niveau (type: "acp"),pluralkit,execApprovals,intents,agentComponents,heartbeat,responsePrefix
Sécurité et opérations
- Traitez les jetons de bot comme des secrets (
DISCORD_BOT_TOKENest recommandé dans les environnements supervisés). - Accordez les autorisations Discord avec le moindre privilège.
- Si le déploiement ou l’état des commandes est obsolète, redémarrez le gateway et revérifiez avec
openclaw channels status --probe.