Pronto per DM e canali guild tramite il Gateway ufficiale di Discord.Documentation Index
Fetch the complete documentation index at: https://docs.openclaw.ai/llms.txt
Use this file to discover all available pages before exploring further.
Abbinamento
Comandi slash
Risoluzione dei problemi del canale
Configurazione rapida
Dovrai creare una nuova applicazione con un bot, aggiungere il bot al tuo server e abbinarlo a OpenClaw. Consigliamo di aggiungere il bot al tuo server privato. Se non ne hai ancora uno, creane prima uno (scegli Create My Own > For me and my friends).Crea un'applicazione Discord e un bot
Abilita gli intent privilegiati
- Message Content Intent (obbligatorio)
- Server Members Intent (consigliato; obbligatorio per le allowlist dei ruoli e la corrispondenza nome-ID)
- Presence Intent (facoltativo; necessario solo per gli aggiornamenti di presenza)
Copia il token del bot
Genera un URL di invito e aggiungi il bot al tuo server
botapplications.commands
- Visualizzare canali Autorizzazioni testo
- Inviare messaggi
- Leggere la cronologia dei messaggi
- Incorporare link
- Allegare file
- Aggiungere reazioni (facoltativo)
Abilita la modalità sviluppatore e raccogli i tuoi ID
- Fai clic su User Settings (icona a forma di ingranaggio accanto al tuo avatar) → Advanced → attiva Developer Mode
- Fai clic con il pulsante destro sull’icona del server nella barra laterale → Copy Server ID
- Fai clic con il pulsante destro sul tuo avatar → Copy User ID
Consenti i DM dai membri del server
Imposta il token del bot in modo sicuro (non inviarlo in chat)
openclaw gateway run.
Per le installazioni come servizio gestito, esegui openclaw gateway install da una shell in cui DISCORD_BOT_TOKEN è presente, oppure memorizza la variabile in ~/.openclaw/.env, in modo che il servizio possa risolvere il SecretRef env dopo il riavvio.
Se il tuo host è bloccato o limitato dalla ricerca dell’applicazione all’avvio di Discord, imposta l’ID applicazione/client Discord dal Developer Portal in modo che l’avvio possa saltare quella chiamata REST. Usa channels.discord.applicationId per l’account predefinito, oppure channels.discord.accounts.<accountId>.applicationId quando esegui più bot Discord.Configura OpenClaw e abbina
- Chiedi al tuo agente
- CLI / configurazione
“Ho già impostato il token del bot Discord nella configurazione. Completa la configurazione di Discord con User ID<user_id>e Server ID<server_id>.”
Approva il primo abbinamento DM
- Chiedi al tuo agente
- CLI
“Approva questo codice di abbinamento Discord: <CODE>”
DISCORD_BOT_TOKEN viene usato solo per l’account predefinito.
Se due account Discord abilitati risolvono allo stesso token del bot, OpenClaw avvia un solo monitor gateway per quel token. Un token proveniente dalla configurazione prevale sul fallback env predefinito; altrimenti vince il primo account abilitato e l’account duplicato viene segnalato come disabilitato.
Per chiamate in uscita avanzate (strumento messaggi/azioni del canale), per quella chiamata viene usato un token esplicito per chiamata. Questo si applica alle azioni di invio e lettura/sonda (ad esempio lettura/ricerca/recupero/thread/pin/autorizzazioni). Le impostazioni di policy/retry dell’account provengono comunque dall’account selezionato nello snapshot di runtime attivo.Consigliato: configura uno spazio di lavoro guild
Una volta che i DM funzionano, puoi configurare il tuo server Discord come spazio di lavoro completo in cui ogni canale ottiene la propria sessione agente con il proprio contesto. Questo è consigliato per server privati in cui ci siete solo tu e il tuo bot.Aggiungi il tuo server alla allowlist guild
- Chiedi al tuo agente
- Configurazione
“Aggiungi il mio Discord Server ID <server_id> alla allowlist guild”
Consenti risposte senza @menzione
message, così l’agente può restare in ascolto per impostazione predefinita e pubblicare solo quando decide che una risposta nel canale è utile.Ciò significa che il modello selezionato deve chiamare gli strumenti in modo affidabile. Se Discord mostra la digitazione e i log mostrano l’uso dei token ma nessun messaggio pubblicato, controlla nel log della sessione se c’è testo dell’assistente con didSendViaMessagingTool: false. Questo significa che il modello ha prodotto una risposta finale privata invece di chiamare message(action=send). Passa a un modello più efficace nella chiamata degli strumenti, oppure usa la configurazione sotto per ripristinare le risposte finali automatiche legacy.- Chiedi al tuo agente
- Configurazione
“Consenti al mio agente di rispondere su questo server senza dover essere @menzionato”
Pianifica la memoria nei canali guild
- Chiedi al tuo agente
- Manuale
“Quando faccio domande nei canali Discord, usa memory_search o memory_get se ti serve contesto a lungo termine da MEMORY.md.”
#coding, #home, #research o qualunque cosa si adatti al tuo flusso di lavoro.
Modello di runtime
- Gateway possiede la connessione Discord.
- L’instradamento delle risposte è deterministico: le risposte in ingresso da Discord tornano a Discord.
- I metadati di guild/canale Discord vengono aggiunti al prompt del modello come contesto non attendibile, non come prefisso di risposta visibile all’utente. Se un modello copia nuovamente quell’involucro, OpenClaw rimuove i metadati copiati dalle risposte in uscita e dal futuro contesto di replay.
- Per impostazione predefinita (
session.dmScope=main), le chat dirette condividono la sessione principale dell’agente (agent:main:main). - I canali guild sono chiavi di sessione isolate (
agent:<agentId>:discord:channel:<channelId>). - I DM di gruppo sono ignorati per impostazione predefinita (
channels.discord.dm.groupEnabled=false). - I comandi slash nativi vengono eseguiti in sessioni di comando isolate (
agent:<agentId>:discord:slash:<userId>), pur continuando a portareCommandTargetSessionKeyalla sessione di conversazione instradata. - La consegna degli annunci cron/heartbeat solo testo a Discord usa una sola volta la risposta finale visibile all’assistente. I payload multimediali e dei componenti strutturati restano multi-messaggio quando l’agente emette più payload consegnabili.
Canali forum
I canali forum e media di Discord accettano solo post nei thread. OpenClaw supporta due modi per crearli:- Invia un messaggio al forum padre (
channel:<forumId>) per creare automaticamente un thread. Il titolo del thread usa la prima riga non vuota del messaggio. - Usa
openclaw message thread createper creare direttamente un thread. Non passare--message-idper i canali forum.
channel:<threadId>).
Componenti interattivi
OpenClaw supporta contenitori di componenti Discord v2 per i messaggi degli agenti. Usa lo strumento messaggi con un payloadcomponents. I risultati delle interazioni vengono instradati all’agente come normali messaggi in ingresso e seguono le impostazioni Discord replyToMode esistenti.
Blocchi supportati:
text,section,separator,actions,media-gallery,file- Le righe di azione consentono fino a 5 pulsanti o un singolo menu di selezione
- Tipi di selezione:
string,user,role,mentionable,channel
components.reusable=true per consentire a pulsanti, selezioni e moduli di essere usati più volte fino alla scadenza.
Per limitare chi può fare clic su un pulsante, imposta allowedUsers su quel pulsante (ID utente Discord, tag o *). Quando configurato, gli utenti non corrispondenti ricevono un rifiuto effimero.
I comandi slash /model e /models aprono un selettore interattivo del modello con menu a discesa per provider, modello e runtime compatibile, più un passaggio Invia. /models add è deprecato e ora restituisce un messaggio di deprecazione invece di registrare modelli dalla chat. La risposta del selettore è effimera e solo l’utente che l’ha invocata può usarla. I menu di selezione Discord sono limitati a 25 opzioni, quindi aggiungi voci provider/* a agents.defaults.models quando vuoi che il selettore mostri modelli rilevati dinamicamente solo per provider selezionati come openai-codex o vllm.
Allegati file:
- I blocchi
filedevono puntare a un riferimento di allegato (attachment://<filename>) - Fornisci l’allegato tramite
media/path/filePath(file singolo); usamedia-galleryper più file - Usa
filenameper sovrascrivere il nome di caricamento quando deve corrispondere al riferimento dell’allegato
- Aggiungi
components.modalcon un massimo di 5 campi - Tipi di campo:
text,checkbox,radio,select,role-select,user-select - OpenClaw aggiunge automaticamente un pulsante di attivazione
Controllo degli accessi e instradamento
- Criterio DM
- Gruppi di accesso
- Criterio guild
- Menzioni e DM di gruppo
channels.discord.dmPolicy controlla l’accesso ai DM. channels.discord.allowFrom è la allowlist DM canonica.pairing(predefinito)allowlistopen(richiede chechannels.discord.allowFromincluda"*")disabled
pairing).Precedenza multi-account:channels.discord.accounts.default.allowFromsi applica solo all’accountdefault.- Per un account,
allowFromha precedenza sul legacydm.allowFrom. - Gli account con nome ereditano
channels.discord.allowFromquando i propriallowFrome il legacydm.allowFromnon sono impostati. - Gli account con nome non ereditano
channels.discord.accounts.default.allowFrom.
channels.discord.dm.policy e channels.discord.dm.allowFrom vengono ancora letti per compatibilità. openclaw doctor --fix li migra a dmPolicy e allowFrom quando può farlo senza modificare l’accesso.Formato target DM per la consegna:user:<id>- menzione
<@id>
allowFrom effettivo dell’account vengono trattati come target DM utente per compatibilità.Instradamento degli agenti basato sui ruoli
Usabindings[].match.roles per instradare i membri della guild Discord ad agenti diversi in base all’ID ruolo. I binding basati sui ruoli accettano solo ID ruolo e vengono valutati dopo i binding peer o parent-peer e prima dei binding solo guild. Se un binding imposta anche altri campi di corrispondenza (per esempio peer + guildId + roles), tutti i campi configurati devono corrispondere.
Comandi nativi e autenticazione dei comandi
commands.nativeha come valore predefinito"auto"ed è abilitato per Discord.- Override per canale:
channels.discord.commands.native. commands.native=falsesalta la registrazione e la pulizia dei comandi slash di Discord durante l’avvio. I comandi registrati in precedenza possono rimanere visibili in Discord finché non li rimuovi dall’app Discord.- L’autorizzazione dei comandi nativi usa le stesse allowlist/policy di Discord della normale gestione dei messaggi.
- I comandi possono comunque essere visibili nell’interfaccia utente di Discord per gli utenti non autorizzati; l’esecuzione applica comunque l’autorizzazione di OpenClaw e restituisce “non autorizzato”.
ephemeral: true
Dettagli della funzionalità
Reply tags and native replies
Reply tags and native replies
Live stream preview
Live stream preview
channels.discord.streaming accetta off | partial | block | progress (predefinito). progress mantiene una bozza di stato modificabile e la aggiorna con l’avanzamento degli strumenti fino alla consegna finale; l’etichetta iniziale condivisa è una riga scorrevole, quindi scorre via come il resto quando compare abbastanza lavoro. streamMode è un alias runtime legacy. Esegui openclaw doctor --fix per riscrivere la configurazione persistita con la chiave canonica.Imposta channels.discord.streaming.mode su off per disabilitare le modifiche di anteprima di Discord. Se lo streaming a blocchi di Discord è abilitato esplicitamente, OpenClaw salta il flusso di anteprima per evitare il doppio streaming.partialmodifica un singolo messaggio di anteprima man mano che arrivano i token.blockemette blocchi delle dimensioni di una bozza (usadraftChunkper regolare dimensione e punti di interruzione, limitati atextChunkLimit).- I messaggi finali con media, errore e risposta esplicita annullano le modifiche di anteprima in sospeso.
streaming.preview.toolProgress(predefinitotrue) controlla se gli aggiornamenti di strumenti/avanzamento riutilizzano il messaggio di anteprima.- Le righe strumenti/avanzamento vengono renderizzate come emoji compatta + titolo + dettaglio quando disponibili, per esempio
🛠️ Bash: run testso🔎 Web Search: for "query". streaming.preview.commandText/streaming.progress.commandTextcontrolla il dettaglio comando/esecuzione nelle righe di avanzamento compatte:raw(predefinito) ostatus(solo etichetta dello strumento).
block è abilitato esplicitamente, OpenClaw salta il flusso di anteprima per evitare il doppio streaming.History, context, and thread behavior
History, context, and thread behavior
channels.discord.historyLimitpredefinito20- fallback:
messages.groupChat.historyLimit 0disabilita
channels.discord.dmHistoryLimitchannels.discord.dms["<user_id>"].historyLimit
- I thread Discord vengono instradati come sessioni di canale ed ereditano la configurazione del canale padre se non sovrascritta.
- Le sessioni thread ereditano la selezione
/modela livello di sessione del canale padre come fallback solo per il modello; le selezioni/modellocali al thread hanno comunque la precedenza e la cronologia della trascrizione del padre non viene copiata a meno che l’ereditarietà della trascrizione sia abilitata. channels.discord.thread.inheritParent(predefinitofalse) attiva per i nuovi thread automatici il seeding dalla trascrizione padre. Gli override per account si trovano sottochannels.discord.accounts.<id>.thread.inheritParent.- Le reazioni dello strumento messaggi possono risolvere destinazioni DM
user:<id>. guilds.<guild>.channels.<channel>.requireMention: falseviene preservato durante il fallback di attivazione in fase di risposta.
Thread-bound sessions for subagents
Thread-bound sessions for subagents
/focus <target>associa il thread corrente/nuovo a una destinazione di sottoagente/sessione/unfocusrimuove l’associazione del thread corrente/agentsmostra esecuzioni attive e stato dell’associazione/session idle <duration|off>ispeziona/aggiorna l’auto-unfocus per inattività per le associazioni focalizzate/session max-age <duration|off>ispeziona/aggiorna l’età massima rigida per le associazioni focalizzate
session.threadBindings.*imposta i valori predefiniti globali.channels.discord.threadBindings.*sovrascrive il comportamento di Discord.spawnSessionscontrolla la creazione/associazione automatica di thread persessions_spawn({ thread: true })e gli spawn di thread ACP. Predefinito:true.defaultSpawnContextcontrolla il contesto nativo dei sottoagenti per gli spawn associati a thread. Predefinito:"fork".- Le chiavi deprecate
spawnSubagentSessions/spawnAcpSessionsvengono migrate daopenclaw doctor --fix. - Se le associazioni dei thread sono disabilitate per un account,
/focuse le operazioni correlate di associazione dei thread non sono disponibili.
Persistent ACP channel bindings
Persistent ACP channel bindings
bindings[]contype: "acp"ematch.channel: "discord"
/acp spawn codex --bind hereassocia il canale o thread corrente sul posto e mantiene i messaggi futuri sulla stessa sessione ACP. I messaggi del thread ereditano l’associazione del canale padre.- In un canale o thread associato,
/newe/resetreimpostano la stessa sessione ACP sul posto. Le associazioni temporanee dei thread possono sovrascrivere la risoluzione della destinazione mentre sono attive. spawnSessionsregola la creazione/associazione dei thread figli tramite--thread auto|here.
Reaction notifications
Reaction notifications
offown(predefinito)allallowlist(usaguilds.<id>.users)
Ack reactions
Ack reactions
ackReaction invia un’emoji di conferma mentre OpenClaw elabora un messaggio in ingresso.Ordine di risoluzione:channels.discord.accounts.<accountId>.ackReactionchannels.discord.ackReactionmessages.ackReaction- fallback all’emoji dell’identità dell’agente (
agents.list[].identity.emoji, altrimenti ”👀”)
- Discord accetta emoji unicode o nomi di emoji personalizzate.
- Usa
""per disabilitare la reazione per un canale o account.
Config writes
Config writes
/config set|unset (quando le funzionalità di comando sono abilitate).Disabilita:Gateway proxy
Gateway proxy
channels.discord.proxy.PluralKit support
PluralKit support
- le allowlist possono usare
pk:<memberId> - i nomi visualizzati dei membri vengono confrontati per nome/slug solo quando
channels.discord.dangerouslyAllowNameMatching: true - le ricerche usano l’ID del messaggio originale e sono vincolate a una finestra temporale
- se la ricerca fallisce, i messaggi con proxy vengono trattati come messaggi bot e scartati a meno che
allowBots=true
Outbound mention aliases
Outbound mention aliases
mentionAliases quando gli agenti hanno bisogno di menzioni in uscita deterministiche per utenti Discord noti. Le chiavi sono handle senza la @ iniziale; i valori sono ID utente Discord. Handle sconosciuti, @everyone, @here e menzioni all’interno di code span Markdown vengono lasciati invariati.Presence configuration
Presence configuration
- 0: In gioco
- 1: Streaming (richiede
activityUrl) - 2: In ascolto
- 3: In visione
- 4: Personalizzata (usa il testo dell’attività come stato; l’emoji è facoltativa)
- 5: In competizione
autoPresence.healthyTextautoPresence.degradedTextautoPresence.exhaustedText(supporta il segnaposto{reason})
Approvals in Discord
Approvals in Discord
channels.discord.execApprovals.enabledchannels.discord.execApprovals.approvers(facoltativo; ricorre acommands.ownerAllowFromquando possibile)channels.discord.execApprovals.target(dm|channel|both, predefinito:dm)agentFilter,sessionFilter,cleanupAfterResolve
enabled non è impostato o è "auto" e almeno un approvatore può essere risolto, da execApprovals.approvers oppure da commands.ownerAllowFrom. Discord non deduce gli approvatori exec da allowFrom del canale, dal vecchio dm.allowFrom o da defaultTo dei messaggi diretti. Imposta enabled: false per disabilitare esplicitamente Discord come client di approvazione nativo.Per comandi di gruppo sensibili riservati al proprietario, come /diagnostics e /export-trajectory, OpenClaw invia privatamente le richieste di approvazione e i risultati finali. Prova prima il DM Discord quando il proprietario che invoca il comando ha una route proprietario Discord; se non è disponibile, ricorre alla prima route proprietario disponibile da commands.ownerAllowFrom, come Telegram.Quando target è channel o both, la richiesta di approvazione è visibile nel canale. Solo gli approvatori risolti possono usare i pulsanti; gli altri utenti ricevono un rifiuto effimero. Le richieste di approvazione includono il testo del comando, quindi abilita la consegna nel canale solo in canali attendibili. Se l’ID del canale non può essere derivato dalla chiave di sessione, OpenClaw ricorre alla consegna tramite DM.Discord renderizza anche i pulsanti di approvazione condivisi usati dagli altri canali chat. L’adattatore nativo Discord aggiunge principalmente il routing DM degli approvatori e il fanout sui canali.
Quando questi pulsanti sono presenti, sono la UX di approvazione principale; OpenClaw
dovrebbe includere un comando manuale /approve solo quando il risultato dello strumento indica
che le approvazioni via chat non sono disponibili o che l’approvazione manuale è l’unico percorso.
Se il runtime di approvazione nativo Discord non è attivo, OpenClaw mantiene visibile
la richiesta deterministica locale /approve <id> <decision>. Se il
runtime è attivo ma una scheda nativa non può essere consegnata ad alcuna destinazione,
OpenClaw invia nello stesso chat un avviso di fallback con il comando /approve
esatto dall’approvazione in sospeso.L’autenticazione Gateway e la risoluzione delle approvazioni seguono il contratto client Gateway condiviso (gli ID plugin: si risolvono tramite plugin.approval.resolve; gli altri ID tramite exec.approval.resolve). Le approvazioni scadono dopo 30 minuti per impostazione predefinita.Vedi Approvazioni exec.Strumenti e gate delle azioni
Le azioni sui messaggi Discord includono azioni di messaggistica, amministrazione dei canali, moderazione, presenza e metadati. Esempi principali:- messaggistica:
sendMessage,readMessages,editMessage,deleteMessage,threadReply - reazioni:
react,reactions,emojiList - moderazione:
timeout,kick,ban - presenza:
setPresence
event-create accetta un parametro facoltativo image (URL o percorso di file locale) per impostare l’immagine di copertina dell’evento programmato.
I gate delle azioni si trovano sotto channels.discord.actions.*.
Comportamento predefinito dei gate:
| Gruppo di azioni | Predefinito |
|---|---|
| reazioni, messaggi, thread, pin, sondaggi, ricerca, informazioni membro, informazioni ruolo, informazioni canale, canali, stato voce, eventi, sticker, caricamenti emoji, caricamenti sticker, autorizzazioni | abilitato |
| ruoli | disabilitato |
| moderazione | disabilitato |
| presenza | disabilitato |
UI Components v2
OpenClaw usa Discord components v2 per le approvazioni exec e i marcatori tra contesti. Le azioni sui messaggi Discord possono anche accettarecomponents per UI personalizzate (avanzato; richiede la costruzione di un payload componente tramite lo strumento Discord), mentre i vecchi embeds restano disponibili ma non sono consigliati.
channels.discord.ui.components.accentColorimposta il colore di accento usato dai contenitori dei componenti Discord (hex).- Imposta per account con
channels.discord.accounts.<id>.ui.components.accentColor. embedsviene ignorato quando sono presenti components v2.
Voce
Discord ha due superfici voce distinte: canali vocali in tempo reale (conversazioni continue) e allegati di messaggi vocali (il formato di anteprima a forma d’onda). Il gateway supporta entrambe.Canali vocali
Checklist di configurazione:- Abilita Message Content Intent nel Discord Developer Portal.
- Abilita Server Members Intent quando si usano allowlist di ruoli/utenti.
- Invita il bot con gli scope
boteapplications.commands. - Concedi Connect, Speak, Send Messages e Read Message History nel canale vocale di destinazione.
- Abilita i comandi nativi (
commands.nativeochannels.discord.commands.native). - Configura
channels.discord.voice.
/vc join|leave|status per controllare le sessioni. Il comando usa l’agente predefinito dell’account e segue le stesse regole di allowlist e criteri di gruppo degli altri comandi Discord.
voice.ttssovrascrivemessages.ttssolo per la riproduzione vocalestt-tts. Le modalità realtime usanovoice.realtime.voice.voice.modecontrolla il percorso della conversazione. Il valore predefinito èagent-proxy: un front end vocale realtime gestisce la temporizzazione dei turni, l’interruzione e la riproduzione, delega il lavoro sostanziale all’agente OpenClaw instradato tramiteopenclaw_agent_consulte tratta il risultato come un prompt Discord digitato da quello speaker.stt-ttsmantiene il flusso batch STT più TTS precedente.bidiconsente al modello realtime di conversare direttamente, esponendo al contempoopenclaw_agent_consultper il cervello OpenClaw.voice.agentSessioncontrolla quale conversazione OpenClaw riceve i turni vocali. Lascialo non impostato per la sessione propria del canale vocale, oppure imposta{ mode: "target", target: "channel:<text-channel-id>" }per fare in modo che il canale vocale agisca come estensione microfono/speaker di una sessione esistente di canale testuale Discord, come#maintainers.voice.modelsovrascrive il cervello dell’agente OpenClaw per le risposte vocali Discord e le consultazioni realtime. Lascialo non impostato per ereditare il modello dell’agente instradato. È separato davoice.realtime.model.agent-proxyinstrada il parlato tramitediscord-voice, che preserva la normale autorizzazione owner/tool per lo speaker e la sessione di destinazione, ma nasconde lo strumentottsdell’agente perché la voce Discord possiede la riproduzione. Per impostazione predefinita,agent-proxyconcede alla consultazione l’accesso completo agli strumenti equivalente a quello dell’owner per gli speaker owner (voice.realtime.toolPolicy: "owner") e preferisce fortemente consultare l’agente OpenClaw prima delle risposte sostanziali (voice.realtime.consultPolicy: "always"). In quella modalità predefinitaalways, il livello realtime non pronuncia automaticamente riempitivi prima della risposta della consultazione; cattura e trascrive il parlato, poi pronuncia la risposta OpenClaw instradata. Se più risposte di consultazione forzata terminano mentre Discord sta ancora riproducendo la prima risposta, le risposte successive con parlato esatto vengono messe in coda finché la riproduzione non è inattiva, invece di sostituire il parlato a metà frase.- In modalità
stt-tts, STT usatools.media.audio;voice.modelnon influisce sulla trascrizione. - Nelle modalità realtime,
voice.realtime.provider,voice.realtime.modelevoice.realtime.voiceconfigurano la sessione audio realtime. Per OpenAI Realtime 2 più il cervello Codex, usavoice.realtime.model: "gpt-realtime-2"evoice.model: "openai-codex/gpt-5.5". - Il provider realtime OpenAI accetta i nomi evento Realtime 2 correnti e gli alias legacy compatibili con Codex per gli eventi di audio in uscita e trascrizione, così gli snapshot dei provider compatibili possono divergere senza perdere l’audio dell’assistente.
voice.realtime.bargeIncontrolla se gli eventi di avvio dello speaker Discord interrompono la riproduzione realtime attiva. Se non impostato, segue l’impostazione di interruzione dell’audio in ingresso del provider realtime.voice.realtime.minBargeInAudioEndMscontrolla la durata minima della riproduzione dell’assistente prima che un barge-in realtime OpenAI tronchi l’audio. Predefinito:250. Imposta0per l’interruzione immediata in stanze con poco eco, oppure aumentalo per configurazioni con speaker molto soggette a eco.- Per una voce OpenAI sulla riproduzione Discord, imposta
voice.tts.provider: "openai"e scegli una voce Text-to-speech invoice.tts.openai.voiceovoice.tts.providers.openai.voice.cedarè una buona scelta dal suono maschile sull’attuale modello TTS OpenAI. - Le sovrascritture
systemPromptDiscord per canale si applicano ai turni di trascrizione vocale per quel canale vocale. - I turni di trascrizione vocale derivano lo stato di owner da
allowFromdi Discord (odm.allowFrom); gli speaker non-owner non possono accedere agli strumenti riservati agli owner (per esempiogatewayecron). - La voce Discord è opt-in per le configurazioni solo testo; imposta
channels.discord.voice.enabled=true(oppure mantieni un bloccochannels.discord.voiceesistente) per abilitare i comandi/vc, il runtime vocale e l’intent GatewayGuildVoiceStates. channels.discord.intents.voiceStatespuò sovrascrivere esplicitamente la sottoscrizione all’intent degli stati vocali. Lascialo non impostato affinché l’intent segua l’abilitazione vocale effettiva.- Se
voice.autoJoinha più voci per la stessa guild, OpenClaw entra nell’ultimo canale configurato per quella guild. voice.allowedChannelsè una allowlist di residenza opzionale. Lasciala non impostata per consentire/vc joinin qualsiasi canale vocale Discord autorizzato. Quando è impostata,/vc join, l’auto-join all’avvio e gli spostamenti dello stato vocale del bot sono limitati alle voci{ guildId, channelId }elencate. Impostala su un array vuoto per negare tutti gli ingressi vocali Discord. Se Discord sposta il bot fuori dalla allowlist, OpenClaw lascia quel canale e rientra nel target auto-join configurato quando ne è disponibile uno.voice.daveEncryptionevoice.decryptionFailureTolerancevengono passati alle opzioni di join di@discordjs/voice.- I valori predefiniti di
@discordjs/voicesonodaveEncryption=trueedecryptionFailureTolerance=24se non impostati. - OpenClaw usa per impostazione predefinita il decoder pure-JS
opusscriptper la ricezione vocale Discord. Il pacchetto nativo opzionale@discordjs/opusviene ignorato dalla policy di installazione pnpm del repo, così le installazioni normali, le lane Docker e i test non correlati non compilano un addon nativo. Gli host dedicati alle prestazioni vocali possono optare per l’uso diOPENCLAW_DISCORD_OPUS_DECODER=nativedopo aver installato l’addon nativo. voice.connectTimeoutMscontrolla l’attesa iniziale@discordjs/voiceReady per i tentativi/vc joine auto-join. Predefinito:30000.voice.reconnectGraceMscontrolla per quanto tempo OpenClaw attende che una sessione vocale disconnessa inizi a riconnettersi prima di distruggerla. Predefinito:15000.- In modalità
stt-tts, la riproduzione vocale non si ferma solo perché un altro utente inizia a parlare. Per evitare loop di feedback, OpenClaw ignora la nuova cattura vocale mentre TTS è in riproduzione; parla dopo la fine della riproduzione per il turno successivo. Le modalità realtime inoltrano gli avvii degli speaker come segnali di barge-in al provider realtime. - Nelle modalità realtime, l’eco dagli speaker verso un microfono aperto può sembrare un barge-in e interrompere la riproduzione. Per stanze Discord con molto eco, imposta
voice.realtime.providers.openai.interruptResponseOnInputAudio: falseper impedire a OpenAI di interrompersi automaticamente sull’audio in ingresso. Aggiungivoice.realtime.bargeIn: truese vuoi comunque che gli eventi di avvio speaker Discord interrompano la riproduzione attiva. Il bridge realtime OpenAI ignora i troncamenti di riproduzione più brevi divoice.realtime.minBargeInAudioEndMscome probabile eco/rumore e li registra come saltati invece di cancellare la riproduzione Discord. voice.captureSilenceGraceMscontrolla per quanto tempo OpenClaw attende dopo che Discord segnala che uno speaker ha smesso di parlare prima di finalizzare quel segmento audio per STT. Predefinito:2500; aumentalo se Discord spezza le pause normali in trascrizioni parziali frammentate.- Quando ElevenLabs è il provider TTS selezionato, la riproduzione vocale Discord usa TTS in streaming e parte dallo stream di risposta del provider. I provider senza supporto streaming ripiegano sul percorso del file temporaneo sintetizzato.
- OpenClaw monitora anche gli errori di decrittazione in ricezione e recupera automaticamente lasciando/rientrando nel canale vocale dopo errori ripetuti in una finestra breve.
- Se i log di ricezione mostrano ripetutamente
DecryptionFailed(UnencryptedWhenPassthroughDisabled)dopo un aggiornamento, raccogli un report delle dipendenze e i log. La linea@discordjs/voiceinclusa comprende la correzione upstream del padding dalla PR discord.js #11449, che ha chiuso l’issue discord.js #11419. - Gli eventi di ricezione
The operation was abortedsono previsti quando OpenClaw finalizza un segmento di speaker catturato; sono diagnostica dettagliata, non avvisi. - I log vocali dettagliati di Discord includono un’anteprima limitata su una riga della trascrizione STT per ogni segmento di speaker accettato, così il debug mostra sia il lato utente sia il lato della risposta dell’agente senza riversare testo di trascrizione illimitato.
- In modalità
agent-proxy, il fallback della consultazione forzata salta frammenti di trascrizione probabilmente incompleti, come testo che termina con...o un connettore finale comeand, oltre a chiusure chiaramente non operative come “torno subito” o “ciao”. I log mostranoforced agent consult skipped reason=...quando questo impedisce una risposta in coda obsoleta.
node-gyp per la build da sorgente.
Dopo aver installato l’addon nativo, avvia il Gateway con:
discord voice: opus decoder: @discordjs/opus. Senza l’opt-in tramite env, oppure se l’addon nativo manca o non può essere caricato sull’host, OpenClaw registra discord voice: opus decoder: opusscript e continua a ricevere voce tramite il fallback pure-JS.
Pipeline STT più TTS:
- La cattura PCM Discord viene convertita in un file temporaneo WAV.
tools.media.audiogestisce STT, per esempioopenai/gpt-4o-mini-transcribe.- La trascrizione viene inviata tramite l’ingresso e il routing Discord mentre l’LLM di risposta viene eseguito con una policy di output vocale che nasconde lo strumento
ttsdell’agente e richiede testo restituito, perché la voce Discord possiede la riproduzione TTS finale. voice.model, quando impostato, sovrascrive solo l’LLM di risposta per questo turno del canale vocale.voice.ttsviene unito sopramessages.tts; i provider con capacità di streaming alimentano direttamente il player, altrimenti il file audio risultante viene riprodotto nel canale in cui si è entrati.
voice.agentSession, ogni canale vocale ottiene la propria sessione OpenClaw instradata. Per esempio, /vc join channel:234567890123456789 parla alla sessione di quel canale vocale Discord. Il modello realtime è solo il front end vocale; le richieste sostanziali vengono passate all’agente OpenClaw configurato. Se il modello realtime produce una trascrizione finale senza chiamare lo strumento di consultazione, OpenClaw forza la consultazione come fallback, così l’impostazione predefinita continua a comportarsi come parlare con l’agente.
Esempio legacy STT più TTS:
agent-proxy il bot entra nel canale vocale configurato, ma i turni dell’agente OpenClaw usano la sessione e l’agente normalmente instradati del canale di destinazione. La sessione vocale realtime pronuncia il risultato restituito nel canale vocale. L’agente supervisore può comunque usare i normali strumenti di messaggistica in base alla sua policy degli strumenti, incluso l’invio di un messaggio Discord separato se è l’azione corretta.
Forme di destinazione utili:
target: "channel:123456789012345678"instrada tramite una sessione di canale testuale Discord.target: "123456789012345678"viene trattato come target di canale.target: "dm:123456789012345678"otarget: "user:123456789012345678"instrada tramite quella sessione di messaggi diretti.
bargeIn: true consente agli eventi di avvio dello speaker Discord e all’audio dello speaker già attivo di annullare le risposte realtime attive prima che il turno acquisito successivo raggiunga OpenAI. I segnali di barge-in molto precoci con audioEndMs inferiore a minBargeInAudioEndMs sono trattati come probabile eco/rumore e ignorati, così il modello non si interrompe al primo frame di riproduzione.
Log vocali attesi:
- All’ingresso:
discord voice: joining ... voiceSession=... supervisorSession=... agentSessionMode=... voiceModel=... realtimeModel=... - All’avvio realtime:
discord voice: realtime bridge starting ... autoRespond=false interruptResponse=false bargeIn=false minBargeInAudioEndMs=... - Sull’audio dello speaker:
discord voice: realtime speaker turn opened ...,discord voice: realtime input audio started ... outputAudioMs=... outputActive=...ediscord voice: realtime speaker turn closed ... chunks=... discordBytes=... realtimeBytes=... interruptedPlayback=... - Sul parlato obsoleto saltato:
discord voice: realtime forced agent consult skipped reason=incomplete-transcript ...oreason=non-actionable-closing ... - Al completamento della risposta realtime:
discord voice: realtime audio playback finishing reason=response.done ... audioMs=... chunks=... - All’arresto/ripristino della riproduzione:
discord voice: realtime audio playback stopped reason=... audioMs=... elapsedMs=... chunks=... - Sulla consultazione realtime:
discord voice: realtime consult requested ... voiceSession=... supervisorSession=... question=... - Alla risposta dell’agente:
discord voice: agent turn answer ... - Sul parlato esatto accodato:
discord voice: realtime exact speech queued ... queued=... outputAudioMs=... outputActive=..., seguito dadiscord voice: realtime exact speech dequeued reason=player-idle ... - Sul rilevamento del barge-in:
discord voice: realtime barge-in detected source=speaker-start ...odiscord voice: realtime barge-in detected source=active-speaker-audio ..., seguito dadiscord voice: realtime barge-in requested reason=... outputAudioMs=... outputActive=... - Sull’interruzione realtime:
discord voice: realtime model interrupt requested client:response.cancel reason=barge-in, seguito dadiscord voice: realtime model audio truncated client:conversation.item.truncate reason=barge-in audioEndMs=...oppurediscord voice: realtime model interrupt confirmed server:response.done status=cancelled ... - Su eco/rumore ignorati:
discord voice: realtime model interrupt ignored client:conversation.item.truncate.skipped reason=barge-in audioEndMs=0 minAudioEndMs=250 - Sul barge-in disabilitato:
discord voice: realtime capture ignored during playback (barge-in disabled) ... - Sulla riproduzione inattiva:
discord voice: realtime barge-in ignored reason=... outputActive=false ... playbackChunks=0
realtime audio playback startedsignifica che Discord ha iniziato a riprodurre l’audio dell’assistente. Da questo punto il bridge inizia a contare i chunk di output dell’assistente, i byte PCM di Discord, i byte realtime del provider e la durata dell’audio sintetizzato.realtime speaker turn openedindica che uno speaker Discord è diventato attivo. Se la riproduzione è già attiva ebargeInè abilitato, può essere seguito dabarge-in detected source=speaker-start.realtime input audio startedindica il primo frame audio effettivo ricevuto per quel turno dello speaker.outputActive=trueo unoutputAudioMsdiverso da zero qui significa che il microfono sta inviando input mentre la riproduzione dell’assistente è ancora attiva.barge-in detected source=active-speaker-audiosignifica che OpenClaw ha rilevato audio live dello speaker mentre la riproduzione dell’assistente era attiva. Questo è utile per distinguere un’interruzione reale da un evento di avvio speaker Discord senza audio utile.barge-in requested reason=...significa che OpenClaw ha chiesto al provider realtime di annullare o troncare la risposta attiva. IncludeoutputAudioMs,outputActiveeplaybackChunkscosì puoi vedere quanto audio dell’assistente era stato effettivamente riprodotto prima dell’interruzione.realtime audio playback stopped reason=...è il punto di reset della riproduzione Discord locale. Il motivo indica chi ha fermato la riproduzione:barge-in,player-idle,provider-clear-audio,forced-agent-consult,stream-closeosession-close.realtime speaker turn closedriepiloga il turno di input acquisito.chunks=0ohasAudio=falsesignifica che il turno dello speaker si è aperto ma nessun audio utilizzabile ha raggiunto il bridge realtime.interruptedPlayback=truesignifica che quel turno di input si è sovrapposto all’output dell’assistente e ha attivato la logica di barge-in.
outputAudioMs: durata dell’audio dell’assistente generato dal provider realtime prima della riga di log.audioMs: durata dell’audio dell’assistente conteggiata da OpenClaw prima dell’arresto della riproduzione.elapsedMs: tempo di orologio tra apertura e chiusura dello stream di riproduzione o del turno dello speaker.discordBytes: byte PCM stereo a 48 kHz inviati a o ricevuti dalla voce Discord.realtimeBytes: byte PCM nel formato del provider inviati a o ricevuti dal provider realtime.playbackChunks: chunk audio dell’assistente inoltrati a Discord per la risposta attiva.sinceLastAudioMs: intervallo tra l’ultimo frame audio dello speaker acquisito e la chiusura del turno dello speaker.
- Interruzione immediata con
source=active-speaker-audio,outputAudioMsbasso e lo stesso utente nelle vicinanze di solito indica eco degli altoparlanti che entra nel microfono. Aumentavoice.realtime.minBargeInAudioEndMs, abbassa il volume degli altoparlanti, usa cuffie o impostavoice.realtime.providers.openai.interruptResponseOnInputAudio: false. source=speaker-startseguito daspeaker turn closed ... hasAudio=falsesignifica che Discord ha segnalato l’avvio di uno speaker, ma nessun audio ha raggiunto OpenClaw. Può trattarsi di un evento vocale Discord transitorio, del comportamento del noise gate o di un client che attiva brevemente il microfono.audio playback stopped reason=stream-closesenza un barge-in vicino oprovider-clear-audiosignifica che lo stream di riproduzione Discord locale è terminato inaspettatamente. Controlla i log precedenti del provider e del player Discord.capture ignored during playback (barge-in disabled)significa che OpenClaw ha scartato intenzionalmente l’input mentre l’audio dell’assistente era attivo. Abilitavoice.realtime.bargeInse vuoi che il parlato interrompa la riproduzione.barge-in ignored ... outputActive=falsesignifica che Discord o il VAD del provider ha segnalato parlato, ma OpenClaw non aveva alcuna riproduzione attiva da interrompere. Questo non dovrebbe interrompere l’audio.
voice.model, autenticazione STT per tools.media.audio, autenticazione TTS per messages.tts/voice.tts e autenticazione del provider realtime per voice.realtime.providers o la normale configurazione di autenticazione del provider.
Messaggi vocali
I messaggi vocali Discord mostrano un’anteprima della forma d’onda e richiedono audio OGG/Opus. OpenClaw genera automaticamente la forma d’onda, ma richiedeffmpeg e ffprobe sull’host del Gateway per analizzare e convertire.
- Fornisci un percorso file locale (gli URL vengono rifiutati).
- Ometti il contenuto testuale (Discord rifiuta testo + messaggio vocale nello stesso payload).
- È accettato qualsiasi formato audio; OpenClaw converte in OGG/Opus secondo necessità.
Risoluzione dei problemi
Used disallowed intents or bot sees no guild messages
Used disallowed intents or bot sees no guild messages
- abilita Message Content Intent
- abilita Server Members Intent quando dipendi dalla risoluzione di utente/membro
- riavvia il Gateway dopo aver modificato gli intent
Guild messages blocked unexpectedly
Guild messages blocked unexpectedly
- verifica
groupPolicy - verifica l’allowlist della guild in
channels.discord.guilds - se esiste la mappa
channelsdella guild, sono consentiti solo i canali elencati - verifica il comportamento di
requireMentione i pattern di menzione
Require mention false but still blocked
Require mention false but still blocked
groupPolicy="allowlist"senza una allowlist di guild/canale corrispondenterequireMentionconfigurato nel posto sbagliato (deve essere sottochannels.discord.guildso nella voce del canale)- mittente bloccato dalla allowlist
usersdella guild/del canale
Long-running Discord turns or duplicate replies
Long-running Discord turns or duplicate replies
Slow listener detected ...stuck session: sessionKey=agent:...:discord:... state=processing ...
- account singolo:
channels.discord.eventQueue.listenerTimeout - multi-account:
channels.discord.accounts.<accountId>.eventQueue.listenerTimeout - questo controlla solo il lavoro del listener del Gateway Discord, non la durata del turno dell’agente
Gateway metadata lookup timeout warnings
Gateway metadata lookup timeout warnings
/gateway/bot prima di connettersi. Gli errori transitori ripiegano sull’URL Gateway predefinito di Discord e sono limitati nella frequenza nei log.Manopole di timeout dei metadati:- account singolo:
channels.discord.gatewayInfoTimeoutMs - multi-account:
channels.discord.accounts.<accountId>.gatewayInfoTimeoutMs - fallback env quando la configurazione non è impostata:
OPENCLAW_DISCORD_GATEWAY_INFO_TIMEOUT_MS - predefinito:
30000(30 secondi), max:120000
Gateway READY timeout restarts
Gateway READY timeout restarts
READY del Gateway Discord durante l’avvio e dopo le riconnessioni runtime. Le configurazioni multi-account con scaglionamento all’avvio possono richiedere una finestra READY di avvio più lunga rispetto al valore predefinito.Manopole di timeout READY:- avvio account singolo:
channels.discord.gatewayReadyTimeoutMs - avvio multi-account:
channels.discord.accounts.<accountId>.gatewayReadyTimeoutMs - fallback env di avvio quando la configurazione non è impostata:
OPENCLAW_DISCORD_READY_TIMEOUT_MS - predefinito di avvio:
15000(15 secondi), max:120000 - runtime account singolo:
channels.discord.gatewayRuntimeReadyTimeoutMs - runtime multi-account:
channels.discord.accounts.<accountId>.gatewayRuntimeReadyTimeoutMs - fallback env runtime quando la configurazione non è impostata:
OPENCLAW_DISCORD_RUNTIME_READY_TIMEOUT_MS - predefinito runtime:
30000(30 secondi), max:120000
Permissions audit mismatches
Permissions audit mismatches
channels status --probe funzionano solo per ID canale numerici.Se usi chiavi slug, la corrispondenza runtime può comunque funzionare, ma il probe non può verificare completamente i permessi.DM and pairing issues
DM and pairing issues
- DM disabilitati:
channels.discord.dm.enabled=false - policy DM disabilitata:
channels.discord.dmPolicy="disabled"(legacy:channels.discord.dm.policy) - approvazione di abbinamento in attesa in modalità
pairing
Bot to bot loops
Bot to bot loops
channels.discord.allowBots=true, usa regole rigorose per le menzioni e le allowlist per evitare comportamenti a ciclo.
Preferisci channels.discord.allowBots="mentions" per accettare solo messaggi di bot che menzionano il bot.Cali dell'STT vocale con DecryptionFailed(...)
Cali dell'STT vocale con DecryptionFailed(...)
- mantieni OpenClaw aggiornato (
openclaw update) in modo che la logica di recupero della ricezione vocale Discord sia presente - conferma
channels.discord.voice.daveEncryption=true(predefinito) - parti da
channels.discord.voice.decryptionFailureTolerance=24(predefinito upstream) e regola solo se necessario - controlla nei log:
discord voice: DAVE decrypt failures detecteddiscord voice: repeated decrypt failures; attempting rejoin
- se gli errori continuano dopo il rientro automatico, raccogli i log e confrontali con la cronologia di ricezione DAVE upstream in discord.js #11419 e discord.js #11449
Riferimento di configurazione
Riferimento principale: Riferimento di configurazione - Discord.Campi Discord ad alto segnale
Campi Discord ad alto segnale
- avvio/autenticazione:
enabled,token,accounts.*,allowBots - criterio:
groupPolicy,dm.*,guilds.*,guilds.*.channels.* - comando:
commands.native,commands.useAccessGroups,configWrites,slashCommand.* - coda eventi:
eventQueue.listenerTimeout(budget del listener),eventQueue.maxQueueSize,eventQueue.maxConcurrency - gateway:
gatewayInfoTimeoutMs,gatewayReadyTimeoutMs,gatewayRuntimeReadyTimeoutMs - risposta/cronologia:
replyToMode,historyLimit,dmHistoryLimit,dms.*.historyLimit - consegna:
textChunkLimit,chunkMode,maxLinesPerMessage - streaming:
streaming(alias legacy:streamMode),streaming.preview.toolProgress,draftChunk,blockStreaming,blockStreamingCoalesce - media/riprova:
mediaMaxMb(limita i caricamenti Discord in uscita, predefinito100MB),retry - azioni:
actions.* - presenza:
activity,status,activityType,activityUrl - UI:
ui.components.accentColor - funzionalità:
threadBindings,bindings[]di primo livello (type: "acp"),pluralkit,execApprovals,intents,agentComponents,heartbeat,responsePrefix
Sicurezza e operazioni
- Tratta i token dei bot come segreti (
DISCORD_BOT_TOKENpreferito negli ambienti supervisionati). - Concedi autorizzazioni Discord con privilegi minimi.
- Se la distribuzione/lo stato dei comandi è obsoleto, riavvia il gateway e ricontrolla con
openclaw channels status --probe.