macOS companion app

語音喚醒（macOS）

語音喚醒與按住說話

系統需求

語音喚醒與按住說話功能需要 macOS 26 或更新版本。在較舊的 macOS 上，這些控制項不會顯示於語音設定頁面，頁面會改為顯示 macOS 26 的系統需求。

語音喚醒需要 Apple Speech 支援所選語言的裝置端辨識。若無法使用此僅限本機的機制，應用程式會拒絕啟動被動喚醒詞監聽，且絕不會改用網路辨識。按住說話、對話模式與快速聊天聽寫皆為明確的使用者操作，可使用 Apple Speech 網路服務以支援更多語言。

模式

喚醒詞模式（預設）：持續執行的裝置端 Speech 辨識器會等待觸發詞元（swabbleTriggerWords）。符合時會開始擷取、顯示含有部分文字的浮動視窗，並在一段靜音後自動傳送。
按住說話（按住右側 Option 鍵）：按住右側 Option 鍵即可立即擷取，無須觸發詞。按住期間會顯示浮動視窗；放開按鍵後，系統會在短暫延遲後完成處理並轉送，讓你可以編輯文字。

執行階段行為（喚醒詞）

辨識器位於 VoiceWakeRuntime。
只有在喚醒詞與下一個詞之間出現明顯停頓時才會觸發（triggerPauseWindow = 0.55 秒）。即使指令尚未開始，浮動視窗／提示音也可在停頓時啟動。
靜音時間範圍：語音持續時為 2.0 秒（silenceWindow）；若只聽到觸發詞，則為 5.0 秒（triggerOnlySilenceWindow）。
強制停止：120 秒（captureHardStop），以防止工作階段失控。
工作階段之間的防彈跳間隔：傳送後 350 毫秒（debounceAfterSend）。
浮動視窗由 VoiceWakeOverlayController 驅動，並以不同顏色顯示已確認／暫時文字。
傳送後，辨識器會完全重新啟動，以監聽下一個觸發詞。

生命週期不變條件

若已啟用語音喚醒並授予權限，喚醒詞辨識器會持續監聽，但進行中的按住說話擷取期間除外。
關閉浮動視窗（包括透過 X 按鈕手動關閉）一律會恢復辨識器：VoiceSessionCoordinator.overlayDidDismiss 會在每個關閉路徑呼叫 VoiceWakeRuntime.refresh(state:)。工作階段／權杖模型請參閱語音浮動視窗。

按住說話詳細資訊

快速鍵偵測使用全域 .flagsChanged 監控右側 Option 鍵（keyCode 61 + .option）。它只會觀察事件，絕不會攔截事件。
擷取功能位於 VoicePushToTalk：立即啟動 Speech、將部分結果串流至浮動視窗，並在放開按鍵時呼叫 VoiceWakeForwarder。
啟動按住說話時會暫停喚醒詞執行階段，以避免音訊擷取互相衝突；放開按鍵後會自動重新啟動。
權限：需要麥克風與語音辨識權限；接收按鍵事件需要輔助使用／輸入監控核准。
外接鍵盤：部分鍵盤不會如預期公開右側 Option 鍵。若使用者回報未偵測到按鍵，請提供備用快速鍵。

使用者設定

語音喚醒切換開關：啟用喚醒詞執行階段。
按住右側 Option 鍵說話：啟用按住說話監控。
若所選語言在這台 Mac 上不支援裝置端辨識，語音喚醒會維持停用，但按住說話與對話模式仍可使用。
語言與麥克風選擇器、即時音量計、觸發詞表格，以及測試工具（僅限本機，絕不轉送）。
若裝置中斷連線，麥克風選擇器會保留最後的選擇、顯示中斷連線提示，並暫時改用系統預設值，直到該裝置恢復連線。
音效：偵測到觸發詞及傳送時播放提示音，預設使用 macOS 的 “Glass” 系統音效。你可以為每個事件選擇任何可由 NSSound 載入的檔案（例如 MP3/WAV/AIFF），或選擇 No Sound。

轉送行為

轉送時，若已設定作用中的 WebChat 工作階段金鑰，VoiceWakeForwarder.selectedSessionOptions 會選用該金鑰，否則會選用閘道的主要工作階段金鑰。
它會透過 sessions.list 查詢該工作階段，並從工作階段的傳遞情境衍生傳遞頻道與目標（依序改用其最後使用的頻道／目標，再改用剖析後的工作階段金鑰）；若均無法解析，則預設使用 WebChat。
若傳遞失敗，系統會記錄錯誤（voicewake.forward 類別），且仍可透過 WebChat／工作階段記錄查看該次執行。

轉送承載內容

VoiceWakeForwarder.prefixedTranscript(_:) 會在逐字稿前加上一行機器提示（解析出的主機名稱；若無法解析則使用 “this Mac”），供喚醒詞與按住說話路徑共用。

快速驗證

開啟按住說話、按住右側 Option 鍵、說話後再放開：浮動視窗應先顯示部分結果，然後傳送。
按住期間，選單列上的耳朵圖示應保持放大（triggerVoiceEars(ttl: nil)）；放開按鍵後會縮小。

相關內容

Was this useful?

On this page

On this page