Skip to main content

Documentation Index

Fetch the complete documentation index at: https://docs.openclaw.ai/llms.txt

Use this file to discover all available pages before exploring further.

Google Meet 参与者支持面向 OpenClaw,插件按设计保持显式:
  • 它只会加入显式的 https://meet.google.com/... URL。
  • 它可以通过 Google Meet API 创建新的 Meet 空间,然后加入返回的 URL。
  • agent 是默认回话模式:实时转录负责监听,配置的 OpenClaw 智能体负责回答,常规 OpenClaw TTS 会在 Meet 中发声。
  • bidi 仍可作为备用的直接实时语音模型模式。
  • 智能体通过 mode 选择加入行为:使用 agent 进行实时监听/回话,使用 bidi 作为直接实时语音备用方案,或使用 transcribe 加入/控制浏览器但不启用回话桥接。
  • 身份验证从个人 Google OAuth 或已登录的 Chrome 配置文件开始。
  • 不会自动播报同意声明。
  • 默认 Chrome 音频后端是 BlackHole 2ch
  • Chrome 可以在本地运行,也可以在已配对的节点主机上运行。
  • Twilio 接受拨入号码以及可选的 PIN 或 DTMF 序列;它不能直接拨打 Meet URL。
  • CLI 命令是 googlemeetmeet 保留给更广义的智能体电话会议工作流。

快速开始

安装本地音频依赖,并配置实时转录提供商以及常规 OpenClaw TTS。OpenAI 是默认转录提供商;Google Gemini Live 也可作为单独的 bidi 语音备用方案使用,并设置 realtime.voiceProvider: "google"
brew install blackhole-2ch sox
export OPENAI_API_KEY=sk-...
# only needed when realtime.voiceProvider is "google" for bidi mode
export GEMINI_API_KEY=...
blackhole-2ch 会安装 BlackHole 2ch 虚拟音频设备。Homebrew 的安装器需要重启,macOS 才会暴露该设备:
sudo reboot
重启后,验证这两个部分:
system_profiler SPAudioDataType | grep -i BlackHole
command -v sox
启用插件:
{
  plugins: {
    entries: {
      "google-meet": {
        enabled: true,
        config: {},
      },
    },
  },
}
检查设置:
openclaw googlemeet setup
设置输出旨在便于智能体读取,并且感知模式。它会报告 Chrome 配置文件、节点固定,以及对于实时 Chrome 加入场景的 BlackHole/SoX 音频桥接和延迟实时介绍检查。对于仅观察的加入,请用 --mode transcribe 检查同一传输协议;该模式会跳过实时音频前置条件,因为它不会通过桥接监听或发声:
openclaw googlemeet setup --transport chrome-node --mode transcribe
配置 Twilio 委派后,设置还会报告 voice-call 插件、Twilio 凭证以及公开 webhook 暴露是否就绪。在要求智能体加入之前,把任何 ok: false 检查都视为对应传输协议和模式的阻塞项。脚本或机器可读输出请使用 openclaw googlemeet setup --json。在智能体尝试前,可使用 --transport chrome--transport chrome-node--transport twilio 对特定传输协议进行预检。 对于 Twilio,当默认传输协议是 Chrome 时,始终显式预检该传输协议:
openclaw googlemeet setup --transport twilio
这会在智能体尝试拨入会议前捕获缺失的 voice-call 接线、Twilio 凭证或不可访问的 webhook 暴露。 加入会议:
openclaw googlemeet join https://meet.google.com/abc-defg-hij
或者让智能体通过 google_meet 工具加入:
{
  "action": "join",
  "url": "https://meet.google.com/abc-defg-hij",
  "transport": "chrome-node",
  "mode": "agent"
}
面向智能体的 google_meet 工具在非 macOS 主机上仍可用于制品、日历、设置、转录、Twilio 和 chrome-node 流程。本地 Chrome 回话操作在那里会被阻止,因为内置 Chrome 音频路径目前依赖 macOS BlackHole 2ch。在 Linux 上,请使用 mode: "transcribe"、Twilio 拨入,或使用 macOS chrome-node 主机进行 Chrome 回话参会。 创建新会议并加入:
openclaw googlemeet create --transport chrome-node --mode agent
对于通过 API 创建的房间,当你希望房间的免敲门策略显式设置而不是继承 Google 账号默认值时,请使用 Google Meet SpaceConfig.accessType
openclaw googlemeet create --access-type OPEN --transport chrome-node --mode agent
OPEN 允许任何拥有 Meet URL 的人无需敲门即可加入。TRUSTED 允许主持人组织中的受信用户、受邀外部用户和拨入用户无需敲门即可加入。RESTRICTED 将免敲门进入限制为受邀者。这些设置仅适用于官方 Google Meet API 创建路径,因此必须配置 OAuth 凭证。 如果你在此选项可用之前已验证 Google Meet,请在把 meetings.space.settings 范围添加到你的 Google OAuth 同意屏幕后,重新运行 openclaw googlemeet auth login --json 只创建 URL 而不加入:
openclaw googlemeet create --no-join
googlemeet create 有两条路径:
  • API 创建:在已配置 Google Meet OAuth 凭证时使用。这是最确定的路径,不依赖浏览器 UI 状态。
  • 浏览器备用方案:在没有 OAuth 凭证时使用。OpenClaw 使用固定的 Chrome 节点,打开 https://meet.google.com/new,等待 Google 重定向到真实的会议代码 URL,然后返回该 URL。此路径要求节点上的 OpenClaw Chrome 配置文件已登录 Google。浏览器自动化会处理 Meet 自身的首次运行麦克风提示;该提示不会被视为 Google 登录失败。 加入和创建流程也会尝试先复用现有 Meet 标签页,然后再打开新标签页。匹配会忽略无害的 URL 查询字符串,例如 authuser,因此智能体重试时应聚焦已经打开的会议,而不是创建第二个 Chrome 标签页。
命令/工具输出包含 source 字段(apibrowser),因此智能体可以说明使用了哪条路径。create 默认加入新会议,并返回 joined: true 以及加入会话。若只生成 URL,请在 CLI 上使用 create --no-join,或向工具传入 "join": false 或者告诉智能体:“创建一个 Google Meet,用智能体回话模式加入,并把链接发给我。”智能体应以 action: "create" 调用 google_meet,然后分享返回的 meetingUri
{
  "action": "create",
  "transport": "chrome-node",
  "mode": "agent"
}
对于仅观察/浏览器控制的加入,请设置 "mode": "transcribe"。这不会启动双工实时语音桥接,不需要 BlackHole 或 SoX,也不会在会议中回话。此模式下的 Chrome 加入还会避免 OpenClaw 的麦克风/摄像头权限授予,并避免 Meet 使用麦克风 路径。如果 Meet 显示音频选择插页,自动化会尝试无麦克风路径,否则会报告需要手动操作,而不是打开本地麦克风。在转录模式下,托管 Chrome 传输协议还会安装尽力而为的 Meet 字幕观察器。googlemeet status --jsongooglemeet doctor 会暴露 captioningcaptionsEnabledAttemptedtranscriptLineslastCaptionAtlastCaptionSpeakerlastCaptionText 以及简短的 recentTranscript 尾部,便于操作员判断浏览器是否已加入通话,以及 Meet 字幕是否正在产出文本。 当你需要一个是/否探针时,请使用 openclaw googlemeet test-listen <meet-url> --transport chrome-node:它会以转录模式加入,等待新的字幕或转录变动,并返回 listenVerifiedlistenTimedOut、手动操作字段以及最新字幕健康状态。 实时会话期间,google_meet 状态包含浏览器和音频桥接健康信息,例如 inCallmanualActionRequiredproviderConnectedrealtimeReadyaudioInputActiveaudioOutputActive、最后输入/输出时间戳、字节计数器以及桥接关闭状态。如果出现安全的 Meet 页面提示,浏览器自动化会在可行时处理。登录、主持人准入以及浏览器/操作系统权限提示会以需要手动操作的形式报告,并附带原因和消息,供智能体转述。托管 Chrome 会话只会在浏览器健康报告 inCall: true 后发送介绍语或测试短语;否则状态会报告 speechReady: false,并阻止语音尝试,而不是假装智能体已在会议中发声。 本地 Chrome 通过已登录的 OpenClaw 浏览器配置文件加入。实时模式需要 BlackHole 2ch,用于 OpenClaw 使用的麦克风/扬声器路径。若要获得干净的双工音频,请使用独立虚拟设备或类似 Loopback 的图;单个 BlackHole 设备足以进行首次冒烟测试,但可能产生回声。

本地 Gateway 网关 + Parallels Chrome

仅为了让 macOS VM 持有 Chrome,你需要在 VM 内运行完整的 OpenClaw Gateway 网关或配置模型 API key。在本地运行 Gateway 网关和智能体,然后在 VM 中运行节点主机。在 VM 上启用一次内置插件,让节点播发 Chrome 命令: 运行位置:
  • Gateway 网关主机:OpenClaw Gateway 网关、智能体工作区、模型/API key、实时提供商,以及 Google Meet 插件配置。
  • Parallels macOS VM:OpenClaw CLI/节点主机、Google Chrome、SoX、BlackHole 2ch,以及已登录 Google 的 Chrome 配置文件。
  • VM 中不需要:Gateway 网关服务、智能体配置、OpenAI/GPT key 或模型提供商设置。
安装 VM 依赖:
brew install blackhole-2ch sox
安装 BlackHole 后重启 VM,使 macOS 暴露 BlackHole 2ch
sudo reboot
重启后,验证 VM 能看到音频设备和 SoX 命令:
system_profiler SPAudioDataType | grep -i BlackHole
command -v sox
在 VM 中安装或更新 OpenClaw,然后在那里启用内置插件:
openclaw plugins enable google-meet
在 VM 中启动节点主机:
openclaw node run --host <gateway-host> --port 18789 --display-name parallels-macos
如果 <gateway-host> 是 LAN IP 且你没有使用 TLS,除非你为该受信私有网络选择启用,否则节点会拒绝明文 WebSocket:
OPENCLAW_ALLOW_INSECURE_PRIVATE_WS=1 \
  openclaw node run --host <gateway-lan-ip> --port 18789 --display-name parallels-macos
将节点安装为 LaunchAgent 时使用同一环境变量:
OPENCLAW_ALLOW_INSECURE_PRIVATE_WS=1 \
  openclaw node install --host <gateway-lan-ip> --port 18789 --display-name parallels-macos --force
openclaw node restart
OPENCLAW_ALLOW_INSECURE_PRIVATE_WS=1 是进程环境,不是 openclaw.json 设置。当安装命令中存在它时,openclaw node install 会把它存入 LaunchAgent 环境。 从 Gateway 网关主机批准节点:
openclaw devices list
openclaw devices approve <requestId>
确认 Gateway 网关能看到该节点,并且它同时播发 googlemeet.chrome 和浏览器能力/browser.proxy
openclaw nodes status
在 Gateway 网关主机上通过该节点路由 Meet:
{
  gateway: {
    nodes: {
      allowCommands: ["googlemeet.chrome", "browser.proxy"],
    },
  },
  plugins: {
    entries: {
      "google-meet": {
        enabled: true,
        config: {
          defaultTransport: "chrome-node",
          chrome: {
            guestName: "OpenClaw Agent",
            autoJoin: true,
            reuseExistingTab: true,
          },
          chromeNode: {
            node: "parallels-macos",
          },
        },
      },
    },
  },
}
现在从 Gateway 网关主机正常加入:
openclaw googlemeet join https://meet.google.com/abc-defg-hij
或要求智能体使用带有 transport: "chrome-node"google_meet 工具。 如需一条命令完成冒烟测试,创建或复用会话、说出已知短语并打印会话健康信息:
openclaw googlemeet test-speech https://meet.google.com/abc-defg-hij
在实时加入期间,OpenClaw 浏览器自动化会填写访客姓名,点击加入/请求加入,并在 Meet 首次运行的 “使用麦克风” 选项出现时接受该选项。在仅观察加入或仅浏览器创建会议期间,如果可用,它会在不使用麦克风的情况下继续通过同一提示。如果浏览器配置文件未登录、Meet 正在等待主持人准入、Chrome 需要实时加入的麦克风/摄像头权限,或 Meet 卡在自动化无法解决的提示上,加入/测试语音结果会报告 manualActionRequired: true,并附带 manualActionReasonmanualActionMessage。智能体应停止重试加入,报告该确切消息以及当前的 browserUrl/browserTitle,并且仅在手动浏览器操作完成后重试。 如果省略 chromeNode.node,只有在恰好一个已连接节点同时声明 googlemeet.chrome 和浏览器控制时,OpenClaw 才会自动选择。如果连接了多个具备能力的节点,请将 chromeNode.node 设置为节点 ID、显示名称或远程 IP。 常见失败检查:
  • Configured Google Meet node ... is not usable: offline:固定的节点已被 Gateway 网关知晓,但不可用。智能体应将该节点视为诊断状态,而不是可用的 Chrome 主机,并报告设置阻碍;除非用户要求,否则不要回退到其他传输协议。
  • No connected Google Meet-capable node:在 VM 中启动 openclaw node run,批准配对,并确保已在 VM 中运行 openclaw plugins enable google-meetopenclaw plugins enable browser。同时确认 Gateway 网关主机允许这两个节点命令:gateway.nodes.allowCommands: ["googlemeet.chrome", "browser.proxy"]
  • BlackHole 2ch audio device not found:在正在检查的主机上安装 blackhole-2ch,并在使用本地 Chrome 音频前重启。
  • BlackHole 2ch audio device not found on the node:在 VM 中安装 blackhole-2ch,并重启 VM。
  • Chrome 打开但无法加入:在 VM 内的浏览器配置文件中登录,或保留 chrome.guestName 以进行访客加入。访客自动加入会通过节点浏览器代理使用 OpenClaw 浏览器自动化;请确保节点浏览器配置指向你想要的配置文件,例如 browser.defaultProfile: "user" 或某个已命名的现有会话配置文件。
  • 重复的 Meet 标签页:保持启用 chrome.reuseExistingTab: true。OpenClaw 会先激活同一 Meet URL 的现有标签页,再打开新标签页;浏览器会议创建也会在打开另一个标签页前复用正在进行的 https://meet.google.com/new 或 Google 账号提示标签页。
  • 没有音频:在 Meet 中,将麦克风/扬声器路由到 OpenClaw 使用的虚拟音频设备路径;使用单独的虚拟设备或 Loopback 风格的路由来获得干净的双工音频。

安装说明

Chrome 回听默认使用两个外部工具:
  • sox:命令行音频工具。该插件会为默认的 24 kHz PCM16 音频桥接使用显式 CoreAudio 设备命令。
  • blackhole-2ch:macOS 虚拟音频驱动。它会创建 Chrome/Meet 可路由通过的 BlackHole 2ch 音频设备。
OpenClaw 不捆绑或再分发任一软件包。文档要求用户通过 Homebrew 将它们作为主机依赖安装。SoX 的许可证为 LGPL-2.0-only AND GPL-2.0-only;BlackHole 为 GPL-3.0。如果你构建的安装程序或设备将 BlackHole 与 OpenClaw 捆绑,请审查 BlackHole 的上游许可条款,或向 Existential Audio 获取单独许可证。

传输协议

Chrome

Chrome 传输协议会通过 OpenClaw 浏览器控制打开 Meet URL,并以已登录的 OpenClaw 浏览器配置文件身份加入。在 macOS 上,插件会在启动前检查 BlackHole 2ch。如果已配置,它还会在打开 Chrome 前运行音频桥接健康检查命令和启动命令。当 Chrome/音频位于 Gateway 网关主机上时使用 chrome;当 Chrome/音频位于配对节点(例如 Parallels macOS VM)上时使用 chrome-node。对于本地 Chrome,使用 browser.defaultProfile 选择配置文件;chrome.browserProfile 会传递给 chrome-node 主机。
openclaw googlemeet join https://meet.google.com/abc-defg-hij --transport chrome
openclaw googlemeet join https://meet.google.com/abc-defg-hij --transport chrome-node
将 Chrome 麦克风和扬声器音频路由通过本地 OpenClaw 音频桥接。如果未安装 BlackHole 2ch,加入会失败并给出设置错误,而不是在没有音频路径的情况下静默加入。

Twilio

Twilio 传输协议是委托给 Voice Call 插件的严格拨号计划。它不会解析 Meet 页面中的电话号码。 当 Chrome 参与不可用,或你想要电话拨入回退时使用它。Google Meet 必须为会议公开电话拨入号码和 PIN;OpenClaw 不会从 Meet 页面发现这些信息。 在 Gateway 网关主机上启用 Voice Call 插件,而不是在 Chrome 节点上:
{
  plugins: {
    allow: ["google-meet", "voice-call", "google"],
    entries: {
      "google-meet": {
        enabled: true,
        config: {
          defaultTransport: "chrome-node",
          // or set "twilio" if Twilio should be the default
        },
      },
      "voice-call": {
        enabled: true,
        config: {
          provider: "twilio",
          inboundPolicy: "allowlist",
          realtime: {
            enabled: true,
            provider: "google",
            instructions: "Join this Google Meet as an OpenClaw agent. Be brief.",
            toolPolicy: "safe-read-only",
            providers: {
              google: {
                silenceDurationMs: 500,
                startSensitivity: "high",
              },
            },
          },
        },
      },
      google: {
        enabled: true,
      },
    },
  },
}
通过环境或配置提供 Twilio 凭证。环境会让密钥不进入 openclaw.json
export TWILIO_ACCOUNT_SID=AC...
export TWILIO_AUTH_TOKEN=...
export TWILIO_FROM_NUMBER=+15550001234
export GEMINI_API_KEY=...
如果你的实时语音提供商是 OpenAI provider 插件,请改用 realtime.provider: "openai"OPENAI_API_KEY 启用 voice-call 后重启或重新加载 Gateway 网关;插件配置更改在已运行的 Gateway 网关进程重新加载前不会出现。 然后验证:
openclaw config validate
openclaw plugins list | grep -E 'google-meet|voice-call'
openclaw googlemeet setup
当 Twilio 委托已接通时,googlemeet setup 会包含成功的 twilio-voice-call-plugintwilio-voice-call-credentialstwilio-voice-call-webhook 检查。
openclaw googlemeet join https://meet.google.com/abc-defg-hij \
  --transport twilio \
  --dial-in-number +15551234567 \
  --pin 123456
当会议需要自定义序列时使用 --dtmf-sequence
openclaw googlemeet join https://meet.google.com/abc-defg-hij \
  --transport twilio \
  --dial-in-number +15551234567 \
  --dtmf-sequence ww123456#

OAuth 和预检

OAuth 对于创建 Meet 链接是可选的,因为 googlemeet create 可以回退到浏览器自动化。当你需要官方 API 创建、空间解析或 Meet Media API 预检时,请配置 OAuth。 Google Meet API 访问使用用户 OAuth:创建 Google Cloud OAuth 客户端,请求所需作用域,授权一个 Google 账号,然后将生成的刷新令牌存储在 Google Meet 插件配置中,或提供 OPENCLAW_GOOGLE_MEET_* 环境变量。 OAuth 不会替代 Chrome 加入路径。当你使用浏览器参与时,Chrome 和 Chrome-node 传输协议仍然会通过已登录的 Chrome 配置文件、BlackHole/SoX 以及已连接节点加入。OAuth 只用于官方 Google Meet API 路径:创建会议空间、解析空间,以及运行 Meet Media API 预检。

创建 Google 凭证

在 Google Cloud Console 中:
  1. 创建或选择一个 Google Cloud 项目。
  2. 为该项目启用 Google Meet REST API
  3. 配置 OAuth 同意屏幕。
    • 内部 对 Google Workspace 组织最简单。
    • 外部 适用于个人/测试设置;当应用处于测试阶段时,将每个会授权该应用的 Google 账号添加为测试用户。
  4. 添加 OpenClaw 请求的作用域:
    • https://www.googleapis.com/auth/meetings.space.created
    • https://www.googleapis.com/auth/meetings.space.readonly
    • https://www.googleapis.com/auth/meetings.space.settings
    • https://www.googleapis.com/auth/meetings.conference.media.readonly
  5. 创建 OAuth 客户端 ID。
    • 应用类型:Web application
    • 已授权重定向 URI:
      http://localhost:8085/oauth2callback
      
  6. 复制客户端 ID 和客户端密钥。
Google Meet spaces.create 需要 meetings.space.createdmeetings.space.readonly 让 OpenClaw 能够将 Meet URL/代码解析为空间。 meetings.space.settings 让 OpenClaw 能够在 API 房间创建期间传递 SpaceConfig 设置,例如 accessTypemeetings.conference.media.readonly 用于 Meet Media API 预检和媒体工作;实际使用 Media API 时,Google 可能要求加入 Developer Preview。 如果你只需要基于浏览器的 Chrome 加入,请完全跳过 OAuth。

生成刷新令牌

配置 oauth.clientId,并可选配置 oauth.clientSecret,或将它们作为环境变量传入,然后运行:
openclaw googlemeet auth login --json
该命令会打印一个带有刷新令牌的 oauth 配置块。它使用 PKCE、http://localhost:8085/oauth2callback 上的 localhost 回调,以及带 --manual 的手动复制/粘贴流程。 示例:
OPENCLAW_GOOGLE_MEET_CLIENT_ID="your-client-id" \
OPENCLAW_GOOGLE_MEET_CLIENT_SECRET="your-client-secret" \
openclaw googlemeet auth login --json
当浏览器无法访问本地回调时使用手动模式:
OPENCLAW_GOOGLE_MEET_CLIENT_ID="your-client-id" \
OPENCLAW_GOOGLE_MEET_CLIENT_SECRET="your-client-secret" \
openclaw googlemeet auth login --json --manual
JSON 输出包括:
{
  "oauth": {
    "clientId": "your-client-id",
    "clientSecret": "your-client-secret",
    "refreshToken": "refresh-token",
    "accessToken": "access-token",
    "expiresAt": 1770000000000
  },
  "scope": "..."
}
oauth 对象存储在 Google Meet 插件配置下:
{
  plugins: {
    entries: {
      "google-meet": {
        enabled: true,
        config: {
          oauth: {
            clientId: "your-client-id",
            clientSecret: "your-client-secret",
            refreshToken: "refresh-token",
          },
        },
      },
    },
  },
}
当你不希望刷新令牌出现在配置中时,优先使用环境变量。如果配置值和环境值都存在,插件会先解析配置,然后再使用环境回退。 OAuth 同意包含 Meet 空间创建、Meet 空间读取访问,以及 Meet 会议媒体读取访问。如果你在会议创建支持存在之前已进行身份验证,请重新运行 openclaw googlemeet auth login --json,使刷新令牌具备 meetings.space.created 作用域。

使用 Doctor 验证 OAuth

当你需要快速、非密钥的健康检查时,运行 OAuth Doctor:
openclaw googlemeet doctor --oauth --json
这不会加载 Chrome 运行时,也不需要已连接的 Chrome 节点。它会检查 OAuth 配置是否存在,以及刷新令牌是否可以生成访问令牌。JSON 报告只包含状态字段,例如 okconfiguredtokenSourceexpiresAt 和检查消息;它不会打印访问令牌、刷新令牌或客户端密钥。 常见结果:
检查含义
oauth-config存在 oauth.clientIdoauth.refreshToken,或存在缓存的访问令牌。
oauth-token缓存的访问令牌仍然有效,或刷新令牌签发了新的访问令牌。
meet-spaces-get可选的 --meeting 检查解析了现有 Meet 空间。
meet-spaces-create可选的 --create-space 检查创建了新的 Meet 空间。
要同时证明 Google Meet API 已启用以及具备 spaces.create 范围,请运行会产生副作用的创建检查:
openclaw googlemeet doctor --oauth --create-space --json
openclaw googlemeet create --no-join --json
--create-space 会创建一个一次性的 Meet URL。当你需要确认 Google Cloud 项目已启用 Meet API,且授权账号具有 meetings.space.created 范围时使用它。 要证明对现有会议空间的读取访问权限:
openclaw googlemeet doctor --oauth --meeting https://meet.google.com/abc-defg-hij --json
openclaw googlemeet resolve-space --meeting https://meet.google.com/abc-defg-hij
doctor --oauth --meetingresolve-space 会证明对授权 Google 账号可访问的现有空间具有读取访问权限。这些检查返回 403 通常表示 Google Meet REST API 已停用、已同意授权的刷新令牌缺少所需范围,或该 Google 账号无法访问该 Meet 空间。刷新令牌错误表示需要重新运行 openclaw googlemeet auth login --json 并存储新的 oauth 块。 浏览器回退不需要 OAuth 凭证。在该模式下,Google 认证来自所选节点上已登录的 Chrome 个人资料,而不是来自 OpenClaw 配置。 以下环境变量可作为回退使用:
  • OPENCLAW_GOOGLE_MEET_CLIENT_IDGOOGLE_MEET_CLIENT_ID
  • OPENCLAW_GOOGLE_MEET_CLIENT_SECRETGOOGLE_MEET_CLIENT_SECRET
  • OPENCLAW_GOOGLE_MEET_REFRESH_TOKENGOOGLE_MEET_REFRESH_TOKEN
  • OPENCLAW_GOOGLE_MEET_ACCESS_TOKENGOOGLE_MEET_ACCESS_TOKEN
  • OPENCLAW_GOOGLE_MEET_ACCESS_TOKEN_EXPIRES_ATGOOGLE_MEET_ACCESS_TOKEN_EXPIRES_AT
  • OPENCLAW_GOOGLE_MEET_DEFAULT_MEETINGGOOGLE_MEET_DEFAULT_MEETING
  • OPENCLAW_GOOGLE_MEET_PREVIEW_ACKGOOGLE_MEET_PREVIEW_ACK
通过 spaces.get 解析 Meet URL、代码或 spaces/{id}
openclaw googlemeet resolve-space --meeting https://meet.google.com/abc-defg-hij
在媒体工作之前运行预检:
openclaw googlemeet preflight --meeting https://meet.google.com/abc-defg-hij
在 Meet 创建会议记录后列出会议工件和出席情况:
openclaw googlemeet artifacts --meeting https://meet.google.com/abc-defg-hij
openclaw googlemeet attendance --meeting https://meet.google.com/abc-defg-hij
openclaw googlemeet export --meeting https://meet.google.com/abc-defg-hij --output ./meet-export
--meeting 时,artifactsattendance 默认使用最新的会议记录。当你想要该会议的每条保留记录时,传入 --all-conference-records 日历查找可以先从 Google Calendar 解析会议 URL,再读取 Meet 工件:
openclaw googlemeet latest --today
openclaw googlemeet calendar-events --today --json
openclaw googlemeet artifacts --event "Weekly sync"
openclaw googlemeet attendance --today --format csv --output attendance.csv
--today 会在今天的 primary 日历中搜索带有 Google Meet 链接的 Calendar 事件。使用 --event <query> 搜索匹配的事件文本,使用 --calendar <id> 指定非主日历。日历查找需要一次新的 OAuth 登录,并包含 Calendar events readonly 范围。calendar-events 会预览匹配的 Meet 事件,并标记 latestartifactsattendanceexport 将选择的事件。 如果你已经知道会议记录 ID,可以直接指定它:
openclaw googlemeet latest --meeting https://meet.google.com/abc-defg-hij
openclaw googlemeet artifacts --conference-record conferenceRecords/abc123 --json
openclaw googlemeet attendance --conference-record conferenceRecords/abc123 --json
当你想在通话结束后关闭房间时,可以结束 API 创建空间的活跃会议:
openclaw googlemeet end-active-conference https://meet.google.com/abc-defg-hij
这会调用 Google Meet spaces.endActiveConference,并且需要 OAuth,对授权账号可管理的空间具备 meetings.space.created 范围。OpenClaw 接受 Meet URL、会议代码或 spaces/{id} 输入,并在结束活跃会议前将其解析为 API 空间资源。它与 googlemeet leave 是分开的:leave 会停止 OpenClaw 的本地/会话参与,而 end-active-conference 会请求 Google Meet 结束该空间的活跃会议。 写入可读报告:
openclaw googlemeet artifacts --conference-record conferenceRecords/abc123 \
  --format markdown --output meet-artifacts.md
openclaw googlemeet attendance --conference-record conferenceRecords/abc123 \
  --format markdown --output meet-attendance.md
openclaw googlemeet attendance --conference-record conferenceRecords/abc123 \
  --format csv --output meet-attendance.csv
openclaw googlemeet export --conference-record conferenceRecords/abc123 \
  --include-doc-bodies --zip --output meet-export
openclaw googlemeet export --conference-record conferenceRecords/abc123 \
  --include-doc-bodies --dry-run
当 Google 为会议公开这些数据时,artifacts 会返回会议记录元数据,以及参与者、录制、转录、结构化转录条目和智能笔记资源元数据。对大型会议使用 --no-transcript-entries 可跳过条目查找。attendance 会将参与者展开为参与者会话行,包含首次/最后出现时间、总会话时长、迟到/提前离开标志,并按已登录用户或显示名称合并重复参与者资源。传入 --no-merge-duplicates 可让原始参与者资源保持分开,传入 --late-after-minutes 可调整迟到检测,传入 --early-before-minutes 可调整提前离开检测。 export 会写入一个文件夹,其中包含 summary.mdattendance.csvtranscript.mdartifacts.jsonattendance.jsonmanifest.jsonmanifest.json 会记录所选输入、导出选项、会议记录、输出文件、计数、令牌来源、使用过的 Calendar 事件,以及任何部分检索警告。传入 --zip 还会在该文件夹旁边写入一个可移植归档。传入 --include-doc-bodies 可通过 Google Drive files.export 导出链接的转录和智能笔记 Google Docs 文本;这需要一次新的 OAuth 登录,并包含 Drive Meet readonly 范围。没有 --include-doc-bodies 时,导出只包含 Meet 元数据和结构化转录条目。如果 Google 返回部分工件失败,例如智能笔记列表、转录条目或 Drive 文档正文错误,摘要和清单会保留警告,而不是让整个导出失败。使用 --dry-run 可获取相同的工件/出席数据并打印清单 JSON,而不创建文件夹或 ZIP。这在写入大型导出前,或智能体只需要计数、所选记录和警告时很有用。 智能体也可以通过 google_meet 工具创建相同的包:
{
  "action": "export",
  "conferenceRecord": "conferenceRecords/abc123",
  "includeDocumentBodies": true,
  "outputDir": "meet-export",
  "zip": true
}
设置 "dryRun": true 可只返回导出清单并跳过文件写入。 智能体也可以使用显式访问策略创建 API 支持的房间:
{
  "action": "create",
  "transport": "chrome-node",
  "mode": "agent",
  "accessType": "OPEN"
}
并且它们可以结束已知房间的活跃会议:
{
  "action": "end_active_conference",
  "meeting": "https://meet.google.com/abc-defg-hij"
}
对于先监听验证,智能体应在声称会议有用之前使用 test_listen
{
  "action": "test_listen",
  "url": "https://meet.google.com/abc-defg-hij",
  "transport": "chrome-node",
  "timeoutMs": 30000
}
针对真实保留会议运行受保护的实时冒烟测试:
OPENCLAW_LIVE_TEST=1 \
OPENCLAW_GOOGLE_MEET_LIVE_MEETING=https://meet.google.com/abc-defg-hij \
pnpm test:live -- extensions/google-meet/google-meet.live.test.ts
针对有人会发言且 Meet 字幕可用的会议,运行实时先监听浏览器探测:
openclaw googlemeet setup --transport chrome-node --mode transcribe
openclaw googlemeet test-listen https://meet.google.com/abc-defg-hij --transport chrome-node --timeout-ms 30000
实时冒烟环境:
  • OPENCLAW_LIVE_TEST=1 启用受保护的实时测试。
  • OPENCLAW_GOOGLE_MEET_LIVE_MEETING 指向保留的 Meet URL、代码或 spaces/{id}
  • OPENCLAW_GOOGLE_MEET_CLIENT_IDGOOGLE_MEET_CLIENT_ID 提供 OAuth 客户端 ID。
  • OPENCLAW_GOOGLE_MEET_REFRESH_TOKENGOOGLE_MEET_REFRESH_TOKEN 提供刷新令牌。
  • 可选:OPENCLAW_GOOGLE_MEET_CLIENT_SECRETOPENCLAW_GOOGLE_MEET_ACCESS_TOKENOPENCLAW_GOOGLE_MEET_ACCESS_TOKEN_EXPIRES_AT 使用没有 OPENCLAW_ 前缀的相同回退名称。
基础工件/出席实时冒烟测试需要 https://www.googleapis.com/auth/meetings.space.readonlyhttps://www.googleapis.com/auth/meetings.conference.media.readonly。Calendar 查找需要 https://www.googleapis.com/auth/calendar.events.readonly。Drive 文档正文导出需要 https://www.googleapis.com/auth/drive.meet.readonly 创建新的 Meet 空间:
openclaw googlemeet create
该命令会打印新的 meeting uri、来源和加入会话。带 OAuth 凭证时,它使用官方 Google Meet API。没有 OAuth 凭证时,它会使用固定 Chrome 节点的已登录浏览器个人资料作为回退。智能体可以使用 google_meet 工具并带 action: "create" 来一步创建并加入。对于仅创建 URL,传入 "join": false 来自浏览器回退的 JSON 输出示例:
{
  "source": "browser",
  "meetingUri": "https://meet.google.com/abc-defg-hij",
  "joined": true,
  "browser": {
    "nodeId": "ba0f4e4bc...",
    "targetId": "tab-1"
  },
  "join": {
    "session": {
      "id": "meet_...",
      "url": "https://meet.google.com/abc-defg-hij"
    }
  }
}
如果浏览器回退在创建 URL 之前遇到 Google 登录或 Meet 权限阻断,Gateway 网关方法会返回失败响应,google_meet 工具会返回结构化详情,而不是纯字符串:
{
  "source": "browser",
  "error": "google-login-required: Sign in to Google in the OpenClaw browser profile, then retry meeting creation.",
  "manualActionRequired": true,
  "manualActionReason": "google-login-required",
  "manualActionMessage": "Sign in to Google in the OpenClaw browser profile, then retry meeting creation.",
  "browser": {
    "nodeId": "ba0f4e4bc...",
    "targetId": "tab-1",
    "browserUrl": "https://accounts.google.com/signin",
    "browserTitle": "Sign in - Google Accounts"
  }
}
当智能体看到 manualActionRequired: true 时,应报告 manualActionMessage 加浏览器节点/标签页上下文,并停止打开新的 Meet 标签页,直到操作员完成浏览器步骤。 来自 API 创建的 JSON 输出示例:
{
  "source": "api",
  "meetingUri": "https://meet.google.com/abc-defg-hij",
  "joined": true,
  "space": {
    "name": "spaces/abc-defg-hij",
    "meetingCode": "abc-defg-hij",
    "meetingUri": "https://meet.google.com/abc-defg-hij"
  },
  "join": {
    "session": {
      "id": "meet_...",
      "url": "https://meet.google.com/abc-defg-hij"
    }
  }
}
创建 Meet 默认会加入会议。Chrome 或 Chrome-node 传输协议仍然需要已登录的 Google Chrome 配置文件,才能通过浏览器加入。如果配置文件已退出登录,OpenClaw 会报告 manualActionRequired: true 或浏览器回退错误,并要求操作者先完成 Google 登录后再重试。 只有在确认你的 Cloud 项目、OAuth 主体和会议参与者都已加入 Google Workspace Developer Preview Program for Meet media APIs 后,才设置 preview.enrollmentAcknowledged: true

配置

通用 Chrome 智能体路径只需要启用插件、BlackHole、SoX、一个实时转录提供商密钥,以及一个已配置的 OpenClaw TTS 提供商。OpenAI 是默认转录提供商;将 realtime.voiceProvider 设为 "google",并设置 realtime.model,即可在 bidi 模式下使用 Google Gemini Live,而无需更改默认智能体模式转录提供商:
brew install blackhole-2ch sox
export OPENAI_API_KEY=sk-...
# or
export GEMINI_API_KEY=...
plugins.entries.google-meet.config 下设置插件配置:
{
  plugins: {
    entries: {
      "google-meet": {
        enabled: true,
        config: {},
      },
    },
  },
}
默认值:
  • defaultTransport: "chrome"
  • defaultMode: "agent""realtime" 仅作为 "agent" 的旧版兼容别名被接受;新的工具调用应使用 "agent"
  • chromeNode.node:用于 chrome-node 的可选节点 ID、名称或 IP
  • chrome.audioBackend: "blackhole-2ch"
  • chrome.guestName: "OpenClaw Agent":在已退出登录的 Meet 访客界面上使用的名称
  • chrome.autoJoin: true:通过 chrome-node 上的 OpenClaw 浏览器自动化,尽力填写访客名称并点击 Join Now
  • chrome.reuseExistingTab: true:激活现有 Meet 标签页,而不是打开重复标签页
  • chrome.waitForInCallMs: 20000:在触发回话介绍前,等待 Meet 标签页报告已在通话中
  • chrome.audioFormat: "pcm16-24khz":命令对音频格式。只有仍会发出电话音频的旧版或自定义命令对才使用 "g711-ulaw-8khz"
  • chrome.audioBufferBytes: 4096:用于生成的 Chrome 命令对音频命令的 SoX 处理缓冲区。这是 SoX 默认 8192 字节缓冲区的一半,可降低默认管道延迟,同时为繁忙主机保留上调空间。低于 SoX 最小值的值会被钳制为 17 字节。
  • chrome.audioInputCommand:从 CoreAudio BlackHole 2ch 读取并以 chrome.audioFormat 写入音频的 SoX 命令
  • chrome.audioOutputCommand:以 chrome.audioFormat 读取音频并写入 CoreAudio BlackHole 2ch 的 SoX 命令
  • chrome.bargeInInputCommand:可选的本地麦克风命令,用于在助手播放处于活动状态时写入有符号 16 位小端单声道 PCM,以检测真人插话。目前这适用于由 Gateway 网关托管的 chrome 命令对桥接。
  • chrome.bargeInRmsThreshold: 650:在 chrome.bargeInInputCommand 上计为真人打断的 RMS 电平
  • chrome.bargeInPeakThreshold: 2500:在 chrome.bargeInInputCommand 上计为真人打断的峰值电平
  • chrome.bargeInCooldownMs: 900:重复清除真人打断之间的最小延迟
  • mode: "agent":默认回话模式。参与者语音由配置的实时转录提供商转录,发送到每次会议子智能体会话中的已配置 OpenClaw 智能体,并通过常规 OpenClaw TTS 运行时回说。
  • mode: "bidi":回退的直接双向实时模型模式。实时语音提供商直接回答参与者语音,并可调用 openclaw_agent_consult 获取更深入或由工具支持的答案。
  • mode: "transcribe":不带回话桥接的仅观察模式。
  • realtime.provider: "openai":当下面的作用域提供商字段未设置时使用的兼容性回退。
  • realtime.transcriptionProvider: "openai"agent 模式用于实时转录的提供商 ID。
  • realtime.voiceProviderbidi 模式用于直接实时语音的提供商 ID。将它设为 "google" 可使用 Gemini Live,同时让智能体模式转录保持在 OpenAI 上。
  • realtime.toolPolicy: "safe-read-only"
  • realtime.instructions:简短语音回复,并使用 openclaw_agent_consult 获取更深入答案
  • realtime.introMessage:实时桥接连接时的简短语音就绪检查;将它设为 "" 可静默加入
  • realtime.agentId:用于 openclaw_agent_consult 的可选 OpenClaw 智能体 ID;默认值为 main
可选覆盖项:
{
  defaults: {
    meeting: "https://meet.google.com/abc-defg-hij",
  },
  browser: {
    defaultProfile: "openclaw",
  },
  chrome: {
    guestName: "OpenClaw Agent",
    waitForInCallMs: 30000,
    bargeInInputCommand: [
      "sox",
      "-q",
      "-t",
      "coreaudio",
      "External Microphone",
      "-r",
      "24000",
      "-c",
      "1",
      "-b",
      "16",
      "-e",
      "signed-integer",
      "-t",
      "raw",
      "-",
    ],
  },
  chromeNode: {
    node: "parallels-macos",
  },
  defaultMode: "agent",
  realtime: {
    provider: "openai",
    transcriptionProvider: "openai",
    voiceProvider: "google",
    model: "gemini-2.5-flash-native-audio-preview-12-2025",
    agentId: "jay",
    toolPolicy: "owner",
    introMessage: "Say exactly: I'm here.",
    providers: {
      google: {
        voice: "Kore",
      },
    },
  },
}
同时将 ElevenLabs 用于智能体模式的聆听和发声:
{
  messages: {
    tts: {
      provider: "elevenlabs",
      providers: {
        elevenlabs: {
          modelId: "eleven_v3",
          voiceId: "pMsXgVXv3BLzUgSXRplE",
        },
      },
    },
  },
  plugins: {
    entries: {
      "google-meet": {
        config: {
          realtime: {
            transcriptionProvider: "elevenlabs",
            providers: {
              elevenlabs: {
                modelId: "scribe_v2_realtime",
                audioFormat: "ulaw_8000",
                sampleRate: 8000,
                commitStrategy: "vad",
              },
            },
          },
        },
      },
    },
  },
}
持久的 Meet 语音来自 messages.tts.providers.elevenlabs.voiceId。启用 TTS 模型覆盖时,智能体回复也可以使用按回复设置的 [[tts:voiceId=... model=eleven_v3]] 指令,但配置是会议的确定性默认值。加入时,日志应显示 transcriptionProvider=elevenlabs,并且每条语音回复都应记录 provider=elevenlabs model=eleven_v3 voice=<voiceId> 仅 Twilio 配置:
{
  defaultTransport: "twilio",
  twilio: {
    defaultDialInNumber: "+15551234567",
    defaultPin: "123456",
  },
  voiceCall: {
    gatewayUrl: "ws://127.0.0.1:18789",
  },
}
voiceCall.enabled 默认为 true;使用 Twilio 传输协议时,它会将实际的 PSTN 呼叫、DTMF 和介绍问候委托给 Voice Call 插件。Voice Call 会先播放 DTMF 序列,再打开实时媒体流,然后使用保存的介绍文本作为初始实时问候。如果未启用 voice-call,Google Meet 仍可校验并记录拨号计划,但无法发起 Twilio 呼叫。

工具

智能体可以使用 google_meet 工具:
{
  "action": "join",
  "url": "https://meet.google.com/abc-defg-hij",
  "transport": "chrome-node",
  "mode": "agent"
}
当 Chrome 在 Gateway 网关主机上运行时,使用 transport: "chrome"。当 Chrome 在配对节点(例如 Parallels VM)上运行时,使用 transport: "chrome-node"。两种情况下,模型提供商和 openclaw_agent_consult 都在 Gateway 网关主机上运行,因此模型凭证保留在那里。使用默认的 mode: "agent" 时,实时转录提供商负责聆听,配置的 OpenClaw 智能体生成答案,常规 OpenClaw TTS 将其说进 Meet。想让实时语音模型直接回答时,使用 mode: "bidi"。原始的 mode: "realtime" 仍作为 mode: "agent" 的旧版兼容别名被接受,但不再在智能体工具架构中公开。智能体模式日志会在桥接启动时包含解析后的转录提供商和模型,并在每次合成回复后包含 TTS 提供商、模型、语音、输出格式和采样率。 使用 action: "status" 列出活动会话或检查会话 ID。使用带有 sessionIdmessageaction: "speak" 让实时智能体立即说话。使用 action: "test_speech" 创建或复用会话、触发一个已知短语,并在 Chrome 主机可以报告时返回 inCall 健康状态。test_speech 始终强制使用 mode: "agent";如果要求它在 mode: "transcribe" 中运行,它会失败,因为仅观察会话会有意禁止发出语音。它的 speechOutputVerified 结果基于本次测试调用期间实时音频输出字节数的增加,因此带有旧音频的复用会话不会计为新的成功语音检查。使用 action: "leave" 将会话标记为已结束。 status 会在可用时包含 Chrome 健康状态:
  • inCall:Chrome 看起来已进入 Meet 通话
  • micMuted:尽力判断的 Meet 麦克风状态
  • manualActionRequired / manualActionReason / manualActionMessage:浏览器配置文件需要手动登录、Meet 主持人准入、权限,或浏览器控制修复后,语音才能工作
  • speechReady / speechBlockedReason / speechBlockedMessage:当前是否允许托管 Chrome 语音。speechReady: false 表示 OpenClaw 没有将介绍或测试短语发送到音频桥接。
  • providerConnected / realtimeReady:实时语音桥接状态
  • lastInputAt / lastOutputAt:桥接最近收到或发送音频的时间
  • audioOutputRouted / audioOutputDeviceLabel:Meet 标签页的媒体输出是否已主动路由到桥接使用的 BlackHole 设备
  • lastSuppressedInputAt / suppressedInputBytes:助手播放处于活动状态时被忽略的 local loopback 输入
{
  "action": "speak",
  "sessionId": "meet_...",
  "message": "Say exactly: I'm here and listening."
}

智能体和 Bidi 模式

Chrome agent 模式针对“我的智能体在会议中”行为进行了优化。实时转录提供商会听取会议音频,最终参与者转录会路由到配置的 OpenClaw 智能体,答案则通过常规 OpenClaw TTS 运行时说出。想让实时语音模型直接回答时,设置 mode: "bidi"。相近的最终转录片段会在 consult 之前合并,因此一次发言不会产生多个陈旧的部分答案。排队的助手音频仍在播放时,也会抑制实时输入,并且在智能体 consult 之前会忽略最近类似助手的转录回声,以免 BlackHole local loopback 让智能体回答自己的语音。
模式谁决定答案语音输出路径适用场景
agent配置的 OpenClaw 智能体常规 OpenClaw TTS 运行时你想要“我的智能体在会议中”行为
bidi实时语音模型实时语音提供商音频响应你想要最低延迟的对话式语音循环
bidi 模式中,当实时模型需要更深入的推理、当前信息或常规 OpenClaw 工具时,它可以调用 openclaw_agent_consult consult 工具会在幕后运行常规 OpenClaw 智能体,带上近期会议转录上下文,并返回简洁的语音回答。在 agent 模式下,OpenClaw 会将该回答直接发送到 TTS 运行时;在 bidi 模式下,实时语音模型可以把 consult 结果说回会议中。它使用与 Voice Call 相同的共享 consult 机制。 默认情况下,consult 会针对 main 智能体运行。当某个 Meet 通道需要 consult 专用的 OpenClaw Agent 工作区、模型默认值、工具策略、记忆和会话历史时,请设置 realtime.agentId 智能体模式的 consult 使用按会议划分的 agent:<id>:subagent:google-meet:<session> 会话键,因此后续问题可以保留会议上下文,同时继承已配置智能体的正常智能体策略。 realtime.toolPolicy 控制 consult 运行:
  • safe-read-only:公开 consult 工具,并将常规智能体限制为 readweb_searchweb_fetchx_searchmemory_searchmemory_get
  • owner:公开 consult 工具,并允许常规智能体使用正常的智能体工具策略。
  • none:不要向实时语音模型公开 consult 工具。
consult 会话键按 Meet 会话限定范围,因此后续 consult 调用可以在同一会议期间复用之前的 consult 上下文。 要在 Chrome 完全加入通话后强制执行一次语音就绪检查:
openclaw googlemeet speak meet_... "Say exactly: I'm here and listening."
完整的加入并发声 smoke:
openclaw googlemeet test-speech https://meet.google.com/abc-defg-hij \
  --transport chrome-node \
  --message "Say exactly: I'm here and listening."

实时测试清单

在把会议交给无人值守的智能体之前,使用此序列:
openclaw googlemeet setup
openclaw nodes status
openclaw googlemeet test-speech https://meet.google.com/abc-defg-hij \
  --transport chrome-node \
  --message "Say exactly: Google Meet speech test complete."
预期的 Chrome-node 状态:
  • googlemeet setup 全部为绿色。
  • 当 Chrome-node 是默认传输协议或已固定某个节点时,googlemeet setup 包含 chrome-node-connected
  • nodes status 显示所选节点已连接。
  • 所选节点同时声明 googlemeet.chromebrowser.proxy
  • Meet 标签页加入通话,并且 test-speech 返回 Chrome 健康状态,其中 inCall: true
对于 Parallels macOS VM 这样的远程 Chrome 主机,在更新 Gateway 网关或 VM 后,下面是最短的安全检查:
openclaw googlemeet setup
openclaw nodes status --connected
openclaw nodes invoke \
  --node parallels-macos \
  --command googlemeet.chrome \
  --params '{"action":"setup"}'
这可以证明 Gateway 网关插件已加载、VM 节点已使用当前令牌连接,并且 Meet 音频桥可用,然后智能体才会打开真实会议标签页。 对于 Twilio smoke,请使用公开电话拨入详情的会议:
openclaw googlemeet setup
openclaw googlemeet join https://meet.google.com/abc-defg-hij \
  --transport twilio \
  --dial-in-number +15551234567 \
  --pin 123456
预期的 Twilio 状态:
  • googlemeet setup 包含绿色的 twilio-voice-call-plugintwilio-voice-call-credentialstwilio-voice-call-webhook 检查。
  • Gateway 网关重新加载后,CLI 中可用 voicecall
  • 返回的会话包含 transport: "twilio"twilio.voiceCallId
  • openclaw logs --follow 显示先提供 DTMF TwiML,再提供实时 TwiML,然后是一个已排队初始问候语的实时桥。
  • googlemeet leave <sessionId> 会挂断委派的语音通话。

故障排除

智能体看不到 Google Meet 工具

确认插件已在 Gateway 网关配置中启用,并重新加载 Gateway 网关:
openclaw plugins list | grep google-meet
openclaw googlemeet setup
如果你刚刚编辑了 plugins.entries.google-meet,请重启或重新加载 Gateway 网关。正在运行的智能体只能看到当前 Gateway 网关进程注册的插件工具。 在非 macOS Gateway 网关主机上,面向智能体的 google_meet 工具仍保持可见,但本地 Chrome 回话动作会在到达音频桥之前被阻止。本地 Chrome 回话音频目前依赖 macOS BlackHole 2ch,因此 Linux 智能体应使用 mode: "transcribe"、Twilio 拨入,或 macOS chrome-node 主机,而不是默认的本地 Chrome 智能体路径。

没有已连接且支持 Google Meet 的节点

在节点主机上运行:
openclaw plugins enable google-meet
openclaw plugins enable browser
OPENCLAW_ALLOW_INSECURE_PRIVATE_WS=1 \
  openclaw node run --host <gateway-lan-ip> --port 18789 --display-name parallels-macos
在 Gateway 网关主机上,批准节点并验证命令:
openclaw devices list
openclaw devices approve <requestId>
openclaw nodes status
节点必须已连接,并列出 googlemeet.chrome 加上 browser.proxy。Gateway 网关配置必须允许这些节点命令:
{
  gateway: {
    nodes: {
      allowCommands: ["browser.proxy", "googlemeet.chrome"],
    },
  },
}
如果 googlemeet setupchrome-node-connected 失败,或 Gateway 网关日志报告 gateway token mismatch,请使用当前 Gateway 网关令牌重新安装或重启节点。对于 LAN Gateway 网关,这通常意味着:
OPENCLAW_ALLOW_INSECURE_PRIVATE_WS=1 \
  openclaw node install \
  --host <gateway-lan-ip> \
  --port 18789 \
  --display-name parallels-macos \
  --force
然后重新加载节点服务并重新运行:
openclaw googlemeet setup
openclaw nodes status --connected

浏览器打开但智能体无法加入

对仅观察加入运行 googlemeet test-listen,或对实时加入运行 googlemeet test-speech,然后检查返回的 Chrome 健康状态。如果任一探测报告 manualActionRequired: true,请向操作员显示 manualActionMessage,并在浏览器操作完成前停止重试。 常见手动操作:
  • 登录 Chrome 配置文件。
  • 从 Meet 主持账号批准访客加入。
  • 当 Chrome 的原生权限提示出现时,授予 Chrome 麦克风/摄像头权限。
  • 关闭或修复卡住的 Meet 权限对话框。
不要仅仅因为 Meet 显示“Do you want people to hear you in the meeting?”就报告“未登录”。这是 Meet 的音频选择插页;OpenClaw 会在可用时通过浏览器自动化点击 Use microphone,并继续等待真实会议状态。对于仅创建的浏览器回退,OpenClaw 可能会点击 Continue without microphone,因为创建 URL 不需要实时音频路径。

会议创建失败

googlemeet create 首先在已配置 OAuth 凭据时使用 Google Meet API spaces.create 端点。没有 OAuth 凭据时,它会回退到固定的 Chrome 节点浏览器。请确认:
  • 对于 API 创建:已配置 oauth.clientIdoauth.refreshToken,或存在匹配的 OPENCLAW_GOOGLE_MEET_* 环境变量。
  • 对于 API 创建:刷新令牌是在添加创建支持之后签发的。较旧的令牌可能缺少 meetings.space.created 作用域;请重新运行 openclaw googlemeet auth login --json 并更新插件配置。
  • 对于浏览器回退:defaultTransport: "chrome-node"chromeNode.node 指向一个已连接、带有 browser.proxygooglemeet.chrome 的节点。
  • 对于浏览器回退:该节点上的 OpenClaw Chrome 配置文件已登录 Google,并且可以打开 https://meet.google.com/new
  • 对于浏览器回退:重试会在打开新标签页之前复用已有的 https://meet.google.com/new 或 Google 账号提示标签页。如果智能体超时,请重试工具调用,而不是手动打开另一个 Meet 标签页。
  • 对于浏览器回退:如果工具返回 manualActionRequired: true,请使用返回的 browser.nodeIdbrowser.targetIdbrowserUrlmanualActionMessage 指导操作员。在该操作完成前不要循环重试。
  • 对于浏览器回退:如果 Meet 显示“Do you want people to hear you in the meeting?”,请保持标签页打开。OpenClaw 应通过浏览器自动化点击 Use microphone,或在仅创建回退时点击 Continue without microphone,并继续等待生成的 Meet URL。如果无法做到,错误应提及 meet-audio-choice-required,而不是 google-login-required

智能体加入但不说话

检查实时路径:
openclaw googlemeet setup
openclaw googlemeet doctor
对正常的 STT -> OpenClaw 智能体 -> TTS 回话路径使用 mode: "agent",或对直接实时语音回退使用 mode: "bidi"mode: "transcribe" 会有意不启动回话桥。对于仅观察调试,请在参与者发言后运行 openclaw googlemeet status --json <session-id>,并检查 captioningtranscriptLineslastCaptionText。如果 inCall 为 true 但 transcriptLines 一直为 0,可能是 Meet 字幕已禁用、自观察器安装后无人发言、Meet UI 已变化,或该会议语言/账号不支持实时字幕。 googlemeet test-speech 始终检查实时路径,并报告该次调用是否观察到桥输出字节。如果 speechOutputVerified 为 false 且 speechOutputTimedOut 为 true,实时提供商可能已接受该话语,但 OpenClaw 没有看到新的输出字节到达 Chrome 音频桥。 还要验证:
  • Gateway 网关主机上可用实时提供商密钥,例如 OPENAI_API_KEYGEMINI_API_KEY
  • Chrome 主机上可见 BlackHole 2ch
  • Chrome 主机上存在 sox
  • Meet 麦克风和扬声器通过 OpenClaw 使用的虚拟音频路径路由。对于本地 Chrome 实时加入,doctor 应显示 meet output routed: yes
googlemeet doctor [session-id] 会打印会话、节点、通话中状态、手动操作原因、实时提供商连接、realtimeReady、音频输入/输出活动、最近音频时间戳、字节计数器和浏览器 URL。需要原始 JSON 时,使用 googlemeet status [session-id] --json。需要在不暴露令牌的情况下验证 Google Meet OAuth 刷新时,使用 googlemeet doctor --oauth;还需要 Google Meet API 证明时,添加 --meeting--create-space 如果智能体超时,而你能看到已经打开的 Meet 标签页,请检查该标签页,而不要打开另一个:
openclaw googlemeet recover-tab
openclaw googlemeet recover-tab https://meet.google.com/abc-defg-hij
等效的工具动作是 recover_current_tab。它会聚焦并检查所选传输协议的现有 Meet 标签页。使用 chrome 时,它通过 Gateway 网关使用本地浏览器控制;使用 chrome-node 时,它使用已配置的 Chrome 节点。它不会打开新标签页或创建新会话;它会报告当前阻塞点,例如登录、准入、权限或音频选择状态。CLI 命令会与已配置的 Gateway 网关通信,因此 Gateway 网关必须正在运行;chrome-node 还要求 Chrome 节点已连接。

Twilio 设置检查失败

voice-call 未被允许或未启用时,twilio-voice-call-plugin 会失败。将其添加到 plugins.allow,启用 plugins.entries.voice-call,并重新加载 Gateway 网关。 当 Twilio 后端缺少账号 SID、认证令牌或主叫号码时,twilio-voice-call-credentials 会失败。在 Gateway 网关主机上设置这些变量:
export TWILIO_ACCOUNT_SID=AC...
export TWILIO_AUTH_TOKEN=...
export TWILIO_FROM_NUMBER=+15550001234
voice-call 没有公网 webhook 暴露,或 publicUrl 指向 local loopback 或私有网络空间时,twilio-voice-call-webhook 会失败。将 plugins.entries.voice-call.config.publicUrl 设置为公共提供商 URL,或配置 voice-call 隧道/Tailscale 暴露。 Loopback 和私有 URL 不适用于运营商回调。不要将 localhost127.0.0.10.0.0.010.x172.16.x-172.31.x192.168.x169.254.xfc00::/7fd00::/8 用作 publicUrl 对于稳定的公共 URL:
{
  plugins: {
    entries: {
      "voice-call": {
        enabled: true,
        config: {
          provider: "twilio",
          fromNumber: "+15550001234",
          publicUrl: "https://voice.example.com/voice/webhook",
        },
      },
    },
  },
}
对于本地开发,请使用隧道或 Tailscale 暴露,而不是私有主机 URL:
{
  plugins: {
    entries: {
      "voice-call": {
        config: {
          tunnel: { provider: "ngrok" },
          // or
          tailscale: { mode: "funnel", path: "/voice/webhook" },
        },
      },
    },
  },
}
然后重启或重新加载 Gateway 网关,并运行:
openclaw googlemeet setup --transport twilio
openclaw voicecall setup
openclaw voicecall smoke
默认情况下,voicecall smoke 仅检查就绪状态。要对特定号码进行试运行:
openclaw voicecall smoke --to "+15555550123"
只有当你有意要发起实时出站通知通话时,才添加 --yes
openclaw voicecall smoke --to "+15555550123" --yes

Twilio 通话已开始但始终未进入会议

确认 Meet 事件公开了电话拨入详情。传入准确的拨入号码和 PIN,或自定义 DTMF 序列:
openclaw googlemeet join https://meet.google.com/abc-defg-hij \
  --transport twilio \
  --dial-in-number +15551234567 \
  --dtmf-sequence ww123456#
如果提供商需要在输入 PIN 前暂停,请在 --dtmf-sequence 中使用前导 w 或逗号。 如果电话通话已创建,但 Meet 名单始终未显示拨入参会者:
  • 运行 openclaw googlemeet doctor <session-id>,确认委托的 Twilio 通话 ID、DTMF 是否已排队,以及是否已请求开场问候。
  • 运行 openclaw voicecall status --call-id <id>,并确认通话仍处于活动状态。
  • 运行 openclaw voicecall tail,检查 Twilio webhook 是否到达 Gateway 网关。
  • 运行 openclaw logs --follow,查找 Twilio Meet 序列:Google Meet 委托加入,Voice Call 启动电话链路,Google Meet 等待 voiceCall.dtmfDelayMs,通过 voicecall.dtmf 发送 DTMF,等待 voiceCall.postDtmfSpeechDelayMs,然后通过 voicecall.speak 请求开场语音。
  • 重新运行 openclaw googlemeet setup --transport twilio;需要绿色设置检查通过,但这不能证明会议 PIN 序列正确。
  • 确认拨入号码与 PIN 属于同一个 Meet 邀请和地区。
  • 如果 Meet 接听较慢,或通话转录在发送 DTMF 后仍显示要求输入 PIN 的提示,请增加 voiceCall.dtmfDelayMs
  • 如果参会者已加入但你听不到问候,请检查 openclaw logs --follow 中 DTMF 之后的 voicecall.speak 请求,以及媒体流 TTS 播放或 Twilio <Say> 回退。如果通话转录仍包含 “enter the meeting PIN”,说明电话链路尚未加入 Meet 房间,因此会议参会者不会听到语音。
如果 webhook 未到达,请先调试 Voice Call 插件:提供商必须能够访问 plugins.entries.voice-call.config.publicUrl 或已配置的隧道。参见语音通话故障排除

备注

Google Meet 的官方媒体 API 以接收为主,因此向 Meet 通话中说话仍需要一条参会者路径。此插件让该边界保持可见:Chrome 处理浏览器参会和本地音频路由;Twilio 处理电话拨入参会。 Chrome 回话模式需要 BlackHole 2ch,并搭配以下任一项:
  • chrome.audioInputCommandchrome.audioOutputCommand:OpenClaw 拥有桥接,并在这些命令与所选提供商之间以 chrome.audioFormat 传输音频。智能体模式使用实时转录加常规 TTS;bidi 模式使用实时语音提供商。默认 Chrome 路径是 24 kHz PCM16,并使用 chrome.audioBufferBytes: 4096;8 kHz G.711 mu-law 仍可用于旧版命令对。
  • chrome.audioBridgeCommand:外部桥接命令拥有整个本地音频路径,并且必须在启动或验证其守护进程后退出。这仅对 bidi 有效,因为 agent 模式需要直接访问命令对以用于 TTS。
当智能体在智能体模式下调用 google_meet 工具时,会议顾问会话会在回答参会者语音前 fork 调用方当前的转录。Meet 会话仍保持独立(agent:<agentId>:subagent:google-meet:<sessionId>),因此会议后续跟进不会直接改变调用方转录。 为了获得干净的双工音频,请将 Meet 输出和 Meet 麦克风路由到不同的虚拟设备,或路由到 Loopback 风格的虚拟设备图。单个共享 BlackHole 设备可能会把其他参会者的声音回声回通话中。 使用命令对 Chrome 桥接时,chrome.bargeInInputCommand 可以监听单独的本地麦克风,并在真人开始说话时清除助手播放。即使共享的 BlackHole loopback 输入在助手播放期间被临时抑制,这也能让真人语音优先于助手输出。与 chrome.audioInputCommandchrome.audioOutputCommand 一样,它是由操作者配置的本地命令。请使用明确可信的命令路径或参数列表,不要将其指向不受信任位置的脚本。 googlemeet speak 会触发 Chrome 会话的活动回话音频桥接。googlemeet leave 会停止该桥接。对于通过 Voice Call 插件委托的 Twilio 会话,leave 还会挂断底层语音通话。当你还想关闭由 API 管理空间中的活动 Google Meet 会议时,请使用 googlemeet end-active-conference

相关