Google(Gemini)
Google 插件通过 Google AI Studio 提供对 Gemini 模型的访问,并支持通过 Gemini Grounding 实现图像生成、媒体理解(图像/音频/视频)和网页搜索。- 提供商:
google - 认证:
GEMINI_API_KEY或GOOGLE_API_KEY - API:Google Gemini API
- 替代提供商:
google-gemini-cli(OAuth)
快速开始
- 设置 API 密钥:
- 设置默认模型:
非交互式示例
OAuth(Gemini CLI)
另一个替代提供商google-gemini-cli 使用 PKCE OAuth,而不是 API 密钥。
这是一个非官方集成;有些用户报告称会遇到账户限制。
请自行承担使用风险。
- 默认模型:
google-gemini-cli/gemini-3-flash-preview - 别名:
gemini-cli - 安装前提:本地可用的 Gemini CLI,命令名为
gemini- Homebrew:
brew install gemini-cli - npm:
npm install -g @google/gemini-cli
- Homebrew:
- 登录:
OPENCLAW_GEMINI_OAUTH_CLIENT_IDOPENCLAW_GEMINI_OAUTH_CLIENT_SECRET
GEMINI_CLI_* 变体。)
如果 Gemini CLI OAuth 请求在登录后失败,请在 Gateway 网关主机上设置 GOOGLE_CLOUD_PROJECT 或 GOOGLE_CLOUD_PROJECT_ID,然后重试。
如果登录在浏览器流程开始前失败,请确保本地 gemini 命令已安装并存在于 PATH 中。OpenClaw 同时支持 Homebrew 安装和全局 npm 安装,包括常见的 Windows/npm 布局。
Gemini CLI JSON 使用说明:
- 回复文本来自 CLI JSON 的
response字段。 - 当 CLI 将
usage留空时,用量会回退到stats。 stats.cached会被规范化为 OpenClawcacheRead。- 如果缺少
stats.input,OpenClaw 会根据stats.input_tokens - stats.cached推导输入 token 数。
功能
| Capability | Supported |
|---|---|
| Chat completions | 是 |
| Image generation | 是 |
| Music generation | 是 |
| Image understanding | 是 |
| Audio transcription | 是 |
| Video understanding | 是 |
| Web search (Grounding) | 是 |
| Thinking/reasoning | 是(Gemini 3.1+) |
直接复用 Gemini 缓存
对于直接 Gemini API 运行(api: "google-generative-ai"),OpenClaw 现在会将已配置的 cachedContent 句柄传递给 Gemini 请求。
- 可通过
cachedContent或旧版cached_content配置每个模型或全局参数 - 如果两者同时存在,则
cachedContent优先 - 示例值:
cachedContents/prebuilt-context - Gemini 的缓存命中用量会根据上游
cachedContentTokenCount规范化为 OpenClawcacheRead
图像生成
内置的google 图像生成提供商默认使用 google/gemini-3.1-flash-image-preview。
- 也支持
google/gemini-3-pro-image-preview - 生成:每次请求最多 4 张图像
- 编辑模式:已启用,最多支持 5 张输入图像
- 几何控制:
size、aspectRatio和resolution
google-gemini-cli 提供商是一个独立的文本推理接口。图像生成、媒体理解和 Gemini Grounding 仍然使用 google 提供商 id。
要将 Google 用作默认图像提供商:
视频生成
内置的google 插件还会通过共享 video_generate 工具注册视频生成功能。
- 默认视频模型:
google/veo-3.1-fast-generate-preview - 模式:文生视频、图生视频,以及单视频参考流程
- 支持
aspectRatio、resolution和audio - 当前时长限制:4 到 8 秒
音乐生成
内置的google 插件还会通过共享 music_generate 工具注册音乐生成功能。
- 默认音乐模型:
google/lyria-3-clip-preview - 也支持
google/lyria-3-pro-preview - 提示词控制:
lyrics和instrumental - 输出格式:默认是
mp3,此外在google/lyria-3-pro-preview上还支持wav - 参考输入:最多 10 张图像
- 基于会话的运行会通过共享任务/状态流程分离执行,包括
action: "status"
环境说明
如果 Gateway 网关以守护进程方式运行(launchd/systemd),请确保该进程可以访问GEMINI_API_KEY(例如放在 ~/.openclaw/.env 中,或通过 env.shellEnv 提供)。