Google (Gemini)
Google plugin は、Google AI Studio 経由で Gemini モデルへのアクセスを提供し、さらに 画像生成、media understanding(画像 / 音声 / 動画)、および Gemini Grounding 経由の web search も提供します。- Provider:
google - Auth:
GEMINI_API_KEYまたはGOOGLE_API_KEY - API: Google Gemini API
- 代替 provider:
google-gemini-cli(OAuth)
クイックスタート
- API キーを設定します:
- デフォルトモデルを設定します:
非対話型の例
OAuth(Gemini CLI)
代替 provider のgoogle-gemini-cli は、API
キーの代わりに PKCE OAuth を使用します。これは非公式な統合であり、一部ユーザーから
アカウント制限が報告されています。自己責任で使用してください。
- デフォルトモデル:
google-gemini-cli/gemini-3.1-pro-preview - エイリアス:
gemini-cli - インストール前提条件: ローカルで
geminiとして利用可能な Gemini CLI- Homebrew:
brew install gemini-cli - npm:
npm install -g @google/gemini-cli
- Homebrew:
- ログイン:
OPENCLAW_GEMINI_OAUTH_CLIENT_IDOPENCLAW_GEMINI_OAUTH_CLIENT_SECRET
GEMINI_CLI_* バリアント。)
ログイン後に Gemini CLI OAuth リクエストが失敗する場合は、
gateway ホストで GOOGLE_CLOUD_PROJECT または GOOGLE_CLOUD_PROJECT_ID を設定し、
再試行してください。
ブラウザーフロー開始前にログインが失敗する場合は、ローカルの gemini
コマンドがインストールされており、PATH 上にあることを確認してください。OpenClaw は、
Homebrew インストールとグローバル npm インストールの両方をサポートしており、一般的な Windows / npm レイアウトも含まれます。
Gemini CLI JSON の使用に関する注意:
- reply テキストは CLI JSON の
responseフィールドから取得されます。 - CLI が
usageを空のままにした場合、使用量はstatsにフォールバックします。 stats.cachedは OpenClaw のcacheReadに正規化されます。stats.inputが欠けている場合、OpenClaw はstats.input_tokens - stats.cachedから input token を導出します。
機能
| Capability | Supported |
|---|---|
| Chat completions | Yes |
| Image generation | Yes |
| Image understanding | Yes |
| Audio transcription | Yes |
| Video understanding | Yes |
| Web search (Grounding) | Yes |
| Thinking/reasoning | Yes (Gemini 3.1+) |
直接の Gemini cache 再利用
直接の Gemini API 実行(api: "google-generative-ai")では、OpenClaw は現在、
設定済みの cachedContent ハンドルを Gemini リクエストにそのまま渡します。
- モデル単位またはグローバルの params で
cachedContentまたはレガシーのcached_contentのいずれかを設定します - 両方ある場合は
cachedContentが優先されます - 例の値:
cachedContents/prebuilt-context - Gemini の cache hit 使用量は、上流の
cachedContentTokenCountから OpenClaw のcacheReadに正規化されます
画像生成
bundled のgoogle 画像生成 provider は、デフォルトで
google/gemini-3.1-flash-image-preview を使用します。
google/gemini-3-pro-image-previewもサポートします- Generate: 1 リクエストあたり最大 4 枚の画像
- Edit mode: 有効、最大 5 枚の入力画像
- ジオメトリー制御:
size、aspectRatio、resolution
google-gemini-cli provider は、別個の text inference
サーフェスです。画像生成、media understanding、および Gemini Grounding は引き続き
google provider id 上にあります。
環境に関する注意
Gateway が daemon(launchd/systemd)として実行される場合は、GEMINI_API_KEY が
そのプロセスから利用可能であることを確認してください(たとえば ~/.openclaw/.env または
env.shellEnv 経由)。