Google (Gemini)
Plugin Google menyediakan akses ke model Gemini melalui Google AI Studio, serta pembuatan gambar, pemahaman media (gambar/audio/video), text-to-speech, dan pencarian web melalui Gemini Grounding.- Provider:
google - Auth:
GEMINI_API_KEYatauGOOGLE_API_KEY - API: Google Gemini API
- Provider alternatif:
google-gemini-cli(OAuth)
Memulai
Pilih metode autentikasi yang Anda inginkan dan ikuti langkah-langkah penyiapannya.- API key
- Gemini CLI (OAuth)
Kemampuan
| Capability | Supported |
|---|---|
| Chat completions | Ya |
| Image generation | Ya |
| Music generation | Ya |
| Text-to-speech | Ya |
| Image understanding | Ya |
| Audio transcription | Ya |
| Video understanding | Ya |
| Web search (Grounding) | Ya |
| Thinking/reasoning | Ya (Gemini 2.5+ / Gemini 3+) |
| Gemma 4 models | Ya |
Pembuatan gambar
Provider pembuatan gambargoogle bawaan secara default menggunakan
google/gemini-3.1-flash-image-preview.
- Juga mendukung
google/gemini-3-pro-image-preview - Generate: hingga 4 gambar per permintaan
- Mode edit: diaktifkan, hingga 5 gambar input
- Kontrol geometri:
size,aspectRatio, danresolution
Lihat Image Generation untuk parameter tool bersama, pemilihan provider, dan perilaku failover.
Pembuatan video
Plugingoogle bawaan juga mendaftarkan pembuatan video melalui tool bersama
video_generate.
- Model video default:
google/veo-3.1-fast-generate-preview - Mode: text-to-video, image-to-video, dan alur referensi video tunggal
- Mendukung
aspectRatio,resolution, danaudio - Batas durasi saat ini: 4 hingga 8 detik
Lihat Video Generation untuk parameter tool bersama, pemilihan provider, dan perilaku failover.
Pembuatan musik
Plugingoogle bawaan juga mendaftarkan pembuatan musik melalui tool bersama
music_generate.
- Model musik default:
google/lyria-3-clip-preview - Juga mendukung
google/lyria-3-pro-preview - Kontrol prompt:
lyricsdaninstrumental - Format output:
mp3secara default, sertawavpadagoogle/lyria-3-pro-preview - Input referensi: hingga 10 gambar
- Eksekusi berbasis sesi dipisahkan melalui alur task/status bersama, termasuk
action: "status"
Lihat Music Generation untuk parameter tool bersama, pemilihan provider, dan perilaku failover.
Text-to-speech
Provider speechgoogle bawaan menggunakan jalur Gemini API TTS dengan
gemini-3.1-flash-tts-preview.
- Suara default:
Kore - Auth:
messages.tts.providers.google.apiKey,models.providers.google.apiKey,GEMINI_API_KEY, atauGOOGLE_API_KEY - Output: WAV untuk lampiran TTS biasa, PCM untuk Talk/telephony
- Output voice note native: tidak didukung pada jalur Gemini API ini karena API mengembalikan PCM, bukan Opus
[whispers] atau [laughs]. Untuk menjaga agar tag tidak muncul di balasan chat yang terlihat sambil
tetap mengirimkannya ke TTS, letakkan tag tersebut di dalam blok [[tts:text]]...[[/tts:text]]:
Key API Google Cloud Console yang dibatasi ke Gemini API valid untuk
provider ini. Ini bukan jalur Cloud Text-to-Speech API yang terpisah.
Konfigurasi lanjutan
Penggunaan ulang cache Gemini langsung
Penggunaan ulang cache Gemini langsung
Untuk eksekusi Gemini API langsung (
api: "google-generative-ai"), OpenClaw
meneruskan handle cachedContent yang dikonfigurasi ke permintaan Gemini.- Konfigurasikan parameter per model atau global dengan
cachedContentataucached_contentlama - Jika keduanya ada,
cachedContentakan diprioritaskan - Contoh nilai:
cachedContents/prebuilt-context - Penggunaan cache-hit Gemini dinormalisasi ke OpenClaw
cacheReaddari upstreamcachedContentTokenCount
Catatan penggunaan JSON Gemini CLI
Catatan penggunaan JSON Gemini CLI
Saat menggunakan provider OAuth
google-gemini-cli, OpenClaw menormalisasi
output JSON CLI sebagai berikut:- Teks balasan berasal dari field CLI JSON
response. - Usage menggunakan fallback ke
statssaat CLI membiarkanusagekosong. stats.cacheddinormalisasi menjadi OpenClawcacheRead.- Jika
stats.inputtidak ada, OpenClaw menurunkan token input daristats.input_tokens - stats.cached.
Penyiapan lingkungan dan daemon
Penyiapan lingkungan dan daemon
Jika Gateway berjalan sebagai daemon (launchd/systemd), pastikan
GEMINI_API_KEY
tersedia untuk proses tersebut (misalnya, di ~/.openclaw/.env atau melalui
env.shellEnv).Terkait
Pemilihan model
Memilih provider, ref model, dan perilaku failover.
Pembuatan gambar
Parameter tool gambar bersama dan pemilihan provider.
Pembuatan video
Parameter tool video bersama dan pemilihan provider.
Pembuatan musik
Parameter tool musik bersama dan pemilihan provider.