Plugin Google menyediakan akses ke model Gemini melalui Google AI Studio, plus pembuatan gambar, pemahaman media (gambar/audio/video), text-to-speech, dan pencarian web melalui Gemini Grounding.Documentation Index
Fetch the complete documentation index at: https://docs.openclaw.ai/llms.txt
Use this file to discover all available pages before exploring further.
- Penyedia:
google - Auth:
GEMINI_API_KEYatauGOOGLE_API_KEY - API: Google Gemini API
- Opsi runtime: provider/model
agentRuntime.id: "google-gemini-cli"menggunakan ulang OAuth Gemini CLI sambil menjaga referensi model tetap kanonis sebagaigoogle/*.
Memulai
Pilih metode auth yang Anda inginkan dan ikuti langkah-langkah penyiapannya.- Kunci API
- Gemini CLI (OAuth)
Kapabilitas
| Kapabilitas | Didukung |
|---|---|
| Penyelesaian chat | Ya |
| Pembuatan gambar | Ya |
| Pembuatan musik | Ya |
| Text-to-speech | Ya |
| Suara realtime | Ya (Google Live API) |
| Pemahaman gambar | Ya |
| Transkripsi audio | Ya |
| Pemahaman video | Ya |
| Pencarian web (Grounding) | Ya |
| Thinking/penalaran | Ya (Gemini 2.5+ / Gemini 3+) |
| Model Gemma 4 | Ya |
Pencarian web
Penyedia pencarian webgemini bawaan menggunakan Gemini Google Search grounding.
Konfigurasikan kunci pencarian khusus di bawah plugins.entries.google.config.webSearch,
atau biarkan menggunakan ulang models.providers.google.apiKey setelah GEMINI_API_KEY:
webSearch.apiKey khusus, lalu GEMINI_API_KEY,
lalu models.providers.google.apiKey. webSearch.baseUrl bersifat opsional dan
ada untuk proxy operator atau endpoint Gemini API yang kompatibel; jika dihilangkan,
pencarian web Gemini menggunakan ulang models.providers.google.baseUrl. Lihat
Gemini search untuk perilaku tool khusus penyedia.
Pembuatan gambar
Penyedia pembuatan gambargoogle bawaan menggunakan default
google/gemini-3.1-flash-image-preview.
- Juga mendukung
google/gemini-3-pro-image-preview - Buat: hingga 4 gambar per permintaan
- Mode edit: diaktifkan, hingga 5 gambar input
- Kontrol geometri:
size,aspectRatio, danresolution
Lihat Pembuatan Gambar untuk parameter tool bersama, pemilihan penyedia, dan perilaku failover.
Pembuatan video
Plugingoogle bawaan juga mendaftarkan pembuatan video melalui tool bersama
video_generate.
- Model video default:
google/veo-3.1-fast-generate-preview - Mode: alur teks-ke-video, gambar-ke-video, dan referensi video tunggal
- Mendukung
aspectRatio(16:9,9:16) danresolution(720P,1080P); output audio belum didukung oleh Veo saat ini - Durasi yang didukung: 4, 6, atau 8 detik (nilai lain disesuaikan ke nilai terdekat yang diizinkan)
Lihat Pembuatan Video untuk parameter tool bersama, pemilihan penyedia, dan perilaku failover.
Pembuatan musik
Plugingoogle bawaan juga mendaftarkan pembuatan musik melalui tool bersama
music_generate.
- Model musik default:
google/lyria-3-clip-preview - Juga mendukung
google/lyria-3-pro-preview - Kontrol prompt:
lyricsdaninstrumental - Format output:
mp3secara default, pluswavpadagoogle/lyria-3-pro-preview - Input referensi: hingga 10 gambar
- Proses yang didukung sesi dilepas melalui alur tugas/status bersama, termasuk
action: "status"
Lihat Pembuatan Musik untuk parameter tool bersama, pemilihan penyedia, dan perilaku failover.
Text-to-speech
Penyedia ucapangoogle bawaan menggunakan jalur TTS Gemini API dengan
gemini-3.1-flash-tts-preview.
- Suara default:
Kore - Auth:
messages.tts.providers.google.apiKey,models.providers.google.apiKey,GEMINI_API_KEY, atauGOOGLE_API_KEY - Output: WAV untuk lampiran TTS reguler, Opus untuk target catatan suara, PCM untuk Talk/telepon
- Output catatan suara: PCM Google dibungkus sebagai WAV dan ditranskode ke Opus 48 kHz dengan
ffmpeg
generateContent yang selesai. Untuk percakapan lisan dengan latensi terendah, gunakan
penyedia suara realtime Google yang didukung Gemini Live API alih-alih TTS
batch.
Untuk menggunakan Google sebagai penyedia TTS default:
audioProfile untuk menambahkan prompt gaya yang dapat digunakan ulang sebelum teks yang diucapkan. Tetapkan
speakerName saat teks prompt Anda merujuk ke pembicara bernama.
Gemini API TTS juga menerima tag audio ekspresif dalam tanda kurung siku di teks,
seperti [whispers] atau [laughs]. Untuk menjaga tag tidak muncul dalam balasan chat yang terlihat
sambil tetap mengirimkannya ke TTS, letakkan di dalam blok [[tts:text]]...[[/tts:text]]:
Kunci API Google Cloud Console yang dibatasi ke Gemini API valid untuk
penyedia ini. Ini bukan jalur Cloud Text-to-Speech API yang terpisah.
Suara realtime
Plugingoogle bawaan mendaftarkan penyedia suara realtime yang didukung oleh
Gemini Live API untuk jembatan audio backend seperti Voice Call dan Google Meet.
| Pengaturan | Jalur konfigurasi | Default |
|---|---|---|
| Model | plugins.entries.voice-call.config.realtime.providers.google.model | gemini-2.5-flash-native-audio-preview-12-2025 |
| Suara | ...google.voice | Kore |
| Suhu | ...google.temperature | (belum diatur) |
| Sensitivitas awal VAD | ...google.startSensitivity | (belum diatur) |
| Sensitivitas akhir VAD | ...google.endSensitivity | (belum diatur) |
| Durasi hening | ...google.silenceDurationMs | (belum diatur) |
| Penanganan aktivitas | ...google.activityHandling | Default Google, start-of-activity-interrupts |
| Cakupan giliran | ...google.turnCoverage | Default Google, only-activity |
| Nonaktifkan VAD otomatis | ...google.automaticActivityDetectionDisabled | false |
| Pelanjutan sesi | ...google.sessionResumption | true |
| Kompresi konteks | ...google.contextWindowCompression | true |
| Kunci API | ...google.apiKey | Beralih ke models.providers.google.apiKey, GEMINI_API_KEY, atau GOOGLE_API_KEY |
Google Live API menggunakan audio dua arah dan pemanggilan fungsi melalui WebSocket.
OpenClaw menyesuaikan audio jembatan telefoni/Meet ke stream PCM Live API Gemini dan
mempertahankan panggilan alat pada kontrak suara realtime bersama. Biarkan
temperature
belum diatur kecuali Anda memerlukan perubahan sampling; OpenClaw menghilangkan nilai non-positif
karena Google Live dapat mengembalikan transkrip tanpa audio untuk temperature: 0.
Transkripsi Gemini API diaktifkan tanpa languageCodes; SDK Google saat ini
menolak petunjuk kode bahasa pada jalur API ini.Control UI Talk mendukung sesi browser Google Live dengan token sekali pakai
yang dibatasi. Penyedia suara realtime khusus backend juga dapat berjalan melalui transport relay
Gateway generik, yang menyimpan kredensial penyedia di Gateway.
OPENAI_API_KEY=... GEMINI_API_KEY=... node --import tsx scripts/dev/realtime-talk-live-smoke.ts.
Smoke ini juga mencakup jalur backend/WebRTC OpenAI; bagian Google membuat bentuk token
Live API terbatas yang sama seperti yang digunakan oleh Control UI Talk, membuka endpoint
WebSocket browser, mengirim payload penyiapan awal, dan menunggu
setupComplete.
Konfigurasi lanjutan
Penggunaan ulang cache Gemini langsung
Penggunaan ulang cache Gemini langsung
Untuk eksekusi Gemini API langsung (
api: "google-generative-ai"), OpenClaw
meneruskan handle cachedContent yang dikonfigurasi ke permintaan Gemini.- Konfigurasikan parameter per model atau global dengan
cachedContentataucached_contentlama - Jika keduanya ada,
cachedContentyang berlaku - Nilai contoh:
cachedContents/prebuilt-context - Penggunaan cache-hit Gemini dinormalisasi ke OpenClaw
cacheReaddari upstreamcachedContentTokenCount
Catatan penggunaan JSON Gemini CLI
Catatan penggunaan JSON Gemini CLI
Saat menggunakan penyedia OAuth
google-gemini-cli, OpenClaw menormalisasi
keluaran JSON CLI sebagai berikut:- Teks balasan berasal dari kolom CLI JSON
response. - Penggunaan beralih ke
statssaat CLI membiarkanusagekosong. stats.cacheddinormalisasi ke OpenClawcacheRead.- Jika
stats.inputtidak ada, OpenClaw memperoleh token input daristats.input_tokens - stats.cached.
Penyiapan lingkungan dan daemon
Penyiapan lingkungan dan daemon
Jika Gateway berjalan sebagai daemon (launchd/systemd), pastikan
GEMINI_API_KEY
tersedia untuk proses tersebut (misalnya, di ~/.openclaw/.env atau melalui
env.shellEnv).Terkait
Pemilihan model
Memilih penyedia, referensi model, dan perilaku failover.
Pembuatan gambar
Parameter alat gambar bersama dan pemilihan penyedia.
Pembuatan video
Parameter alat video bersama dan pemilihan penyedia.
Pembuatan musik
Parameter alat musik bersama dan pemilihan penyedia.