Google Plugin’i, Google AI Studio üzerinden Gemini modellerine erişimin yanı sıra görüntü oluşturma, medya anlama (görüntü/ses/video), metinden sese dönüştürme ve Gemini Grounding aracılığıyla web araması sağlar.Documentation Index
Fetch the complete documentation index at: https://docs.openclaw.ai/llms.txt
Use this file to discover all available pages before exploring further.
- Sağlayıcı:
google - Kimlik doğrulama:
GEMINI_API_KEYveyaGOOGLE_API_KEY - API: Google Gemini API
- Çalışma zamanı seçeneği: sağlayıcı/model
agentRuntime.id: "google-gemini-cli"model başvurularınıgoogle/*olarak kanonik tutarken Gemini CLI OAuth’u yeniden kullanır.
Başlarken
Tercih ettiğiniz kimlik doğrulama yöntemini seçin ve kurulum adımlarını izleyin.- API key
- Gemini CLI (OAuth)
Yetenekler
| Yetenek | Destekleniyor |
|---|---|
| Sohbet tamamlamaları | Evet |
| Görüntü oluşturma | Evet |
| Müzik oluşturma | Evet |
| Metinden sese | Evet |
| Gerçek zamanlı ses | Evet (Google Live API) |
| Görüntü anlama | Evet |
| Ses transkripsiyonu | Evet |
| Video anlama | Evet |
| Web araması (Grounding) | Evet |
| Düşünme/akıl yürütme | Evet (Gemini 2.5+ / Gemini 3+) |
| Gemma 4 modelleri | Evet |
Web araması
Paketlenengemini web araması sağlayıcısı, Gemini Google Search grounding kullanır.
plugins.entries.google.config.webSearch altında özel bir arama anahtarı yapılandırın
ya da GEMINI_API_KEY sonrasında models.providers.google.apiKey değerini yeniden kullanmasına izin verin:
webSearch.apiKey, sonra GEMINI_API_KEY,
ardından models.providers.google.apiKey şeklindedir. webSearch.baseUrl isteğe bağlıdır ve
operatör proxy’leri veya uyumlu Gemini API uç noktaları için bulunur; atlandığında
Gemini web araması models.providers.google.baseUrl değerini yeniden kullanır. Sağlayıcıya özgü araç davranışı için
Gemini araması bölümüne bakın.
Görüntü oluşturma
Paketlenengoogle görüntü oluşturma sağlayıcısı varsayılan olarak
google/gemini-3.1-flash-image-preview kullanır.
google/gemini-3-pro-image-previewda desteklenir- Oluşturma: istek başına en fazla 4 görüntü
- Düzenleme modu: etkin, en fazla 5 giriş görüntüsü
- Geometri denetimleri:
size,aspectRatioveresolution
Paylaşılan araç parametreleri, sağlayıcı seçimi ve yük devretme davranışı için Görüntü Oluşturma bölümüne bakın.
Video oluşturma
Paketlenengoogle Plugin’i, paylaşılan
video_generate aracı üzerinden video oluşturmayı da kaydeder.
- Varsayılan video modeli:
google/veo-3.1-fast-generate-preview - Modlar: metinden videoya, görüntüden videoya ve tek video referans akışları
aspectRatio(16:9,9:16) veresolution(720P,1080P) destekler; ses çıktısı bugün Veo tarafından desteklenmez- Desteklenen süreler: 4, 6 veya 8 saniye (diğer değerler en yakın izin verilen değere yuvarlanır)
Paylaşılan araç parametreleri, sağlayıcı seçimi ve yük devretme davranışı için Video Oluşturma bölümüne bakın.
Müzik oluşturma
Paketlenengoogle Plugin’i, paylaşılan
music_generate aracı üzerinden müzik oluşturmayı da kaydeder.
- Varsayılan müzik modeli:
google/lyria-3-clip-preview google/lyria-3-pro-previewda desteklenir- İstem denetimleri:
lyricsveinstrumental - Çıkış biçimi: varsayılan olarak
mp3, ayrıcagoogle/lyria-3-pro-previewüzerindewav - Referans girişleri: en fazla 10 görüntü
- Oturum destekli çalıştırmalar,
action: "status"dahil olmak üzere paylaşılan görev/durum akışı üzerinden ayrılır
Paylaşılan araç parametreleri, sağlayıcı seçimi ve yük devretme davranışı için Müzik Oluşturma bölümüne bakın.
Metinden sese
Paketlenengoogle konuşma sağlayıcısı, Gemini API TTS yolunu
gemini-3.1-flash-tts-preview ile kullanır.
- Varsayılan ses:
Kore - Kimlik doğrulama:
messages.tts.providers.google.apiKey,models.providers.google.apiKey,GEMINI_API_KEYveyaGOOGLE_API_KEY - Çıkış: normal TTS ekleri için WAV, sesli not hedefleri için Opus, Talk/telephony için PCM
- Sesli not çıktısı: Google PCM, WAV olarak sarılır ve
ffmpegile 48 kHz Opus’a dönüştürülür
generateContent yanıtında oluşturulan sesi döndürür. En düşük gecikmeli konuşmalı görüşmeler için toplu
TTS yerine Gemini Live API tarafından desteklenen Google gerçek zamanlı ses sağlayıcısını kullanın.
Google’ı varsayılan TTS sağlayıcısı olarak kullanmak için:
audioProfile ayarlayın. İstem metniniz adlandırılmış bir konuşmacıya atıfta bulunuyorsa
speakerName ayarlayın.
Gemini API TTS ayrıca metinde [whispers] veya [laughs] gibi ifadeli köşeli parantez ses etiketlerini kabul eder.
Etiketleri görünür sohbet yanıtının dışında tutarken TTS’ye göndermek için bunları bir [[tts:text]]...[[/tts:text]]
bloğunun içine koyun:
Gemini API ile sınırlandırılmış bir Google Cloud Console API anahtarı bu sağlayıcı için geçerlidir.
Bu, ayrı Cloud Text-to-Speech API yolu değildir.
Gerçek zamanlı ses
Paketlenengoogle Plugin’i, Voice Call ve Google Meet gibi arka uç ses köprüleri için
Gemini Live API tarafından desteklenen bir gerçek zamanlı ses sağlayıcısı kaydeder.
| Ayar | Yapılandırma yolu | Varsayılan |
|---|---|---|
| Model | plugins.entries.voice-call.config.realtime.providers.google.model | gemini-2.5-flash-native-audio-preview-12-2025 |
| Ses | ...google.voice | Kore |
| Sıcaklık | ...google.temperature | (ayarlanmamış) |
| VAD başlangıç hassasiyeti | ...google.startSensitivity | (ayarlanmamış) |
| VAD bitiş hassasiyeti | ...google.endSensitivity | (ayarlanmamış) |
| Sessizlik süresi | ...google.silenceDurationMs | (ayarlanmamış) |
| Etkinlik işleme | ...google.activityHandling | Google varsayılanı, start-of-activity-interrupts |
| Tur kapsamı | ...google.turnCoverage | Google varsayılanı, only-activity |
| Otomatik VAD’yi devre dışı bırak | ...google.automaticActivityDetectionDisabled | false |
| Oturum sürdürme | ...google.sessionResumption | true |
| Bağlam sıkıştırma | ...google.contextWindowCompression | true |
| API anahtarı | ...google.apiKey | models.providers.google.apiKey, GEMINI_API_KEY veya GOOGLE_API_KEY değerine geri döner |
Google Live API, WebSocket üzerinden çift yönlü ses ve işlev çağırma kullanır.
OpenClaw, telefon/Meet köprüsü sesini Gemini’nin PCM Live API akışına uyarlar ve
araç çağrılarını paylaşılan gerçek zamanlı ses sözleşmesinde tutar. Örnekleme
değişikliklerine ihtiyacınız yoksa
temperature değerini ayarlanmamış bırakın;
OpenClaw pozitif olmayan değerleri atlar çünkü Google Live, temperature: 0 için
ses olmadan transkript döndürebilir. Gemini API transkripsiyonu languageCodes
olmadan etkinleştirilir; mevcut Google SDK, bu API yolunda dil kodu ipuçlarını
reddeder.Control UI Talk, kısıtlı tek kullanımlık belirteçlerle Google Live tarayıcı
oturumlarını destekler. Yalnızca arka uç gerçek zamanlı ses sağlayıcıları,
sağlayıcı kimlik bilgilerini Gateway’de tutan genel Gateway aktarma taşıması
üzerinden de çalışabilir.
OPENAI_API_KEY=... GEMINI_API_KEY=... node --import tsx scripts/dev/realtime-talk-live-smoke.ts
çalıştırın. Smoke, OpenAI arka uç/WebRTC yollarını da kapsar; Google ayağı, Control UI Talk
tarafından kullanılan aynı kısıtlı Live API belirteci şeklini üretir, tarayıcı
WebSocket uç noktasını açar, ilk kurulum yükünü gönderir ve
setupComplete için bekler.
Gelişmiş yapılandırma
Doğrudan Gemini önbellek yeniden kullanımı
Doğrudan Gemini önbellek yeniden kullanımı
Doğrudan Gemini API çalıştırmaları (
api: "google-generative-ai") için OpenClaw,
yapılandırılmış bir cachedContent tanıtıcısını Gemini isteklerine geçirir.- Model başına veya genel parametreleri
cachedContentya da eskicached_contentile yapılandırın - İkisi de varsa
cachedContentkazanır - Örnek değer:
cachedContents/prebuilt-context - Gemini önbellek isabeti kullanımı, yukarı akış
cachedContentTokenCountdeğerinden OpenClawcacheReadiçine normalize edilir
Gemini CLI JSON kullanım notları
Gemini CLI JSON kullanım notları
google-gemini-cli OAuth sağlayıcısı kullanılırken OpenClaw,
CLI JSON çıktısını aşağıdaki şekilde normalize eder:- Yanıt metni, CLI JSON
responsealanından gelir. - CLI
usagedeğerini boş bıraktığında kullanımstatsdeğerine geri döner. stats.cached, OpenClawcacheReadiçine normalize edilir.stats.inputeksikse OpenClaw, giriş belirteçlerinistats.input_tokens - stats.cacheddeğerinden türetir.
Ortam ve daemon kurulumu
Ortam ve daemon kurulumu
Gateway bir daemon (launchd/systemd) olarak çalışıyorsa
GEMINI_API_KEY
değerinin bu süreç tarafından kullanılabildiğinden emin olun (örneğin,
~/.openclaw/.env içinde veya env.shellEnv üzerinden).İlgili
Model seçimi
Sağlayıcıları, model referanslarını ve yük devretme davranışını seçme.
Görüntü oluşturma
Paylaşılan görüntü aracı parametreleri ve sağlayıcı seçimi.
Video oluşturma
Paylaşılan video aracı parametreleri ve sağlayıcı seçimi.
Müzik oluşturma
Paylaşılan müzik aracı parametreleri ve sağlayıcı seçimi.