Providers
Google (Gemini)
Google Plugin'i, Google AI Studio üzerinden Gemini modellerine erişimin yanı sıra Gemini Grounding aracılığıyla görüntü oluşturma, medya anlama (görüntü/ses/video), metinden konuşmaya ve web araması sağlar.
- Sağlayıcı:
google - Kimlik doğrulama:
GEMINI_API_KEYveyaGOOGLE_API_KEY - API: Google Gemini API
- Çalışma zamanı seçeneği: provider/model
agentRuntime.id: "google-gemini-cli"model başvurularınıgoogle/*olarak kanonik tutarken Gemini CLI OAuth'u yeniden kullanır.
Başlarken
Tercih ettiğiniz kimlik doğrulama yöntemini seçin ve kurulum adımlarını izleyin.
API anahtarı
En iyi kullanım: Google AI Studio üzerinden standart Gemini API erişimi.
Onboarding'i çalıştırın
openclaw onboard --auth-choice gemini-api-keyYa da anahtarı doğrudan geçirin:
openclaw onboard --non-interactive \ --mode local \ --auth-choice gemini-api-key \ --gemini-api-key "$GEMINI_API_KEY"Varsayılan model ayarlayın
{ agents: { defaults: { model: { primary: "google/gemini-3.1-pro-preview" }, }, },}Modelin kullanılabilir olduğunu doğrulayın
openclaw models list --provider googleGemini CLI (OAuth)
En iyi kullanım: ayrı bir API anahtarı yerine PKCE OAuth aracılığıyla mevcut bir Gemini CLI oturum açmasını yeniden kullanmak.
Gemini CLI'yi kurun
Yerel gemini komutu PATH üzerinde kullanılabilir olmalıdır.
# Homebrewbrew install gemini-cli # or npmnpm install -g @google/gemini-cliOpenClaw, yaygın Windows/npm düzenleri dahil hem Homebrew kurulumlarını hem de global npm kurulumlarını destekler.
OAuth ile oturum açın
openclaw models auth login --provider google-gemini-cli --set-defaultModelin kullanılabilir olduğunu doğrulayın
openclaw models list --provider google- Varsayılan model:
google/gemini-3.1-pro-preview - Çalışma zamanı:
google-gemini-cli - Takma ad:
gemini-cli
Gemini 3.1 Pro'nun Gemini API model kimliği gemini-3.1-pro-preview şeklindedir. OpenClaw, kolaylık takma adı olarak daha kısa google/gemini-3.1-pro değerini kabul eder ve sağlayıcı çağrılarından önce normalleştirir.
Ortam değişkenleri:
OPENCLAW_GEMINI_OAUTH_CLIENT_IDOPENCLAW_GEMINI_OAUTH_CLIENT_SECRET
(Ya da GEMINI_CLI_* varyantları.)
google-gemini-cli/* model başvuruları eski uyumluluk takma adlarıdır. Yeni
yapılandırmalar, yerel Gemini CLI yürütmesi istediklerinde google/* model
başvurularını ve google-gemini-cli çalışma zamanını kullanmalıdır.
Yetenekler
| Yetenek | Desteklenir |
|---|---|
| Sohbet tamamlama | Evet |
| Görüntü oluşturma | Evet |
| Müzik oluşturma | Evet |
| Metinden konuşmaya | Evet |
| Gerçek zamanlı ses | Evet (Google Live API) |
| Görüntü anlama | Evet |
| Ses transkripsiyonu | Evet |
| Video anlama | Evet |
| Web araması (Grounding) | Evet |
| Düşünme/akıl yürütme | Evet (Gemini 2.5+ / Gemini 3+) |
| Gemma 4 modelleri | Evet |
Web araması
Paketle gelen gemini web araması sağlayıcısı, Gemini Google Search grounding kullanır.
plugins.entries.google.config.webSearch altında özel bir arama anahtarı yapılandırın
veya GEMINI_API_KEY sonrasında models.providers.google.apiKey değerini yeniden kullanmasına izin verin:
{ plugins: { entries: { google: { config: { webSearch: { apiKey: "AIza...", // optional if GEMINI_API_KEY or models.providers.google.apiKey is set baseUrl: "https://generativelanguage.googleapis.com/v1beta", // falls back to models.providers.google.baseUrl model: "gemini-2.5-flash", }, }, }, }, },}Kimlik bilgisi önceliği önce özel webSearch.apiKey, ardından GEMINI_API_KEY,
ardından models.providers.google.apiKey şeklindedir. webSearch.baseUrl isteğe bağlıdır ve
operatör proxy'leri veya uyumlu Gemini API uç noktaları için vardır; belirtilmediğinde
Gemini web araması models.providers.google.baseUrl değerini yeniden kullanır. Sağlayıcıya özgü araç davranışı için
Gemini araması bölümüne bakın.
Görüntü oluşturma
Paketle gelen google görüntü oluşturma sağlayıcısının varsayılanı
google/gemini-3.1-flash-image-preview değeridir.
google/gemini-3-pro-image-previewdeğerini de destekler- Oluşturma: istek başına en fazla 4 görüntü
- Düzenleme modu: etkin, en fazla 5 giriş görüntüsü
- Geometri denetimleri:
size,aspectRatioveresolution
Google'ı varsayılan görüntü sağlayıcısı olarak kullanmak için:
{ agents: { defaults: { imageGenerationModel: { primary: "google/gemini-3.1-flash-image-preview", }, }, },}Video oluşturma
Paketle gelen google Plugin'i, paylaşılan
video_generate aracı üzerinden video oluşturmayı da kaydeder.
- Varsayılan video modeli:
google/veo-3.1-fast-generate-preview - Modlar: metinden videoya, görüntüden videoya ve tek videolu referans akışları
aspectRatio(16:9,9:16) veresolution(720P,1080P) destekler; ses çıktısı bugün Veo tarafından desteklenmez- Desteklenen süreler: 4, 6 veya 8 saniye (diğer değerler izin verilen en yakın değere yuvarlanır)
Google'ı varsayılan video sağlayıcısı olarak kullanmak için:
{ agents: { defaults: { videoGenerationModel: { primary: "google/veo-3.1-fast-generate-preview", }, }, },}Müzik oluşturma
Paketle gelen google Plugin'i, paylaşılan
music_generate aracı üzerinden müzik oluşturmayı da kaydeder.
- Varsayılan müzik modeli:
google/lyria-3-clip-preview google/lyria-3-pro-previewdeğerini de destekler- Prompt denetimleri:
lyricsveinstrumental - Çıktı biçimi: varsayılan olarak
mp3, ayrıcagoogle/lyria-3-pro-previewüzerindewav - Referans girişleri: en fazla 10 görüntü
- Oturum destekli çalıştırmalar,
action: "status"dahil paylaşılan görev/durum akışı üzerinden ayrılır
Google'ı varsayılan müzik sağlayıcısı olarak kullanmak için:
{ agents: { defaults: { musicGenerationModel: { primary: "google/lyria-3-clip-preview", }, }, },}Metinden konuşmaya
Paketle gelen google konuşma sağlayıcısı, Gemini API TTS yolunu
gemini-3.1-flash-tts-preview ile kullanır.
- Varsayılan ses:
Kore - Kimlik doğrulama:
messages.tts.providers.google.apiKey,models.providers.google.apiKey,GEMINI_API_KEYveyaGOOGLE_API_KEY - Çıktı: normal TTS ekleri için WAV, sesli not hedefleri için Opus, Talk/telefon için PCM
- Sesli not çıktısı: Google PCM, WAV olarak sarılır ve
ffmpegile 48 kHz Opus'a dönüştürülür
Google'ın toplu Gemini TTS yolu, oluşturulan sesi tamamlanmış
generateContent yanıtında döndürür. En düşük gecikmeli sözlü konuşmalar için toplu
TTS yerine Gemini Live API tarafından desteklenen Google gerçek zamanlı ses sağlayıcısını kullanın.
Google'ı varsayılan TTS sağlayıcısı olarak kullanmak için:
{ messages: { tts: { auto: "always", provider: "google", providers: { google: { model: "gemini-3.1-flash-tts-preview", speakerVoice: "Kore", audioProfile: "Speak professionally with a calm tone.", }, }, }, },}Gemini API TTS, stil denetimi için doğal dil prompt'u kullanır.
Konuşulan metinden önce yeniden kullanılabilir bir stil prompt'u eklemek için
audioProfile ayarlayın. Prompt metniniz adlandırılmış bir konuşmacıya atıfta bulunuyorsa
speakerName ayarlayın.
Gemini API TTS ayrıca metinde [whispers] veya [laughs] gibi ifade edici köşeli parantez ses etiketlerini kabul eder.
Etiketleri görünür sohbet yanıtının dışında tutarken TTS'e göndermek için bunları
bir [[tts:text]]...[[/tts:text]] bloğunun içine koyun:
Here is the clean reply text. [[tts:text]][whispers] Here is the spoken version.[[/tts:text]]Gerçek zamanlı ses
Paketle gelen google Plugin'i, Voice Call ve Google Meet gibi arka uç ses köprüleri için
Gemini Live API tarafından desteklenen bir gerçek zamanlı ses sağlayıcısı kaydeder.
| Ayar | Yapılandırma yolu | Varsayılan |
|---|---|---|
| Model | plugins.entries.voice-call.config.realtime.providers.google.model |
gemini-2.5-flash-native-audio-preview-12-2025 |
| Ses | ...google.voice |
Kore |
| Sıcaklık | ...google.temperature |
(ayarlanmamış) |
| VAD başlangıç hassasiyeti | ...google.startSensitivity |
(ayarlanmamış) |
| VAD bitiş hassasiyeti | ...google.endSensitivity |
(ayarlanmamış) |
| Sessizlik süresi | ...google.silenceDurationMs |
(ayarlanmamış) |
| Etkinlik işleme | ...google.activityHandling |
Google varsayılanı, start-of-activity-interrupts |
| Tur kapsamı | ...google.turnCoverage |
Google varsayılanı, only-activity |
| Otomatik VAD'yi devre dışı bırak | ...google.automaticActivityDetectionDisabled |
false |
| Oturum sürdürme | ...google.sessionResumption |
true |
| Bağlam sıkıştırma | ...google.contextWindowCompression |
true |
| API anahtarı | ...google.apiKey |
models.providers.google.apiKey, GEMINI_API_KEY veya GOOGLE_API_KEY değerine geri döner |
Voice Call realtime yapılandırma örneği:
{ plugins: { entries: { "voice-call": { enabled: true, config: { realtime: { enabled: true, provider: "google", providers: { google: { model: "gemini-2.5-flash-native-audio-preview-12-2025", speakerVoice: "Kore", activityHandling: "start-of-activity-interrupts", turnCoverage: "only-activity", }, }, }, }, }, }, },}Bakımcı canlı doğrulaması için şunu çalıştırın:
OPENAI_API_KEY=... GEMINI_API_KEY=... node --import tsx scripts/dev/realtime-talk-live-smoke.ts.
Smoke testi OpenAI backend/WebRTC yollarını da kapsar; Google ayağı, Control UI Talk tarafından kullanılan
aynı sınırlı Live API token biçimini üretir, tarayıcı WebSocket uç noktasını açar,
ilk kurulum yükünü gönderir ve setupComplete bekler.
Gelişmiş yapılandırma
Doğrudan Gemini önbellek yeniden kullanımı
Doğrudan Gemini API çalıştırmaları (api: "google-generative-ai") için OpenClaw,
yapılandırılmış bir cachedContent tanıtıcısını Gemini isteklerine iletir.
- Model başına veya genel parametreleri
cachedContentya da eskicached_contentile yapılandırın - İkisi de varsa
cachedContentkazanır - Örnek değer:
cachedContents/prebuilt-context - Gemini önbellek isabeti kullanımı, yukarı akış
cachedContentTokenCountdeğerinden OpenClawcacheReadiçine normalleştirilir
{ agents: { defaults: { models: { "google/gemini-2.5-pro": { params: { cachedContent: "cachedContents/prebuilt-context", }, }, }, }, },}Gemini CLI kullanım notları
google-gemini-cli OAuth sağlayıcısı kullanılırken OpenClaw, varsayılan olarak Gemini
CLI stream-json çıktısını kullanır ve kullanımı son stats yükünden normalleştirir.
Eski --output-format json geçersiz kılmaları yine JSON ayrıştırıcısını kullanır.
- Akışlı yanıt metni assistant
messageolaylarından gelir. - Eski JSON çıktısı için yanıt metni CLI JSON
responsealanından gelir. - CLI
usagedeğerini boş bıraktığında kullanımstatsdeğerine geri döner. stats.cached, OpenClawcacheReadiçine normalleştirilir.stats.inputeksikse OpenClaw, giriş token'larınıstats.input_tokens - stats.cacheddeğerinden türetir.
Ortam ve daemon kurulumu
Gateway bir daemon (launchd/systemd) olarak çalışıyorsa GEMINI_API_KEY
değerinin bu işlem için kullanılabilir olduğundan emin olun (örneğin ~/.openclaw/.env
içinde veya env.shellEnv üzerinden).
İlgili
Sağlayıcıları, model başvurularını ve yük devretme davranışını seçme.
Paylaşılan görüntü aracı parametreleri ve sağlayıcı seçimi.
Paylaşılan video aracı parametreleri ve sağlayıcı seçimi.
Paylaşılan müzik aracı parametreleri ve sağlayıcı seçimi.