Ana içeriğe atla

Documentation Index

Fetch the complete documentation index at: https://docs.openclaw.ai/llms.txt

Use this file to discover all available pages before exploring further.

Google Plugin’i, Google AI Studio üzerinden Gemini modellerine erişimin yanı sıra görüntü oluşturma, medya anlama (görüntü/ses/video), metinden sese dönüştürme ve Gemini Grounding aracılığıyla web araması sağlar.
  • Sağlayıcı: google
  • Kimlik doğrulama: GEMINI_API_KEY veya GOOGLE_API_KEY
  • API: Google Gemini API
  • Çalışma zamanı seçeneği: sağlayıcı/model agentRuntime.id: "google-gemini-cli" model başvurularını google/* olarak kanonik tutarken Gemini CLI OAuth’u yeniden kullanır.

Başlarken

Tercih ettiğiniz kimlik doğrulama yöntemini seçin ve kurulum adımlarını izleyin.
En uygun kullanım: Google AI Studio üzerinden standart Gemini API erişimi.
1

Run onboarding

openclaw onboard --auth-choice gemini-api-key
Ya da anahtarı doğrudan geçirin:
openclaw onboard --non-interactive \
  --mode local \
  --auth-choice gemini-api-key \
  --gemini-api-key "$GEMINI_API_KEY"
2

Set a default model

{
  agents: {
    defaults: {
      model: { primary: "google/gemini-3.1-pro-preview" },
    },
  },
}
3

Verify the model is available

openclaw models list --provider google
GEMINI_API_KEY ve GOOGLE_API_KEY ortam değişkenlerinin ikisi de kabul edilir. Hangisini zaten yapılandırdıysanız onu kullanın.

Yetenekler

YetenekDestekleniyor
Sohbet tamamlamalarıEvet
Görüntü oluşturmaEvet
Müzik oluşturmaEvet
Metinden seseEvet
Gerçek zamanlı sesEvet (Google Live API)
Görüntü anlamaEvet
Ses transkripsiyonuEvet
Video anlamaEvet
Web araması (Grounding)Evet
Düşünme/akıl yürütmeEvet (Gemini 2.5+ / Gemini 3+)
Gemma 4 modelleriEvet

Web araması

Paketlenen gemini web araması sağlayıcısı, Gemini Google Search grounding kullanır. plugins.entries.google.config.webSearch altında özel bir arama anahtarı yapılandırın ya da GEMINI_API_KEY sonrasında models.providers.google.apiKey değerini yeniden kullanmasına izin verin:
{
  plugins: {
    entries: {
      google: {
        config: {
          webSearch: {
            apiKey: "AIza...", // optional if GEMINI_API_KEY or models.providers.google.apiKey is set
            baseUrl: "https://generativelanguage.googleapis.com/v1beta", // falls back to models.providers.google.baseUrl
            model: "gemini-2.5-flash",
          },
        },
      },
    },
  },
}
Kimlik bilgisi önceliği önce özel webSearch.apiKey, sonra GEMINI_API_KEY, ardından models.providers.google.apiKey şeklindedir. webSearch.baseUrl isteğe bağlıdır ve operatör proxy’leri veya uyumlu Gemini API uç noktaları için bulunur; atlandığında Gemini web araması models.providers.google.baseUrl değerini yeniden kullanır. Sağlayıcıya özgü araç davranışı için Gemini araması bölümüne bakın.
Gemini 3 modelleri thinkingBudget yerine thinkingLevel kullanır. OpenClaw, Gemini 3, Gemini 3.1 ve gemini-*-latest takma ad akıl yürütme denetimlerini thinkingLevel değerine eşler; böylece varsayılan/düşük gecikmeli çalıştırmalar devre dışı thinkingBudget değerleri göndermez./think adaptive, sabit bir OpenClaw seviyesi seçmek yerine Google’ın dinamik düşünme semantiğini korur. Gemini 3 ve Gemini 3.1, Google’ın seviyeyi seçebilmesi için sabit bir thinkingLevel göndermez; Gemini 2.5 ise Google’ın dinamik işaretçisi olan thinkingBudget: -1 değerini gönderir.Gemma 4 modelleri (örneğin gemma-4-26b-a4b-it) düşünme modunu destekler. OpenClaw, Gemma 4 için thinkingBudget değerini desteklenen bir Google thinkingLevel değerine yeniden yazar. Düşünmeyi off olarak ayarlamak, MINIMAL değerine eşlemek yerine düşünmenin devre dışı kalmasını korur.

Görüntü oluşturma

Paketlenen google görüntü oluşturma sağlayıcısı varsayılan olarak google/gemini-3.1-flash-image-preview kullanır.
  • google/gemini-3-pro-image-preview da desteklenir
  • Oluşturma: istek başına en fazla 4 görüntü
  • Düzenleme modu: etkin, en fazla 5 giriş görüntüsü
  • Geometri denetimleri: size, aspectRatio ve resolution
Google’ı varsayılan görüntü sağlayıcısı olarak kullanmak için:
{
  agents: {
    defaults: {
      imageGenerationModel: {
        primary: "google/gemini-3.1-flash-image-preview",
      },
    },
  },
}
Paylaşılan araç parametreleri, sağlayıcı seçimi ve yük devretme davranışı için Görüntü Oluşturma bölümüne bakın.

Video oluşturma

Paketlenen google Plugin’i, paylaşılan video_generate aracı üzerinden video oluşturmayı da kaydeder.
  • Varsayılan video modeli: google/veo-3.1-fast-generate-preview
  • Modlar: metinden videoya, görüntüden videoya ve tek video referans akışları
  • aspectRatio (16:9, 9:16) ve resolution (720P, 1080P) destekler; ses çıktısı bugün Veo tarafından desteklenmez
  • Desteklenen süreler: 4, 6 veya 8 saniye (diğer değerler en yakın izin verilen değere yuvarlanır)
Google’ı varsayılan video sağlayıcısı olarak kullanmak için:
{
  agents: {
    defaults: {
      videoGenerationModel: {
        primary: "google/veo-3.1-fast-generate-preview",
      },
    },
  },
}
Paylaşılan araç parametreleri, sağlayıcı seçimi ve yük devretme davranışı için Video Oluşturma bölümüne bakın.

Müzik oluşturma

Paketlenen google Plugin’i, paylaşılan music_generate aracı üzerinden müzik oluşturmayı da kaydeder.
  • Varsayılan müzik modeli: google/lyria-3-clip-preview
  • google/lyria-3-pro-preview da desteklenir
  • İstem denetimleri: lyrics ve instrumental
  • Çıkış biçimi: varsayılan olarak mp3, ayrıca google/lyria-3-pro-preview üzerinde wav
  • Referans girişleri: en fazla 10 görüntü
  • Oturum destekli çalıştırmalar, action: "status" dahil olmak üzere paylaşılan görev/durum akışı üzerinden ayrılır
Google’ı varsayılan müzik sağlayıcısı olarak kullanmak için:
{
  agents: {
    defaults: {
      musicGenerationModel: {
        primary: "google/lyria-3-clip-preview",
      },
    },
  },
}
Paylaşılan araç parametreleri, sağlayıcı seçimi ve yük devretme davranışı için Müzik Oluşturma bölümüne bakın.

Metinden sese

Paketlenen google konuşma sağlayıcısı, Gemini API TTS yolunu gemini-3.1-flash-tts-preview ile kullanır.
  • Varsayılan ses: Kore
  • Kimlik doğrulama: messages.tts.providers.google.apiKey, models.providers.google.apiKey, GEMINI_API_KEY veya GOOGLE_API_KEY
  • Çıkış: normal TTS ekleri için WAV, sesli not hedefleri için Opus, Talk/telephony için PCM
  • Sesli not çıktısı: Google PCM, WAV olarak sarılır ve ffmpeg ile 48 kHz Opus’a dönüştürülür
Google’ın toplu Gemini TTS yolu, tamamlanmış generateContent yanıtında oluşturulan sesi döndürür. En düşük gecikmeli konuşmalı görüşmeler için toplu TTS yerine Gemini Live API tarafından desteklenen Google gerçek zamanlı ses sağlayıcısını kullanın. Google’ı varsayılan TTS sağlayıcısı olarak kullanmak için:
{
  messages: {
    tts: {
      auto: "always",
      provider: "google",
      providers: {
        google: {
          model: "gemini-3.1-flash-tts-preview",
          voiceName: "Kore",
          audioProfile: "Speak professionally with a calm tone.",
        },
      },
    },
  },
}
Gemini API TTS, stil denetimi için doğal dil istemleri kullanır. Konuşulan metinden önce yeniden kullanılabilir bir stil istemi eklemek için audioProfile ayarlayın. İstem metniniz adlandırılmış bir konuşmacıya atıfta bulunuyorsa speakerName ayarlayın. Gemini API TTS ayrıca metinde [whispers] veya [laughs] gibi ifadeli köşeli parantez ses etiketlerini kabul eder. Etiketleri görünür sohbet yanıtının dışında tutarken TTS’ye göndermek için bunları bir [[tts:text]]...[[/tts:text]] bloğunun içine koyun:
Here is the clean reply text.

[[tts:text]][whispers] Here is the spoken version.[[/tts:text]]
Gemini API ile sınırlandırılmış bir Google Cloud Console API anahtarı bu sağlayıcı için geçerlidir. Bu, ayrı Cloud Text-to-Speech API yolu değildir.

Gerçek zamanlı ses

Paketlenen google Plugin’i, Voice Call ve Google Meet gibi arka uç ses köprüleri için Gemini Live API tarafından desteklenen bir gerçek zamanlı ses sağlayıcısı kaydeder.
AyarYapılandırma yoluVarsayılan
Modelplugins.entries.voice-call.config.realtime.providers.google.modelgemini-2.5-flash-native-audio-preview-12-2025
Ses...google.voiceKore
Sıcaklık...google.temperature(ayarlanmamış)
VAD başlangıç hassasiyeti...google.startSensitivity(ayarlanmamış)
VAD bitiş hassasiyeti...google.endSensitivity(ayarlanmamış)
Sessizlik süresi...google.silenceDurationMs(ayarlanmamış)
Etkinlik işleme...google.activityHandlingGoogle varsayılanı, start-of-activity-interrupts
Tur kapsamı...google.turnCoverageGoogle varsayılanı, only-activity
Otomatik VAD’yi devre dışı bırak...google.automaticActivityDetectionDisabledfalse
Oturum sürdürme...google.sessionResumptiontrue
Bağlam sıkıştırma...google.contextWindowCompressiontrue
API anahtarı...google.apiKeymodels.providers.google.apiKey, GEMINI_API_KEY veya GOOGLE_API_KEY değerine geri döner
Örnek Voice Call gerçek zamanlı yapılandırması:
{
  plugins: {
    entries: {
      "voice-call": {
        enabled: true,
        config: {
          realtime: {
            enabled: true,
            provider: "google",
            providers: {
              google: {
                model: "gemini-2.5-flash-native-audio-preview-12-2025",
                voice: "Kore",
                activityHandling: "start-of-activity-interrupts",
                turnCoverage: "only-activity",
              },
            },
          },
        },
      },
    },
  },
}
Google Live API, WebSocket üzerinden çift yönlü ses ve işlev çağırma kullanır. OpenClaw, telefon/Meet köprüsü sesini Gemini’nin PCM Live API akışına uyarlar ve araç çağrılarını paylaşılan gerçek zamanlı ses sözleşmesinde tutar. Örnekleme değişikliklerine ihtiyacınız yoksa temperature değerini ayarlanmamış bırakın; OpenClaw pozitif olmayan değerleri atlar çünkü Google Live, temperature: 0 için ses olmadan transkript döndürebilir. Gemini API transkripsiyonu languageCodes olmadan etkinleştirilir; mevcut Google SDK, bu API yolunda dil kodu ipuçlarını reddeder.
Control UI Talk, kısıtlı tek kullanımlık belirteçlerle Google Live tarayıcı oturumlarını destekler. Yalnızca arka uç gerçek zamanlı ses sağlayıcıları, sağlayıcı kimlik bilgilerini Gateway’de tutan genel Gateway aktarma taşıması üzerinden de çalışabilir.
Bakımcı canlı doğrulaması için OPENAI_API_KEY=... GEMINI_API_KEY=... node --import tsx scripts/dev/realtime-talk-live-smoke.ts çalıştırın. Smoke, OpenAI arka uç/WebRTC yollarını da kapsar; Google ayağı, Control UI Talk tarafından kullanılan aynı kısıtlı Live API belirteci şeklini üretir, tarayıcı WebSocket uç noktasını açar, ilk kurulum yükünü gönderir ve setupComplete için bekler.

Gelişmiş yapılandırma

Doğrudan Gemini API çalıştırmaları (api: "google-generative-ai") için OpenClaw, yapılandırılmış bir cachedContent tanıtıcısını Gemini isteklerine geçirir.
  • Model başına veya genel parametreleri cachedContent ya da eski cached_content ile yapılandırın
  • İkisi de varsa cachedContent kazanır
  • Örnek değer: cachedContents/prebuilt-context
  • Gemini önbellek isabeti kullanımı, yukarı akış cachedContentTokenCount değerinden OpenClaw cacheRead içine normalize edilir
{
  agents: {
    defaults: {
      models: {
        "google/gemini-2.5-pro": {
          params: {
            cachedContent: "cachedContents/prebuilt-context",
          },
        },
      },
    },
  },
}
google-gemini-cli OAuth sağlayıcısı kullanılırken OpenClaw, CLI JSON çıktısını aşağıdaki şekilde normalize eder:
  • Yanıt metni, CLI JSON response alanından gelir.
  • CLI usage değerini boş bıraktığında kullanım stats değerine geri döner.
  • stats.cached, OpenClaw cacheRead içine normalize edilir.
  • stats.input eksikse OpenClaw, giriş belirteçlerini stats.input_tokens - stats.cached değerinden türetir.
Gateway bir daemon (launchd/systemd) olarak çalışıyorsa GEMINI_API_KEY değerinin bu süreç tarafından kullanılabildiğinden emin olun (örneğin, ~/.openclaw/.env içinde veya env.shellEnv üzerinden).

İlgili

Model seçimi

Sağlayıcıları, model referanslarını ve yük devretme davranışını seçme.

Görüntü oluşturma

Paylaşılan görüntü aracı parametreleri ve sağlayıcı seçimi.

Video oluşturma

Paylaşılan video aracı parametreleri ve sağlayıcı seçimi.

Müzik oluşturma

Paylaşılan müzik aracı parametreleri ve sağlayıcı seçimi.