Ana içeriğe atla

Google (Gemini)

Google Plugin, Google AI Studio üzerinden Gemini modellere erişim sağlar; ayrıca Gemini Grounding aracılığıyla görüntü oluşturma, medya anlama (görüntü/ses/video), metinden konuşma ve web aramayı da destekler.
  • Sağlayıcı: google
  • Kimlik doğrulama: GEMINI_API_KEY veya GOOGLE_API_KEY
  • API: Google Gemini API
  • Alternatif sağlayıcı: google-gemini-cli (OAuth)

Başlarken

Tercih ettiğiniz kimlik doğrulama yöntemini seçin ve kurulum adımlarını izleyin.
En uygunu: Google AI Studio üzerinden standart Gemini API erişimi.
1

Onboarding'i çalıştırın

openclaw onboard --auth-choice gemini-api-key
Ya da anahtarı doğrudan iletin:
openclaw onboard --non-interactive \
  --mode local \
  --auth-choice gemini-api-key \
  --gemini-api-key "$GEMINI_API_KEY"
2

Varsayılan bir model ayarlayın

{
  agents: {
    defaults: {
      model: { primary: "google/gemini-3.1-pro-preview" },
    },
  },
}
3

Modelin kullanılabilir olduğunu doğrulayın

openclaw models list --provider google
GEMINI_API_KEY ve GOOGLE_API_KEY ortam değişkenlerinin ikisi de kabul edilir. Halihazırda yapılandırmış olduğunuzu kullanın.

Yetenekler

YetenekDestek durumu
Sohbet tamamlamaEvet
Görüntü oluşturmaEvet
Müzik oluşturmaEvet
Metinden konuşmaEvet
Görüntü anlamaEvet
Ses transkripsiyonuEvet
Video anlamaEvet
Web arama (Grounding)Evet
Thinking/reasoningEvet (Gemini 2.5+ / Gemini 3+)
Gemma 4 modelleriEvet
Gemini 3 modelleri thinkingBudget yerine thinkingLevel kullanır. OpenClaw, varsayılan/düşük gecikmeli çalıştırmalarda devre dışı bırakılmış thinkingBudget değerleri gönderilmesin diye Gemini 3, Gemini 3.1 ve gemini-*-latest takma ad reasoning denetimlerini thinkingLevel ile eşler.Gemma 4 modelleri (örneğin gemma-4-26b-a4b-it) thinking modunu destekler. OpenClaw, thinkingBudget değerini Gemma 4 için desteklenen bir Google thinkingLevel değerine yeniden yazar. Thinking’i off olarak ayarlamak, bunu MINIMAL değerine eşlemek yerine devre dışı bırakılmış halde korur.

Görüntü oluşturma

Paketlenmiş google görüntü oluşturma sağlayıcısı varsayılan olarak google/gemini-3.1-flash-image-preview kullanır.
  • google/gemini-3-pro-image-preview da desteklenir
  • Oluşturma: istek başına en fazla 4 görüntü
  • Düzenleme modu: etkin, en fazla 5 giriş görüntüsü
  • Geometri denetimleri: size, aspectRatio ve resolution
Google’ı varsayılan görüntü sağlayıcısı olarak kullanmak için:
{
  agents: {
    defaults: {
      imageGenerationModel: {
        primary: "google/gemini-3.1-flash-image-preview",
      },
    },
  },
}
Paylaşılan araç parametreleri, sağlayıcı seçimi ve yük devretme davranışı için Image Generation bölümüne bakın.

Video oluşturma

Paketlenmiş google Plugin’i, paylaşılan video_generate aracı üzerinden video oluşturmayı da kaydeder.
  • Varsayılan video modeli: google/veo-3.1-fast-generate-preview
  • Modlar: metinden videoya, görüntüden videoya ve tek-video referans akışları
  • aspectRatio, resolution ve audio desteklenir
  • Geçerli süre sınırlaması: 4 ila 8 saniye
Google’ı varsayılan video sağlayıcısı olarak kullanmak için:
{
  agents: {
    defaults: {
      videoGenerationModel: {
        primary: "google/veo-3.1-fast-generate-preview",
      },
    },
  },
}
Paylaşılan araç parametreleri, sağlayıcı seçimi ve yük devretme davranışı için Video Generation bölümüne bakın.

Müzik oluşturma

Paketlenmiş google Plugin’i, paylaşılan music_generate aracı üzerinden müzik oluşturmayı da kaydeder.
  • Varsayılan müzik modeli: google/lyria-3-clip-preview
  • google/lyria-3-pro-preview da desteklenir
  • İstem denetimleri: lyrics ve instrumental
  • Çıkış biçimi: varsayılan olarak mp3, ayrıca google/lyria-3-pro-preview için wav
  • Referans girdileri: en fazla 10 görüntü
  • Oturum destekli çalıştırmalar, action: "status" dahil olmak üzere paylaşılan görev/durum akışı üzerinden ayrılır
Google’ı varsayılan müzik sağlayıcısı olarak kullanmak için:
{
  agents: {
    defaults: {
      musicGenerationModel: {
        primary: "google/lyria-3-clip-preview",
      },
    },
  },
}
Paylaşılan araç parametreleri, sağlayıcı seçimi ve yük devretme davranışı için Music Generation bölümüne bakın.

Metinden konuşma

Paketlenmiş google konuşma sağlayıcısı, Gemini API TTS yolunu gemini-3.1-flash-tts-preview ile kullanır.
  • Varsayılan ses: Kore
  • Kimlik doğrulama: messages.tts.providers.google.apiKey, models.providers.google.apiKey, GEMINI_API_KEY veya GOOGLE_API_KEY
  • Çıkış: normal TTS ekleri için WAV, Talk/telefon için PCM
  • Yerel sesli not çıktısı: API Opus yerine PCM döndürdüğü için bu Gemini API yolunda desteklenmez
Google’ı varsayılan TTS sağlayıcısı olarak kullanmak için:
{
  messages: {
    tts: {
      auto: "always",
      provider: "google",
      providers: {
        google: {
          model: "gemini-3.1-flash-tts-preview",
          voiceName: "Kore",
        },
      },
    },
  },
}
Gemini API TTS, metin içinde [whispers] veya [laughs] gibi ifade odaklı köşeli parantezli ses etiketlerini kabul eder. Etiketleri görünür sohbet yanıtının dışında tutup TTS’e göndermek için bunları bir [[tts:text]]...[[/tts:text]] bloğu içine yerleştirin:
İşte temiz yanıt metni.

[[tts:text]][whispers] İşte seslendirilen sürüm.[[/tts:text]]
Gemini API ile sınırlandırılmış bir Google Cloud Console API anahtarı bu sağlayıcı için geçerlidir. Bu, ayrı Cloud Text-to-Speech API yolu değildir.

Gelişmiş yapılandırma

Doğrudan Gemini API çalıştırmaları için (api: "google-generative-ai"), OpenClaw yapılandırılmış bir cachedContent tanıtıcısını Gemini isteklerine iletir.
  • Model bazında veya genel parametreleri cachedContent ya da eski cached_content ile yapılandırın
  • Her ikisi de varsa cachedContent önceliklidir
  • Örnek değer: cachedContents/prebuilt-context
  • Gemini önbellek isabeti kullanımı, üst akıştaki cachedContentTokenCount değerinden OpenClaw cacheRead içine normalize edilir
{
  agents: {
    defaults: {
      models: {
        "google/gemini-2.5-pro": {
          params: {
            cachedContent: "cachedContents/prebuilt-context",
          },
        },
      },
    },
  },
}
google-gemini-cli OAuth sağlayıcısını kullanırken, OpenClaw CLI JSON çıktısını şu şekilde normalize eder:
  • Yanıt metni CLI JSON response alanından gelir.
  • CLI usage alanını boş bırakırsa kullanım bilgisi stats alanına geri döner.
  • stats.cached, OpenClaw cacheRead içine normalize edilir.
  • stats.input eksikse OpenClaw giriş tokenlarını stats.input_tokens - stats.cached üzerinden türetir.
Gateway bir daemon olarak çalışıyorsa (launchd/systemd), GEMINI_API_KEY değerinin bu süreç için kullanılabilir olduğundan emin olun (örneğin ~/.openclaw/.env içinde veya env.shellEnv aracılığıyla).

İlgili

Model seçimi

Sağlayıcıları, model referanslarını ve yük devretme davranışını seçme.

Görüntü oluşturma

Paylaşılan görüntü aracı parametreleri ve sağlayıcı seçimi.

Video oluşturma

Paylaşılan video aracı parametreleri ve sağlayıcı seçimi.

Müzik oluşturma

Paylaşılan müzik aracı parametreleri ve sağlayıcı seçimi.