Перейти до основного вмісту

Google (Gemini)

Плагін Google надає доступ до моделей Gemini через Google AI Studio, а також до генерації зображень, розуміння медіа (зображення/аудіо/відео) і вебпошуку через Gemini Grounding.
  • Провайдер: google
  • Автентифікація: GEMINI_API_KEY або GOOGLE_API_KEY
  • API: Google Gemini API

Швидкий старт

  1. Установіть ключ API:
openclaw onboard --auth-choice gemini-api-key
  1. Установіть модель за замовчуванням:
{
  agents: {
    defaults: {
      model: { primary: "google/gemini-3.1-pro-preview" },
    },
  },
}

Неінтерактивний приклад

openclaw onboard --non-interactive \
  --mode local \
  --auth-choice gemini-api-key \
  --gemini-api-key "$GEMINI_API_KEY"

Можливості

МожливістьПідтримується
Завершення чатуТак
Генерація зображеньТак
Розуміння зображеньТак
Транскрибування аудіоТак
Розуміння відеоТак
Вебпошук (Grounding)Так
Мислення/міркуванняТак (Gemini 3.1+)

Пряме повторне використання кешу Gemini

Для прямих запусків Gemini API (api: "google-generative-ai") OpenClaw тепер передає налаштований дескриптор cachedContent у запити Gemini.
  • Налаштуйте параметри для окремої моделі або глобально, використовуючи cachedContent або застарілий cached_content
  • Якщо присутні обидва, пріоритет має cachedContent
  • Приклад значення: cachedContents/prebuilt-context
  • Використання Gemini cache-hit нормалізується в OpenClaw як cacheRead з вихідного cachedContentTokenCount
Приклад:
{
  agents: {
    defaults: {
      models: {
        "google/gemini-2.5-pro": {
          params: {
            cachedContent: "cachedContents/prebuilt-context",
          },
        },
      },
    },
  },
}

Генерація зображень

Вбудований провайдер генерації зображень google за замовчуванням використовує google/gemini-3.1-flash-image-preview.
  • Також підтримує google/gemini-3-pro-image-preview
  • Генерація: до 4 зображень на запит
  • Режим редагування: увімкнено, до 5 вхідних зображень
  • Керування геометрією: size, aspectRatio і resolution
Генерація зображень, розуміння медіа та Gemini Grounding усі залишаються на ідентифікаторі провайдера google. Щоб використовувати Google як провайдера зображень за замовчуванням:
{
  agents: {
    defaults: {
      imageGenerationModel: {
        primary: "google/gemini-3.1-flash-image-preview",
      },
    },
  },
}
Див. Генерація зображень щодо спільних параметрів інструмента, вибору провайдера та поведінки резервного перемикання.

Генерація відео

Вбудований плагін google також реєструє генерацію відео через спільний інструмент video_generate.
  • Модель відео за замовчуванням: google/veo-3.1-fast-generate-preview
  • Режими: text-to-video, image-to-video і потоки з посиланням на одне відео
  • Підтримує aspectRatio, resolution і audio
  • Поточне обмеження тривалості: від 4 до 8 секунд
Щоб використовувати Google як провайдера відео за замовчуванням:
{
  agents: {
    defaults: {
      videoGenerationModel: {
        primary: "google/veo-3.1-fast-generate-preview",
      },
    },
  },
}
Див. Генерація відео щодо спільних параметрів інструмента, вибору провайдера та поведінки резервного перемикання.

Примітка про середовище

Якщо Gateway працює як демон (launchd/systemd), переконайтеся, що GEMINI_API_KEY доступний для цього процесу (наприклад, у ~/.openclaw/.env або через env.shellEnv).