Перейти до основного вмісту

Google (Gemini)

Plugin Google надає доступ до моделей Gemini через Google AI Studio, а також генерацію зображень, розуміння медіа (зображення/аудіо/відео) і вебпошук через Gemini Grounding.
  • Провайдер: google
  • Автентифікація: GEMINI_API_KEY або GOOGLE_API_KEY
  • API: Google Gemini API
  • Альтернативний провайдер: google-gemini-cli (OAuth)

Початок роботи

Виберіть бажаний спосіб автентифікації та виконайте кроки налаштування.
Найкраще підходить для: стандартного доступу до Gemini API через Google AI Studio.
1

Запустіть онбординг

openclaw onboard --auth-choice gemini-api-key
Або передайте ключ безпосередньо:
openclaw onboard --non-interactive \
  --mode local \
  --auth-choice gemini-api-key \
  --gemini-api-key "$GEMINI_API_KEY"
2

Установіть модель за замовчуванням

{
  agents: {
    defaults: {
      model: { primary: "google/gemini-3.1-pro-preview" },
    },
  },
}
3

Переконайтеся, що модель доступна

openclaw models list --provider google
Змінні середовища GEMINI_API_KEY і GOOGLE_API_KEY обидві підтримуються. Використовуйте ту, яка у вас уже налаштована.

Можливості

МожливістьПідтримується
Чат-комплішениТак
Генерація зображеньТак
Генерація музикиТак
Розуміння зображеньТак
Транскрипція аудіоТак
Розуміння відеоТак
Вебпошук (Grounding)Так
Thinking/reasoningТак (Gemini 3.1+)
Моделі Gemma 4Так
Моделі Gemma 4 (наприклад, gemma-4-26b-a4b-it) підтримують режим thinking. OpenClaw перезаписує thinkingBudget у підтримуваний Google thinkingLevel для Gemma 4. Установлення thinking у off зберігає вимкнений thinking замість зіставлення з MINIMAL.

Генерація зображень

Вбудований провайдер генерації зображень google за замовчуванням використовує google/gemini-3.1-flash-image-preview.
  • Також підтримує google/gemini-3-pro-image-preview
  • Генерація: до 4 зображень на запит
  • Режим редагування: увімкнено, до 5 вхідних зображень
  • Керування геометрією: size, aspectRatio і resolution
Щоб використовувати Google як провайдер зображень за замовчуванням:
{
  agents: {
    defaults: {
      imageGenerationModel: {
        primary: "google/gemini-3.1-flash-image-preview",
      },
    },
  },
}
Див. Генерація зображень щодо спільних параметрів інструмента, вибору провайдера та поведінки failover.

Генерація відео

Вбудований Plugin google також реєструє генерацію відео через спільний інструмент video_generate.
  • Модель відео за замовчуванням: google/veo-3.1-fast-generate-preview
  • Режими: text-to-video, image-to-video і потоки з посиланням на одне відео
  • Підтримує aspectRatio, resolution і audio
  • Поточне обмеження тривалості: від 4 до 8 секунд
Щоб використовувати Google як провайдер відео за замовчуванням:
{
  agents: {
    defaults: {
      videoGenerationModel: {
        primary: "google/veo-3.1-fast-generate-preview",
      },
    },
  },
}
Див. Генерація відео щодо спільних параметрів інструмента, вибору провайдера та поведінки failover.

Генерація музики

Вбудований Plugin google також реєструє генерацію музики через спільний інструмент music_generate.
  • Модель музики за замовчуванням: google/lyria-3-clip-preview
  • Також підтримує google/lyria-3-pro-preview
  • Керування запитом: lyrics і instrumental
  • Формат виводу: mp3 за замовчуванням, а також wav у google/lyria-3-pro-preview
  • Вхідні дані-посилання: до 10 зображень
  • Запуски з підтримкою сесій відокремлюються через спільний потік task/status, включно з action: "status"
Щоб використовувати Google як провайдер музики за замовчуванням:
{
  agents: {
    defaults: {
      musicGenerationModel: {
        primary: "google/lyria-3-clip-preview",
      },
    },
  },
}
Див. Генерація музики щодо спільних параметрів інструмента, вибору провайдера та поведінки failover.

Розширене налаштування

Для прямих запусків Gemini API (api: "google-generative-ai"), OpenClaw передає налаштований дескриптор cachedContent у запити до Gemini.
  • Налаштовуйте параметри для окремої моделі або глобальні параметри через cachedContent або застарілий cached_content
  • Якщо присутні обидва, перевага надається cachedContent
  • Приклад значення: cachedContents/prebuilt-context
  • Використання Gemini cache-hit нормалізується в OpenClaw cacheRead із висхідного cachedContentTokenCount
{
  agents: {
    defaults: {
      models: {
        "google/gemini-2.5-pro": {
          params: {
            cachedContent: "cachedContents/prebuilt-context",
          },
        },
      },
    },
  },
}
Під час використання OAuth-провайдера google-gemini-cli, OpenClaw нормалізує JSON-вивід CLI таким чином:
  • Текст відповіді береться з поля CLI JSON response.
  • Використання повертається до stats, коли CLI залишає usage порожнім.
  • stats.cached нормалізується в OpenClaw cacheRead.
  • Якщо stats.input відсутній, OpenClaw обчислює вхідні токени з stats.input_tokens - stats.cached.
Якщо Gateway працює як демон (launchd/systemd), переконайтеся, що GEMINI_API_KEY доступний цьому процесу (наприклад, у ~/.openclaw/.env або через env.shellEnv).

Пов’язане

Вибір моделі

Вибір провайдерів, посилань на моделі та поведінки failover.

Генерація зображень

Спільні параметри інструмента зображень і вибір провайдера.

Генерація відео

Спільні параметри інструмента відео і вибір провайдера.

Генерація музики

Спільні параметри інструмента музики і вибір провайдера.