Saltar al contenido principal

Google (Gemini)

El Plugin de Google proporciona acceso a modelos Gemini a través de Google AI Studio, además de generación de imágenes, comprensión multimedia (imagen/audio/video) y búsqueda web mediante Gemini Grounding.
  • Provider: google
  • Auth: GEMINI_API_KEY o GOOGLE_API_KEY
  • API: API de Google Gemini
  • Proveedor alternativo: google-gemini-cli (OAuth)

Primeros pasos

Elige tu método de autenticación preferido y sigue los pasos de configuración.
Ideal para: acceso estándar a la API de Gemini mediante Google AI Studio.
1

Run onboarding

openclaw onboard --auth-choice gemini-api-key
O pasa la clave directamente:
openclaw onboard --non-interactive \
  --mode local \
  --auth-choice gemini-api-key \
  --gemini-api-key "$GEMINI_API_KEY"
2

Set a default model

{
  agents: {
    defaults: {
      model: { primary: "google/gemini-3.1-pro-preview" },
    },
  },
}
3

Verify the model is available

openclaw models list --provider google
Se aceptan ambas variables de entorno, GEMINI_API_KEY y GOOGLE_API_KEY. Usa la que ya tengas configurada.

Capacidades

CapabilitySupported
Chat completions
Image generation
Music generation
Image understanding
Audio transcription
Video understanding
Web search (Grounding)
Thinking/reasoningSí (Gemini 3.1+)
Gemma 4 models
Los modelos Gemma 4 (por ejemplo, gemma-4-26b-a4b-it) admiten modo thinking. OpenClaw reescribe thinkingBudget a un thinkingLevel de Google compatible para Gemma 4. Configurar thinking en off conserva thinking deshabilitado en lugar de asignarlo a MINIMAL.

Generación de imágenes

El proveedor de generación de imágenes google integrado usa por defecto google/gemini-3.1-flash-image-preview.
  • También admite google/gemini-3-pro-image-preview
  • Generación: hasta 4 imágenes por solicitud
  • Modo de edición: habilitado, hasta 5 imágenes de entrada
  • Controles de geometría: size, aspectRatio y resolution
Para usar Google como proveedor de imágenes predeterminado:
{
  agents: {
    defaults: {
      imageGenerationModel: {
        primary: "google/gemini-3.1-flash-image-preview",
      },
    },
  },
}
Consulta Generación de imágenes para ver parámetros compartidos de herramientas, selección de proveedor y comportamiento de failover.

Generación de video

El Plugin google integrado también registra la generación de video mediante la herramienta compartida video_generate.
  • Modelo de video predeterminado: google/veo-3.1-fast-generate-preview
  • Modos: texto a video, imagen a video y flujos de referencia de video único
  • Admite aspectRatio, resolution y audio
  • Límite actual de duración: de 4 a 8 segundos
Para usar Google como proveedor de video predeterminado:
{
  agents: {
    defaults: {
      videoGenerationModel: {
        primary: "google/veo-3.1-fast-generate-preview",
      },
    },
  },
}
Consulta Generación de video para ver parámetros compartidos de herramientas, selección de proveedor y comportamiento de failover.

Generación de música

El Plugin google integrado también registra la generación de música mediante la herramienta compartida music_generate.
  • Modelo de música predeterminado: google/lyria-3-clip-preview
  • También admite google/lyria-3-pro-preview
  • Controles del prompt: lyrics e instrumental
  • Formato de salida: mp3 por defecto, además de wav en google/lyria-3-pro-preview
  • Entradas de referencia: hasta 10 imágenes
  • Las ejecuciones con respaldo de sesión se desacoplan mediante el flujo compartido de tarea/estado, incluido action: "status"
Para usar Google como proveedor de música predeterminado:
{
  agents: {
    defaults: {
      musicGenerationModel: {
        primary: "google/lyria-3-clip-preview",
      },
    },
  },
}
Consulta Generación de música para ver parámetros compartidos de herramientas, selección de proveedor y comportamiento de failover.

Configuración avanzada

Para ejecuciones directas de la API de Gemini (api: "google-generative-ai"), OpenClaw pasa un identificador cachedContent configurado a las solicitudes de Gemini.
  • Configura parámetros por modelo o globales con cachedContent o el heredado cached_content
  • Si ambos están presentes, cachedContent tiene prioridad
  • Valor de ejemplo: cachedContents/prebuilt-context
  • El uso con acierto de caché de Gemini se normaliza en OpenClaw como cacheRead a partir de cachedContentTokenCount del upstream
{
  agents: {
    defaults: {
      models: {
        "google/gemini-2.5-pro": {
          params: {
            cachedContent: "cachedContents/prebuilt-context",
          },
        },
      },
    },
  },
}
Al usar el proveedor OAuth google-gemini-cli, OpenClaw normaliza la salida JSON de la CLI de la siguiente manera:
  • El texto de respuesta proviene del campo JSON response de la CLI.
  • El uso recurre a stats cuando la CLI deja usage vacío.
  • stats.cached se normaliza como cacheRead en OpenClaw.
  • Si falta stats.input, OpenClaw deriva los tokens de entrada a partir de stats.input_tokens - stats.cached.
Si el Gateway se ejecuta como daemon (launchd/systemd), asegúrate de que GEMINI_API_KEY esté disponible para ese proceso (por ejemplo, en ~/.openclaw/.env o mediante env.shellEnv).

Relacionado

Selección de modelos

Elegir proveedores, referencias de modelos y comportamiento de failover.

Generación de imágenes

Parámetros compartidos de la herramienta de imágenes y selección de proveedor.

Generación de video

Parámetros compartidos de la herramienta de video y selección de proveedor.

Generación de música

Parámetros compartidos de la herramienta de música y selección de proveedor.