Zum Hauptinhalt springen

Google (Gemini)

Das Google-Plugin bietet Zugriff auf Gemini-Modelle über Google AI Studio sowie Bildgenerierung, Medienverständnis (Bild/Audio/Video) und Websuche über Gemini Grounding.
  • Provider: google
  • Auth: GEMINI_API_KEY oder GOOGLE_API_KEY
  • API: Google Gemini API
  • Alternativer Provider: google-gemini-cli (OAuth)

Erste Schritte

Wählen Sie Ihre bevorzugte Authentifizierungsmethode und folgen Sie den Einrichtungsschritten.
Am besten geeignet für: standardmäßigen Gemini-API-Zugriff über Google AI Studio.
1

Onboarding ausführen

openclaw onboard --auth-choice gemini-api-key
Oder den Schlüssel direkt übergeben:
openclaw onboard --non-interactive \
  --mode local \
  --auth-choice gemini-api-key \
  --gemini-api-key "$GEMINI_API_KEY"
2

Ein Standardmodell festlegen

{
  agents: {
    defaults: {
      model: { primary: "google/gemini-3.1-pro-preview" },
    },
  },
}
3

Prüfen, ob das Modell verfügbar ist

openclaw models list --provider google
Die Umgebungsvariablen GEMINI_API_KEY und GOOGLE_API_KEY werden beide akzeptiert. Verwenden Sie diejenige, die Sie bereits konfiguriert haben.

Fähigkeiten

FähigkeitUnterstützt
Chat CompletionsJa
BildgenerierungJa
MusikgenerierungJa
BildverständnisJa
AudiotranskriptionJa
VideoverständnisJa
Websuche (Grounding)Ja
Thinking/ReasoningJa (Gemini 3.1+)
Gemma-4-ModelleJa
Gemma-4-Modelle (zum Beispiel gemma-4-26b-a4b-it) unterstützen den Thinking-Modus. OpenClaw schreibt thinkingBudget für Gemma 4 in ein unterstütztes Google-thinkingLevel um. Wenn Thinking auf off gesetzt wird, bleibt Thinking deaktiviert, statt auf MINIMAL abgebildet zu werden.

Bildgenerierung

Der gebündelte Provider google für Bildgenerierung verwendet standardmäßig google/gemini-3.1-flash-image-preview.
  • Unterstützt außerdem google/gemini-3-pro-image-preview
  • Generieren: bis zu 4 Bilder pro Anfrage
  • Bearbeitungsmodus: aktiviert, bis zu 5 Eingabebilder
  • Geometriesteuerungen: size, aspectRatio und resolution
So verwenden Sie Google als Standard-Provider für Bilder:
{
  agents: {
    defaults: {
      imageGenerationModel: {
        primary: "google/gemini-3.1-flash-image-preview",
      },
    },
  },
}
Siehe Bildgenerierung für gemeinsame Tool-Parameter, Providerauswahl und Failover-Verhalten.

Videogenerierung

Das gebündelte Plugin google registriert außerdem Videogenerierung über das gemeinsame Tool video_generate.
  • Standard-Videomodell: google/veo-3.1-fast-generate-preview
  • Modi: Text-zu-Video, Bild-zu-Video und Referenz-Abläufe mit einem einzelnen Video
  • Unterstützt aspectRatio, resolution und audio
  • Aktuelle Begrenzung der Dauer: 4 bis 8 Sekunden
So verwenden Sie Google als Standard-Provider für Video:
{
  agents: {
    defaults: {
      videoGenerationModel: {
        primary: "google/veo-3.1-fast-generate-preview",
      },
    },
  },
}
Siehe Videogenerierung für gemeinsame Tool-Parameter, Providerauswahl und Failover-Verhalten.

Musikgenerierung

Das gebündelte Plugin google registriert außerdem Musikgenerierung über das gemeinsame Tool music_generate.
  • Standard-Musikmodell: google/lyria-3-clip-preview
  • Unterstützt außerdem google/lyria-3-pro-preview
  • Prompt-Steuerungen: lyrics und instrumental
  • Ausgabeformat: standardmäßig mp3, außerdem wav auf google/lyria-3-pro-preview
  • Referenzeingaben: bis zu 10 Bilder
  • Sitzungsgebundene Läufe werden über den gemeinsamen Task-/Status-Ablauf entkoppelt, einschließlich action: "status"
So verwenden Sie Google als Standard-Provider für Musik:
{
  agents: {
    defaults: {
      musicGenerationModel: {
        primary: "google/lyria-3-clip-preview",
      },
    },
  },
}
Siehe Musikgenerierung für gemeinsame Tool-Parameter, Providerauswahl und Failover-Verhalten.

Erweiterte Konfiguration

Für direkte Gemini-API-Läufe (api: "google-generative-ai") übergibt OpenClaw ein konfiguriertes cachedContent-Handle an Gemini-Anfragen.
  • Konfigurieren Sie pro Modell oder global Parameter mit entweder cachedContent oder dem veralteten cached_content
  • Wenn beide vorhanden sind, hat cachedContent Vorrang
  • Beispielwert: cachedContents/prebuilt-context
  • Gemini-Cache-Treffer bei der Nutzung werden von OpenClaw in cacheRead normalisiert, basierend auf dem Upstream-Wert cachedContentTokenCount
{
  agents: {
    defaults: {
      models: {
        "google/gemini-2.5-pro": {
          params: {
            cachedContent: "cachedContents/prebuilt-context",
          },
        },
      },
    },
  },
}
Wenn der OAuth-Provider google-gemini-cli verwendet wird, normalisiert OpenClaw die JSON-Ausgabe der CLI wie folgt:
  • Antworttext stammt aus dem Feld response der CLI-JSON.
  • Die Nutzung fällt auf stats zurück, wenn die CLI usage leer lässt.
  • stats.cached wird in OpenClaw cacheRead normalisiert.
  • Wenn stats.input fehlt, leitet OpenClaw Eingabetokens aus stats.input_tokens - stats.cached ab.
Wenn das Gateway als Daemon läuft (launchd/systemd), stellen Sie sicher, dass GEMINI_API_KEY diesem Prozess zur Verfügung steht (zum Beispiel in ~/.openclaw/.env oder über env.shellEnv).

Verwandt

Modellauswahl

Auswahl von Providern, Modell-Refs und Failover-Verhalten.

Bildgenerierung

Gemeinsame Bild-Tool-Parameter und Providerauswahl.

Videogenerierung

Gemeinsame Video-Tool-Parameter und Providerauswahl.

Musikgenerierung

Gemeinsame Musik-Tool-Parameter und Providerauswahl.