De Google-Plugin biedt toegang tot Gemini-modellen via Google AI Studio, plus beeldgeneratie, mediabegrip (afbeelding/audio/video), tekst-naar-spraak en webzoekopdrachten via Gemini Grounding.Documentation Index
Fetch the complete documentation index at: https://docs.openclaw.ai/llms.txt
Use this file to discover all available pages before exploring further.
- Provider:
google - Authenticatie:
GEMINI_API_KEYofGOOGLE_API_KEY - API: Google Gemini API
- Runtime-optie:
agents.defaults.agentRuntime.id: "google-gemini-cli"hergebruikt Gemini CLI OAuth terwijl modelverwijzingen canoniek blijven alsgoogle/*.
Aan de slag
Kies je gewenste authenticatiemethode en volg de installatiestappen.- API-sleutel
- Gemini CLI (OAuth)
Mogelijkheden
| Mogelijkheid | Ondersteund |
|---|---|
| Chatvoltooiingen | Ja |
| Beeldgeneratie | Ja |
| Muziekgeneratie | Ja |
| Tekst-naar-spraak | Ja |
| Realtime spraak | Ja (Google Live API) |
| Afbeeldingsbegrip | Ja |
| Audiotranscriptie | Ja |
| Videobegrip | Ja |
| Webzoekopdracht (Grounding) | Ja |
| Denken/redeneren | Ja (Gemini 2.5+ / Gemini 3+) |
| Gemma 4-modellen | Ja |
Beeldgeneratie
De meegeleverdegoogle-provider voor beeldgeneratie gebruikt standaard
google/gemini-3.1-flash-image-preview.
- Ondersteunt ook
google/gemini-3-pro-image-preview - Genereren: maximaal 4 afbeeldingen per aanvraag
- Bewerkmodus: ingeschakeld, maximaal 5 invoerafbeeldingen
- Geometrie-instellingen:
size,aspectRatioenresolution
Zie Beeldgeneratie voor gedeelde toolparameters, providerselectie en failovergedrag.
Videogeneratie
De meegeleverdegoogle-Plugin registreert ook videogeneratie via de gedeelde
video_generate-tool.
- Standaardvideomodel:
google/veo-3.1-fast-generate-preview - Modi: tekst-naar-video, afbeelding-naar-video en referentieflows met één video
- Ondersteunt
aspectRatio,resolutionenaudio - Huidige duurklem: 4 tot 8 seconden
Zie Videogeneratie voor gedeelde toolparameters, providerselectie en failovergedrag.
Muziekgeneratie
De meegeleverdegoogle-Plugin registreert ook muziekgeneratie via de gedeelde
music_generate-tool.
- Standaardmuziekmodel:
google/lyria-3-clip-preview - Ondersteunt ook
google/lyria-3-pro-preview - Promptinstellingen:
lyricseninstrumental - Uitvoerindeling: standaard
mp3, pluswavopgoogle/lyria-3-pro-preview - Referentie-invoer: maximaal 10 afbeeldingen
- Sessieondersteunde runs worden losgekoppeld via de gedeelde taak-/statusflow, inclusief
action: "status"
Zie Muziekgeneratie voor gedeelde toolparameters, providerselectie en failovergedrag.
Tekst-naar-spraak
De meegeleverdegoogle-spraakprovider gebruikt het Gemini API TTS-pad met
gemini-3.1-flash-tts-preview.
- Standaardstem:
Kore - Authenticatie:
messages.tts.providers.google.apiKey,models.providers.google.apiKey,GEMINI_API_KEYofGOOGLE_API_KEY - Uitvoer: WAV voor gewone TTS-bijlagen, Opus voor spraaknotitiedoelen, PCM voor Talk/telefonie
- Spraaknotitie-uitvoer: Google PCM wordt verpakt als WAV en getranscodeerd naar 48 kHz Opus met
ffmpeg
audioProfile in om een herbruikbare stijlprompt vóór de uitgesproken tekst te plaatsen. Stel
speakerName in wanneer je prompttekst naar een genoemde spreker verwijst.
Gemini API TTS accepteert ook expressieve audiotags tussen vierkante haken in de tekst,
zoals [whispers] of [laughs]. Om tags uit het zichtbare chatantwoord te houden
terwijl ze naar TTS worden verzonden, plaats je ze in een [[tts:text]]...[[/tts:text]]-
blok:
Een Google Cloud Console-API-sleutel die is beperkt tot de Gemini API is geldig voor deze
provider. Dit is niet het afzonderlijke Cloud Text-to-Speech API-pad.
Realtime spraak
De meegeleverdegoogle-Plugin registreert een realtime spraakprovider die wordt ondersteund door de
Gemini Live API voor backend-audiobruggen zoals Voice Call en Google Meet.
| Instelling | Configuratiepad | Standaard |
|---|---|---|
| Model | plugins.entries.voice-call.config.realtime.providers.google.model | gemini-2.5-flash-native-audio-preview-12-2025 |
| Stem | ...google.voice | Kore |
| Temperatuur | ...google.temperature | (niet ingesteld) |
| VAD-startgevoeligheid | ...google.startSensitivity | (niet ingesteld) |
| VAD-eindgevoeligheid | ...google.endSensitivity | (niet ingesteld) |
| Stilteduur | ...google.silenceDurationMs | (niet ingesteld) |
| Activiteitsafhandeling | ...google.activityHandling | Google-standaard, start-of-activity-interrupts |
| Beurtdekking | ...google.turnCoverage | Google-standaard, only-activity |
| Automatische VAD uitschakelen | ...google.automaticActivityDetectionDisabled | false |
| API-sleutel | ...google.apiKey | Valt terug op models.providers.google.apiKey, GEMINI_API_KEY of GOOGLE_API_KEY |
Google Live API gebruikt bidirectionele audio en functieaanroepen via een WebSocket.
OpenClaw past audio van telefonie-/Meet-bruggen aan de PCM Live API-stream van Gemini aan en
houdt toolaanroepen op het gedeelde realtime spraakcontract. Laat
temperature
uitgeschakeld tenzij je samplingwijzigingen nodig hebt; OpenClaw laat niet-positieve waarden weg
omdat Google Live transcripties zonder audio kan retourneren voor temperature: 0.
Gemini API-transcriptie is ingeschakeld zonder languageCodes; de huidige Google
SDK weigert taalcodehints op dit API-pad.Control UI Talk ondersteunt Google Live-browsersessies met beperkte tokens voor eenmalig gebruik.
Backend-only realtime spraakproviders kunnen ook via het generieke
Gateway-relaytransport lopen, waardoor providerreferenties op de Gateway blijven.
OPENAI_API_KEY=... GEMINI_API_KEY=... node --import tsx scripts/dev/realtime-talk-live-smoke.ts uit.
De Google-tak maakt dezelfde beperkte Live API-tokenvorm aan die door Control
UI Talk wordt gebruikt, opent het browser-WebSocket-eindpunt, verzendt de initiële set-up-payload
en wacht op setupComplete.
Geavanceerde configuratie
Direct Gemini-cachehergebruik
Direct Gemini-cachehergebruik
Voor directe Gemini API-runs (
api: "google-generative-ai") geeft OpenClaw
een geconfigureerde cachedContent-handle door aan Gemini-verzoeken.- Configureer per-model- of globale parameters met
cachedContentof verouderdcached_content - Als beide aanwezig zijn, wint
cachedContent - Voorbeeldwaarde:
cachedContents/prebuilt-context - Gemini-cachehitgebruik wordt genormaliseerd naar OpenClaw
cacheReadvanuit upstreamcachedContentTokenCount
Gebruiksnotities voor Gemini CLI JSON
Gebruiksnotities voor Gemini CLI JSON
Bij gebruik van de
google-gemini-cli OAuth-provider normaliseert OpenClaw
de CLI JSON-uitvoer als volgt:- Antwoordtekst komt uit het CLI JSON-veld
response. - Gebruik valt terug op
statswanneer de CLIusageleeg laat. stats.cachedwordt genormaliseerd naar OpenClawcacheRead.- Als
stats.inputontbreekt, leidt OpenClaw invoertokens af uitstats.input_tokens - stats.cached.
Omgevings- en daemonconfiguratie
Omgevings- en daemonconfiguratie
Als de Gateway als daemon draait (launchd/systemd), zorg er dan voor dat
GEMINI_API_KEY
beschikbaar is voor dat proces (bijvoorbeeld in ~/.openclaw/.env of via
env.shellEnv).Gerelateerd
Modelselectie
Providers, modelrefs en failovergedrag kiezen.
Afbeeldingsgeneratie
Gedeelde parameters voor afbeeldingstools en providerselectie.
Videogeneratie
Gedeelde parameters voor videotools en providerselectie.
Muziekgeneratie
Gedeelde parameters voor muziektools en providerselectie.