Google (Gemini)
Il Plugin Google fornisce accesso ai modelli Gemini tramite Google AI Studio, oltre a generazione di immagini, comprensione dei media (immagini/audio/video), sintesi vocale e ricerca web tramite Gemini Grounding.- Provider:
google - Autenticazione:
GEMINI_API_KEYoGOOGLE_API_KEY - API: Google Gemini API
- Provider alternativo:
google-gemini-cli(OAuth)
Per iniziare
Scegli il metodo di autenticazione che preferisci e segui i passaggi di configurazione.- Chiave API
- Gemini CLI (OAuth)
Capacità
| Capacità | Supportato |
|---|---|
| Completamenti chat | Sì |
| Generazione di immagini | Sì |
| Generazione musicale | Sì |
| Sintesi vocale | Sì |
| Comprensione immagini | Sì |
| Trascrizione audio | Sì |
| Comprensione video | Sì |
| Ricerca web (Grounding) | Sì |
| Thinking/ragionamento | Sì (Gemini 3.1+) |
| Modelli Gemma 4 | Sì |
Generazione di immagini
Il provider di generazione immaginigoogle incluso usa come predefinito
google/gemini-3.1-flash-image-preview.
- Supporta anche
google/gemini-3-pro-image-preview - Generazione: fino a 4 immagini per richiesta
- Modalità modifica: abilitata, fino a 5 immagini di input
- Controlli geometrici:
size,aspectRatioeresolution
Consulta Generazione di immagini per i parametri condivisi dello strumento, la selezione del provider e il comportamento di failover.
Generazione video
Il Plugingoogle incluso registra anche la generazione video tramite lo strumento condiviso
video_generate.
- Modello video predefinito:
google/veo-3.1-fast-generate-preview - Modalità: testo in video, immagine in video e flussi con riferimento a singolo video
- Supporta
aspectRatio,resolutioneaudio - Limite attuale della durata: da 4 a 8 secondi
Consulta Generazione video per i parametri condivisi dello strumento, la selezione del provider e il comportamento di failover.
Generazione musicale
Il Plugingoogle incluso registra anche la generazione musicale tramite lo strumento condiviso
music_generate.
- Modello musicale predefinito:
google/lyria-3-clip-preview - Supporta anche
google/lyria-3-pro-preview - Controlli del prompt:
lyricseinstrumental - Formato di output:
mp3per impostazione predefinita, piùwavsugoogle/lyria-3-pro-preview - Input di riferimento: fino a 10 immagini
- Le esecuzioni supportate da sessione si staccano tramite il flusso condiviso attività/stato, incluso
action: "status"
Consulta Generazione musicale per i parametri condivisi dello strumento, la selezione del provider e il comportamento di failover.
Sintesi vocale
Il provider vocalegoogle incluso usa il percorso TTS della Gemini API con
gemini-3.1-flash-tts-preview.
- Voce predefinita:
Kore - Autenticazione:
messages.tts.providers.google.apiKey,models.providers.google.apiKey,GEMINI_API_KEYoGOOGLE_API_KEY - Output: WAV per i normali allegati TTS, PCM per Talk/telefonia
- Output nativo di note vocali: non supportato su questo percorso Gemini API perché l’API restituisce PCM invece di Opus
[whispers] o [laughs]. Per tenere i tag fuori dalla risposta visibile in chat mentre
li invii al TTS, inseriscili in un blocco [[tts:text]]...[[/tts:text]]:
Una chiave API di Google Cloud Console limitata alla Gemini API è valida per questo
provider. Questo non è il percorso separato dell’API Cloud Text-to-Speech.
Configurazione avanzata
Riutilizzo diretto della cache Gemini
Riutilizzo diretto della cache Gemini
Per le esecuzioni dirette della Gemini API (
api: "google-generative-ai"), OpenClaw
passa un handle cachedContent configurato direttamente alle richieste Gemini.- Configura i parametri per modello o globali con
cachedContentoppure il legacycached_content - Se sono presenti entrambi,
cachedContentha la precedenza - Valore di esempio:
cachedContents/prebuilt-context - L’uso di Gemini con cache hit è normalizzato in OpenClaw
cacheReada partire dacachedContentTokenCountupstream
Note sull'uso del JSON di Gemini CLI
Note sull'uso del JSON di Gemini CLI
Quando usi il provider OAuth
google-gemini-cli, OpenClaw normalizza
l’output JSON della CLI come segue:- Il testo della risposta proviene dal campo JSON
responsedella CLI. - L’utilizzo ricade su
statsquando la CLI lascia vuotousage. stats.cachedviene normalizzato in OpenClawcacheRead.- Se
stats.inputmanca, OpenClaw ricava i token di input dastats.input_tokens - stats.cached.
Configurazione di ambiente e daemon
Configurazione di ambiente e daemon
Se il Gateway viene eseguito come daemon (launchd/systemd), assicurati che
GEMINI_API_KEY
sia disponibile per quel processo (ad esempio in ~/.openclaw/.env o tramite
env.shellEnv).Correlati
Selezione del modello
Scegliere provider, riferimenti ai modelli e comportamento di failover.
Generazione di immagini
Parametri condivisi dello strumento per le immagini e selezione del provider.
Generazione video
Parametri condivisi dello strumento per i video e selezione del provider.
Generazione musicale
Parametri condivisi dello strumento per la musica e selezione del provider.