Google (Gemini)
Le plugin Google fournit l’accès aux modèles Gemini via Google AI Studio, ainsi que la génération d’images, la compréhension des médias (image/audio/vidéo) et la recherche Web via Gemini Grounding.- Fournisseur :
google - Authentification :
GEMINI_API_KEYouGOOGLE_API_KEY - API : API Google Gemini
- Fournisseur alternatif :
google-gemini-cli(OAuth)
Démarrage rapide
- Définissez la clé API :
- Définissez un modèle par défaut :
Exemple non interactif
OAuth (Gemini CLI)
Un fournisseur alternatifgoogle-gemini-cli utilise OAuth PKCE au lieu d’une clé API. Il s’agit d’une intégration non officielle ; certains utilisateurs signalent des restrictions de compte. Utilisez-la à vos propres risques.
- Modèle par défaut :
google-gemini-cli/gemini-3-flash-preview - Alias :
gemini-cli - Prérequis d’installation : la Gemini CLI locale doit être disponible sous le nom
gemini- Homebrew :
brew install gemini-cli - npm :
npm install -g @google/gemini-cli
- Homebrew :
- Connexion :
OPENCLAW_GEMINI_OAUTH_CLIENT_IDOPENCLAW_GEMINI_OAUTH_CLIENT_SECRET
GEMINI_CLI_*.)
Si les requêtes OAuth de Gemini CLI échouent après la connexion, définissez GOOGLE_CLOUD_PROJECT ou GOOGLE_CLOUD_PROJECT_ID sur l’hôte de la passerelle, puis réessayez.
Si la connexion échoue avant le démarrage du flux dans le navigateur, assurez-vous que la commande locale gemini est installée et présente dans le PATH. OpenClaw prend en charge les installations Homebrew et les installations npm globales, y compris les dispositions Windows/npm courantes.
Remarques sur l’utilisation du JSON de Gemini CLI :
- Le texte de réponse provient du champ JSON
responsede la CLI. - L’utilisation se rabat sur
statslorsque la CLI laisseusagevide. stats.cachedest normalisé encacheReaddans OpenClaw.- Si
stats.inputest absent, OpenClaw dérive les jetons d’entrée à partir destats.input_tokens - stats.cached.
Capacités
| Capacité | Pris en charge |
|---|---|
| Complétions de chat | Oui |
| Génération d’images | Oui |
| Génération de musique | Oui |
| Compréhension d’images | Oui |
| Transcription audio | Oui |
| Compréhension vidéo | Oui |
| Recherche Web (Grounding) | Oui |
| Thinking/reasoning | Oui (Gemini 3.1+) |
| Modèles Gemma 4 | Oui |
gemma-4-26b-a4b-it) prennent en charge le mode thinking. OpenClaw réécrit thinkingBudget vers un thinkingLevel Google pris en charge pour Gemma 4. Définir thinking sur off conserve la désactivation de thinking au lieu d’un mappage vers MINIMAL.
Réutilisation directe du cache Gemini
Pour les exécutions directes de l’API Gemini (api: "google-generative-ai"), OpenClaw transmet désormais un handle cachedContent configuré aux requêtes Gemini.
- Configurez des paramètres par modèle ou globaux avec
cachedContentou l’anciencached_content - Si les deux sont présents,
cachedContentest prioritaire - Exemple de valeur :
cachedContents/prebuilt-context - L’utilisation en cas de réussite du cache Gemini est normalisée en
cacheReaddans OpenClaw à partir decachedContentTokenCounten amont
Génération d’images
Le fournisseur de génération d’imagesgoogle inclus utilise par défaut google/gemini-3.1-flash-image-preview.
- Prend aussi en charge
google/gemini-3-pro-image-preview - Génération : jusqu’à 4 images par requête
- Mode édition : activé, jusqu’à 5 images d’entrée
- Contrôles de géométrie :
size,aspectRatioetresolution
google-gemini-cli, uniquement OAuth, constitue une surface d’inférence de texte distincte. La génération d’images, la compréhension des médias et Gemini Grounding restent associées à l’identifiant de fournisseur google.
Pour utiliser Google comme fournisseur d’images par défaut :
Génération de vidéo
Le plugingoogle inclus enregistre également la génération de vidéo via l’outil partagé video_generate.
- Modèle vidéo par défaut :
google/veo-3.1-fast-generate-preview - Modes : texte vers vidéo, image vers vidéo et flux à référence vidéo unique
- Prend en charge
aspectRatio,resolutionetaudio - Limitation actuelle de durée : 4 à 8 secondes
Génération de musique
Le plugingoogle inclus enregistre également la génération de musique via l’outil partagé music_generate.
- Modèle musical par défaut :
google/lyria-3-clip-preview - Prend aussi en charge
google/lyria-3-pro-preview - Contrôles d’invite :
lyricsetinstrumental - Format de sortie :
mp3par défaut, ainsi quewavsurgoogle/lyria-3-pro-preview - Entrées de référence : jusqu’à 10 images
- Les exécutions avec session se détachent via le flux partagé de tâche/statut, y compris
action: "status"
Remarque sur l’environnement
Si la passerelle s’exécute en tant que démon (launchd/systemd), assurez-vous queGEMINI_API_KEY est disponible pour ce processus (par exemple dans ~/.openclaw/.env ou via env.shellEnv).