Google (Gemini)
Wtyczka Google zapewnia dostęp do modeli Gemini przez Google AI Studio, a także do generowania obrazów, rozumienia mediów (obraz/dźwięk/wideo) oraz wyszukiwania w sieci przez Gemini Grounding.- Dostawca:
google - Uwierzytelnianie:
GEMINI_API_KEYlubGOOGLE_API_KEY - API: Google Gemini API
- Alternatywny dostawca:
google-gemini-cli(OAuth)
Szybki start
- Ustaw klucz API:
- Ustaw model domyślny:
Przykład nieinteraktywny
OAuth (Gemini CLI)
Alternatywny dostawcagoogle-gemini-cli używa OAuth PKCE zamiast klucza API.
To nieoficjalna integracja; niektórzy użytkownicy zgłaszają ograniczenia
konta. Używasz na własne ryzyko.
- Model domyślny:
google-gemini-cli/gemini-3-flash-preview - Alias:
gemini-cli - Wymaganie instalacyjne: lokalnie dostępny Gemini CLI jako
gemini- Homebrew:
brew install gemini-cli - npm:
npm install -g @google/gemini-cli
- Homebrew:
- Logowanie:
OPENCLAW_GEMINI_OAUTH_CLIENT_IDOPENCLAW_GEMINI_OAUTH_CLIENT_SECRET
GEMINI_CLI_*.)
Jeśli żądania OAuth Gemini CLI kończą się błędem po zalogowaniu, ustaw
GOOGLE_CLOUD_PROJECT lub GOOGLE_CLOUD_PROJECT_ID na hoście gateway i
spróbuj ponownie.
Jeśli logowanie kończy się błędem przed rozpoczęciem przepływu w przeglądarce, upewnij się, że lokalne polecenie gemini
jest zainstalowane i dostępne w PATH. OpenClaw obsługuje zarówno instalacje Homebrew,
jak i globalne instalacje npm, w tym typowe układy Windows/npm.
Uwagi dotyczące użycia JSON przez Gemini CLI:
- Tekst odpowiedzi pochodzi z pola
responsew JSON CLI. - Użycie przełącza się awaryjnie na
stats, gdy CLI pozostawiausagepuste. stats.cachedjest normalizowane do OpenClawcacheRead.- Jeśli
stats.inputnie istnieje, OpenClaw wyprowadza liczbę tokenów wejściowych zstats.input_tokens - stats.cached.
Możliwości
| Możliwość | Obsługiwane |
|---|---|
| Uzupełnianie czatu | Tak |
| Generowanie obrazów | Tak |
| Generowanie muzyki | Tak |
| Rozumienie obrazów | Tak |
| Transkrypcja audio | Tak |
| Rozumienie wideo | Tak |
| Wyszukiwanie w sieci (Grounding) | Tak |
| Thinking/reasoning | Tak (Gemini 3.1+) |
Bezpośrednie ponowne użycie cache Gemini
Dla bezpośrednich uruchomień API Gemini (api: "google-generative-ai"), OpenClaw
przekazuje teraz skonfigurowany uchwyt cachedContent dalej do żądań Gemini.
- Skonfiguruj parametry per model lub globalnie za pomocą
cachedContentalbo starszegocached_content - Jeśli obecne są oba,
cachedContentma pierwszeństwo - Przykładowa wartość:
cachedContents/prebuilt-context - Użycie przy trafieniu do cache Gemini jest normalizowane do OpenClaw
cacheReadz nadrzędnegocachedContentTokenCount
Generowanie obrazów
Dołączony dostawca generowania obrazówgoogle domyślnie używa
google/gemini-3.1-flash-image-preview.
- Obsługuje także
google/gemini-3-pro-image-preview - Generowanie: do 4 obrazów na żądanie
- Tryb edycji: włączony, do 5 obrazów wejściowych
- Sterowanie geometrią:
size,aspectRatioiresolution
google-gemini-cli, dostępny tylko przez OAuth, to oddzielna powierzchnia
wnioskowania tekstowego. Generowanie obrazów, rozumienie mediów i Gemini Grounding pozostają przy
identyfikatorze dostawcy google.
Aby używać Google jako domyślnego dostawcy obrazów:
Generowanie wideo
Dołączona wtyczkagoogle rejestruje także generowanie wideo przez wspólne
narzędzie video_generate.
- Domyślny model wideo:
google/veo-3.1-fast-generate-preview - Tryby: text-to-video, image-to-video i przepływy z referencją pojedynczego wideo
- Obsługuje
aspectRatio,resolutioniaudio - Bieżące ograniczenie długości: od 4 do 8 sekund
Generowanie muzyki
Dołączona wtyczkagoogle rejestruje także generowanie muzyki przez wspólne
narzędzie music_generate.
- Domyślny model muzyczny:
google/lyria-3-clip-preview - Obsługuje także
google/lyria-3-pro-preview - Sterowanie promptem:
lyricsiinstrumental - Format wyjściowy: domyślnie
mp3, a takżewavdlagoogle/lyria-3-pro-preview - Wejścia referencyjne: do 10 obrazów
- Uruchomienia oparte na sesji są odłączane przez wspólny przepływ zadanie/status, w tym
action: "status"
Uwaga dotycząca środowiska
Jeśli Gateway działa jako demon (launchd/systemd), upewnij się, żeGEMINI_API_KEY
jest dostępne dla tego procesu (na przykład w ~/.openclaw/.env lub przez
env.shellEnv).