Google (Gemini)
Plugin Google zapewnia dostęp do modeli Gemini przez Google AI Studio, a także generowanie obrazów, rozumienie mediów (obrazy/audio/wideo) oraz wyszukiwanie w sieci przez Gemini Grounding.- Dostawca:
google - Uwierzytelnianie:
GEMINI_API_KEYlubGOOGLE_API_KEY - API: Google Gemini API
- Alternatywny dostawca:
google-gemini-cli(OAuth)
Szybki start
- Ustaw klucz API:
- Ustaw model domyślny:
Przykład nieinteraktywny
OAuth (Gemini CLI)
Alternatywny dostawcagoogle-gemini-cli używa PKCE OAuth zamiast klucza API.
To nieoficjalna integracja; niektórzy użytkownicy zgłaszają
ograniczenia kont. Używasz na własne ryzyko.
- Model domyślny:
google-gemini-cli/gemini-3.1-pro-preview - Alias:
gemini-cli - Wymaganie instalacyjne: lokalny Gemini CLI dostępny jako
gemini- Homebrew:
brew install gemini-cli - npm:
npm install -g @google/gemini-cli
- Homebrew:
- Logowanie:
OPENCLAW_GEMINI_OAUTH_CLIENT_IDOPENCLAW_GEMINI_OAUTH_CLIENT_SECRET
GEMINI_CLI_*.)
Jeśli żądania OAuth Gemini CLI nie działają po zalogowaniu, ustaw
GOOGLE_CLOUD_PROJECT lub GOOGLE_CLOUD_PROJECT_ID na hoście Gateway i
spróbuj ponownie.
Jeśli logowanie kończy się niepowodzeniem przed uruchomieniem przepływu w przeglądarce, upewnij się,
że lokalne polecenie gemini jest zainstalowane i dostępne w PATH. OpenClaw obsługuje zarówno instalacje
Homebrew, jak i globalne instalacje npm, w tym typowe układy Windows/npm.
Uwagi dotyczące użycia JSON w Gemini CLI:
- Tekst odpowiedzi pochodzi z pola
responsew JSON CLI. - Dane użycia wracają do
stats, gdy CLI pozostawiausagepuste. stats.cachedjest normalizowane do OpenClawcacheRead.- Jeśli brakuje
stats.input, OpenClaw wyprowadza tokeny wejściowe zstats.input_tokens - stats.cached.
Możliwości
| Możliwość | Obsługiwane |
|---|---|
| Uzupełnianie czatu | Tak |
| Generowanie obrazów | Tak |
| Rozumienie obrazów | Tak |
| Transkrypcja audio | Tak |
| Rozumienie wideo | Tak |
| Wyszukiwanie w sieci (Grounding) | Tak |
| Thinking/reasoning | Tak (Gemini 3.1+) |
Bezpośrednie ponowne użycie pamięci podręcznej Gemini
Dla bezpośrednich uruchomień Gemini API (api: "google-generative-ai"), OpenClaw teraz
przekazuje skonfigurowany uchwyt cachedContent do żądań Gemini.
- Skonfiguruj parametry per model lub globalnie za pomocą
cachedContentalbo starszegocached_content - Jeśli obecne są oba,
cachedContentma pierwszeństwo - Przykładowa wartość:
cachedContents/prebuilt-context - Dane użycia trafień pamięci podręcznej Gemini są normalizowane do OpenClaw
cacheReadz upstreamcachedContentTokenCount
Generowanie obrazów
Dołączony dostawca generowania obrazówgoogle domyślnie używa
google/gemini-3.1-flash-image-preview.
- Obsługuje także
google/gemini-3-pro-image-preview - Generowanie: do 4 obrazów na żądanie
- Tryb edycji: włączony, do 5 obrazów wejściowych
- Sterowanie geometrią:
size,aspectRatioiresolution
google-gemini-cli tylko z OAuth to osobna powierzchnia
wnioskowania tekstowego. Generowanie obrazów, rozumienie mediów oraz Gemini Grounding pozostają przy
identyfikatorze dostawcy google.
Uwaga dotycząca środowiska
Jeśli Gateway działa jako demon (launchd/systemd), upewnij się, żeGEMINI_API_KEY
jest dostępny dla tego procesu (na przykład w ~/.openclaw/.env lub przez
env.shellEnv).