Google (Gemini)
Google Plugin은 Google AI Studio를 통한 Gemini 모델 액세스와 함께, Gemini Grounding을 통한 이미지 생성, 미디어 이해(이미지/오디오/비디오), 웹 검색을 제공합니다.- Provider:
google - Auth:
GEMINI_API_KEY또는GOOGLE_API_KEY - API: Google Gemini API
- 대체 provider:
google-gemini-cli(OAuth)
시작하기
선호하는 인증 방법을 선택하고 설정 단계를 따르세요.- API 키
- Gemini CLI (OAuth)
기능
| Capability | Supported |
|---|---|
| Chat completions | Yes |
| Image generation | Yes |
| Music generation | Yes |
| Image understanding | Yes |
| Audio transcription | Yes |
| Video understanding | Yes |
| Web search (Grounding) | Yes |
| Thinking/reasoning | Yes (Gemini 3.1+) |
| Gemma 4 models | Yes |
이미지 생성
번들google 이미지 생성 provider의 기본값은
google/gemini-3.1-flash-image-preview입니다.
google/gemini-3-pro-image-preview도 지원합니다- 생성: 요청당 최대 4개 이미지
- 편집 모드: 활성화됨, 최대 5개 입력 이미지
- 기하 제어:
size,aspectRatio,resolution
공통 도구 매개변수, provider 선택, 장애 조치 동작은 Image Generation을 참조하세요.
비디오 생성
번들google Plugin은 공유 video_generate 도구를 통해 비디오 생성도 등록합니다.
- 기본 비디오 모델:
google/veo-3.1-fast-generate-preview - 모드: 텍스트-비디오, 이미지-비디오, 단일 비디오 참조 흐름
aspectRatio,resolution,audio지원- 현재 길이 제한: 4~8초
공통 도구 매개변수, provider 선택, 장애 조치 동작은 Video Generation을 참조하세요.
음악 생성
번들google Plugin은 공유 music_generate 도구를 통해 음악 생성도 등록합니다.
- 기본 음악 모델:
google/lyria-3-clip-preview google/lyria-3-pro-preview도 지원합니다- 프롬프트 제어:
lyrics및instrumental - 출력 형식: 기본값은
mp3,google/lyria-3-pro-preview에서는wav도 지원 - 참조 입력: 최대 10개 이미지
- 세션 기반 실행은
action: "status"를 포함한 공유 작업/상태 흐름을 통해 분리되어 처리됩니다
공통 도구 매개변수, provider 선택, 장애 조치 동작은 Music Generation을 참조하세요.
고급 구성
직접 Gemini 캐시 재사용
직접 Gemini 캐시 재사용
직접 Gemini API 실행(
api: "google-generative-ai")의 경우, OpenClaw는 구성된 cachedContent 핸들을 Gemini 요청에 그대로 전달합니다.- 모델별 또는 전역 params에
cachedContent또는 레거시cached_content를 사용해 구성할 수 있습니다 - 둘 다 있으면
cachedContent가 우선합니다 - 예시 값:
cachedContents/prebuilt-context - Gemini 캐시 적중 사용량은 업스트림
cachedContentTokenCount에서 OpenClawcacheRead로 정규화됩니다
Gemini CLI JSON 사용량 참고
Gemini CLI JSON 사용량 참고
google-gemini-cli OAuth provider를 사용할 때 OpenClaw는 CLI JSON 출력을 다음과 같이 정규화합니다:- 답글 텍스트는 CLI JSON
response필드에서 가져옵니다. - CLI가
usage를 비워 둘 경우 사용량은stats로 대체됩니다. stats.cached는 OpenClawcacheRead로 정규화됩니다.stats.input이 없으면 OpenClaw는stats.input_tokens - stats.cached에서 입력 토큰 수를 계산합니다.
환경 및 데몬 설정
환경 및 데몬 설정
Gateway가 데몬(launchd/systemd)으로 실행되는 경우
GEMINI_API_KEY가 해당 프로세스에서 사용 가능해야 합니다(예: ~/.openclaw/.env 또는 env.shellEnv에서).관련
모델 선택
provider, 모델 참조 및 장애 조치 동작 선택하기.
이미지 생성
공통 이미지 도구 매개변수 및 provider 선택.
비디오 생성
공통 비디오 도구 매개변수 및 provider 선택.
음악 생성
공통 음악 도구 매개변수 및 provider 선택.