메인 콘텐츠로 건너뛰기

Google (Gemini)

Google 플러그인은 Google AI Studio를 통해 Gemini 모델에 대한 액세스를 제공하며, 추가로 이미지 생성, 미디어 이해(이미지/오디오/비디오), 그리고 Gemini Grounding을 통한 웹 검색도 제공합니다.
  • Provider: google
  • 인증: GEMINI_API_KEY 또는 GOOGLE_API_KEY
  • API: Google Gemini API
  • 대체 provider: google-gemini-cli (OAuth)

빠른 시작

  1. API 키를 설정합니다.
openclaw onboard --auth-choice gemini-api-key
  1. 기본 모델을 설정합니다.
{
  agents: {
    defaults: {
      model: { primary: "google/gemini-3.1-pro-preview" },
    },
  },
}

비대화형 예시

openclaw onboard --non-interactive \
  --mode local \
  --auth-choice gemini-api-key \
  --gemini-api-key "$GEMINI_API_KEY"

OAuth (Gemini CLI)

대체 provider인 google-gemini-cli는 API 키 대신 PKCE OAuth를 사용합니다. 이는 비공식 통합이며, 일부 사용자는 계정 제한을 보고했습니다. 사용에 따른 위험은 본인이 감수해야 합니다.
  • 기본 모델: google-gemini-cli/gemini-3.1-pro-preview
  • 별칭: gemini-cli
  • 설치 전제 조건: 로컬 Gemini CLI를 gemini로 사용할 수 있어야 함
    • Homebrew: brew install gemini-cli
    • npm: npm install -g @google/gemini-cli
  • 로그인:
openclaw models auth login --provider google-gemini-cli --set-default
환경 변수:
  • OPENCLAW_GEMINI_OAUTH_CLIENT_ID
  • OPENCLAW_GEMINI_OAUTH_CLIENT_SECRET
(GEMINI_CLI_* 변형도 사용할 수 있습니다.) 로그인 후 Gemini CLI OAuth 요청이 실패하면 게이트웨이 호스트에서 GOOGLE_CLOUD_PROJECT 또는 GOOGLE_CLOUD_PROJECT_ID를 설정한 뒤 다시 시도하세요. 브라우저 흐름이 시작되기 전에 로그인이 실패하면, 로컬 gemini 명령이 설치되어 있고 PATH에 포함되어 있는지 확인하세요. OpenClaw는 Homebrew 설치와 전역 npm 설치를 모두 지원하며, 일반적인 Windows/npm 레이아웃도 지원합니다. Gemini CLI JSON 사용 참고 사항:
  • 응답 텍스트는 CLI JSON response 필드에서 가져옵니다.
  • CLI가 usage를 비워 둘 경우 사용량은 stats로 대체됩니다.
  • stats.cached는 OpenClaw cacheRead로 정규화됩니다.
  • stats.input이 없으면 OpenClaw는 stats.input_tokens - stats.cached에서 입력 토큰 수를 계산합니다.

기능

기능지원 여부
채팅 completions
이미지 생성
이미지 이해
오디오 전사
비디오 이해
웹 검색 (Grounding)
사고/추론예 (Gemini 3.1+)

직접 Gemini 캐시 재사용

직접 Gemini API 실행(api: "google-generative-ai")의 경우, OpenClaw는 이제 구성된 cachedContent 핸들을 Gemini 요청으로 그대로 전달합니다.
  • 모델별 또는 전역 params는 cachedContent 또는 레거시 cached_content 중 하나로 구성할 수 있습니다
  • 둘 다 있으면 cachedContent가 우선합니다
  • 예시 값: cachedContents/prebuilt-context
  • Gemini 캐시 적중 사용량은 업스트림 cachedContentTokenCount를 기준으로 OpenClaw cacheRead로 정규화됩니다
예시:
{
  agents: {
    defaults: {
      models: {
        "google/gemini-2.5-pro": {
          params: {
            cachedContent: "cachedContents/prebuilt-context",
          },
        },
      },
    },
  },
}

이미지 생성

번들된 google 이미지 생성 provider의 기본값은 google/gemini-3.1-flash-image-preview입니다.
  • google/gemini-3-pro-image-preview도 지원합니다
  • 생성: 요청당 최대 4개 이미지
  • 편집 모드: 활성화됨, 입력 이미지 최대 5개
  • 기하 제어: size, aspectRatio, resolution
OAuth 전용 google-gemini-cli provider는 별도의 텍스트 추론 표면입니다. 이미지 생성, 미디어 이해, Gemini Grounding은 계속 google provider id에 유지됩니다.

환경 참고 사항

Gateway가 데몬(launchd/systemd)으로 실행되는 경우, GEMINI_API_KEY가 해당 프로세스에서 사용 가능하도록 해야 합니다(예: ~/.openclaw/.env 또는 env.shellEnv를 통해).