---
read_when:
    - 인증 프로필 교체, 쿨다운 또는 모델 폴백 동작 진단
    - 인증 프로필 또는 모델의 장애 조치 규칙 업데이트하기
    - 세션 모델 재정의가 폴백 재시도와 상호 작용하는 방식 이해하기
sidebarTitle: Model failover
summary: OpenClaw가 인증 프로필을 순환하고 모델 간에 폴백하는 방식
title: 모델 장애 조치
x-i18n:
    generated_at: "2026-07-04T15:11:43Z"
    model: gpt-5.5
    postprocess_version: locale-links-v1
    provider: openai
    source_hash: 1521e27c53029ead305f29b7a29b627b519adbd28ed30688c01f32542625855f
    source_path: concepts/model-failover.md
    workflow: 16
---

OpenClaw는 장애를 두 단계로 처리합니다.

1. 현재 제공자 내에서의 **인증 프로필 순환**.
2. `agents.defaults.model.fallbacks`의 다음 모델로 **모델 대체**.

이 문서는 런타임 규칙과 이를 뒷받침하는 데이터를 설명합니다.

## 런타임 흐름

일반 텍스트 실행에서 OpenClaw는 다음 순서로 후보를 평가합니다.

<Steps>
  <Step title="세션 상태 확인">
    활성 세션 모델과 인증 프로필 선호도를 확인합니다.
  </Step>
  <Step title="후보 체인 구성">
    현재 모델 선택과 해당 선택 소스의 대체 정책에서 모델 후보 체인을 구성합니다. 구성된 기본값, cron 작업 기본 모델, 자동 선택된 대체 모델은 구성된 대체 모델을 사용할 수 있으며, 명시적인 사용자 세션 선택은 엄격하게 적용됩니다.
  </Step>
  <Step title="현재 제공자 시도">
    인증 프로필 순환/쿨다운 규칙을 적용해 현재 제공자를 시도합니다.
  </Step>
  <Step title="장애 조치 대상 오류에서 진행">
    해당 제공자가 장애 조치 대상 오류로 모두 소진되면 다음 모델 후보로 이동합니다.
  </Step>
  <Step title="대체 오버라이드 저장">
    재시도가 시작되기 전에 선택된 대체 오버라이드를 저장하여 다른 세션 읽기 주체가 러너가 사용하려는 동일한 제공자/모델을 보게 합니다. 저장된 모델 오버라이드는 `modelOverrideSource: "auto"`로 표시됩니다.
  </Step>
  <Step title="실패 시 좁은 범위로 롤백">
    대체 후보가 실패하면, 해당 실패 후보와 여전히 일치하는 경우에만 대체가 소유한 세션 오버라이드 필드를 롤백합니다.
  </Step>
  <Step title="모두 소진되면 FallbackSummaryError 발생">
    모든 후보가 실패하면 시도별 세부 정보와 알려진 경우 가장 이른 쿨다운 만료 시간을 포함한 `FallbackSummaryError`를 발생시킵니다.
  </Step>
</Steps>

이는 의도적으로 "전체 세션을 저장하고 복원"하는 것보다 좁은 범위입니다. 응답 러너는 대체를 위해 자신이 소유한 모델 선택 필드만 저장합니다.

- `providerOverride`
- `modelOverride`
- `modelOverrideSource`
- `authProfileOverride`
- `authProfileOverrideSource`
- `authProfileOverrideCompactionCount`

이렇게 하면 실패한 대체 재시도가 시도 실행 중 발생한 수동 `/model` 변경이나 세션 순환 업데이트 같은 더 새로운 관련 없는 세션 변경을 덮어쓰지 않습니다.

## 선택 소스 정책

OpenClaw는 선택된 제공자/모델과 그것이 선택된 이유를 분리합니다. 해당 소스가 대체 체인의 허용 여부를 제어합니다.

- **구성된 기본값**: `agents.defaults.model.primary`는 `agents.defaults.model.fallbacks`를 사용합니다.
- **에이전트 기본 모델**: `agents.list[].model`은 해당 에이전트 모델 객체가 자체 `fallbacks`를 포함하지 않는 한 엄격합니다. 엄격한 동작을 명시하려면 `fallbacks: []`를 사용하거나, 해당 에이전트가 모델 대체를 사용하도록 하려면 비어 있지 않은 목록을 제공합니다.
- **자동 대체 오버라이드**: 런타임 대체는 재시도 전에 `providerOverride`, `modelOverride`, `modelOverrideSource: "auto"`, 선택된 원본 모델을 기록합니다. 이 자동 오버라이드는 모든 메시지에서 기본 모델을 탐색하지 않고도 구성된 대체 체인을 계속 따라갈 수 있지만, OpenClaw는 구성된 원본을 주기적으로 다시 탐색하고 복구되면 자동 오버라이드를 지웁니다. `/new`, `/reset`, `sessions.reset`도 자동 소스 오버라이드를 지웁니다. 명시적인 `heartbeat.model` 없이 실행되는 Heartbeat는 원본이 현재 구성된 기본값과 더 이상 일치하지 않을 때 직접 자동 오버라이드를 지웁니다.
- **사용자 세션 오버라이드**: `/model`, 모델 선택기, `session_status(model=...)`, `sessions.patch`는 `modelOverrideSource: "user"`를 기록합니다. 이는 정확한 세션 선택입니다. 선택된 제공자/모델이 응답을 생성하기 전에 실패하면, OpenClaw는 관련 없는 구성된 대체 모델로 답변하는 대신 실패를 보고합니다.
- **레거시 세션 오버라이드**: 오래된 세션 항목에는 `modelOverrideSource` 없이 `modelOverride`가 있을 수 있습니다. OpenClaw는 명시적인 이전 선택이 조용히 대체 동작으로 변환되지 않도록 이를 사용자 오버라이드로 취급합니다.
- **Cron 페이로드 모델**: cron 작업 `payload.model` / `--model`은 작업 기본 모델이지 사용자 세션 오버라이드가 아닙니다. 작업이 `payload.fallbacks`를 제공하지 않는 한 구성된 대체 모델을 사용하며, `payload.fallbacks: []`는 cron 실행을 엄격하게 만듭니다.

자동 대체 기본 모델 탐색 간격은 5분이며 구성할 수 없습니다. OpenClaw는 실패 중인 기본 모델을 매 턴마다 재시도하지 않도록 세션 및 기본 모델별 최근 탐색을 기억합니다. OpenClaw는 세션이 대체 모델로 이동할 때 표시되는 알림을 보내고, 선택된 기본 모델로 돌아올 때 또 다른 알림을 보냅니다. 고정된 대체 턴마다 알림을 반복하지는 않습니다.

## 인증 실패 건너뛰기 캐시

기본적으로 모든 새 턴은 기존 대체 재시도 동작을 유지합니다. OpenClaw는 최근에 `auth` 또는 `auth_permanent`로 실패한 비기본 후보를 포함해 구성된 각 대체 후보를 다시 시도합니다.

반복되는 인증 실패를 억제하고 싶은 운영자는 다음으로 옵트인할 수 있습니다.

```bash
OPENCLAW_FALLBACK_SKIP_TTL_MS=60000
```

활성화되면 OpenClaw는 인증 클래스 실패 후 비기본 대체 후보에 대해 메모리 내 세션 범위 건너뛰기 마커를 기록합니다. 마커는 세션 ID, 제공자, 모델을 기준으로 키가 지정됩니다. 기본 후보는 절대 건너뛰지 않으므로 명시적인 사용자 모델 선택은 실제 인증 오류를 계속 드러냅니다. 캐시는 프로세스 로컬이며 Gateway 재시작 시 지워집니다.

값은 밀리초 단위 TTL입니다. `0` 또는 설정되지 않은 값은 캐시를 비활성화합니다. 양수 값은 1초에서 10분 사이로 제한됩니다.

## 사용자에게 표시되는 대체 알림

세션이 자동 선택된 대체 모델로 이동하면 OpenClaw는 동일한 응답 표면에 상태 알림을 보냅니다.

```text
↪️ Model Fallback: <fallback> (selected <primary>; <reason>)
```

나중 탐색이 성공하고 세션이 선택된 기본 모델로 돌아오면 OpenClaw는 다음을 보냅니다.

```text
↪️ Model Fallback cleared: <primary> (was <fallback>)
```

이 알림은 어시스턴트 콘텐츠가 아니라 운영 메시지입니다. 가능한 경우 부작용만 있는 턴을 포함해 상태 변경마다 한 번 전달되지만, 고정된 대체 턴에서는 반복되지 않습니다. 전달은 일반 소스 응답 억제를 우회하며, 알림은 스레드형 채널의 첫 번째 어시스턴트 응답 슬롯을 소비하지 않고, 텍스트 음성 변환 및 커밋 추출에서 제외됩니다.

## 인증 저장소(키 + OAuth)

OpenClaw는 API 키와 OAuth 토큰 모두에 **인증 프로필**을 사용합니다.

- 비밀 정보와 런타임 인증 라우팅 상태는 `~/.openclaw/agents/<agentId>/agent/openclaw-agent.sqlite`에 있습니다.
- 구성 `auth.profiles` / `auth.order`는 **메타데이터 + 라우팅 전용**입니다(비밀 정보 없음).
- 레거시 가져오기 전용 OAuth 파일: `~/.openclaw/credentials/oauth.json`(첫 사용 시 에이전트별 인증 저장소로 가져옴).
- 레거시 `auth-profiles.json`, `auth-state.json`, 에이전트별 `auth.json` 파일은 `openclaw doctor --fix`로 가져옵니다.

자세한 내용: [OAuth](/ko/concepts/oauth)

자격 증명 유형:

- `type: "api_key"` → `{ provider, key }`
- `type: "oauth"` → `{ provider, access, refresh, expires, email? }`(일부 제공자의 경우 `projectId`/`enterpriseUrl` 추가)

## 프로필 ID

OAuth 로그인은 여러 계정이 공존할 수 있도록 별도 프로필을 만듭니다.

- 기본값: 이메일을 사용할 수 없을 때 `provider:default`.
- 이메일이 있는 OAuth: `provider:<email>`(예: `google-antigravity:user@gmail.com`).

프로필은 에이전트별 `openclaw-agent.sqlite` 인증 프로필 저장소에 있습니다.

## 순환 순서

제공자에 여러 프로필이 있는 경우 OpenClaw는 다음과 같은 순서로 선택합니다.

<Steps>
  <Step title="명시적 구성">
    `auth.order[provider]`(설정된 경우).
  </Step>
  <Step title="구성된 프로필">
    제공자별로 필터링된 `auth.profiles`.
  </Step>
  <Step title="저장된 프로필">
    해당 제공자의 에이전트별 SQLite 인증 프로필 항목.
  </Step>
</Steps>

명시적 순서가 구성되어 있지 않으면 OpenClaw는 라운드 로빈 순서를 사용합니다.

- **기본 키:** 프로필 유형(**API 키보다 OAuth 우선**).
- **보조 키:** `usageStats.lastUsed`(각 유형 내에서 가장 오래된 것부터).
- **쿨다운/비활성화된 프로필**은 가장 이른 만료 시간 순으로 정렬되어 끝으로 이동합니다.

### 세션 고정성(캐시 친화적)

OpenClaw는 제공자 캐시를 따뜻하게 유지하기 위해 **선택된 인증 프로필을 세션별로 고정**합니다. 매 요청마다 순환하지 **않습니다**. 고정된 프로필은 다음까지 재사용됩니다.

- 세션이 재설정됨(`/new` / `/reset`)
- Compaction이 완료됨(Compaction 횟수 증가)
- 프로필이 쿨다운/비활성화 상태임

`/model …@<profileId>`를 통한 수동 선택은 해당 세션에 **사용자 오버라이드**를 설정하며, 새 세션이 시작될 때까지 자동 순환되지 않습니다.

<Note>
자동 고정 프로필(세션 라우터가 선택)은 **선호도**로 취급됩니다. 먼저 시도되지만, OpenClaw는 속도 제한/타임아웃 시 다른 프로필로 순환할 수 있습니다. 원래 프로필을 다시 사용할 수 있게 되면, 새 실행은 선택된 모델이나 런타임을 변경하지 않고도 이를 다시 선호할 수 있습니다. 사용자 고정 프로필은 해당 프로필에 계속 잠긴 상태로 유지됩니다. 실패하고 모델 대체가 구성되어 있으면 OpenClaw는 프로필을 전환하는 대신 다음 모델로 이동합니다.
</Note>

### OpenAI Codex 구독과 API 키 백업

OpenAI 에이전트 모델의 경우 인증과 런타임은 분리됩니다. `openai/gpt-*`는 Codex 하네스에 유지되며, 인증은 Codex 구독 프로필과 OpenAI API 키 백업 사이에서 순환할 수 있습니다.

사용자에게 표시되는 순서에는 `auth.order.openai`를 사용합니다.

```json5
{
  auth: {
    order: {
      openai: ["openai:user@example.com", "openai:api-key-backup"],
    },
  },
}
```

ChatGPT/Codex OAuth 프로필과 OpenAI API 키 프로필 모두에 `openai:*`를 사용합니다. 구독이 Codex 사용량 제한에 도달하면, OpenClaw는 Codex가 제공하는 경우 정확한 재설정 시간을 기록하고, 순서상 다음 인증 프로필을 시도하며, 실행은 Codex 하네스 내부에 유지합니다. 재설정 시간이 지나면 구독 프로필은 다시 적격 상태가 되고 다음 자동 선택에서 다시 돌아갈 수 있습니다.

해당 세션에서 한 계정/키를 강제로 사용하려는 경우에만 사용자 고정 프로필을 사용합니다. 사용자 고정 프로필은 의도적으로 엄격하며 조용히 다른 프로필로 이동하지 않습니다.

## 쿨다운

프로필이 인증/속도 제한 오류(또는 속도 제한처럼 보이는 타임아웃)로 실패하면 OpenClaw는 이를 쿨다운으로 표시하고 다음 프로필로 이동합니다.

<AccordionGroup>
  <Accordion title="속도 제한 / 타임아웃 버킷에 포함되는 항목">
    해당 속도 제한 버킷은 단순한 `429`보다 넓습니다. `Too many concurrent requests`, `ThrottlingException`, `concurrency limit reached`, `workers_ai ... quota limit exceeded`, `throttled`, `resource exhausted` 같은 제공자 메시지와 `weekly/monthly limit reached` 같은 주기적 사용 기간 제한도 포함합니다.

    형식/잘못된 요청 오류는 일반적으로 종료 오류입니다. 같은 페이로드를 재시도해도 같은 방식으로 실패하므로 OpenClaw는 인증 프로필을 순환하는 대신 이를 표시합니다. 알려진 재시도-복구 경로는 명시적으로 옵트인할 수 있습니다. 예를 들어 Cloud Code Assist 도구 호출 ID 검증 실패는 정리된 뒤 `allowFormatRetry` 정책을 통해 한 번 재시도됩니다. `Unhandled stop reason: error`, `stop reason: error`, `reason: error` 같은 OpenAI 호환 중지 사유 오류는 타임아웃/장애 조치 신호로 분류됩니다.

    소스가 알려진 일시적 패턴과 일치하는 경우 일반 서버 텍스트도 해당 타임아웃 버킷에 포함될 수 있습니다. 예를 들어 단순 모델 런타임 스트림 래퍼 메시지 `An unknown error occurred`는 모든 제공자에서 장애 조치 대상으로 취급됩니다. 공유 모델 런타임이 구체적인 세부 정보 없이 `stopReason: "aborted"` 또는 `stopReason: "error"`로 제공자 스트림이 끝날 때 이를 내보내기 때문입니다. `internal server error`, `unknown error, 520`, `upstream error`, `backend error` 같은 일시적 서버 텍스트가 포함된 JSON `api_error` 페이로드도 장애 조치 대상 타임아웃으로 취급됩니다.

    단순 `Provider returned error` 같은 OpenRouter 전용 일반 업스트림 텍스트는 제공자 컨텍스트가 실제로 OpenRouter인 경우에만 타임아웃으로 취급됩니다. `LLM request failed with an unknown error.` 같은 일반 내부 대체 텍스트는 보수적으로 유지되며 그 자체만으로는 장애 조치를 트리거하지 않습니다.

  </Accordion>
  <Accordion title="SDK retry-after 상한">
    일부 공급자 SDK는 OpenClaw에 제어를 반환하기 전에 긴 `Retry-After` 기간 동안 대기할 수 있습니다. Anthropic 및 OpenAI 같은 Stainless 기반 SDK의 경우, OpenClaw는 기본적으로 SDK 내부 `retry-after-ms` / `retry-after` 대기를 60초로 제한하고, 더 긴 재시도 가능 응답은 즉시 노출하여 이 장애 조치 경로가 실행될 수 있게 합니다. `OPENCLAW_SDK_RETRY_MAX_WAIT_SECONDS`로 상한을 조정하거나 비활성화할 수 있습니다. [재시도 동작](/ko/concepts/retry)을 참고하세요.
  </Accordion>
  <Accordion title="모델 범위 쿨다운">
    속도 제한 쿨다운은 모델 범위로도 적용될 수 있습니다.

    - 실패한 모델 id를 알 수 있을 때 OpenClaw는 속도 제한 실패에 대해 `cooldownModel`을 기록합니다.
    - 쿨다운이 다른 모델로 범위 지정된 경우, 같은 공급자의 형제 모델은 계속 시도할 수 있습니다.
    - 결제/비활성화 기간은 여전히 모델 전반에서 전체 프로필을 차단합니다.

  </Accordion>
</AccordionGroup>

쿨다운은 지수 백오프를 사용합니다.

- 1분
- 5분
- 25분
- 1시간(상한)

상태는 에이전트별 SQLite 인증 상태의 `usageStats` 아래에 저장됩니다.

```json
{
  "usageStats": {
    "provider:profile": {
      "lastUsed": 1736160000000,
      "cooldownUntil": 1736160600000,
      "errorCount": 2
    }
  }
}
```

## 결제 비활성화

결제/크레딧 실패(예: "insufficient credits" / "credit balance too low")는 장애 조치 대상으로 처리되지만, 일반적으로 일시적이지 않습니다. 짧은 쿨다운 대신 OpenClaw는 프로필을 **비활성화**로 표시하고(더 긴 백오프와 함께) 다음 프로필/공급자로 순환합니다.

<Note>
결제 형태의 모든 응답이 `402`인 것은 아니며, 모든 HTTP `402`가 여기로 들어오는 것도 아닙니다. OpenClaw는 공급자가 대신 `401` 또는 `403`을 반환하더라도 명시적인 결제 문구를 결제 레인에 유지하지만, 공급자별 매처는 이를 소유한 공급자로 범위가 제한됩니다(예: OpenRouter `403 Key limit exceeded`).

한편 임시 `402` 사용 기간 및 조직/작업공간 지출 한도 오류는 메시지가 재시도 가능해 보일 때 `rate_limit`으로 분류됩니다(예: `weekly usage limit exhausted`, `daily limit reached, resets tomorrow`, 또는 `organization spending limit exceeded`). 이러한 오류는 긴 결제 비활성화 경로가 아니라 짧은 쿨다운/장애 조치 경로에 유지됩니다.
</Note>

상태는 에이전트별 SQLite 인증 상태에 저장됩니다.

```json
{
  "usageStats": {
    "provider:profile": {
      "disabledUntil": 1736178000000,
      "disabledReason": "billing"
    }
  }
}
```

기본값:

- 결제 백오프는 **5시간**에서 시작해 결제 실패마다 두 배가 되며 **24시간**으로 제한됩니다.
- 프로필이 **24시간** 동안 실패하지 않으면 백오프 카운터가 재설정됩니다(구성 가능).
- 과부하 재시도는 모델 폴백 전에 **동일 공급자 프로필 순환 1회**를 허용합니다.
- 과부하 재시도는 기본적으로 **0 ms 백오프**를 사용합니다.

## 모델 폴백

한 공급자의 모든 프로필이 실패하면 OpenClaw는 `agents.defaults.model.fallbacks`의 다음 모델로 이동합니다. 이는 프로필 순환을 모두 소진한 인증 실패, 속도 제한, 타임아웃에 적용됩니다(다른 오류는 폴백을 진행하지 않습니다). 충분한 세부 정보를 노출하지 않는 공급자 오류도 폴백 상태에서 정확히 라벨링됩니다. `empty_response`는 공급자가 사용 가능한 메시지나 상태를 반환하지 않았음을 의미하고, `no_error_details`는 공급자가 명시적으로 `Unknown error (no error details in response)`를 반환했음을 의미하며, `unclassified`는 OpenClaw가 원시 미리보기를 보존했지만 아직 어떤 분류기도 일치하지 않았음을 의미합니다.

과부하 및 속도 제한 오류는 결제 쿨다운보다 더 적극적으로 처리됩니다. 기본적으로 OpenClaw는 동일 공급자 인증 프로필 재시도를 한 번 허용한 뒤, 기다리지 않고 다음 구성된 모델 폴백으로 전환합니다. `ModelNotReadyException` 같은 공급자 바쁨 신호는 해당 과부하 버킷에 들어갑니다. `auth.cooldowns.overloadedProfileRotations`, `auth.cooldowns.overloadedBackoffMs`, `auth.cooldowns.rateLimitedProfileRotations`로 이를 조정할 수 있습니다.

실행이 구성된 기본 primary, cron 작업 primary, 명시적 폴백이 있는 에이전트 primary, 또는 자동 선택된 폴백 오버라이드에서 시작되면 OpenClaw는 일치하는 구성된 폴백 체인을 따라갈 수 있습니다. 명시적 폴백이 없는 에이전트 primary와 명시적 사용자 선택(예: `/model ollama/qwen3.5:27b`, 모델 선택기, `sessions.patch`, 또는 일회성 CLI 공급자/모델 오버라이드)은 엄격합니다. 해당 공급자/모델에 도달할 수 없거나 응답을 생성하기 전에 실패하면, OpenClaw는 관련 없는 폴백에서 응답하는 대신 실패를 보고합니다.

### 후보 체인 규칙

OpenClaw는 현재 요청된 `provider/model`과 구성된 폴백으로 후보 목록을 만듭니다.

<AccordionGroup>
  <Accordion title="규칙">
    - 요청된 모델은 항상 첫 번째입니다.
    - 명시적으로 구성된 폴백은 중복 제거되지만 모델 허용 목록으로 필터링되지 않습니다. 이는 명시적 운영자 의도로 처리됩니다.
    - 현재 실행이 이미 같은 공급자 계열의 구성된 폴백에 있다면 OpenClaw는 전체 구성 체인을 계속 사용합니다.
    - 명시적 폴백 오버라이드가 제공되지 않으면, 요청된 모델이 다른 공급자를 사용하더라도 구성된 primary보다 구성된 폴백을 먼저 시도합니다.
    - 폴백 실행기에 명시적 폴백 오버라이드가 제공되지 않으면, 체인이 앞선 후보를 모두 소진한 뒤 일반 기본값으로 되돌아갈 수 있도록 구성된 primary가 끝에 추가됩니다.
    - 호출자가 `fallbacksOverride`를 제공하면 실행기는 요청된 모델과 해당 오버라이드 목록만 정확히 사용합니다. 빈 목록은 모델 폴백을 비활성화하고 구성된 primary가 숨겨진 재시도 대상으로 추가되는 것을 방지합니다.

  </Accordion>
</AccordionGroup>

### 폴백을 진행시키는 오류

<Tabs>
  <Tab title="계속 진행">
    - 인증 실패
    - 속도 제한 및 쿨다운 소진
    - 과부하/공급자 바쁨 오류
    - 타임아웃 형태의 장애 조치 오류
    - 결제 비활성화
    - `LiveSessionModelSwitchError`: 오래된 지속 모델이 외부 재시도 루프를 만들지 않도록 장애 조치 경로로 정규화됩니다.
    - 아직 남은 후보가 있을 때의 기타 인식되지 않은 오류

  </Tab>
  <Tab title="계속 진행하지 않음">
    - 타임아웃/장애 조치 형태가 아닌 명시적 중단
    - compaction/재시도 로직 내부에 남아야 하는 컨텍스트 초과 오류(예: `request_too_large`, `INVALID_ARGUMENT: input exceeds the maximum number of tokens`, `input token count exceeds the maximum number of input tokens`, `The input is too long for the model`, 또는 `ollama error: context length exceeded`)
    - 남은 후보가 없을 때의 최종 알 수 없는 오류
    - Claude Fable 5 안전 거부. 직접 API 키 요청은 대신 Anthropic의 서버 측 `claude-opus-4-8` 폴백을 통해 공급자 수준에서 이를 처리합니다([Anthropic](/ko/providers/anthropic#safety-refusal-fallback-claude-fable-5) 참고).

  </Tab>
</Tabs>

### 쿨다운 건너뛰기와 프로브 동작

한 공급자의 모든 인증 프로필이 이미 쿨다운 상태인 경우에도 OpenClaw는 해당 공급자를 영원히 자동으로 건너뛰지 않습니다. 후보별로 결정을 내립니다.

<AccordionGroup>
  <Accordion title="후보별 결정">
    - 지속적인 인증 실패는 전체 공급자를 즉시 건너뜁니다.
    - 결제 비활성화는 보통 건너뛰지만, primary 후보는 재시작 없이 복구가 가능하도록 스로틀 하에서 계속 프로브될 수 있습니다.
    - primary 후보는 공급자별 스로틀과 함께 쿨다운 만료가 가까워졌을 때 프로브될 수 있습니다.
    - 실패가 일시적으로 보이는 경우(`rate_limit`, `overloaded`, 또는 알 수 없음) 동일 공급자 폴백 형제는 쿨다운에도 불구하고 시도될 수 있습니다. 이는 특히 속도 제한이 모델 범위이고 형제 모델이 즉시 복구될 수 있을 때 중요합니다.
    - 단일 공급자가 교차 공급자 폴백을 지연시키지 않도록 일시적 쿨다운 프로브는 폴백 실행당 공급자별 1회로 제한됩니다.

  </Accordion>
</AccordionGroup>

## 세션 오버라이드와 실시간 모델 전환

세션 모델 변경은 공유 상태입니다. 활성 실행기, `/model` 명령, compaction/세션 업데이트, 실시간 세션 조정은 모두 동일한 세션 항목의 일부를 읽거나 씁니다.

이는 폴백 재시도가 실시간 모델 전환과 조율되어야 함을 의미합니다.

- 명시적인 사용자 주도 모델 변경만 대기 중인 실시간 전환을 표시합니다. 여기에는 `/model`, `session_status(model=...)`, `sessions.patch`가 포함됩니다.
- 폴백 순환, heartbeat 오버라이드, compaction 같은 시스템 주도 모델 변경은 그 자체로 대기 중인 실시간 전환을 표시하지 않습니다.
- 사용자 주도 모델 오버라이드는 폴백 정책에서 정확한 선택으로 처리되므로, 선택된 공급자에 도달할 수 없으면 `agents.defaults.model.fallbacks`에 의해 가려지지 않고 실패로 드러납니다.
- 폴백 재시도가 시작되기 전에 응답 실행기는 선택된 폴백 오버라이드 필드를 세션 항목에 지속 저장합니다.
- 자동 폴백 오버라이드는 이후 턴에서도 선택된 상태로 유지되어 OpenClaw가 모든 메시지마다 알려진 불량 primary를 프로브하지 않게 합니다. OpenClaw는 구성된 원점을 주기적으로 다시 프로브하고 복구되면 자동 오버라이드를 해제합니다. `/new`, `/reset`, `sessions.reset`은 자동 원천 오버라이드를 즉시 해제합니다.
- 사용자 응답은 상태 변경마다 한 번 폴백 전환 및 폴백 해제 복구를 알립니다. 고정 폴백 턴에서는 알림을 반복하지 않습니다.
- `/status`는 선택된 모델을 표시하고, 폴백 상태가 다를 때 활성 폴백 모델과 이유를 표시합니다.
- 실시간 세션 조정은 오래된 런타임 모델 필드보다 지속 저장된 세션 오버라이드를 우선합니다.
- 실시간 전환 오류가 활성 폴백 체인의 이후 후보를 가리키면 OpenClaw는 관련 없는 후보를 먼저 따라가는 대신 해당 선택된 모델로 직접 이동합니다.
- 폴백 시도가 실패하면 실행기는 자신이 쓴 오버라이드 필드만 롤백하며, 해당 필드가 여전히 실패한 후보와 일치할 때만 롤백합니다.

이는 고전적인 경합을 방지합니다.

<Steps>
  <Step title="Primary 실패">
    선택된 primary 모델이 실패합니다.
  </Step>
  <Step title="메모리에서 폴백 선택">
    폴백 후보가 메모리에서 선택됩니다.
  </Step>
  <Step title="세션 저장소는 여전히 이전 primary를 표시">
    세션 저장소는 여전히 이전 primary를 반영합니다.
  </Step>
  <Step title="실시간 조정이 오래된 상태를 읽음">
    실시간 세션 조정이 오래된 세션 상태를 읽습니다.
  </Step>
  <Step title="재시도가 되돌아감">
    폴백 시도가 시작되기 전에 재시도가 이전 모델로 되돌아갑니다.
  </Step>
</Steps>

지속 저장된 폴백 오버라이드는 이 구간을 닫고, 좁은 롤백은 더 새로운 수동 또는 런타임 세션 변경을 그대로 유지합니다.

## 관측 가능성과 실패 요약

`runWithModelFallback(...)`은 로그와 사용자 대상 쿨다운 메시징에 제공되는 시도별 세부 정보를 기록합니다.

- 시도한 공급자/모델
- 이유(`rate_limit`, `overloaded`, `billing`, `auth`, `model_not_found` 및 유사한 장애 조치 이유)
- 선택적 상태/코드
- 사람이 읽을 수 있는 오류 요약

구조화된 `model_fallback_decision` 로그에는 후보가 실패하거나, 건너뛰어지거나, 이후 폴백이 성공할 때 평면 `fallbackStep*` 필드도 포함됩니다. 이러한 필드는 시도된 전환을 명시적으로 만듭니다(`fallbackStepFromModel`, `fallbackStepToModel`, `fallbackStepFromFailureReason`, `fallbackStepFromFailureDetail`, `fallbackStepFinalOutcome`). 따라서 로그 및 진단 내보내기 도구는 최종 폴백도 실패한 경우에도 primary 실패를 재구성할 수 있습니다.

모든 후보가 실패하면 OpenClaw는 `FallbackSummaryError`를 throw합니다. 외부 응답 실행기는 이를 사용하여 "모든 모델이 일시적으로 속도 제한됨" 같은 더 구체적인 메시지를 만들고, 알려진 경우 가장 이른 쿨다운 만료 시간을 포함할 수 있습니다.

해당 쿨다운 요약은 모델을 인식합니다.

- 관련 없는 모델 범위 속도 제한은 시도된 공급자/모델 체인에서 무시됩니다.
- 남은 차단이 일치하는 모델 범위 속도 제한인 경우, OpenClaw는 해당 모델을 여전히 차단하는 마지막 일치 만료 시간을 보고합니다.

## 관련 구성

다음 내용은 [Gateway 구성](/ko/gateway/configuration)을 참고하세요.

- `auth.profiles` / `auth.order`
- `auth.cooldowns.billingBackoffHours` / `auth.cooldowns.billingBackoffHoursByProvider`
- `auth.cooldowns.billingMaxHours` / `auth.cooldowns.failureWindowHours`
- `auth.cooldowns.overloadedProfileRotations` / `auth.cooldowns.overloadedBackoffMs`
- `auth.cooldowns.rateLimitedProfileRotations`
- `agents.defaults.model.primary` / `agents.defaults.model.fallbacks`
- `agents.defaults.imageModel` 라우팅

더 광범위한 모델 선택 및 폴백 개요는 [모델](/ko/concepts/models)을 참조하세요.