이 페이지는 OpenClaw 메모리 검색의 모든 구성 조정 항목을 나열합니다. 개념 개요는 다음을 참조하세요.Documentation Index
Fetch the complete documentation index at: https://docs.openclaw.ai/llms.txt
Use this file to discover all available pages before exploring further.
메모리 개요
메모리 작동 방식.
내장 엔진
기본 SQLite 백엔드.
QMD 엔진
로컬 우선 사이드카.
메모리 검색
검색 파이프라인 및 튜닝.
Active Memory
대화형 세션용 메모리 하위 에이전트.
openclaw.json의 agents.defaults.memorySearch 아래에 있습니다.
Active Memory 기능 토글과 하위 에이전트 구성을 찾고 있다면, 이는
memorySearch가 아니라 plugins.entries.active-memory 아래에 있습니다.Active Memory는 두 단계 게이트 모델을 사용합니다.- plugin이 활성화되어 있어야 하며 현재 에이전트 ID를 대상으로 해야 합니다
- 요청은 적격한 대화형 영구 채팅 세션이어야 합니다
제공자 선택
| 키 | 유형 | 기본값 | 설명 |
|---|---|---|---|
provider | string | 자동 감지 | bedrock, deepinfra, gemini, github-copilot, local, mistral, ollama, openai, voyage 같은 임베딩 어댑터 ID입니다. api가 이러한 어댑터 중 하나를 가리키는 구성된 models.providers.<id>일 수도 있습니다 |
model | string | 제공자 기본값 | 임베딩 모델 이름 |
fallback | string | "none" | 기본 제공자가 실패할 때 사용할 폴백 어댑터 ID |
enabled | boolean | true | 메모리 검색을 활성화하거나 비활성화합니다 |
자동 감지 순서
provider가 설정되지 않은 경우 OpenClaw는 사용 가능한 첫 번째 항목을 선택합니다.
ollama는 지원되지만 자동 감지되지는 않습니다(명시적으로 설정하세요).
사용자 지정 제공자 ID
memorySearch.provider는 사용자 지정 models.providers.<id> 항목을 가리킬 수 있습니다. OpenClaw는 엔드포인트, 인증, 모델 접두사 처리를 위해 사용자 지정 제공자 ID를 유지하면서 임베딩 어댑터에 대한 해당 제공자의 api 소유자를 확인합니다. 이를 통해 멀티 GPU 또는 멀티 호스트 설정에서 메모리 임베딩을 특정 로컬 엔드포인트에 전용으로 할당할 수 있습니다.
API 키 확인
원격 임베딩에는 API 키가 필요합니다. 대신 Bedrock은 AWS SDK 기본 자격 증명 체인을 사용합니다(인스턴스 역할, SSO, 액세스 키).| 제공자 | 환경 변수 | 구성 키 |
|---|---|---|
| Bedrock | AWS 자격 증명 체인 | API 키 필요 없음 |
| DeepInfra | DEEPINFRA_API_KEY | models.providers.deepinfra.apiKey |
| Gemini | GEMINI_API_KEY | models.providers.google.apiKey |
| GitHub Copilot | COPILOT_GITHUB_TOKEN, GH_TOKEN, GITHUB_TOKEN | 디바이스 로그인을 통한 인증 프로필 |
| Mistral | MISTRAL_API_KEY | models.providers.mistral.apiKey |
| Ollama | OLLAMA_API_KEY (자리 표시자) | — |
| OpenAI | OPENAI_API_KEY | models.providers.openai.apiKey |
| Voyage | VOYAGE_API_KEY | models.providers.voyage.apiKey |
Codex OAuth는 채팅/완성만 처리하며 임베딩 요청을 충족하지 않습니다.
원격 엔드포인트 구성
사용자 지정 OpenAI 호환 엔드포인트를 사용하거나 제공자 기본값을 재정의하는 경우:사용자 지정 API 기본 URL.
API 키 재정의.
추가 HTTP 헤더(제공자 기본값과 병합됨).
제공자별 구성
Gemini
Gemini
| 키 | 유형 | 기본값 | 설명 |
|---|---|---|---|
model | string | gemini-embedding-001 | gemini-embedding-2-preview도 지원합니다 |
outputDimensionality | number | 3072 | Embedding 2의 경우: 768, 1536 또는 3072 |
OpenAI 호환 입력 유형
OpenAI 호환 입력 유형
OpenAI 호환 임베딩 엔드포인트는 제공자별
이러한 값을 변경하면 제공자 배치 색인에 대한 임베딩 캐시 ID에 영향을 주며, 업스트림 모델이 레이블을 다르게 처리하는 경우 메모리 재색인이 뒤따라야 합니다.
input_type 요청 필드를 사용할 수 있습니다. 이는 쿼리와 문서 임베딩에 서로 다른 레이블이 필요한 비대칭 임베딩 모델에 유용합니다.| 키 | 유형 | 기본값 | 설명 |
|---|---|---|---|
inputType | string | 설정되지 않음 | 쿼리 및 문서 임베딩에 대한 공유 input_type |
queryInputType | string | 설정되지 않음 | 쿼리 시점 input_type; inputType을 재정의합니다 |
documentInputType | string | 설정되지 않음 | 색인/문서 input_type; inputType을 재정의합니다 |
Bedrock
Bedrock
Bedrock 임베딩 구성
Bedrock은 AWS SDK 기본 자격 증명 체인을 사용하므로 API 키가 필요하지 않습니다. OpenClaw가 Bedrock이 활성화된 인스턴스 역할을 사용해 EC2에서 실행되는 경우, 제공자와 모델만 설정하면 됩니다.| 키 | 유형 | 기본값 | 설명 |
|---|---|---|---|
model | string | amazon.titan-embed-text-v2:0 | 모든 Bedrock 임베딩 모델 ID |
outputDimensionality | number | 모델 기본값 | Titan V2의 경우: 256, 512 또는 1024 |
| 모델 ID | 제공자 | 기본 차원 | 구성 가능한 차원 |
|---|---|---|---|
amazon.titan-embed-text-v2:0 | Amazon | 1024 | 256, 512, 1024 |
amazon.titan-embed-text-v1 | Amazon | 1536 | — |
amazon.titan-embed-g1-text-02 | Amazon | 1536 | — |
amazon.titan-embed-image-v1 | Amazon | 1024 | — |
amazon.nova-2-multimodal-embeddings-v1:0 | Amazon | 1024 | 256, 384, 1024, 3072 |
cohere.embed-english-v3 | Cohere | 1024 | — |
cohere.embed-multilingual-v3 | Cohere | 1024 | — |
cohere.embed-v4:0 | Cohere | 1536 | 256-1536 |
twelvelabs.marengo-embed-3-0-v1:0 | TwelveLabs | 512 | — |
twelvelabs.marengo-embed-2-7-v1:0 | TwelveLabs | 1024 | — |
amazon.titan-embed-text-v1:2:8k)은 기본 모델의 구성을 상속합니다.인증: Bedrock 인증은 표준 AWS SDK 자격 증명 확인 순서를 사용합니다.- 환경 변수(
AWS_ACCESS_KEY_ID+AWS_SECRET_ACCESS_KEY) - SSO 토큰 캐시
- 웹 ID 토큰 자격 증명
- 공유 자격 증명 및 구성 파일
- ECS 또는 EC2 메타데이터 자격 증명
AWS_REGION, AWS_DEFAULT_REGION, amazon-bedrock 제공자 baseUrl에서 확인되거나 기본값 us-east-1이 사용됩니다.IAM 권한: IAM 역할 또는 사용자에는 다음이 필요합니다.InvokeModel 범위를 특정 모델로 제한하세요.Local (GGUF + node-llama-cpp)
Local (GGUF + node-llama-cpp)
| 키 | 유형 | 기본값 | 설명 |
|---|---|---|---|
local.modelPath | string | 자동 다운로드됨 | GGUF 모델 파일 경로 |
local.modelCacheDir | string | node-llama-cpp 기본값 | 다운로드한 모델의 캐시 디렉터리 |
local.contextSize | number | "auto" | 4096 | 임베딩 컨텍스트의 컨텍스트 창 크기입니다. 4096은 일반적인 청크(128"auto"는 모델의 학습된 최대값을 사용합니다. 8B+ 모델에는 권장되지 않습니다(Qwen3-Embedding-8B: 40,960토큰 → VRAM 약 32GB, 4096에서는 약 8.8GB). |
embeddinggemma-300m-qat-Q8_0.gguf(약 0.6GB, 자동 다운로드됨). 소스 체크아웃에는 여전히 네이티브 빌드 승인이 필요합니다. pnpm approve-builds를 실행한 다음 pnpm rebuild node-llama-cpp를 실행하세요.Gateway가 사용하는 것과 동일한 제공자 경로를 확인하려면 독립 실행형 CLI를 사용하세요.provider가 auto이면 local.modelPath가 기존 로컬 파일을 가리킬 때만 local이 선택됩니다. hf: 및 HTTP(S) 모델 참조는 provider: "local"과 함께 명시적으로 계속 사용할 수 있지만, 모델이 디스크에서 사용 가능해지기 전에는 auto가 로컬을 선택하게 만들지 않습니다.인라인 임베딩 시간 제한
메모리 인덱싱 중 인라인 임베딩 배치의 시간 제한을 재정의합니다.설정하지 않으면 제공자 기본값을 사용합니다.
local, ollama, lmstudio 같은 로컬/자체 호스팅 제공자는 600초, 호스팅 제공자는 120초입니다. 로컬 CPU 기반 임베딩 배치가 정상적으로 동작하지만 느릴 때 이 값을 늘리세요.하이브리드 검색 설정
모두memorySearch.query.hybrid 아래에 있습니다.
| 키 | 유형 | 기본값 | 설명 |
|---|---|---|---|
enabled | boolean | true | 하이브리드 BM25 + 벡터 검색 활성화 |
vectorWeight | number | 0.7 | 벡터 점수의 가중치(0-1) |
textWeight | number | 0.3 | BM25 점수의 가중치(0-1) |
candidateMultiplier | number | 4 | 후보 풀 크기 배율 |
- MMR (diversity)
- Temporal decay (recency)
| 키 | 유형 | 기본값 | 설명 |
|---|---|---|---|
mmr.enabled | boolean | false | MMR 재순위 지정 활성화 |
mmr.lambda | number | 0.7 | 0 = 최대 다양성, 1 = 최대 관련성 |
전체 예시
추가 메모리 경로
| 키 | 유형 | 설명 |
|---|---|---|
extraPaths | string[] | 인덱싱할 추가 디렉터리 또는 파일 |
.md 파일을 찾기 위해 재귀적으로 스캔됩니다. 심볼릭 링크 처리는 활성 백엔드에 따라 달라집니다. 내장 엔진은 심볼릭 링크를 무시하고, QMD는 기본 QMD 스캐너 동작을 따릅니다.
에이전트 범위의 교차 에이전트 트랜스크립트 검색에는 memory.qmd.paths 대신 agents.list[].memorySearch.qmd.extraCollections를 사용하세요. 이러한 추가 컬렉션은 동일한 { path, name, pattern? } 형태를 따르지만 에이전트별로 병합되며, 경로가 현재 워크스페이스 외부를 가리킬 때 명시적인 공유 이름을 보존할 수 있습니다. 동일하게 해석된 경로가 memory.qmd.paths와 memorySearch.qmd.extraCollections에 모두 나타나면 QMD는 첫 번째 항목을 유지하고 중복 항목을 건너뜁니다.
멀티모달 메모리(Gemini)
Gemini Embedding 2를 사용해 Markdown과 함께 이미지 및 오디오를 인덱싱합니다.| 키 | 유형 | 기본값 | 설명 |
|---|---|---|---|
multimodal.enabled | boolean | false | 멀티모달 인덱싱 활성화 |
multimodal.modalities | string[] | — | ["image"], ["audio"] 또는 ["all"] |
multimodal.maxFileBytes | number | 10000000 | 인덱싱할 최대 파일 크기 |
extraPaths의 파일에만 적용됩니다. 기본 메모리 루트는 Markdown 전용으로 유지됩니다. gemini-embedding-2-preview가 필요합니다. fallback은 반드시 "none"이어야 합니다..jpg, .jpeg, .png, .webp, .gif, .heic, .heif(이미지); .mp3, .wav, .ogg, .opus, .m4a, .aac, .flac(오디오).
임베딩 캐시
| 키 | 유형 | 기본값 | 설명 |
|---|---|---|---|
cache.enabled | boolean | false | 청크 임베딩을 SQLite에 캐시 |
cache.maxEntries | number | 50000 | 캐시되는 최대 임베딩 수 |
배치 인덱싱
| 키 | 유형 | 기본값 | 설명 |
|---|---|---|---|
remote.nonBatchConcurrency | number | 4 | 병렬 인라인 임베딩 |
remote.batch.enabled | boolean | false | 배치 임베딩 API 활성화 |
remote.batch.concurrency | number | 2 | 병렬 배치 작업 |
remote.batch.wait | boolean | true | 배치 완료 대기 |
remote.batch.pollIntervalMs | number | — | 폴링 간격 |
remote.batch.timeoutMinutes | number | — | 배치 시간 제한 |
openai, gemini, voyage에서 사용할 수 있습니다. OpenAI 배치는 일반적으로 대규모 백필에 가장 빠르고 비용이 저렴합니다.
remote.nonBatchConcurrency는 로컬/자체 호스팅 제공자와, 제공자 배치 API가 활성화되지 않은 경우 호스팅 제공자가 사용하는 인라인 임베딩 호출을 제어합니다. Ollama는 더 작은 로컬 호스트에 과부하를 주지 않도록 비배치 인덱싱의 기본값을 1로 설정합니다. 더 큰 머신에서는 더 높은 값을 설정하세요.
이는 인라인 임베딩 호출의 시간 제한을 제어하는 sync.embeddingBatchTimeoutSeconds와는 별개입니다.
세션 메모리 검색(실험적)
세션 대화 기록을 인덱싱하고memory_search를 통해 노출합니다.
| 키 | 유형 | 기본값 | 설명 |
|---|---|---|---|
experimental.sessionMemory | boolean | false | 세션 인덱싱 활성화 |
sources | string[] | ["memory"] | 대화 기록을 포함하려면 "sessions" 추가 |
sync.sessions.deltaBytes | number | 100000 | 재인덱싱을 위한 바이트 임계값 |
sync.sessions.deltaMessages | number | 50 | 재인덱싱을 위한 메시지 임계값 |
SQLite 벡터 가속(sqlite-vec)
| 키 | 유형 | 기본값 | 설명 |
|---|---|---|---|
store.vector.enabled | boolean | true | 벡터 쿼리에 sqlite-vec 사용 |
store.vector.extensionPath | string | 번들 제공 | sqlite-vec 경로 재정의 |
인덱스 저장소
| 키 | 유형 | 기본값 | 설명 |
|---|---|---|---|
store.path | string | ~/.openclaw/memory/{agentId}.sqlite | 인덱스 위치({agentId} 토큰 지원) |
store.fts.tokenizer | string | unicode61 | FTS5 토크나이저(unicode61 또는 trigram) |
QMD 백엔드 구성
활성화하려면memory.backend = "qmd"를 설정하세요. 모든 QMD 설정은 memory.qmd 아래에 있습니다.
| 키 | 유형 | 기본값 | 설명 |
|---|---|---|---|
command | string | qmd | QMD 실행 파일 경로. 서비스 PATH가 셸과 다른 경우 절대 경로를 설정하세요 |
searchMode | string | search | 검색 명령: search, vsearch, query |
includeDefaultMemory | boolean | true | MEMORY.md + memory/**/*.md 자동 인덱싱 |
paths[] | array | — | 추가 경로: { name, path, pattern? } |
sessions.enabled | boolean | false | 세션 대화 기록 인덱싱 |
sessions.retentionDays | number | — | 대화 기록 보존 기간 |
sessions.exportDir | string | — | 내보내기 디렉터리 |
searchMode: "search"는 lexical/BM25 전용입니다. OpenClaw는 memory status --deep 중을 포함하여 해당 모드에 대해 시맨틱 벡터 준비 상태 프로브나 QMD 임베딩 유지 관리를 실행하지 않습니다. vsearch와 query는 계속 QMD 벡터 준비 상태와 임베딩을 요구합니다.
OpenClaw는 현재 QMD 컬렉션과 MCP 쿼리 형태를 선호하지만, 필요할 때 호환 가능한 컬렉션 패턴 플래그와 이전 MCP 도구 이름을 시도하여 오래된 QMD 릴리스도 계속 동작하도록 유지합니다. QMD가 여러 컬렉션 필터 지원을 알리면, 동일 소스 컬렉션은 하나의 QMD 프로세스로 검색됩니다. 오래된 QMD 빌드는 컬렉션별 호환성 경로를 유지합니다. 동일 소스란 영속 메모리 컬렉션이 함께 그룹화되고, 세션 기록 컬렉션은 별도 그룹으로 남아 소스 다양화가 여전히 두 입력을 모두 갖는다는 뜻입니다.
QMD 모델 재정의는 OpenClaw 구성 쪽이 아니라 QMD 쪽에 유지됩니다. QMD의 모델을 전역으로 재정의해야 한다면 Gateway 런타임 환경에서
QMD_EMBED_MODEL, QMD_RERANK_MODEL, QMD_GENERATE_MODEL 같은 환경 변수를 설정하세요.업데이트 일정
업데이트 일정
| 키 | 유형 | 기본값 | 설명 |
|---|---|---|---|
update.interval | string | 5m | 새로 고침 간격 |
update.debounceMs | number | 15000 | 파일 변경 디바운스 |
update.onBoot | boolean | true | 장기 실행 QMD 관리자가 열릴 때 새로 고침하며, 옵트인 시작 시 새로 고침도 제어합니다 |
update.startup | string | off | 선택적 Gateway 시작 시 새로 고침: off, idle, 또는 immediate |
update.startupDelayMs | number | 120000 | startup: "idle" 새로 고침이 실행되기 전 지연 시간 |
update.waitForBootSync | boolean | false | 초기 새로 고침이 완료될 때까지 관리자 열기를 차단 |
update.embedInterval | string | — | 별도 임베딩 주기 |
update.commandTimeoutMs | number | — | QMD 명령 제한 시간 |
update.updateTimeoutMs | number | — | QMD 업데이트 작업 제한 시간 |
update.embedTimeoutMs | number | — | QMD 임베딩 작업 제한 시간 |
제한
제한
| 키 | 유형 | 기본값 | 설명 |
|---|---|---|---|
limits.maxResults | number | 6 | 최대 검색 결과 |
limits.maxSnippetChars | number | — | 스니펫 길이 제한 |
limits.maxInjectedChars | number | — | 주입되는 전체 문자 수 제한 |
limits.timeoutMs | number | 4000 | 검색 제한 시간 |
범위
범위
QMD 검색 결과를 받을 수 있는 세션을 제어합니다. 제공되는 기본값은 그룹은 계속 거부하면서 직접 세션과 채널 세션을 허용합니다.기본값은 DM 전용입니다.
session.sendPolicy와 동일한 스키마입니다.match.keyPrefix는 정규화된 세션 키와 일치하고, match.rawKeyPrefix는 agent:<id>:를 포함한 원시 키와 일치합니다.인용
인용
memory.citations는 모든 백엔드에 적용됩니다.| 값 | 동작 |
|---|---|
auto (기본값) | 스니펫에 Source: <path#line> 푸터 포함 |
on | 항상 푸터 포함 |
off | 푸터 생략(경로는 내부적으로 에이전트에 계속 전달됨) |
전체 QMD 예시
Dreaming
Dreaming은agents.defaults.memorySearch 아래가 아니라 plugins.entries.memory-core.config.dreaming 아래에서 구성됩니다.
Dreaming은 하나의 예약된 스윕으로 실행되며 내부 light/deep/REM 단계를 구현 세부 사항으로 사용합니다.
개념적 동작과 슬래시 명령은 Dreaming을 참조하세요.
사용자 설정
| 키 | 유형 | 기본값 | 설명 |
|---|---|---|---|
enabled | boolean | false | Dreaming을 전체적으로 활성화하거나 비활성화 |
frequency | string | 0 3 * * * | 전체 Dreaming 스윕을 위한 선택적 cron 주기 |
model | string | 기본 모델 | 선택적 Dream Diary 하위 에이전트 모델 재정의 |
예시
- Dreaming은 머신 상태를
memory/.dreams/에 기록합니다. - Dreaming은 사람이 읽을 수 있는 내러티브 출력을
DREAMS.md(또는 기존dreams.md)에 기록합니다. dreaming.model은 기존 Plugin 하위 에이전트 신뢰 게이트를 사용합니다. 활성화하기 전에plugins.entries.memory-core.subagent.allowModelOverride: true를 설정하세요.- 구성된 모델을 사용할 수 없으면 Dream Diary는 세션 기본 모델로 한 번 다시 시도합니다. 신뢰 또는 허용 목록 실패는 기록되며 조용히 재시도되지 않습니다.
- light/deep/REM 단계 정책과 임계값은 사용자 대상 구성이 아니라 내부 동작입니다.