Technical reference

Referência de configuração de memória

Esta página lista todos os controles de configuração para a busca de memória do OpenClaw. Para visões conceituais gerais, consulte:

Visão geral da memória

Como a memória funciona.

Mecanismo integrado

Backend SQLite padrão.

Mecanismo QMD

Sidecar local-first.

Busca de memória

Pipeline de busca e ajuste.

Memória ativa

Subagente de memória para sessões interativas.

Todas as configurações de busca de memória ficam em agents.defaults.memorySearch no openclaw.json, salvo indicação em contrário.

Seleção de provedor

Chave	Tipo	Padrão	Descrição
`provider`	`string`	`"openai"`	ID do adaptador de embeddings, como `bedrock`, `deepinfra`, `gemini`, `github-copilot`, `local`, `mistral`, `ollama`, `openai`, `openai-compatible` ou `voyage`; também pode ser um `models.providers.<id>` configurado cujo `api` aponta para um adaptador de embeddings de memória ou uma API de modelo compatível com OpenAI
`model`	`string`	padrão do provedor	Nome do modelo de embeddings
`fallback`	`string`	`"none"`	ID do adaptador de fallback quando o primário falha
`enabled`	`boolean`	`true`	Habilita ou desabilita a busca de memória

Quando provider não está definido, o OpenClaw usa embeddings da OpenAI. Defina provider explicitamente para usar Gemini, Voyage, Mistral, DeepInfra, Bedrock, GitHub Copilot, Ollama, um modelo GGUF local ou um endpoint /v1/embeddings compatível com OpenAI. Configurações legadas que ainda dizem provider: "auto" são resolvidas para openai.

Quando provider não está definido, provider: "auto" legado está presente ou provider: "none" seleciona intencionalmente o modo somente FTS, a recuperação de memória ainda pode usar classificação lexical FTS quando embeddings não estiverem disponíveis.

Provedores explícitos não locais falham de modo fechado. Se você definir memorySearch.provider como um provedor concreto com backend remoto, como OpenAI, Gemini, Voyage, Mistral, Bedrock, GitHub Copilot, DeepInfra, Ollama, LM Studio ou um provedor personalizado compatível com OpenAI, e esse provedor estiver indisponível em runtime, memory_search retornará um resultado indisponível em vez de usar silenciosamente a recuperação somente FTS. Corrija a configuração de provedor/autenticação, mude para um provedor acessível ou defina provider: "none" se você quiser recuperação somente FTS deliberada.

IDs de provedores personalizados

memorySearch.provider pode apontar para uma entrada personalizada models.providers.<id> para adaptadores de provedor específicos de memória, como ollama, ou para APIs de modelo compatíveis com OpenAI, como openai-responses / openai-completions. O OpenClaw resolve o proprietário de api desse provedor para o adaptador de embeddings preservando o ID de provedor personalizado para tratamento de endpoint, autenticação e prefixo de modelo. Isso permite que configurações com várias GPUs ou vários hosts dediquem embeddings de memória a um endpoint local específico:

json5

{  models: {    providers: {      "ollama-5080": {        api: "ollama",        baseUrl: "http://gpu-box.local:11435",        apiKey: "ollama-local",        models: [{ id: "qwen3-embedding:0.6b" }],      },    },  },  agents: {    defaults: {      memorySearch: {        provider: "ollama-5080",        model: "qwen3-embedding:0.6b",      },    },  },}

Resolução de chave de API

Embeddings remotos exigem uma chave de API. Bedrock usa a cadeia de credenciais padrão do AWS SDK em vez disso (funções de instância, SSO, chaves de acesso).

Provedor	Variável de ambiente	Chave de configuração
Bedrock	cadeia de credenciais da AWS	Nenhuma chave de API necessária
DeepInfra	`DEEPINFRA_API_KEY`	`models.providers.deepinfra.apiKey`
Gemini	`GEMINI_API_KEY`	`models.providers.google.apiKey`
GitHub Copilot	`COPILOT_GITHUB_TOKEN`, `GH_TOKEN`, `GITHUB_TOKEN`	Perfil de autenticação via login de dispositivo
Mistral	`MISTRAL_API_KEY`	`models.providers.mistral.apiKey`
Ollama	`OLLAMA_API_KEY` (placeholder)	--
OpenAI	`OPENAI_API_KEY`	`models.providers.openai.apiKey`
Voyage	`VOYAGE_API_KEY`	`models.providers.voyage.apiKey`

Configuração de endpoint remoto

Use provider: "openai-compatible" para um servidor genérico /v1/embeddings compatível com OpenAI que não deve herdar credenciais globais de chat da OpenAI.

remote.baseUrlstring

URL base personalizada da API.

remote.apiKeystring

Substitui a chave de API.

remote.headersobject

Cabeçalhos HTTP extras (mesclados com os padrões do provedor).

json5

{  agents: {    defaults: {      memorySearch: {        provider: "openai-compatible",        model: "text-embedding-3-small",        remote: {          baseUrl: "https://api.example.com/v1/",          apiKey: "YOUR_KEY",        },      },    },  },}

Configuração específica do provedor

Gemini

Chave	Tipo	Padrão	Descrição
`model`	`string`	`gemini-embedding-001`	Também oferece suporte a `gemini-embedding-2-preview`
`outputDimensionality`	`number`	`3072`	Para Embedding 2: 768, 1536 ou 3072

Tipos de entrada compatíveis com OpenAI

Endpoints de embeddings compatíveis com OpenAI podem optar por campos de solicitação input_type específicos do provedor. Isso é útil para modelos de embeddings assimétricos que exigem rótulos diferentes para embeddings de consulta e de documento.

Chave	Tipo	Padrão	Descrição
`inputType`	`string`	não definido	`input_type` compartilhado para embeddings de consulta e documento
`queryInputType`	`string`	não definido	`input_type` em tempo de consulta; substitui `inputType`
`documentInputType`	`string`	não definido	`input_type` de índice/documento; substitui `inputType`

json5

{  agents: {    defaults: {      memorySearch: {        provider: "openai-compatible",        remote: {          baseUrl: "https://embeddings.example/v1",          apiKey: "${EMBEDDINGS_API_KEY}",        },        model: "asymmetric-embedder",        queryInputType: "query",        documentInputType: "passage",      },    },  },}

Alterar esses valores afeta a identidade do cache de embeddings para indexação em lote do provedor e deve ser seguido por uma reindexação de memória quando o modelo upstream tratar os rótulos de forma diferente.

Bedrock

Configuração de embeddings do Bedrock

Bedrock usa a cadeia de credenciais padrão do AWS SDK — nenhuma chave de API é necessária. Se o OpenClaw for executado no EC2 com uma função de instância habilitada para Bedrock, basta definir o provedor e o modelo:

json5

{  agents: {    defaults: {      memorySearch: {        provider: "bedrock",        model: "amazon.titan-embed-text-v2:0",      },    },  },}

Chave	Tipo	Padrão	Descrição
`model`	`string`	`amazon.titan-embed-text-v2:0`	Qualquer ID de modelo de embeddings do Bedrock
`outputDimensionality`	`number`	padrão do modelo	Para Titan V2: 256, 512 ou 1024

Modelos compatíveis (com detecção de família e padrões de dimensão):

ID do modelo	Provedor	Dimensões padrão	Dimensões configuráveis
`amazon.titan-embed-text-v2:0`	Amazon	1024	256, 512, 1024
`amazon.titan-embed-text-v1`	Amazon	1536	--
`amazon.titan-embed-g1-text-02`	Amazon	1536	--
`amazon.titan-embed-image-v1`	Amazon	1024	--
`amazon.nova-2-multimodal-embeddings-v1:0`	Amazon	1024	256, 384, 1024, 3072
`cohere.embed-english-v3`	Cohere	1024	--
`cohere.embed-multilingual-v3`	Cohere	1024	--
`cohere.embed-v4:0`	Cohere	1536	256-1536
`twelvelabs.marengo-embed-3-0-v1:0`	TwelveLabs	512	--
`twelvelabs.marengo-embed-2-7-v1:0`	TwelveLabs	1024	--

Variantes com sufixo de throughput (por exemplo, amazon.titan-embed-text-v1:2:8k) herdam a configuração do modelo base.

Autenticação: a autenticação do Bedrock usa a ordem padrão de resolução de credenciais do AWS SDK:

Variáveis de ambiente (AWS_ACCESS_KEY_ID + AWS_SECRET_ACCESS_KEY)
Cache de token SSO
Credenciais de token de identidade web
Arquivos compartilhados de credenciais e configuração
Credenciais de metadados do ECS ou EC2

A região é resolvida a partir de AWS_REGION, AWS_DEFAULT_REGION, do baseUrl do provedor amazon-bedrock, ou usa us-east-1 como padrão.

Permissões do IAM: a função ou o usuário do IAM precisa de:

json

{  "Effect": "Allow",  "Action": "bedrock:InvokeModel",  "Resource": "*"}

Para privilégio mínimo, restrinja InvokeModel ao modelo específico:

Code

arn:aws:bedrock:*::foundation-model/amazon.titan-embed-text-v2:0

Local (GGUF + llama.cpp)

Chave	Tipo	Padrão	Descrição
`local.modelPath`	`string`	baixado automaticamente	Caminho para o arquivo de modelo GGUF
`local.modelCacheDir`	`string`	padrão do node-llama-cpp	Diretório de cache para modelos baixados
`local.contextSize`	`number \| "auto"`	`4096`	Tamanho da janela de contexto para o contexto de embeddings. 4096 cobre chunks típicos (128–512 tokens) enquanto limita a VRAM não usada por pesos. Reduza para 1024–2048 em hosts restritos. `"auto"` usa o máximo treinado do modelo — não recomendado para modelos 8B+ (Qwen3-Embedding-8B: 40 960 tokens → ~32 GB de VRAM vs ~8,8 GB em 4096).

Instale primeiro o provedor oficial llama.cpp: openclaw plugins install @openclaw/llama-cpp-provider. Modelo padrão: embeddinggemma-300m-qat-Q8_0.gguf (~0,6 GB, baixado automaticamente). Checkouts de origem ainda exigem aprovação de build nativo: pnpm approve-builds e depois pnpm rebuild node-llama-cpp.

Use a CLI independente para verificar o mesmo caminho de provedor que o Gateway usa:

bash

openclaw memory status --deep --agent mainopenclaw memory index --force --agent main

Defina provider: "local" explicitamente para embeddings GGUF locais. Referências de modelo hf: e HTTP(S) são compatíveis com configurações locais explícitas, mas não alteram o provedor padrão.

Tempo limite de embedding inline

sync.embeddingBatchTimeoutSecondsnumber

Sobrescreva o tempo limite para lotes de embeddings inline durante a indexação de memória.

Quando não definido, usa o padrão do provedor: 600 segundos para provedores locais/auto-hospedados, como local, ollama e lmstudio, e 120 segundos para provedores hospedados. Aumente isso quando os lotes de embeddings locais limitados por CPU estiverem íntegros, mas lentos.

Configuração de busca híbrida

Tudo em memorySearch.query.hybrid:

Chave	Tipo	Padrão	Descrição
`enabled`	`boolean`	`true`	Habilita busca híbrida BM25 + vetorial
`vectorWeight`	`number`	`0.7`	Peso para pontuações vetoriais (0-1)
`textWeight`	`number`	`0.3`	Peso para pontuações BM25 (0-1)
`candidateMultiplier`	`number`	`4`	Multiplicador do tamanho do pool candidato

MMR (diversity)

Chave	Tipo	Padrão	Descrição
`mmr.enabled`	`boolean`	`false`	Habilita reclassificação por MMR
`mmr.lambda`	`number`	`0.7`	0 = diversidade máxima, 1 = relevância máxima

Temporal decay (recency)

Chave	Tipo	Padrão	Descrição
`temporalDecay.enabled`	`boolean`	`false`	Habilita reforço por recência
`temporalDecay.halfLifeDays`	`number`	`30`	A pontuação cai pela metade a cada N dias

Arquivos perenes (MEMORY.md, arquivos sem data em memory/) nunca sofrem decaimento.

Exemplo completo

json5

{  agents: {    defaults: {      memorySearch: {        query: {          hybrid: {            vectorWeight: 0.7,            textWeight: 0.3,            mmr: { enabled: true, lambda: 0.7 },            temporalDecay: { enabled: true, halfLifeDays: 30 },          },        },      },    },  },}

Caminhos adicionais de memória

Chave	Tipo	Descrição
`extraPaths`	`string[]`	Diretórios ou arquivos adicionais a indexar

json5

{  agents: {    defaults: {      memorySearch: {        extraPaths: ["../team-docs", "/srv/shared-notes"],      },    },  },}

Os caminhos podem ser absolutos ou relativos ao workspace. Diretórios são varridos recursivamente em busca de arquivos .md. O tratamento de symlinks depende do backend ativo: o mecanismo integrado ignora symlinks, enquanto o QMD segue o comportamento do scanner QMD subjacente.

Para busca de transcritos entre agentes com escopo de agente, use agents.list[].memorySearch.qmd.extraCollections em vez de memory.qmd.paths. Essas coleções extras seguem o mesmo formato { path, name, pattern? }, mas são mescladas por agente e podem preservar nomes compartilhados explícitos quando o caminho aponta para fora do workspace atual. Se o mesmo caminho resolvido aparecer em memory.qmd.paths e memorySearch.qmd.extraCollections, o QMD mantém a primeira entrada e ignora a duplicada.

Memória multimodal (Gemini)

Indexe imagens e áudio junto com Markdown usando Gemini Embedding 2:

Chave	Tipo	Padrão	Descrição
`multimodal.enabled`	`boolean`	`false`	Habilitar indexação multimodal
`multimodal.modalities`	`string[]`	--	`["image"]`, `["audio"]`, ou `["all"]`
`multimodal.maxFileBytes`	`number`	`10000000`	Tamanho máximo de arquivo para indexar

Formatos compatíveis: .jpg, .jpeg, .png, .webp, .gif, .heic, .heif (imagens); .mp3, .wav, .ogg, .opus, .m4a, .aac, .flac (áudio).

Cache de embeddings

Chave	Tipo	Padrão	Descrição
`cache.enabled`	`boolean`	`true`	Armazenar embeddings de chunks em cache no SQLite
`cache.maxEntries`	`number`	`50000`	Máximo de embeddings em cache

Evita gerar embeddings novamente para texto inalterado durante reindexação ou atualizações de transcritos.

Indexação em lote

Chave	Tipo	Padrão	Descrição
`remote.nonBatchConcurrency`	`number`	`4`	Embeddings inline paralelos
`remote.batch.enabled`	`boolean`	`false`	Habilitar API de embeddings em lote
`remote.batch.concurrency`	`number`	`2`	Jobs em lote paralelos
`remote.batch.wait`	`boolean`	`true`	Aguardar conclusão do lote
`remote.batch.pollIntervalMs`	`number`	--	Intervalo de polling
`remote.batch.timeoutMinutes`	`number`	--	Tempo limite do lote

Disponível para openai, gemini e voyage. O lote da OpenAI costuma ser o mais rápido e barato para grandes preenchimentos retroativos.

remote.nonBatchConcurrency controla chamadas de embedding inline usadas por provedores locais/auto-hospedados e provedores hospedados quando as APIs de lote do provedor não estão ativas. Ollama usa 1 por padrão para indexação sem lote a fim de evitar sobrecarregar hosts locais menores; defina um valor mais alto em máquinas maiores.

Isso é separado de sync.embeddingBatchTimeoutSeconds, que controla o tempo limite para chamadas de embedding inline.

Busca de memória de sessão (experimental)

Indexe transcritos de sessão e exponha-os via memory_search:

Chave	Tipo	Padrão	Descrição
`experimental.sessionMemory`	`boolean`	`false`	Habilitar indexação de sessão
`sources`	`string[]`	`["memory"]`	Adicionar `"sessions"` para incluir transcritos
`sync.sessions.deltaBytes`	`number`	`100000`	Limite em bytes para reindexação
`sync.sessions.deltaMessages`	`number`	`50`	Limite de mensagens para reindexação

As ocorrências em transcrições de sessão também obedecem a tools.sessions.visibility. A visibilidade padrão tree expõe apenas a sessão atual e as sessões que ela criou. Para recuperar uma sessão não relacionada, do mesmo agente, despachada pelo Gateway a partir de outra sessão, como uma DM, amplie intencionalmente a visibilidade para agent (ou all somente quando a recuperação entre agentes também for necessária e a política entre agentes permitir).

Os exemplos abaixo colocam essas configurações em agents.defaults. Você também pode aplicar configurações equivalentes de memorySearch em uma substituição por agente quando apenas um agente deve indexar e pesquisar transcrições de sessão.

Para recuperação Gateway-para-DM no mesmo agente:

Builtin backend

json5

{  agents: {    defaults: {      memorySearch: {        experimental: { sessionMemory: true },        sources: ["memory", "sessions"],      },    },  },  tools: {    sessions: { visibility: "agent" },  },}

QMD backend

json5

{  agents: {    defaults: {      memorySearch: {        experimental: { sessionMemory: true },        sources: ["memory", "sessions"],      },    },  },  memory: {    backend: "qmd",    qmd: {      sessions: { enabled: true },    },  },  tools: {    sessions: { visibility: "agent" },  },}

Ao usar QMD, agents.defaults.memorySearch.experimental.sessionMemory e sources: ["sessions"] não exportam transcrições para o QMD por si só. Defina também memory.qmd.sessions.enabled: true.

Aceleração vetorial SQLite (sqlite-vec)

Chave	Tipo	Padrão	Descrição
`store.vector.enabled`	`boolean`	`true`	Usar sqlite-vec para consultas vetoriais
`store.vector.extensionPath`	`string`	bundled	Substituir o caminho do sqlite-vec

Quando sqlite-vec não está disponível, o OpenClaw recorre automaticamente à similaridade de cosseno no processo.

Armazenamento de índice

Índices de memória integrados ficam no banco de dados SQLite do OpenClaw de cada agente em agents/<agentId>/agent/openclaw-agent.sqlite.

Chave	Tipo	Padrão	Descrição
`store.fts.tokenizer`	`string`	`unicode61`	Tokenizador FTS5 (`unicode61` ou `trigram`)

Configuração do backend QMD

Defina memory.backend = "qmd" para habilitar. Todas as configurações do QMD ficam em memory.qmd:

Chave	Tipo	Padrão	Descrição
`command`	`string`	`qmd`	Caminho do executável QMD; defina um caminho absoluto quando o `PATH` do serviço diferir do seu shell
`searchMode`	`string`	`search`	Comando de pesquisa: `search`, `vsearch`, `query`
`rerank`	`boolean`	--	Defina como `false` com `searchMode: "query"` e QMD 2.1+ para ignorar o reranqueamento do QMD
`includeDefaultMemory`	`boolean`	`true`	Indexar automaticamente `MEMORY.md` + `memory/*/.md`
`paths[]`	`array`	--	Caminhos extras: `{ name, path, pattern? }`
`sessions.enabled`	`boolean`	`false`	Exportar transcrições de sessão para o QMD
`sessions.retentionDays`	`number`	--	Retenção de transcrições
`sessions.exportDir`	`string`	--	Diretório de exportação

searchMode: "search" é apenas lexical/BM25. O OpenClaw não executa sondagens de prontidão vetorial semântica nem manutenção de embeddings do QMD nesse modo, inclusive durante memory status --deep; vsearch e query continuam exigindo prontidão vetorial e embeddings do QMD.

rerank: false altera apenas o modo query do QMD e exige QMD 2.1 ou mais recente. No modo CLI direto, o OpenClaw passa --no-rerank; no modo MCP baseado em mcporter, ele passa rerank: false para a ferramenta de consulta unificada do QMD. Deixe sem definir para usar o comportamento padrão de reranqueamento de consultas do QMD.

O OpenClaw prefere os formatos atuais de coleção e consulta MCP do QMD, mas mantém versões mais antigas do QMD funcionando ao tentar flags compatíveis de padrão de coleção e nomes antigos de ferramentas MCP quando necessário. Quando o QMD anuncia suporte a vários filtros de coleção, coleções da mesma fonte são pesquisadas com um único processo QMD; builds mais antigos do QMD mantêm o caminho de compatibilidade por coleção. Mesma fonte significa que coleções de memória durável são agrupadas, enquanto coleções de transcrições de sessão permanecem um grupo separado para que a diversificação de fontes ainda tenha ambas as entradas.

Cronograma de atualização

Chave	Tipo	Padrão	Descrição
`update.interval`	`string`	`5m`	Intervalo de atualização
`update.debounceMs`	`number`	`15000`	Aplica debounce a alterações de arquivos
`update.onBoot`	`boolean`	`true`	Atualiza quando o gerenciador QMD de longa duração abre; defina como falso para ignorar a atualização imediata na inicialização
`update.startup`	`string`	`off`	Inicialização QMD opcional ao iniciar o gateway: `off`, `idle` ou `immediate`
`update.startupDelayMs`	`number`	`120000`	Atraso antes da atualização de `startup: "idle"` ser executada
`update.waitForBootSync`	`boolean`	`false`	Bloqueia a abertura do gerenciador até a atualização inicial ser concluída
`update.embedInterval`	`string`	--	Cadência separada de embeddings
`update.commandTimeoutMs`	`number`	--	Tempo limite para comandos QMD
`update.updateTimeoutMs`	`number`	--	Tempo limite para operações de atualização QMD
`update.embedTimeoutMs`	`number`	--	Tempo limite para operações de embedding QMD

Limites

Chave	Tipo	Padrão	Descrição
`limits.maxResults`	`number`	`6`	Máximo de resultados de busca
`limits.maxSnippetChars`	`number`	--	Limita o tamanho do trecho
`limits.maxInjectedChars`	`number`	--	Limita o total de caracteres injetados
`limits.timeoutMs`	`number`	`4000`	Tempo limite da busca

Escopo

Controla quais sessões podem receber resultados de busca QMD. Mesmo esquema que session.sendPolicy:

json5

{  memory: {    qmd: {      scope: {        default: "deny",        rules: [{ action: "allow", match: { chatType: "direct" } }],      },    },  },}

O padrão distribuído permite sessões diretas e de canal, enquanto ainda nega grupos.

O padrão é apenas DM. match.keyPrefix corresponde à chave de sessão normalizada; match.rawKeyPrefix corresponde à chave bruta, incluindo agent:<id>:.

Citações

memory.citations se aplica a todos os backends:

Valor	Comportamento
`auto` (padrão)	Inclui o rodapé `Source: <path#line>` nos trechos
`on`	Sempre inclui o rodapé
`off`	Omite o rodapé (o caminho ainda é passado internamente ao agente)

Quando a inicialização QMD ao iniciar o gateway está habilitada, o OpenClaw inicia o QMD apenas para agentes elegíveis. Se update.onBoot for verdadeiro e nenhuma manutenção de intervalo/embedding estiver configurada, a inicialização usa um gerenciador de execução única para a atualização de inicialização e o fecha. Se um intervalo de atualização ou embedding estiver configurado, a inicialização abre o gerenciador QMD de longa duração para que ele possa controlar o observador e os timers de intervalo; update.onBoot: false ignora apenas a atualização imediata na inicialização.

Exemplo completo de QMD

json5

{  memory: {    backend: "qmd",    citations: "auto",    qmd: {      includeDefaultMemory: true,      update: { interval: "5m", debounceMs: 15000 },      limits: { maxResults: 6, timeoutMs: 4000 },      scope: {        default: "deny",        rules: [{ action: "allow", match: { chatType: "direct" } }],      },      paths: [{ name: "docs", path: "~/notes", pattern: "**/*.md" }],    },  },}

Dreaming

Dreaming é configurado em plugins.entries.memory-core.config.dreaming, não em agents.defaults.memorySearch.

Dreaming é executado como uma varredura agendada e usa fases internas light/deep/REM como detalhe de implementação.

Para o comportamento conceitual e os comandos de barra, consulte Dreaming.

Configurações do usuário

Chave	Tipo	Padrão	Descrição
`enabled`	`boolean`	`false`	Habilita ou desabilita totalmente o dreaming
`frequency`	`string`	`0 3 * * *`	Cadência Cron opcional para a varredura completa de dreaming
`model`	`string`	modelo padrão	Substituição opcional do modelo do subagente Dream Diary
`phases.deep.maxPromotedSnippetTokens`	`number`	`160`	Máximo de tokens estimados mantidos de cada trecho de recuperação de curto prazo promovido para `MEMORY.md`; os metadados de proveniência permanecem visíveis

Exemplo

json5

{  plugins: {    entries: {      "memory-core": {        subagent: {          allowModelOverride: true,          allowedModels: ["anthropic/claude-sonnet-4-6"],        },        config: {          dreaming: {            enabled: true,            frequency: "0 3 * * *",            model: "anthropic/claude-sonnet-4-6",          },        },      },    },  },}

Relacionado

Was this useful?

Referência de configuração de memória

Seleção de provedor

IDs de provedores personalizados

Resolução de chave de API

Configuração de endpoint remoto

Configuração específica do provedor

Configuração de embeddings do Bedrock

Tempo limite de embedding inline

Configuração de busca híbrida

MMR (diversity)

Temporal decay (recency)

Exemplo completo

Caminhos adicionais de memória

Memória multimodal (Gemini)

Cache de embeddings

Indexação em lote

Busca de memória de sessão (experimental)

Builtin backend

QMD backend

Aceleração vetorial SQLite (sqlite-vec)

Armazenamento de índice

Configuração do backend QMD

Exemplo completo de QMD

Dreaming

Configurações do usuário

Exemplo

Relacionado

On this page

Molty