Active Memory 是選用的 Plugin 擁有阻塞式記憶子代理,會在符合條件的對話工作階段中,於主要回覆之前執行。 它存在的原因是,大多數記憶系統雖然能力完整,但屬於被動反應式。它們仰賴主要代理決定何時搜尋記憶,或仰賴使用者說出像是「記住這個」或「搜尋記憶」之類的話。到那時,記憶原本能讓回覆感覺自然的時機已經過去了。 Active Memory 讓系統有一次有界限的機會,在產生主要回覆之前浮現相關記憶。Documentation Index
Fetch the complete documentation index at: https://docs.openclaw.ai/llms.txt
Use this file to discover all available pages before exploring further.
快速開始
將這段貼到openclaw.json,即可使用安全預設設定 — 開啟 Plugin、範圍限定於 main 代理、僅限直接訊息工作階段,並在可用時繼承工作階段模型:
plugins.entries.active-memory.enabled: true會開啟 Pluginconfig.agents: ["main"]只讓main代理加入 Active Memoryconfig.allowedChatTypes: ["direct"]將範圍限定為直接訊息工作階段(群組/頻道需明確加入)config.model(選用)會固定使用專用的回憶模型;未設定時會繼承目前工作階段模型config.modelFallback只會在沒有明確指定或繼承到模型時使用config.promptStyle: "balanced"是recent模式的預設值- Active Memory 仍然只會在符合條件的互動式持久聊天工作階段中執行
速度建議
最簡單的設定是讓config.model 保持未設定,並讓 Active Memory 使用你已經用於一般回覆的同一個模型。這是最安全的預設值,因為它會遵循你現有的提供者、驗證與模型偏好。
如果你想讓 Active Memory 感覺更快,請使用專用推論模型,而不是借用主要聊天模型。回憶品質很重要,但延遲比主要回答路徑更重要,而且 Active Memory 的工具介面很窄(它只會呼叫可用的記憶回憶工具)。
良好的快速模型選項:
cerebras/gpt-oss-120b作為專用的低延遲回憶模型google/gemini-3-flash作為低延遲備援,而不變更你的主要聊天模型- 保持
config.model未設定,以使用你的正常工作階段模型
Cerebras 設定
新增 Cerebras 提供者,並讓 Active Memory 指向它:chat/completions 存取權 — 只有 /v1/models 可見並不能保證可用。
如何查看
Active Memory 會為模型注入隱藏的不受信任提示前綴。它不會在一般用戶端可見的回覆中暴露原始<active_memory_plugin>...</active_memory_plugin> 標籤。
工作階段切換
當你想在不編輯設定的情況下,暫停或恢復目前聊天工作階段的 Active Memory,請使用 Plugin 指令:plugins.entries.active-memory.enabled、代理目標或其他全域設定。
如果你希望指令寫入設定,並為所有工作階段暫停或恢復 Active Memory,請使用明確的全域形式:
plugins.entries.active-memory.config.enabled。它會讓 plugins.entries.active-memory.enabled 保持開啟,因此之後仍可使用指令重新開啟 Active Memory。
如果你想查看 Active Memory 在即時工作階段中的運作,請開啟符合你想要輸出的工作階段切換:
- 當
/verbose on時,顯示像Active Memory: status=ok elapsed=842ms query=recent summary=34 chars這樣的 Active Memory 狀態列 - 當
/trace on時,顯示像Active Memory Debug: Lemon pepper wings with blue cheese.這樣可讀的偵錯摘要
/trace raw,追蹤的 Model Input (User Role) 區塊會將隱藏的 Active Memory 前綴顯示為:
何時執行
Active Memory 使用兩個關卡:- 設定加入
Plugin 必須啟用,且目前代理 id 必須出現在
plugins.entries.active-memory.config.agents中。 - 嚴格執行階段資格 即使已啟用並指定目標,Active Memory 也只會在符合條件的互動式持久聊天工作階段中執行。
工作階段類型
config.allowedChatTypes 控制哪些類型的對話可以執行 Active Memory。
預設值是:
config.allowedChatIds 和 config.deniedChatIds。
allowedChatIds 是已解析對話 id 的明確允許清單。當它非空時,Active Memory 只會在工作階段的對話 id 位於該清單中時執行。這會一次縮小每種允許聊天類型的範圍,包括直接訊息。如果你想要所有直接訊息再加上特定群組,請在 allowedChatIds 中包含直接對等 id,或讓 allowedChatTypes 聚焦於你正在測試的群組/頻道推出。
deniedChatIds 是明確拒絕清單。它永遠優先於 allowedChatTypes 和 allowedChatIds,因此即使工作階段類型原本允許,符合的對話也會被略過。
這些 id 來自持久頻道工作階段金鑰:例如 Feishu chat_id / open_id、Telegram chat id,或 Slack channel id。比對不區分大小寫。如果 allowedChatIds 非空,而 OpenClaw 無法解析工作階段的對話 id,Active Memory 會略過該回合,而不是猜測。
範例:
執行位置
Active Memory 是對話增強功能,不是全平台推論功能。| 介面 | 是否執行 Active Memory? |
|---|---|
| 控制 UI / 網頁聊天持久工作階段 | 是,如果 Plugin 已啟用且代理已設為目標 |
| 同一持久聊天路徑上的其他互動式頻道工作階段 | 是,如果 Plugin 已啟用且代理已設為目標 |
| 無介面一次性執行 | 否 |
| Heartbeat/背景執行 | 否 |
通用內部 agent-command 路徑 | 否 |
| 子代理/內部輔助程式執行 | 否 |
為什麼使用它
在以下情況使用 Active Memory:- 工作階段是持久且面向使用者的
- 代理有值得搜尋的有意義長期記憶
- 連續性與個人化比原始提示決定性更重要
- 穩定偏好
- 重複習慣
- 應自然浮現的長期使用者情境
- 自動化
- 內部 worker
- 一次性 API 任務
- 隱藏個人化會令人意外的地方
運作方式
執行階段形態是: 阻塞式記憶子代理只能使用可用的記憶回憶工具:memory_recallmemory_searchmemory_get
NONE。
查詢模式
config.queryMode 控制阻塞式記憶子代理能看到多少對話。請選擇仍能良好回答追問的最小模式;逾時預算應隨著情境大小增加(message < recent < full)。
- message
- recent
- full
只會傳送最新的使用者訊息。在以下情況使用:
- 你想要最快的行為
- 你想要最強烈偏向穩定偏好回憶
- 後續回合不需要對話情境
config.timeoutMs 可從約 3000 到 5000 ms 開始。提示樣式
config.promptStyle 控制阻塞式記憶子代理在決定是否回傳記憶時的積極或嚴格程度。
可用樣式:
balanced:recent模式的一般用途預設值strict:最不積極;適合你希望盡量減少附近脈絡滲入時使用contextual:最有利於連續性;適合對話歷史應該更重要時使用recall-heavy:更願意在較寬鬆但仍合理的匹配上顯示記憶precision-heavy:除非匹配很明顯,否則會積極偏好NONEpreference-only:針對喜好、習慣、例行事項、品味和重複出現的個人事實最佳化
config.promptStyle 時的預設對應:
config.promptStyle,該覆寫會優先。
範例:
模型備援策略
如果未設定config.model,Active Memory 會依照下列順序嘗試解析模型:
config.modelFallback 會控制已設定的備援步驟。
選用的自訂備援:
config.modelFallbackPolicy 只會作為舊設定的已棄用相容性欄位保留。
它不再改變執行階段行為。
進階逃生口
這些選項刻意不列入建議設定。config.thinking 可以覆寫阻塞式記憶子代理的思考層級:
config.promptAppend 會在預設 Active
Memory 提示之後、對話脈絡之前加入額外的操作員指令:
config.promptOverride 會取代預設的 Active Memory 提示。OpenClaw
仍會在之後附加對話脈絡:
NONE 或精簡的使用者事實脈絡。
轉錄持久化
Active Memory 阻塞式記憶子代理執行時,會在阻塞式記憶子代理呼叫期間建立真實的session.jsonl 轉錄。
預設情況下,該轉錄是暫時性的:
- 會寫入暫存目錄
- 只用於阻塞式記憶子代理執行
- 執行完成後會立即刪除
config.transcriptDir 變更相對子目錄。
請謹慎使用:
- 阻塞式記憶子代理轉錄可能在繁忙工作階段中快速累積
full查詢模式可能會複製大量對話脈絡- 這些轉錄包含隱藏提示脈絡和已回憶的記憶
設定
所有 Active Memory 設定都位於:| 鍵 | 類型 | 含義 |
|---|---|---|
enabled | boolean | 啟用 Plugin 本身 |
config.agents | string[] | 可使用 Active Memory 的代理 ID |
config.model | string | 選用的阻塞式記憶子代理模型參照;未設定時,Active Memory 會使用目前工作階段模型 |
config.allowedChatTypes | ("direct" | "group" | "channel")[] | 可執行 Active Memory 的工作階段類型;預設為直接訊息樣式工作階段 |
config.allowedChatIds | string[] | 選用的逐對話允許清單,會在 allowedChatTypes 之後套用;非空清單會採用失敗即關閉 |
config.deniedChatIds | string[] | 選用的逐對話拒絕清單,會覆寫允許的工作階段類型和允許的 ID |
config.queryMode | "message" | "recent" | "full" | 控制阻塞式記憶子代理能看到多少對話 |
config.promptStyle | "balanced" | "strict" | "contextual" | "recall-heavy" | "precision-heavy" | "preference-only" | 控制阻塞式記憶子代理在決定是否回傳記憶時的積極或嚴格程度 |
config.thinking | "off" | "minimal" | "low" | "medium" | "high" | "xhigh" | "adaptive" | "max" | 阻塞式記憶子代理的進階思考覆寫;預設為 off 以提升速度 |
config.promptOverride | string | 進階完整提示取代;不建議一般使用 |
config.promptAppend | string | 附加到預設或已覆寫提示後的進階額外指令 |
config.timeoutMs | number | 阻塞式記憶子代理的硬性逾時,上限為 120000 毫秒 |
config.maxSummaryChars | number | Active Memory 摘要允許的最大總字元數 |
config.logging | boolean | 調校時發出 Active Memory 日誌 |
config.persistTranscripts | boolean | 將阻塞式記憶子代理轉錄保留在磁碟上,而不是刪除暫存檔 |
config.transcriptDir | string | 代理工作階段資料夾下的相對阻塞式記憶子代理轉錄目錄 |
| 鍵 | 類型 | 含義 |
|---|---|---|
config.maxSummaryChars | number | Active Memory 摘要允許的最大總字元數 |
config.recentUserTurns | number | 當 queryMode 為 recent 時要包含的先前使用者回合 |
config.recentAssistantTurns | number | 當 queryMode 為 recent 時要包含的先前助理回合 |
config.recentUserChars | number | 每個最近使用者回合的最大字元數 |
config.recentAssistantChars | number | 每個最近助理回合的最大字元數 |
config.cacheTtlMs | number | 重複相同查詢的快取重用(範圍:1000-120000 毫秒;預設:15000) |
config.circuitBreakerMaxTimeouts | number | 同一代理/模型連續逾時達到此數量後略過回憶。成功回憶或冷卻時間到期後會重設(範圍:1-20;預設:3)。 |
config.circuitBreakerCooldownMs | number | 斷路器觸發後略過回憶的時間長度,以毫秒為單位(範圍:5000-600000;預設:60000)。 |
建議設定
從recent 開始。
/verbose on,
並對 Active Memory 除錯摘要使用 /trace on,而不是尋找獨立的 Active
Memory 除錯命令。在聊天頻道中,這些診斷列會在主助理回覆之後傳送,而不是之前。
然後改用:
- 如果你想降低延遲,使用
message - 如果你認為額外脈絡值得較慢的阻塞式記憶子代理,使用
full
除錯
如果 Active Memory 沒有出現在你預期的位置:- 確認 Plugin 已在
plugins.entries.active-memory.enabled下啟用。 - 確認目前代理 ID 已列在
config.agents中。 - 確認你是透過互動式持久聊天工作階段進行測試。
- 開啟
config.logging: true並觀察 Gateway 日誌。 - 使用
openclaw memory status --deep驗證記憶搜尋本身可正常運作。
maxSummaryChars
- 降低
queryMode - 降低
timeoutMs - 減少最近回合數
- 減少每回合字元上限
常見問題
Active Memory 會透過已設定記憶體 Plugin 的召回管線運作,因此多數召回上的意外狀況都是嵌入提供者問題,而不是 Active Memory 的錯誤。預設的memory-core 路徑使用 memory_search;memory-lancedb 使用 memory_recall。
嵌入提供者已切換或停止運作
嵌入提供者已切換或停止運作
如果未設定
memorySearch.provider,OpenClaw 會自動偵測第一個可用的嵌入提供者。新的 API 金鑰、配額用盡,或受速率限制的託管提供者,都可能讓每次執行時解析到的提供者發生變化。如果沒有解析到提供者,memory_search 可能會降級為僅詞彙式檢索;在提供者已選定後發生的執行階段失敗,不會自動回退。請明確固定提供者(以及選用的備援)以讓選擇具備決定性。完整的提供者清單與固定範例,請參閱記憶體搜尋。召回感覺緩慢、空白或不一致
召回感覺緩慢、空白或不一致
- 開啟
/trace on,以在工作階段中顯示 Plugin 所擁有的 Active Memory 除錯摘要。 - 開啟
/verbose on,也可以在每次回覆後看到🧩 Active Memory: ...狀態行。 - 觀察 Gateway 記錄中的
active-memory: ... start|done、memory sync failed (search-bootstrap),或提供者嵌入錯誤。 - 執行
openclaw memory status --deep,檢查記憶體搜尋後端與索引健康狀態。 - 如果你使用
ollama,請確認嵌入模型已安裝(ollama list)。