Active Memory — це необов’язковий блокувальний під-агент пам’яті під керуванням Plugin, який запускається перед основною відповіддю для придатних розмовних сеансів. Ця функція існує, тому що більшість систем пам’яті потужні, але реактивні. Вони покладаються на те, що основний агент вирішить, коли шукати в пам’яті, або що користувач скаже щось на кшталт “запам’ятай це” чи “пошукай у пам’яті”. На той момент мить, коли пам’ять могла б зробити відповідь природною, уже минула. Active Memory дає системі одну обмежену можливість підняти релевантну інформацію з пам’яті до того, як буде згенеровано основну відповідь.Documentation Index
Fetch the complete documentation index at: https://docs.openclaw.ai/llms.txt
Use this file to discover all available pages before exploring further.
Швидкий початок
Вставте це вopenclaw.json для налаштування з безпечними типовими параметрами — Plugin увімкнено, обмежено
агентом main, лише сеанси прямих повідомлень, модель сеансу успадковується
за наявності:
plugins.entries.active-memory.enabled: trueвмикає Pluginconfig.agents: ["main"]вмикає Active Memory лише для агентаmainconfig.allowedChatTypes: ["direct"]обмежує це сеансами прямих повідомлень (групи/канали вмикайте явно)config.model(необов’язково) закріплює окрему модель пригадування; якщо не задано, успадковується поточна модель сеансуconfig.modelFallbackвикористовується лише тоді, коли не вдається визначити ні явну, ні успадковану модельconfig.promptStyle: "balanced"є типовим значенням для режимуrecent- Active Memory усе одно запускається лише для придатних інтерактивних постійних чат-сеансів
Рекомендації щодо швидкості
Найпростіше налаштування — залишитиconfig.model незаданим і дозволити Active Memory використовувати
ту саму модель, яку ви вже використовуєте для звичайних відповідей. Це найбезпечніше типове налаштування,
оскільки воно відповідає вашим наявним параметрам провайдера, автентифікації та моделі.
Якщо ви хочете, щоб Active Memory відчувалася швидшою, використовуйте окрему модель інференсу
замість запозичення основної чат-моделі. Якість пригадування важлива, але затримка
важливіша, ніж для основного шляху відповіді, а інструментальний інтерфейс Active Memory
вузький (вона викликає лише доступні інструменти пригадування пам’яті).
Хороші варіанти швидких моделей:
cerebras/gpt-oss-120bяк окрема низьколатентна модель пригадуванняgoogle/gemini-3-flashяк низьколатентний резервний варіант без зміни вашої основної чат-моделі- ваша звичайна модель сеансу, якщо залишити
config.modelнезаданим
Налаштування Cerebras
Додайте провайдера Cerebras і спрямуйте Active Memory на нього:chat/completions для
вибраної моделі — сама лише видимість /v1/models цього не гарантує.
Як це побачити
Active Memory додає прихований недовірений префікс промпту для моделі. Вона не показує сирі теги<active_memory_plugin>...</active_memory_plugin> у
звичайній видимій клієнту відповіді.
Перемикач сеансу
Використовуйте команду Plugin, коли хочете призупинити або відновити Active Memory для поточного чат-сеансу без редагування конфігурації:plugins.entries.active-memory.enabled, вибір цільових агентів або іншу глобальну
конфігурацію.
Якщо ви хочете, щоб команда записала конфігурацію та призупинила або відновила Active Memory для
всіх сеансів, використовуйте явну глобальну форму:
plugins.entries.active-memory.config.enabled. Вона залишає
plugins.entries.active-memory.enabled увімкненим, щоб команда лишалася доступною для
повторного ввімкнення Active Memory пізніше.
Якщо ви хочете побачити, що робить Active Memory у живому сеансі, увімкніть
перемикачі сеансу, які відповідають потрібному виводу:
- рядок стану Active Memory, наприклад
Active Memory: status=ok elapsed=842ms query=recent summary=34 chars, коли/verbose on - читабельний налагоджувальний підсумок, наприклад
Active Memory Debug: Lemon pepper wings with blue cheese., коли/trace on
/trace raw, трасований блок Model Input (User Role) покаже
прихований префікс Active Memory так:
Коли запускається
Active Memory використовує дві умови допуску:- Увімкнення в конфігурації
Plugin має бути увімкнений, а ідентифікатор поточного агента має бути в
plugins.entries.active-memory.config.agents. - Строга придатність під час виконання Навіть коли Active Memory увімкнено й націлено, вона запускається лише для придатних інтерактивних постійних чат-сеансів.
Типи сеансів
config.allowedChatTypes контролює, у яких видах розмов узагалі може запускатися Active
Memory.
Типове значення:
config.allowedChatIds і
config.deniedChatIds після вибору дозволених типів сеансів.
allowedChatIds — це явний список дозволених визначених ідентифікаторів розмов. Коли він
не порожній, Active Memory запускається лише тоді, коли ідентифікатор розмови сеансу є в
цьому списку. Це одночасно звужує кожен дозволений тип чату, включно з прямими
повідомленнями. Якщо ви хочете всі прямі повідомлення плюс лише конкретні групи, додайте
ідентифікатори прямих співрозмовників у allowedChatIds або залиште allowedChatTypes зосередженим на
розгортанні груп/каналів, яке ви тестуєте.
deniedChatIds — це явний список заборон. Він завжди має пріоритет над
allowedChatTypes і allowedChatIds, тому відповідна розмова пропускається
навіть тоді, коли її тип сеансу інакше дозволений.
Ідентифікатори походять із ключа постійного сеансу каналу: наприклад Feishu
chat_id / open_id, ідентифікатор чату Telegram або ідентифікатор каналу Slack. Зіставлення
не враховує регістр. Якщо allowedChatIds не порожній і OpenClaw не може визначити
ідентифікатор розмови для сеансу, Active Memory пропускає цю репліку замість того, щоб
вгадувати.
Приклад:
Де запускається
Active Memory — це функція збагачення розмови, а не функція інференсу на рівні всієї платформи.| Поверхня | Запускає Active Memory? |
|---|---|
| Інтерфейс керування / постійні сеанси вебчату | Так, якщо Plugin увімкнено й агент входить до цільових |
| Інші інтерактивні сеанси каналів на тому самому шляху постійного чату | Так, якщо Plugin увімкнено й агент входить до цільових |
| Одноразові запуски без інтерфейсу | Ні |
| Запуски Heartbeat/фонові запуски | Ні |
Загальні внутрішні шляхи agent-command | Ні |
| Виконання під-агента/внутрішнього допоміжного процесу | Ні |
Навіщо це використовувати
Використовуйте Active Memory, коли:- сеанс є постійним і орієнтованим на користувача
- агент має змістовну довгострокову пам’ять для пошуку
- безперервність і персоналізація важливіші за необроблений детермінізм промпту
- стабільних уподобань
- повторюваних звичок
- довгострокового користувацького контексту, який має з’являтися природно
- автоматизації
- внутрішніх воркерів
- одноразових API-завдань
- місць, де прихована персоналізація була б несподіваною
Як це працює
Форма під час виконання: Блокувальний під-агент пам’яті може використовувати лише доступні інструменти пригадування з пам’яті:memory_recallmemory_searchmemory_get
NONE.
Режими запиту
config.queryMode контролює, який обсяг розмови бачить блокувальний під-агент пам’яті.
Вибирайте найменший режим, який усе ще добре відповідає на уточнювальні запитання;
бюджети тайм-ауту мають збільшуватися разом із розміром контексту (message < recent < full).
- message
- recent
- full
Надсилається лише останнє повідомлення користувача.Використовуйте цей режим, коли:
- вам потрібна найшвидша поведінка
- вам потрібне найсильніше зміщення в бік пригадування стабільних уподобань
- наступним реплікам не потрібен контекст розмови
3000 до 5000 мс для config.timeoutMs.Стилі промпту
config.promptStyle контролює, наскільки охочим або суворим є блокувальний під-агент пам’яті,
коли вирішує, чи повертати дані з пам’яті.
Доступні стилі:
balanced: універсальне значення за замовчуванням для режимуrecentstrict: найменш охочий; найкраще, коли потрібно дуже мало змішування із сусіднім контекстомcontextual: найкраще підтримує безперервність; найкраще, коли історія розмови має більше значенняrecall-heavy: охочіше показує пам’ять для м’якших, але все ще правдоподібних збігівprecision-heavy: агресивно віддає перевагуNONE, якщо збіг не є очевиднимpreference-only: оптимізовано для улюбленого, звичок, рутин, смаків і повторюваних особистих фактів
config.promptStyle не задано:
config.promptStyle, це перевизначення має пріоритет.
Приклад:
Політика резервної моделі
Якщоconfig.model не задано, Active Memory намагається визначити модель у такому порядку:
config.modelFallback керує кроком налаштованої резервної моделі.
Необов’язкова власна резервна модель:
config.modelFallbackPolicy збережено лише як застаріле поле сумісності
для старіших конфігурацій. Воно більше не змінює поведінку під час виконання.
Розширені аварійні виходи
Ці параметри навмисно не входять до рекомендованого налаштування.config.thinking може перевизначати рівень thinking блокувального під-агента пам’яті:
config.promptAppend додає додаткові операторські інструкції після стандартного prompt Active
Memory і перед контекстом розмови:
config.promptOverride замінює стандартний prompt Active Memory. OpenClaw
все одно додає контекст розмови після нього:
NONE,
або компактний контекст факту про користувача для основної моделі.
Збереження транскрипта
Запуски блокувального під-агента пам’яті Active Memory створюють реальний транскриптsession.jsonl під час виклику блокувального під-агента пам’яті.
За замовчуванням цей транскрипт тимчасовий:
- він записується до тимчасового каталогу
- він використовується лише для запуску блокувального під-агента пам’яті
- він видаляється одразу після завершення запуску
config.transcriptDir.
Використовуйте це обережно:
- транскрипти блокувального під-агента пам’яті можуть швидко накопичуватися в активних сеансах
- режим запиту
fullможе дублювати багато контексту розмови - ці транскрипти містять прихований контекст prompt і пригадані спогади
Конфігурація
Уся конфігурація Active Memory міститься в:| Ключ | Тип | Значення |
|---|---|---|
enabled | boolean | Вмикає сам plugin |
config.agents | string[] | Ідентифікатори агентів, які можуть використовувати Active Memory |
config.model | string | Необов’язкове посилання на модель блокувального під-агента пам’яті; якщо не задано, Active Memory використовує модель поточного сеансу |
config.allowedChatTypes | ("direct" | "group" | "channel")[] | Типи сеансів, які можуть запускати Active Memory; за замовчуванням це сеанси у стилі прямих повідомлень |
config.allowedChatIds | string[] | Необов’язковий allowlist для окремих розмов, який застосовується після allowedChatTypes; непорожні списки закриті за замовчуванням |
config.deniedChatIds | string[] | Необов’язковий denylist для окремих розмов, який перевизначає дозволені типи сеансів і дозволені ідентифікатори |
config.queryMode | "message" | "recent" | "full" | Керує тим, скільки розмови бачить блокувальний під-агент пам’яті |
config.promptStyle | "balanced" | "strict" | "contextual" | "recall-heavy" | "precision-heavy" | "preference-only" | Керує тим, наскільки охочим або суворим є блокувальний під-агент пам’яті, коли вирішує, чи повертати пам’ять |
config.thinking | "off" | "minimal" | "low" | "medium" | "high" | "xhigh" | "adaptive" | "max" | Розширене перевизначення thinking для блокувального під-агента пам’яті; за замовчуванням off для швидкості |
config.promptOverride | string | Розширена повна заміна prompt; не рекомендовано для звичайного використання |
config.promptAppend | string | Розширені додаткові інструкції, що додаються до стандартного або перевизначеного prompt |
config.timeoutMs | number | Жорсткий тайм-аут для блокувального під-агента пам’яті, обмежений 120000 мс |
config.setupGraceTimeoutMs | number | Розширений додатковий бюджет налаштування до завершення тайм-ауту пригадування; за замовчуванням 0 і обмежено 30000 мс. Див. Пільговий період холодного старту щодо вказівок з оновлення до v2026.4.x |
config.maxSummaryChars | number | Максимальна загальна кількість символів, дозволена в підсумку active-memory |
config.logging | boolean | Виводить журнали active memory під час налаштування |
config.persistTranscripts | boolean | Зберігає транскрипти блокувального під-агента пам’яті на диску замість видалення тимчасових файлів |
config.transcriptDir | string | Відносний каталог транскриптів блокувального під-агента пам’яті під текою сеансів агента |
| Ключ | Тип | Значення |
|---|---|---|
config.maxSummaryChars | number | Максимальна загальна кількість символів, дозволена у підсумку active-memory |
config.recentUserTurns | number | Попередні репліки користувача, які потрібно включити, коли queryMode має значення recent |
config.recentAssistantTurns | number | Попередні репліки асистента, які потрібно включити, коли queryMode має значення recent |
config.recentUserChars | number | Максимальна кількість символів на кожну нещодавню репліку користувача |
config.recentAssistantChars | number | Максимальна кількість символів на кожну нещодавню репліку асистента |
config.cacheTtlMs | number | Повторне використання кешу для повторюваних ідентичних запитів (діапазон: 1000-120000 мс; типово: 15000) |
config.circuitBreakerMaxTimeouts | number | Пропускати пригадування після такої кількості послідовних тайм-аутів для того самого агента/моделі. Скидається після успішного пригадування або завершення cooldown (діапазон: 1-20; типово: 3). |
config.circuitBreakerCooldownMs | number | Як довго пропускати пригадування після спрацювання circuit breaker, у мс (діапазон: 5000-600000; типово: 60000). |
Рекомендоване налаштування
Почніть ізrecent.
/verbose on для
звичайного рядка стану та /trace on для налагоджувального підсумку active-memory замість
пошуку окремої команди налагодження active-memory. У чат-каналах ці
діагностичні рядки надсилаються після основної відповіді асистента, а не перед нею.
Потім перейдіть до:
message, якщо хочете нижчу затримкуfull, якщо вирішите, що додатковий контекст вартий повільнішого блокувального під-агента пам’яті
Пільговий період холодного запуску
До v2026.5.2 Plugin непомітно подовжував налаштований вамиtimeoutMs на
додаткові 30000 мс під час холодного запуску, щоб прогрів моделі, завантаження індексу embedding
і перше пригадування могли спільно використовувати більший бюджет. У v2026.5.2 цей пільговий період
перенесено за явну конфігурацію setupGraceTimeoutMs — тепер налаштований вами timeoutMs
є бюджетом за замовчуванням, якщо ви явно не ввімкнете інше.
Якщо ви оновилися з v2026.4.x і встановили timeoutMs на значення, підібране для
старого світу неявного пільгового періоду (рекомендований стартовий timeoutMs: 15000 є одним
прикладом), установіть setupGraceTimeoutMs: 30000, щоб розширити бюджети hook для побудови prompt
і зовнішнього watchdog до ефективних значень до v5.2:
setupGraceTimeoutMs, тож Plugin більше не подовжує непомітно
конфігурації 15000 мс до 45000 мс на головній лінії.”
Вбудований runner пригадування використовує той самий ефективний бюджет тайм-ауту, тому
setupGraceTimeoutMs покриває як зовнішній watchdog побудови prompt, так і внутрішній
блокувальний запуск пригадування.
Для ресурсно обмежених Gateway, де затримка холодного запуску є відомим компромісом,
нижчі значення (5000–15000 мс) також працюють — компромісом є вища ймовірність того,
що найперше пригадування після перезапуску Gateway поверне порожній результат, поки прогрів
завершується.
Налагодження
Якщо активна пам’ять не з’являється там, де ви очікуєте:- Переконайтеся, що Plugin увімкнено в
plugins.entries.active-memory.enabled. - Переконайтеся, що поточний id агента перелічено в
config.agents. - Переконайтеся, що ви тестуєте через інтерактивну постійну чат-сесію.
- Увімкніть
config.logging: trueі стежте за журналами Gateway. - Перевірте, що сам пошук пам’яті працює, за допомогою
openclaw memory status --deep.
maxSummaryChars
- знизьте
queryMode - знизьте
timeoutMs - зменште кількість нещодавніх реплік
- зменште ліміти символів на репліку
Поширені проблеми
Active Memory працює поверх налаштованого pipeline пригадування Plugin пам’яті, тому більшість несподіванок пригадування є проблемами provider embedding, а не помилками Active Memory. Стандартний шляхmemory-core використовує memory_search; memory-lancedb використовує
memory_recall.
Provider embedding змінено або він припинив працювати
Provider embedding змінено або він припинив працювати
Якщо
memorySearch.provider не задано, OpenClaw автоматично виявляє перший
доступний provider embedding. Новий API-ключ, вичерпання квоти або
rate-limited hosted provider можуть змінити, який provider визначається між
запусками. Якщо жоден provider не визначено, memory_search може деградувати до
пошуку лише за лексичними збігами; runtime-помилки після того, як provider уже вибрано, не
перемикаються на fallback автоматично.Явно закріпіть provider (і необов’язковий fallback), щоб зробити вибір
детермінованим. Див. Пошук пам’яті для повного
списку provider і прикладів закріплення.Пригадування здається повільним, порожнім або непослідовним
Пригадування здається повільним, порожнім або непослідовним
- Увімкніть
/trace on, щоб показати у сесії налагоджувальний підсумок Active Memory, яким володіє Plugin. - Увімкніть
/verbose on, щоб також бачити рядок стану🧩 Active Memory: ...після кожної відповіді. - Стежте за журналами Gateway щодо
active-memory: ... start|done,memory sync failed (search-bootstrap)або помилок embedding provider. - Запустіть
openclaw memory status --deep, щоб перевірити backend пошуку пам’яті та стан індексу. - Якщо ви використовуєте
ollama, переконайтеся, що модель embedding встановлена (ollama list).
Перше пригадування після перезапуску Gateway повертає `status=timeout`
Перше пригадування після перезапуску Gateway повертає `status=timeout`
У v2026.5.2 і пізніших версіях, якщо налаштування холодного запуску (прогрів моделі + завантаження
індексу embedding) не завершилося до моменту запуску першого пригадування, виконання
може вичерпати налаштований бюджет
timeoutMs і повернути status=timeout
з порожнім виводом. Журнали Gateway показують active-memory timeout after Nms
біля першої придатної відповіді після перезапуску.Див. Пільговий період холодного запуску у розділі «Рекомендоване налаштування» щодо
рекомендованого значення setupGraceTimeoutMs.