Technical reference

Гігієна транскриптів

OpenClaw застосовує виправлення, специфічні для провайдера, до транскриптів перед запуском (побудовою контексту моделі). Більшість із них є коригуваннями в пам’яті, що використовуються для виконання суворих вимог провайдера. Окремий прохід відновлення файлу сеансу також може переписати збережений JSONL до завантаження сеансу, але лише для неправильно сформованих рядків або збережених ходів, які є недійсними довготривалими записами. Доставлені відповіді асистента зберігаються на диску; специфічне для провайдера видалення попереднього заповнення асистента відбувається лише під час побудови вихідних payload. Коли виконується відновлення, початковий файл записується в тимчасовий сусідній *.bak-<pid>-<ts> перед атомарною заміною та видаляється після успішної заміни; резервна копія зберігається лише якщо саме очищення завершується невдало (у такому разі шлях повертається у звіті).

Обсяг охоплює:

Контекст підказки лише для runtime, який не потрапляє до видимих користувачу ходів транскрипту
Очищення id викликів інструментів
Перевірку input викликів інструментів
Відновлення зіставлення результатів інструментів
Перевірку / впорядкування ходів
Очищення підписів думок
Очищення підписів thinking
Очищення payload зображень
Очищення порожніх текстових блоків перед повторним відтворенням для провайдера
Очищення незавершених ходів довжини лише з reasoning перед повторним відтворенням для провайдера
Позначення походження user-input (для підказок, маршрутизованих між сеансами)
Відновлення порожніх error-ходів асистента для повторного відтворення Bedrock Converse

Якщо вам потрібні подробиці про зберігання транскриптів, див.:

Глибокий огляд керування сеансами

Глобальне правило: runtime-контекст не є транскриптом користувача

Runtime/system-контекст може бути доданий до підказки моделі для ходу, але це не вміст, створений кінцевим користувачем. OpenClaw зберігає окреме тіло підказки, орієнтоване на транскрипт, для відповідей Gateway, поставлених у чергу followup, ACP, CLI та вбудованих запусків OpenClaw. Збережені видимі ходи користувача використовують це тіло транскрипту замість підказки, збагаченої runtime.

Для застарілих сеансів, які вже зберегли runtime-обгортки, поверхні історії Gateway застосовують display projection перед поверненням повідомлень клієнтам WebChat, TUI, REST або SSE.

Де це виконується

Уся гігієна транскриптів централізована у вбудованому runner:

Вибір політики: src/agents/transcript-policy.ts
Застосування очищення/відновлення: sanitizeSessionHistory у src/agents/embedded-agent-runner/replay-history.ts

Політика використовує provider, modelApi і modelId, щоб визначити, що застосовувати.

Окремо від гігієни транскриптів файли сеансів відновлюються (за потреби) перед завантаженням:

repairSessionFileIfNeeded у src/agents/session-file-repair.ts
Викликається з run/attempt.ts і compact.ts (вбудований runner)

Глобальне правило: очищення зображень

Payload зображень завжди очищуються, щоб запобігти відхиленню на стороні провайдера через обмеження розміру (зменшення масштабу/повторне стискання завеликих base64-зображень).

Це також допомагає контролювати token pressure, спричинений зображеннями, для моделей із підтримкою vision. Менші максимальні розміри зазвичай зменшують використання токенів; більші розміри зберігають деталі.

Реалізація:

sanitizeSessionMessagesImages у src/agents/embedded-agent-helpers/images.ts
sanitizeContentBlocksImages у src/agents/tool-images.ts
Максимальна сторона зображення налаштовується через agents.defaults.imageMaxDimensionPx (типово: 1200).
Порожні текстові блоки видаляються, доки цей прохід обходить вміст replay. Ходи асистента, які стають порожніми, вилучаються з replay-копії; ходи користувача та tool-result, які стають порожніми, отримують непорожній placeholder для пропущеного вмісту.

Глобальне правило: неправильно сформовані виклики інструментів

Блоки викликів інструментів асистента, у яких відсутні і input, і arguments, відкидаються до побудови контексту моделі. Це запобігає відхиленням провайдера через частково збережені виклики інструментів (наприклад, після збою через rate limit).

Реалізація:

sanitizeToolCallInputs у src/agents/session-transcript-repair.ts
Застосовується в sanitizeSessionHistory у src/agents/embedded-agent-runner/replay-history.ts

Глобальне правило: незавершені ходи лише з reasoning

Ходи асистента, які досягають ліміту output провайдера лише з thinking або redacted-thinking-вмістом, пропускаються з replay-копії в пам’яті. Такі ходи містять незавершений стан провайдера і можуть нести частковий підпис thinking.

Порожні length-ходи залишаються без змін, як і length-ходи з видимим текстом, викликами інструментів або невідомими блоками вмісту. Збережені транскрипти не переписуються.

Реалізація:

normalizeAssistantReplayContent у src/agents/embedded-agent-runner/replay-history.ts

Глобальне правило: походження міжсеансового input

Коли агент надсилає підказку в інший сеанс через sessions_send (включно з кроками відповіді/оголошення agent-to-agent), OpenClaw зберігає створений хід користувача з:

message.provenance.kind = "inter_session"

OpenClaw також додає на початок того самого ходу маркер [Inter-session message ... isUser=false] перед текстом маршрутизованої підказки, щоб активний виклик моделі міг відрізнити output чужого сеансу від зовнішніх інструкцій кінцевого користувача. Цей маркер містить вихідний сеанс, канал та інструмент, коли вони доступні. Транскрипт усе ще використовує role: "user" для сумісності з провайдером, але і видимий текст, і metadata походження позначають хід як міжсеансові дані.

Під час перебудови контексту OpenClaw застосовує той самий маркер до старіших збережених міжсеансових ходів користувача, які мають лише metadata походження.

Матриця провайдерів (поточна поведінка)

OpenAI / OpenAI Codex

Лише очищення зображень.
Відкидати осиротілі підписи reasoning (самостійні reasoning items без наступного блоку вмісту) для транскриптів OpenAI Responses/Codex і відкидати replayable reasoning OpenAI після перемикання маршруту моделі.
Зберігати payload replayable reasoning items OpenAI Responses, включно із зашифрованими items із порожнім summary, щоб ручний/WebSocket replay зберігав потрібний стан rs_* у парі з output items асистента.
Native ChatGPT Codex Responses дотримується wire parity Codex, повторно відтворюючи попередні payload Responses reasoning/message/function без попередніх item IDs, водночас зберігаючи session prompt_cache_key.
Replay сімейства OpenAI Responses зберігає канонічні пари reasoning call_*|fc_* для тієї самої моделі, але детерміновано нормалізує неправильно сформовані або задовгі call_id / ids function-call item перед перетворенням pi-ai payload.
Відновлення зіставлення результатів інструментів може переміщувати реальні зіставлені outputs і синтезувати outputs у стилі Codex aborted для відсутніх викликів інструментів.
Немає перевірки або переупорядкування ходів.
Відсутні tool outputs сімейства OpenAI Responses синтезуються як aborted, щоб відповідати нормалізації replay Codex.
Підписи думок не видаляються.

OpenAI-сумісні Chat Completions

Історичні блоки thinking/reasoning асистента видаляються перед replay, щоб локальні та proxy-style OpenAI-сумісні сервери не отримували поля reasoning попередніх ходів, як-от reasoning або reasoning_content.
Поточні продовження tool-call у тому самому ході зберігають блок reasoning асистента, прикріплений до виклику інструмента, доки результат інструмента не буде відтворено.
Кастомні/самостійно розгорнуті записи моделей із reasoning: true зберігають відтворені metadata reasoning.
Винятки, що належать провайдеру, можуть вимкнути це, коли їхній wire protocol вимагає відтворених metadata reasoning.

Google (Generative AI / Gemini CLI / Antigravity)

Очищення id викликів інструментів: суворо алфавітно-цифрові.
Відновлення зіставлення результатів інструментів і синтетичні результати інструментів.
Перевірка ходів (чергування ходів у стилі Gemini).
Виправлення впорядкування ходів Google (додавання крихітного user bootstrap на початок, якщо історія починається з асистента).
Antigravity Claude: нормалізувати підписи thinking; відкидати непідписані блоки thinking.

Anthropic / Minimax (Anthropic-сумісний)

Відновлення зіставлення результатів інструментів і синтетичні результати інструментів.
Перевірка ходів (об’єднання послідовних ходів користувача для відповідності суворому чергуванню).
Кінцеві ходи попереднього заповнення асистента видаляються з вихідних payload Anthropic Messages, коли thinking увімкнено, включно з маршрутами Cloudflare AI Gateway.
Підписи thinking асистента до Compaction видаляються перед replay для провайдера, коли сеанс було стиснуто. Підписи thinking криптографічно прив’язані до префікса розмови під час генерації; після Compaction префікс змінюється (узагальнений вміст замінюється summary Compaction), тому replay початкових підписів змушує Anthropic відхилити запит із повідомленням «Недійсний підпис у блоці thinking». Текст thinking зберігається як непідписаний блок, а потім обробляється правилом нижче.
Блоки thinking з відсутніми, порожніми або blank replay signatures видаляються перед перетворенням для провайдера. Якщо це спорожнює хід асистента, OpenClaw зберігає форму ходу з непорожнім omitted-reasoning-текстом.
Старіші thinking-only ходи асистента, які потрібно видалити, замінюються непорожнім omitted-reasoning-текстом, щоб adapters провайдера не відкидали replay-хід.

Amazon Bedrock (Converse API)

Порожні stream-error ходи асистента відновлюються до непорожнього fallback-текстового блоку перед replay. Bedrock Converse відхиляє повідомлення асистента з content: [], тому збережені ходи асистента з stopReason: "error" і порожнім вмістом також відновлюються на диску перед завантаженням.
Stream-error ходи асистента, які містять лише blank text blocks, відкидаються з replay-копії в пам’яті замість повторного відтворення недійсного blank block.
Підписи thinking асистента до Compaction видаляються перед replay Converse, коли сеанс було стиснуто, з тієї самої причини, що й для Anthropic вище.
Блоки thinking Claude з відсутніми, порожніми або blank replay signatures видаляються перед replay Converse. Якщо це спорожнює хід асистента, OpenClaw зберігає форму ходу з непорожнім omitted-reasoning-текстом.
Старіші thinking-only ходи асистента, які потрібно видалити, замінюються непорожнім omitted-reasoning-текстом, щоб replay Converse зберігав сувору форму ходів.
Replay фільтрує delivery-mirror OpenClaw і gateway-injected ходи асистента.
Очищення зображень застосовується через глобальне правило.

Mistral (включно з виявленням на основі model-id)

Очищення id викликів інструментів: strict9 (алфавітно-цифрові, довжина 9).

OpenRouter Gemini

Очищення підписів думок: видаляти не-base64 значення thought_signature (зберігати base64).

OpenRouter Anthropic

Кінцеві ходи попереднього заповнення асистента видаляються з перевірених payload OpenAI-сумісних Anthropic-моделей OpenRouter, коли reasoning увімкнено, відповідно до поведінки replay безпосереднього Anthropic і Cloudflare Anthropic.

Усе інше

Лише очищення зображень.

Історична поведінка (до 2026.1.22)

До релізу 2026.1.22 OpenClaw застосовував кілька шарів гігієни транскриптів:

transcript-sanitize extension запускався під час кожної побудови контексту і міг:
- Відновлювати зіставлення використання інструмента/результату.
- Очищати ids викликів інструментів (включно з нестрогим режимом, який зберігав _/-).
Runner також виконував специфічне для провайдера очищення, що дублювало роботу.
Додаткові мутації відбувалися поза політикою провайдера, включно з:
- Видаленням тегів <final> з тексту асистента перед збереженням.
- Відкиданням порожніх error-ходів асистента.
- Обрізанням вмісту асистента після викликів інструментів.

Ця складність спричиняла регресії між провайдерами (особливо для зіставлення call_id|fc_id в openai-responses). Очищення 2026.1.22 видалило extension, централізувало логіку в runner і зробило OpenAI без змін за межами очищення зображень.

Пов’язане

Was this useful?

Гігієна транскриптів

Глобальне правило: runtime-контекст не є транскриптом користувача

Де це виконується

Глобальне правило: очищення зображень

Глобальне правило: неправильно сформовані виклики інструментів

Глобальне правило: незавершені ходи лише з reasoning

Глобальне правило: походження міжсеансового input

Матриця провайдерів (поточна поведінка)

Історична поведінка (до 2026.1.22)

Пов’язане

On this page

Molty