---
read_when:
    - Запуск локальных проверок надежности личного агента
    - Расширение каталога сценариев QA, поддерживаемого репозиторием
    - Проверка напоминаний, ответов, памяти, редактирования конфиденциальных данных, безопасного выполнения инструментов до конца, статуса задач, безопасной для передачи диагностики, заявлений о завершении, подкрепленных доказательствами, и восстановления после сбоев
summary: Локальные сценарии qa-channel для проверок рабочих процессов персонального ассистента с сохранением конфиденциальности.
title: Персональный набор бенчмарков агента
x-i18n:
    generated_at: "2026-06-28T22:52:01Z"
    model: gpt-5.5
    postprocess_version: locale-links-v1
    provider: openai
    source_hash: a5a6b653abbba0718a6287d4e471435f15ef5823aa62abd238a14d955fdc1e5a
    source_path: concepts/personal-agent-benchmark-pack.md
    workflow: 16
---

Пакет бенчмарков для персонального агента — это небольшой пакет QA-сценариев, хранящийся в репозитории, для
локальных рабочих процессов персонального ассистента. Это не универсальный бенчмарк моделей, и он
не требует нового средства запуска. Пакет повторно использует приватный стек QA, описанный в
[обзоре QA](/ru/concepts/qa-e2e-automation), синтетический
[QA-канал](/ru/channels/qa-channel) и существующий YAML-каталог `qa/scenarios`.

Первый пакет намеренно узкий:

- фиктивные личные напоминания через локальную доставку Cron
- фиктивная маршрутизация личных сообщений и ответов в тредах через `qa-channel`
- фиктивное восстановление предпочтений из временных файлов памяти рабочей области QA
- фиктивные проверки на невывод секретов
- безопасное доведение работы инструмента до конца с опорой на чтение после короткого хода в стиле подтверждения
- поведение остановки при отказе в подтверждении для чувствительного локального запроса чтения
- отчетность о статусе задач, подкрепленная доказательствами, которая разделяет ожидающие, заблокированные и завершенные задачи
- безопасные для передачи диагностические артефакты, которые сохраняют полезный статус, но исключают необработанное личное содержимое
- заявления о завершении, подкрепленные доказательствами, которые избегают фиктивного прогресса до появления локального подтверждения
- восстановление после сбоя, которое сообщает частичный статус и сохраняет четкие границы повторных попыток

## Сценарии

Машиночитаемые метаданные пакета находятся в
`extensions/qa-lab/src/scenario-packs.ts`. Запустите пакет с
`--pack personal-agent`:

```bash
OPENCLAW_ENABLE_PRIVATE_QA_CLI=1 pnpm openclaw qa suite \
  --provider-mode mock-openai \
  --pack personal-agent \
  --concurrency 1
```

`--pack` дополняет повторяющиеся флаги `--scenario`. Явно указанные сценарии запускаются
первыми, затем сценарии пакета запускаются в порядке `QA_PERSONAL_AGENT_SCENARIO_IDS` с
удалением дубликатов.

Пакет рассчитан на `qa-channel` с `mock-openai` или другой локальной QA-линией
провайдера. Его не следует направлять на живые чат-сервисы или реальные личные
аккаунты.

## Модель конфиденциальности

Сценарии используют только фиктивных пользователей, фиктивные предпочтения, фиктивные секреты и
временную рабочую область QA Gateway, созданную набором тестов. Они не должны читать или записывать
реальную пользовательскую память OpenClaw, сессии, учетные данные, агенты запуска, глобальные конфиги
или живое состояние Gateway.

Артефакты остаются в существующем каталоге артефактов набора QA и должны
рассматриваться как тестовый вывод. Проверки редактирования используют фиктивные маркеры, поэтому сбои безопасно
проверять и оформлять в issues.

## Расширение пакета

Добавьте новые `.yaml`-случаи в `qa/scenarios/personal/`, затем добавьте идентификатор сценария
в `QA_PERSONAL_AGENT_SCENARIO_IDS`. Держите каждый случай небольшим, локальным, детерминированным
в `mock-openai` и сфокусированным на одном поведении персонального ассистента.

Хорошие кандидаты для следующих шагов:

- проверки экспорта отредактированной траектории
- проверки рабочих процессов Plugin только для локального режима

Избегайте добавления нового средства запуска, Plugin, зависимости, живого транспорта или модельного судьи,
пока в каталоге сценариев не будет достаточно стабильных случаев, чтобы оправдать такую поверхность.