Fundamentals

Paquete de pruebas comparativas de agente personal

El paquete de referencia de agente personal es un pequeño paquete de escenarios de QA respaldado por repositorio para flujos de trabajo de asistente personal local. No es una referencia genérica de modelos y no requiere un runner nuevo. El paquete reutiliza la pila privada de QA descrita en descripción general de QA, el canal de QA sintético y el catálogo YAML qa/scenarios existente.

El primer paquete es intencionalmente limitado:

recordatorios personales falsos mediante entrega de cron local
enrutamiento falso de DM y respuestas de hilos mediante qa-channel
recuperación falsa de preferencias desde los archivos de memoria temporales del espacio de trabajo de QA
comprobaciones falsas de no eco de secretos
seguimiento seguro de herramientas respaldado por lectura después de un breve turno de estilo aprobación
comportamiento de detención ante denegación de aprobación para una solicitud sensible de lectura local
informes de estado de tareas respaldados por pruebas que mantienen separados pendiente, bloqueado y hecho
artefactos de diagnóstico seguros para compartir que mantienen estado útil mientras omiten contenido personal sin procesar
afirmaciones de finalización respaldadas por pruebas que evitan el progreso falso antes de que exista evidencia local
recuperación de fallos que informa el estado parcial y mantiene claros los límites de reintento

Escenarios

Los metadatos legibles por máquina del paquete viven en extensions/qa-lab/src/scenario-packs.ts. Ejecuta el paquete con --pack personal-agent:

bash

OPENCLAW_ENABLE_PRIVATE_QA_CLI=1 pnpm openclaw qa suite \  --provider-mode mock-openai \  --pack personal-agent \  --concurrency 1

--pack es aditivo con banderas --scenario repetidas. Los escenarios explícitos se ejecutan primero; luego, los escenarios del paquete se ejecutan en el orden de QA_PERSONAL_AGENT_SCENARIO_IDS con los duplicados eliminados.

El paquete está diseñado para qa-channel con mock-openai u otro carril local de proveedor de QA. No debe apuntarse a servicios de chat en vivo ni a cuentas personales reales.

Modelo De Privacidad

Los escenarios usan solo usuarios falsos, preferencias falsas, secretos falsos y el espacio de trabajo temporal de QA Gateway creado por la suite. No deben leer ni escribir memoria, sesiones, credenciales, agentes de inicio, configuraciones globales ni estado de Gateway en vivo de usuarios reales de OpenClaw.

Los artefactos permanecen bajo el directorio existente de artefactos de la suite de QA y deben tratarse como salida de pruebas. Las comprobaciones de censura usan marcadores falsos, por lo que los fallos son seguros de inspeccionar y registrar en incidencias.

Ampliación Del Paquete

Agrega nuevos casos .yaml bajo qa/scenarios/personal/; luego, agrega el identificador del escenario a QA_PERSONAL_AGENT_SCENARIO_IDS. Mantén cada caso pequeño, local, determinista en mock-openai y enfocado en un comportamiento de asistente personal.

Buenos candidatos de seguimiento:

comprobaciones de exportación de trayectoria censurada
comprobaciones de flujo de trabajo de plugin solo local

Evita agregar un runner, plugin, dependencia, transporte en vivo o juez de modelo nuevo hasta que el catálogo de escenarios tenga suficientes casos estables para justificar esa superficie.

Was this useful?

Paquete de pruebas comparativas de agente personal

Escenarios

Modelo De Privacidad

Ampliación Del Paquete

On this page

Molty