Fundamentals

حزمة معايير قياس أداء الوكيل الشخصي

حزمة معيار الوكيل الشخصي هي حزمة صغيرة لسيناريوهات QA مدعومة بمستودع لسير عمل المساعد الشخصي المحلي. وهي ليست معيارًا عامًا للنماذج ولا تتطلب مشغّلًا جديدًا. تعيد الحزمة استخدام مكدس QA الخاص الموضح في نظرة عامة على QA، وقناة QA الاصطناعية، وكتالوج YAML الحالي qa/scenarios.

الحزمة الأولى ضيقة النطاق عمدًا:

تذكيرات شخصية وهمية عبر تسليم Cron محلي
توجيه وهمي للرسائل المباشرة والردود في السلاسل عبر qa-channel
استدعاء تفضيلات وهمية من ملفات ذاكرة مساحة عمل QA المؤقتة
فحوصات وهمية لعدم صدى الأسرار
متابعة آمنة للأداة مدعومة بالقراءة بعد جولة قصيرة بأسلوب الموافقة
سلوك توقف عند رفض الموافقة لطلب قراءة محلي حساس
إبلاغ بحالة المهام مدعوم بالإثباتات يبقي المعلّق والمحظور والمنجز منفصلة
عناصر تشخيص آمنة للمشاركة تحتفظ بالحالة المفيدة مع حذف المحتوى الشخصي الخام
ادعاءات إكمال مدعومة بالإثباتات تتجنب التقدم الوهمي قبل وجود دليل محلي
تعافٍ من الفشل يبلّغ عن الحالة الجزئية ويبقي حدود إعادة المحاولة واضحة

السيناريوهات

توجد بيانات تعريف الحزمة القابلة للقراءة آليًا في extensions/qa-lab/src/scenario-packs.ts. شغّل الحزمة باستخدام --pack personal-agent:

bash

OPENCLAW_ENABLE_PRIVATE_QA_CLI=1 pnpm openclaw qa suite \  --provider-mode mock-openai \  --pack personal-agent \  --concurrency 1

--pack خيار إضافي مع أعلام --scenario المتكررة. تعمل السيناريوهات الصريحة أولًا، ثم تعمل سيناريوهات الحزمة بترتيب QA_PERSONAL_AGENT_SCENARIO_IDS مع إزالة التكرارات.

صُممت الحزمة من أجل qa-channel مع mock-openai أو مسار موفر QA محلي آخر. ينبغي عدم توجيهها إلى خدمات دردشة مباشرة أو حسابات شخصية حقيقية.

نموذج الخصوصية

تستخدم السيناريوهات مستخدمين وهميين فقط، وتفضيلات وهمية، وأسرارًا وهمية، ومساحة عمل Gateway المؤقتة الخاصة بـ QA التي تنشئها المجموعة. يجب ألا تقرأ أو تكتب ذاكرة مستخدم OpenClaw الحقيقية، أو الجلسات، أو بيانات الاعتماد، أو وكلاء التشغيل، أو الإعدادات العامة، أو حالة Gateway المباشرة.

تبقى العناصر ضمن دليل عناصر مجموعة QA الحالي، وينبغي التعامل معها كمخرجات اختبار. تستخدم فحوصات التنقيح علامات وهمية بحيث تكون الإخفاقات آمنة للفحص والتسجيل في المشكلات.

توسيع الحزمة

أضف حالات .yaml جديدة ضمن qa/scenarios/personal/، ثم أضف معرّف السيناريو إلى QA_PERSONAL_AGENT_SCENARIO_IDS. أبقِ كل حالة صغيرة ومحلية وحتمية في mock-openai، ومركزة على سلوك واحد للمساعد الشخصي.

مرشحو المتابعة الجيدون:

فحوصات تصدير المسار بعد التنقيح
فحوصات سير عمل Plugin محلية فقط

تجنب إضافة مشغّل جديد، أو Plugin، أو تبعية، أو نقل مباشر، أو حكم نموذج إلى أن يحتوي كتالوج السيناريوهات على عدد كافٍ من الحالات المستقرة يبرر ذلك السطح.

Was this useful?

حزمة معايير قياس أداء الوكيل الشخصي

السيناريوهات

نموذج الخصوصية

توسيع الحزمة

On this page

Molty