Fundamentals

بسته بنچمارک عامل شخصی

بسته بنچمارک عامل شخصی یک بسته سناریوی QA کوچک و متکی بر مخزن برای گردش‌کارهای دستیار شخصی محلی است. این بسته یک بنچمارک مدل عمومی نیست و به اجراکننده جدیدی نیاز ندارد. این بسته از پشته QA خصوصی توصیف‌شده در نمای کلی QA، کانال QA مصنوعی، و کاتالوگ YAML موجود qa/scenarios دوباره استفاده می‌کند.

بسته نخست عمداً محدود است:

یادآورهای شخصی ساختگی از طریق تحویل Cron محلی
مسیریابی پیام مستقیم و پاسخ رشته‌ای ساختگی از طریق qa-channel
یادآوری ترجیحات ساختگی از فایل‌های حافظه موقت فضای کاری QA
بررسی‌های ساختگی عدم بازتاب راز
پیگیری ابزار با پشتوانه خواندن ایمن پس از یک نوبت کوتاه شبیه تأیید
رفتار توقف در صورت رد تأیید برای یک درخواست خواندن محلی حساس
گزارش وضعیت وظیفه با پشتوانه اثبات که در انتظار، مسدود و انجام‌شده را جدا نگه می‌دارد
آرتیفکت‌های تشخیصی ایمن برای اشتراک‌گذاری که وضعیت مفید را حفظ می‌کنند و محتوای شخصی خام را حذف می‌کنند
ادعاهای تکمیل با پشتوانه اثبات که پیش از وجود شواهد محلی از پیشرفت ساختگی پرهیز می‌کنند
بازیابی از شکست که وضعیت جزئی را گزارش می‌کند و مرزهای تلاش مجدد را روشن نگه می‌دارد

سناریوها

فراداده قابل خواندن توسط ماشین برای بسته در extensions/qa-lab/src/scenario-packs.ts قرار دارد. بسته را با --pack personal-agent اجرا کنید:

bash

OPENCLAW_ENABLE_PRIVATE_QA_CLI=1 pnpm openclaw qa suite \  --provider-mode mock-openai \  --pack personal-agent \  --concurrency 1

--pack با پرچم‌های تکراری --scenario افزایشی است. سناریوهای صریح ابتدا اجرا می‌شوند، سپس سناریوهای بسته به ترتیب QA_PERSONAL_AGENT_SCENARIO_IDS با حذف موارد تکراری اجرا می‌شوند.

این بسته برای qa-channel با mock-openai یا یک مسیر ارائه‌دهنده QA محلی دیگر طراحی شده است. نباید آن را به سرویس‌های گفت‌وگوی زنده یا حساب‌های شخصی واقعی متصل کرد.

مدل حریم خصوصی

سناریوها فقط از کاربران ساختگی، ترجیحات ساختگی، رازهای ساختگی، و فضای کاری موقت QA Gateway که توسط مجموعه ساخته می‌شود استفاده می‌کنند. آن‌ها نباید حافظه کاربر واقعی OpenClaw، نشست‌ها، اعتبارنامه‌ها، عامل‌های راه‌اندازی، پیکربندی‌های سراسری، یا وضعیت Gateway زنده را بخوانند یا بنویسند.

آرتیفکت‌ها زیر دایرکتوری آرتیفکت مجموعه QA موجود باقی می‌مانند و باید مانند خروجی آزمون با آن‌ها برخورد شود. بررسی‌های ویرایش از نشانگرهای ساختگی استفاده می‌کنند تا بررسی و ثبت شکست‌ها در issues ایمن باشد.

گسترش بسته

موارد جدید .yaml را زیر qa/scenarios/personal/ اضافه کنید، سپس شناسه سناریو را به QA_PERSONAL_AGENT_SCENARIO_IDS اضافه کنید. هر مورد را کوچک، محلی، قطعی در mock-openai، و متمرکز بر یک رفتار دستیار شخصی نگه دارید.

گزینه‌های مناسب برای پیگیری:

بررسی‌های صدور مسیر حرکت ویرایش‌شده
بررسی‌های گردش‌کار Plugin فقط محلی

تا زمانی که کاتالوگ سناریو به اندازه کافی مورد پایدار برای توجیه این سطح پیدا نکرده است، از افزودن اجراکننده، Plugin، وابستگی، انتقال زنده، یا داور مدل جدید خودداری کنید.

Was this useful?

بسته بنچمارک عامل شخصی

سناریوها

مدل حریم خصوصی

گسترش بسته

On this page

Molty