---
read_when:
    - स्थानीय निजी एजेंट विश्वसनीयता जाँचें चलाना
    - रेपो-समर्थित QA परिदृश्य कैटलॉग का विस्तार करना
    - रिमाइंडर, उत्तर, मेमोरी, रिडैक्शन, सुरक्षित टूल फ़ॉलो-थ्रू, कार्य स्थिति, साझा करने हेतु सुरक्षित डायग्नॉस्टिक्स, प्रमाण-समर्थित पूर्णता दावे, और विफलता रिकवरी का सत्यापन
summary: गोपनीयता-संरक्षण वाले निजी सहायक वर्कफ़्लो जांचों के लिए स्थानीय qa-channel परिदृश्य।
title: व्यक्तिगत एजेंट बेंचमार्क पैक
x-i18n:
    generated_at: "2026-06-28T23:01:05Z"
    model: gpt-5.5
    postprocess_version: locale-links-v1
    provider: openai
    source_hash: a5a6b653abbba0718a6287d4e471435f15ef5823aa62abd238a14d955fdc1e5a
    source_path: concepts/personal-agent-benchmark-pack.md
    workflow: 16
---

Personal Agent Benchmark Pack स्थानीय व्यक्तिगत सहायक वर्कफ़्लो के लिए एक छोटा repo-समर्थित QA परिदृश्य पैक है। यह कोई सामान्य मॉडल बेंचमार्क नहीं है और इसे नए रनर की आवश्यकता नहीं है। पैक [QA अवलोकन](/hi/concepts/qa-e2e-automation), सिंथेटिक [QA चैनल](/hi/channels/qa-channel), और मौजूदा `qa/scenarios` YAML कैटलॉग में वर्णित निजी QA स्टैक का पुनः उपयोग करता है।

पहला पैक जानबूझकर सीमित है:

- स्थानीय Cron डिलीवरी के माध्यम से नकली व्यक्तिगत रिमाइंडर
- `qa-channel` के माध्यम से नकली DM और थ्रेड उत्तर रूटिंग
- अस्थायी QA वर्कस्पेस मेमरी फ़ाइलों से नकली प्राथमिकता स्मरण
- नकली गुप्त नो-इको जांचें
- छोटे अनुमोदन-शैली संवाद-चरण के बाद सुरक्षित पठन-समर्थित टूल फ़ॉलोथ्रू
- संवेदनशील स्थानीय पठन अनुरोध के लिए अनुमोदन अस्वीकृति रोक व्यवहार
- प्रमाण-समर्थित कार्य स्थिति रिपोर्टिंग, जो लंबित, अवरुद्ध, और पूर्ण को अलग रखती है
- साझा करने के लिए सुरक्षित निदान आर्टिफ़ैक्ट, जो कच्ची व्यक्तिगत सामग्री हटाते हुए उपयोगी स्थिति बनाए रखते हैं
- प्रमाण-समर्थित पूर्णता दावे, जो स्थानीय साक्ष्य मौजूद होने से पहले नकली प्रगति से बचते हैं
- विफलता पुनर्प्राप्ति, जो आंशिक स्थिति रिपोर्ट करती है और पुनः प्रयास सीमाओं को स्पष्ट रखती है

## परिदृश्य

मशीन-पठनीय पैक मेटाडेटा `extensions/qa-lab/src/scenario-packs.ts` में रहता है। पैक को `--pack personal-agent` के साथ चलाएँ:

```bash
OPENCLAW_ENABLE_PRIVATE_QA_CLI=1 pnpm openclaw qa suite \
  --provider-mode mock-openai \
  --pack personal-agent \
  --concurrency 1
```

`--pack` दोहराए गए `--scenario` फ़्लैग के साथ योगात्मक है। स्पष्ट परिदृश्य पहले चलते हैं, फिर पैक परिदृश्य `QA_PERSONAL_AGENT_SCENARIO_IDS` क्रम में चलते हैं और डुप्लिकेट हटा दिए जाते हैं।

यह पैक `mock-openai` या किसी अन्य स्थानीय QA प्रदाता लेन के साथ `qa-channel` के लिए बनाया गया है। इसे लाइव चैट सेवाओं या वास्तविक व्यक्तिगत खातों की ओर निर्देशित नहीं किया जाना चाहिए।

## गोपनीयता मॉडल

परिदृश्य केवल नकली उपयोगकर्ताओं, नकली प्राथमिकताओं, नकली रहस्यों, और suite द्वारा बनाए गए अस्थायी QA Gateway वर्कस्पेस का उपयोग करते हैं। उन्हें वास्तविक OpenClaw उपयोगकर्ता मेमरी, सत्र, क्रेडेंशियल, लॉन्च एजेंट, वैश्विक कॉन्फ़िग, या लाइव Gateway स्थिति को पढ़ना या लिखना नहीं चाहिए।

आर्टिफ़ैक्ट मौजूदा QA suite आर्टिफ़ैक्ट डायरेक्टरी के अंतर्गत रहते हैं और उन्हें परीक्षण आउटपुट की तरह माना जाना चाहिए। रिडैक्शन जांचें नकली मार्कर का उपयोग करती हैं, इसलिए विफलताओं का निरीक्षण करना और उन्हें issues में दर्ज करना सुरक्षित है।

## पैक का विस्तार करना

`qa/scenarios/personal/` के अंतर्गत नए `.yaml` केस जोड़ें, फिर परिदृश्य id को `QA_PERSONAL_AGENT_SCENARIO_IDS` में जोड़ें। प्रत्येक केस को छोटा, स्थानीय, `mock-openai` में नियतात्मक, और एक व्यक्तिगत सहायक व्यवहार पर केंद्रित रखें।

अच्छे अनुवर्ती उम्मीदवार:

- रिडैक्ट किए गए ट्रैजेक्टरी निर्यात जांचें
- केवल-स्थानीय Plugin वर्कफ़्लो जांचें

नया रनर, Plugin, निर्भरता, लाइव ट्रांसपोर्ट, या मॉडल जज जोड़ने से बचें, जब तक परिदृश्य कैटलॉग में उस सतह को उचित ठहराने के लिए पर्याप्त स्थिर केस न हों।
