Release and CI

Pipeline CI

OpenClaw CI berjalan pada setiap push ke main dan setiap pull request. Push main kanonis terlebih dahulu melewati jendela penerimaan hosted-runner selama 90 detik. Grup konkurensi CI yang sudah ada membatalkan run yang sedang menunggu itu ketika commit yang lebih baru masuk, sehingga merge berurutan tidak masing-masing mendaftarkan matriks Blacksmith penuh. Pull request dan dispatch manual melewati penantian tersebut. Job preflight kemudian mengklasifikasikan diff dan mematikan lane mahal saat hanya area yang tidak terkait berubah. Run manual workflow_dispatch sengaja melewati pemetaan cakupan cerdas dan menyebarkan seluruh graf untuk kandidat rilis dan validasi luas. Lane Android tetap opt-in melalui include_android. Cakupan Plugin khusus rilis berada di workflow Prapeluncuran Plugin terpisah dan hanya berjalan dari Validasi Rilis Penuh atau dispatch manual eksplisit.

Gambaran umum pipeline

Job	Tujuan	Kapan berjalan
`preflight`	Mendeteksi perubahan khusus docs, cakupan yang berubah, ekstensi yang berubah, dan membangun manifes CI	Selalu pada push dan PR non-draft
`runner-admission`	Debounce hosted 90 detik untuk push `main` kanonis sebelum pekerjaan Blacksmith didaftarkan	Setiap run CI; sleep hanya pada push `main` kanonis
`security-fast`	Deteksi private key, audit workflow yang berubah melalui `zizmor`, dan audit lockfile produksi	Selalu pada push dan PR non-draft
`check-dependencies`	Pass khusus dependensi Knip produksi ditambah guard allowlist file yang tidak digunakan	Perubahan yang relevan dengan Node
`build-artifacts`	Membangun `dist/`, Control UI, pemeriksaan smoke CLI-terbangun, pemeriksaan artefak-terbangun tertanam, dan artefak yang dapat digunakan ulang	Perubahan yang relevan dengan Node
`checks-fast-core`	Lane kebenaran Linux cepat seperti bundled, protocol, CI Smoke QA, dan pemeriksaan routing CI	Perubahan yang relevan dengan Node
`checks-fast-contracts-plugins-*`	Dua pemeriksaan kontrak Plugin yang di-shard	Perubahan yang relevan dengan Node
`checks-fast-contracts-channels-*`	Dua pemeriksaan kontrak channel yang di-shard	Perubahan yang relevan dengan Node
`checks-node-core-*`	Shard pengujian Node inti, mengecualikan lane channel, bundled, kontrak, dan ekstensi	Perubahan yang relevan dengan Node
`check-*`	Padanan gate lokal utama yang di-shard: tipe produksi, lint, guard, tipe pengujian, dan smoke ketat	Perubahan yang relevan dengan Node
`check-additional-*`	Arsitektur, drift boundary/prompt yang di-shard, guard ekstensi, boundary paket, dan topologi runtime	Perubahan yang relevan dengan Node
`checks-node-compat-node22`	Build kompatibilitas Node 22 dan lane smoke	Dispatch CI manual untuk rilis
`check-docs`	Pemformatan docs, lint, dan pemeriksaan broken-link	Docs berubah
`skills-python`	Ruff + pytest untuk Skills berbasis Python	Perubahan yang relevan dengan Skill Python
`checks-windows`	Pengujian proses/path khusus Windows ditambah regresi specifier impor runtime bersama	Perubahan yang relevan dengan Windows
`macos-node`	Lane pengujian TypeScript macOS menggunakan artefak terbangun bersama	Perubahan yang relevan dengan macOS
`macos-swift`	Lint, build, dan pengujian Swift untuk aplikasi macOS	Perubahan yang relevan dengan macOS
`ios-build`	Pembuatan proyek Xcode ditambah build simulator aplikasi iOS	Aplikasi iOS, app kit bersama, atau perubahan Swabble
`android`	Pengujian unit Android untuk kedua flavor ditambah satu build APK debug	Perubahan yang relevan dengan Android
`test-performance-agent`	Optimisasi pengujian lambat Codex harian setelah aktivitas tepercaya	Keberhasilan CI utama atau dispatch manual
`openclaw-performance`	Laporan performa runtime Kova harian/sesuai permintaan dengan lane mock-provider, deep-profile, dan live GPT 5.5	Terjadwal dan dispatch manual

Urutan fail-fast

runner-admission menunggu hanya untuk push main kanonis; push yang lebih baru membatalkan run sebelum pendaftaran Blacksmith.
preflight memutuskan lane mana yang ada sama sekali. Logika docs-scope dan changed-scope adalah langkah di dalam job ini, bukan job mandiri.
security-fast, check-*, check-additional-*, check-docs, dan skills-python gagal dengan cepat tanpa menunggu job matriks artefak dan platform yang lebih berat.
build-artifacts berjalan beririsan dengan lane Linux cepat sehingga konsumen downstream dapat mulai segera setelah build bersama siap.
Lane platform dan runtime yang lebih berat menyebar setelah itu: checks-fast-core, checks-fast-contracts-plugins-*, checks-fast-contracts-channels-*, checks-node-core-*, checks-windows, macos-node, macos-swift, ios-build, dan android.

GitHub dapat menandai job yang tersupersede sebagai cancelled ketika push yang lebih baru masuk ke PR atau ref main yang sama. Anggap itu sebagai noise CI kecuali run terbaru untuk ref yang sama juga gagal. Job matriks menggunakan fail-fast: false, dan build-artifacts melaporkan kegagalan channel tertanam, core-support-boundary, dan gateway-watch secara langsung alih-alih mengantre job verifier kecil. Kunci konkurensi CI otomatis diberi versi (CI-v7-*) sehingga zombie sisi GitHub dalam grup antrean lama tidak dapat memblokir run main yang lebih baru tanpa batas. Run full-suite manual menggunakan CI-manual-v1-* dan tidak membatalkan run yang sedang berjalan.

Gunakan pnpm ci:timings, pnpm ci:timings:recent, atau node scripts/ci-run-timings.mjs <run-id> untuk merangkum wall time, queue time, job paling lambat, kegagalan, dan barrier fanout pnpm-store-warmup dari GitHub Actions. CI juga mengunggah ringkasan run yang sama sebagai artefak ci-timings-summary. Untuk timing build, periksa langkah Build dist pada job build-artifacts: pnpm build:ci-artifacts mencetak [build-all] phase timings: dan menyertakan ui:build; job tersebut juga mengunggah artefak startup-memory.

Untuk run pull request, job timing-summary terminal menjalankan helper dari revisi base tepercaya sebelum meneruskan GH_TOKEN ke gh run view. Ini menjaga kueri bertoken tetap berada di luar kode yang dikendalikan branch sambil tetap merangkum run CI pull request saat ini.

Konteks dan bukti PR

PR kontributor eksternal menjalankan gate konteks dan bukti PR dari .github/workflows/real-behavior-proof.yml. Workflow melakukan checkout commit base tepercaya dan hanya mengevaluasi body PR; workflow tersebut tidak mengeksekusi kode dari branch kontributor.

Gate berlaku untuk penulis PR yang bukan pemilik repository, member, collaborator, atau bot. Gate lulus ketika body PR berisi bagian yang ditulis penulis What Problem This Solves dan Evidence. Bukti dapat berupa pengujian terfokus, hasil CI, screenshot, rekaman, output terminal, observasi live, log yang disunting, atau tautan artefak. Body menyediakan maksud dan validasi yang berguna; reviewer memeriksa kode, pengujian, dan CI untuk menilai kebenaran.

Ketika pemeriksaan gagal, perbarui body PR alih-alih mendorong commit kode lain.

Cakupan dan routing

Logika cakupan berada di scripts/ci-changed-scope.mjs dan dicakup oleh pengujian unit di src/scripts/ci-changed-scope.test.ts. Dispatch manual melewati deteksi changed-scope dan membuat manifes preflight bertindak seolah setiap area tercakup berubah.

Edit workflow CI memvalidasi graf CI Node ditambah linting workflow, tetapi tidak memaksa build native Windows, iOS, Android, atau macOS dengan sendirinya; lane platform tersebut tetap dicakup ke perubahan source platform.
Workflow Sanity menjalankan actionlint, zizmor atas semua file YAML workflow, guard interpolasi composite-action, dan guard conflict-marker. Job security-fast yang dicakup PR juga menjalankan zizmor atas file workflow yang berubah sehingga temuan keamanan workflow gagal lebih awal di graf CI utama.
Docs pada push main diperiksa oleh workflow mandiri Docs dengan mirror docs ClawHub yang sama yang digunakan CI, sehingga push campuran kode+docs tidak juga mengantre shard check-docs CI. Pull request dan CI manual tetap menjalankan check-docs dari CI ketika docs berubah.
TUI PTY berjalan di shard Node Linux checks-node-core-runtime-tui-pty untuk perubahan TUI. Shard menjalankan test/vitest/vitest.tui-pty.config.ts dengan OPENCLAW_TUI_PTY_INCLUDE_LOCAL=1, sehingga mencakup lane fixture TuiBackend deterministik dan smoke tui --local yang lebih lambat yang hanya melakukan mock endpoint model eksternal.
Edit khusus routing CI, edit fixture pengujian inti murah terpilih, dan edit helper kontrak Plugin/routing pengujian yang sempit menggunakan path manifes cepat khusus Node: preflight, keamanan, dan satu tugas checks-fast-core. Path itu melewati artefak build, kompatibilitas Node 22, kontrak channel, shard inti penuh, shard Plugin bundled, dan matriks guard tambahan ketika perubahan terbatas pada surface routing atau helper yang langsung diuji tugas cepat tersebut.
Pemeriksaan Node Windows dicakup ke wrapper proses/path khusus Windows, helper runner npm/pnpm/UI, konfigurasi package manager, dan surface workflow CI yang mengeksekusi lane tersebut; perubahan source, Plugin, install-smoke, dan khusus pengujian yang tidak terkait tetap berada pada lane Node Linux.

Rangkaian pengujian Node yang paling lambat dipecah atau diseimbangkan agar setiap job tetap kecil tanpa mencadangkan runner secara berlebihan: kontrak plugin dan kontrak channel masing-masing berjalan sebagai dua shard berbobot yang didukung Blacksmith dengan fallback runner GitHub standar, lane core unit fast/support berjalan terpisah, infrastruktur runtime core dipecah antara state, process/config, shared, dan tiga shard domain cron, auto-reply berjalan sebagai worker seimbang (dengan subtree reply dipecah menjadi shard agent-runner, dispatch, dan commands/state-routing), dan konfigurasi agentic gateway/server dipecah di seluruh lane chat/auth/model/http-plugin/runtime/startup alih-alih menunggu artefak yang dibangun. CI normal kemudian hanya mengemas shard include-pattern infrastruktur terisolasi ke dalam bundle deterministik berisi paling banyak 64 file pengujian, sehingga mengurangi matriks Node tanpa menggabungkan suite command/cron yang tidak terisolasi, agents-core berstatus stateful, atau gateway/server; suite tetap yang berat tetap memakai 8 vCPU sementara lane yang dibundel dan berbobot lebih rendah memakai 4 vCPU. Pull request pada repositori kanonis memakai rencana admission ringkas tambahan: grup per konfigurasi yang sama berjalan dalam subprocess terisolasi di dalam rencana Linux Node 34-job saat ini, sehingga satu PR tidak mendaftarkan seluruh matriks Node dengan lebih dari 70 job. Push ke main, dispatch manual, dan gate rilis mempertahankan matriks penuh. Pengujian browser luas, QA, media, dan plugin lain-lain memakai konfigurasi Vitest khususnya sendiri alih-alih catch-all plugin bersama. Shard include-pattern mencatat entri timing menggunakan nama shard CI, sehingga .artifacts/vitest-shard-timings.json dapat membedakan seluruh konfigurasi dari shard yang difilter. check-additional-* mempertahankan pekerjaan compile/canary batas paket tetap bersama dan memisahkan arsitektur topologi runtime dari cakupan gateway watch; daftar boundary guard distripe menjadi satu shard yang berat prompt dan satu shard gabungan untuk stripe guard yang tersisa, masing-masing menjalankan guard independen terpilih secara bersamaan dan mencetak timing per-check. Pemeriksaan drift snapshot prompt happy-path Codex yang mahal berjalan sebagai job tambahan tersendiri untuk CI manual dan hanya untuk perubahan yang memengaruhi prompt, sehingga perubahan Node normal yang tidak terkait tidak menunggu di belakang pembuatan snapshot prompt dingin dan shard boundary tetap seimbang sementara drift prompt tetap dipatok ke PR yang menyebabkannya; flag yang sama melewati pembuatan Vitest snapshot prompt di dalam shard core support-boundary artefak yang dibangun. Gateway watch, pengujian channel, dan shard core support-boundary berjalan bersamaan di dalam build-artifacts setelah dist/ dan dist-runtime/ sudah dibangun.

Setelah diterima, CI Linux kanonis mengizinkan hingga 24 job pengujian Node bersamaan dan 12 untuk lane fast/check yang lebih kecil; Windows dan Android tetap pada dua karena pool runner tersebut lebih sempit.

Rencana PR ringkas menghasilkan 18 job Node untuk suite saat ini: grup whole-config dibatch dalam subprocess terisolasi dengan timeout batch 120 menit, sementara grup include-pattern berbagi anggaran job terbatas yang sama.

CI Android menjalankan testPlayDebugUnitTest dan testThirdPartyDebugUnitTest, lalu membangun APK debug Play. Flavor pihak ketiga tidak memiliki source set atau manifest terpisah; lane unit-test-nya tetap mengompilasi flavor dengan flag BuildConfig SMS/call-log, sambil menghindari job packaging APK debug duplikat pada setiap push yang relevan dengan Android.

Shard check-dependencies menjalankan pnpm deadcode:dependencies (pass Knip produksi khusus dependensi yang dipatok ke versi Knip terbaru, dengan usia rilis minimum pnpm dinonaktifkan untuk instalasi dlx) dan pnpm deadcode:unused-files, yang membandingkan temuan unused-file produksi Knip dengan scripts/deadcode-unused-files.allowlist.mjs. Guard unused-file gagal saat PR menambahkan file tak terpakai baru yang belum ditinjau atau meninggalkan entri allowlist yang sudah basi, sambil mempertahankan permukaan plugin dinamis, generated, build, live-test, dan package bridge yang disengaja yang tidak dapat diselesaikan Knip secara statis.

Penerusan aktivitas ClawSweeper

.github/workflows/clawsweeper-dispatch.yml adalah bridge sisi target dari aktivitas repositori OpenClaw ke ClawSweeper. Workflow ini tidak melakukan checkout atau menjalankan kode pull request yang tidak tepercaya. Workflow membuat token GitHub App dari CLAWSWEEPER_APP_PRIVATE_KEY, lalu mengirim payload repository_dispatch ringkas ke openclaw/clawsweeper.

Workflow memiliki empat lane:

clawsweeper_item untuk permintaan peninjauan issue dan pull request yang spesifik;
clawsweeper_comment untuk perintah ClawSweeper eksplisit dalam komentar issue;
clawsweeper_commit_review untuk permintaan peninjauan tingkat commit pada push main;
github_activity untuk aktivitas GitHub umum yang dapat diperiksa agen ClawSweeper.

Lane github_activity hanya meneruskan metadata yang dinormalisasi: jenis event, action, actor, repository, nomor item, URL, judul, state, dan kutipan singkat untuk komentar atau review saat ada. Lane ini sengaja menghindari penerusan seluruh body webhook. Workflow penerima di openclaw/clawsweeper adalah .github/workflows/github-activity.yml, yang memposting event yang dinormalisasi ke hook OpenClaw Gateway untuk agen ClawSweeper.

Aktivitas umum adalah observasi, bukan pengiriman secara default. Agen ClawSweeper menerima target Discord dalam prompt-nya dan hanya boleh memposting ke #clawsweeper saat event tersebut mengejutkan, dapat ditindaklanjuti, berisiko, atau berguna secara operasional. Pembukaan rutin, edit, churn bot, noise webhook duplikat, dan lalu lintas review normal harus menghasilkan NO_REPLY.

Perlakukan judul, komentar, body, teks review, nama branch, dan pesan commit GitHub sebagai data yang tidak tepercaya di sepanjang jalur ini. Semua itu adalah input untuk peringkasan dan triase, bukan instruksi untuk workflow atau runtime agen.

Dispatch manual

Dispatch CI manual menjalankan grafik job yang sama seperti CI normal tetapi memaksa setiap lane scoped non-Android aktif: shard Linux Node, shard bundled-plugin, shard kontrak plugin dan channel, kompatibilitas Node 22, check-*, check-additional-*, pemeriksaan smoke artefak yang dibangun, pemeriksaan docs, Python skills, Windows, macOS, build iOS, dan Control UI i18n. Dispatch CI manual mandiri menjalankan Android hanya dengan include_android=true; umbrella rilis penuh mengaktifkan Android dengan meneruskan include_android=true. Pemeriksaan statis prerelease plugin, shard khusus rilis agentic-plugins, sweep batch extension penuh, dan lane Docker prerelease plugin dikecualikan dari CI. Suite prerelease Docker hanya berjalan saat Full Release Validation men-dispatch workflow Plugin Prerelease terpisah dengan gate release-validation diaktifkan.

Run manual memakai concurrency group unik sehingga suite penuh release-candidate tidak dibatalkan oleh push atau PR run lain pada ref yang sama. Input opsional target_ref memungkinkan caller tepercaya menjalankan grafik tersebut terhadap branch, tag, atau SHA commit penuh sambil memakai file workflow dari ref dispatch yang dipilih.

bash

gh workflow run ci.yml --ref release/YYYY.M.PATCHgh workflow run ci.yml --ref main -f target_ref=<branch-or-sha> -f include_android=truegh workflow run full-release-validation.yml --ref main -f ref=<branch-or-sha>

Jalur extended-stable bulanan khusus npm adalah pengecualian: dispatch preflight OpenClaw NPM Release dan Full Release Validation dari branch extended-stable/YYYY.M.33 yang persis, pertahankan ID run keduanya, dan teruskan kedua ID ke run publish npm langsung. Lihat Publikasi extended-stable bulanan khusus npm untuk perintah, persyaratan identitas yang tepat, readback registry, dan prosedur perbaikan selector. Jalur ini tidak men-dispatch publikasi plugin, macOS, Windows, GitHub Release, dist-tag privat, atau platform lainnya.

Runner

Runner	Job
`ubuntu-24.04`	Dispatch CI manual dan fallback repositori non-kanonis, pemindaian kualitas CodeQL JavaScript/actions, workflow-sanity, labeler, auto-response, workflow docs di luar CI, dan preflight install-smoke agar matriks Blacksmith dapat mengantre lebih awal
`blacksmith-4vcpu-ubuntu-2404`	`preflight`, `security-fast`, shard extension berbobot lebih rendah, `checks-fast-core` kecuali QA Smoke CI, shard kontrak plugin/channel, sebagian besar shard Linux Node bundled/berbobot lebih rendah, `check-guards`, `check-prod-types`, `check-test-types`, shard `check-additional-*` terpilih, dan `check-dependencies`
`blacksmith-8vcpu-ubuntu-2404`	Suite Linux Node berat yang dipertahankan, shard `check-additional-*` yang berat boundary/extension, dan `android`
`blacksmith-16vcpu-ubuntu-2404`	QA Smoke CI, `build-artifacts` di CI dan Testbox, `check-lint` (cukup sensitif CPU sehingga 8 vCPU lebih mahal daripada penghematannya); build Docker install-smoke (biaya waktu antrean 32-vCPU lebih besar daripada penghematannya)
`blacksmith-8vcpu-windows-2025`	`checks-windows`
`blacksmith-6vcpu-macos-15`	`macos-node` pada `openclaw/openclaw`; fork fallback ke `macos-15`
`blacksmith-12vcpu-macos-26`	`macos-swift` dan `ios-build` pada `openclaw/openclaw`; fork fallback ke `macos-26`

Anggaran pendaftaran runner

Bucket pendaftaran runner GitHub OpenClaw saat ini melaporkan 10.000 pendaftaran runner self-hosted per 5 menit dalam ghx api rate_limit. Periksa ulang actions_runner_registration sebelum setiap pass tuning karena GitHub dapat mengubah bucket ini. Batas tersebut dibagi oleh semua pendaftaran runner Blacksmith dalam organisasi openclaw, sehingga menambahkan instalasi Blacksmith lain tidak menambahkan bucket baru.

Perlakukan label Blacksmith sebagai resource langka untuk kontrol burst. Job yang hanya merutekan, memberi notifikasi, meringkas, memilih shard, atau menjalankan pemindaian CodeQL singkat harus tetap berada di runner yang di-host GitHub kecuali memiliki kebutuhan khusus Blacksmith yang terukur. Setiap matriks Blacksmith baru, max-parallel yang lebih besar, atau workflow berfrekuensi tinggi harus menunjukkan jumlah pendaftaran worst-case-nya dan menjaga target tingkat org di bawah sekitar 60% dari bucket live. Dengan bucket 10.000 pendaftaran saat ini, itu berarti target operasi 6.000 pendaftaran, menyisakan headroom untuk repositori bersamaan, retry, dan overlap burst.

CI repo kanonis mempertahankan Blacksmith sebagai jalur runner default untuk run push dan pull-request normal. workflow_dispatch dan run repositori non-kanonis memakai runner yang di-host GitHub, tetapi run kanonis normal saat ini tidak mem-probe kesehatan antrean Blacksmith atau secara otomatis fallback ke label yang di-host GitHub saat Blacksmith tidak tersedia.

Padanan lokal

bash

pnpm changed:lanes                            # inspect the local changed-lane classifier for origin/main...HEADpnpm check:changed                            # smart local check gate: changed typecheck/lint/guards by boundary lanepnpm check                                    # fast local gate: prod tsgo + sharded lint + parallel fast guardspnpm check:test-typespnpm check:timed                              # same gate with per-stage timingspnpm build:strict-smokepnpm check:architecturepnpm test:gateway:watch-regressionOPENCLAW_TUI_PTY_INCLUDE_LOCAL=1 node scripts/run-vitest.mjs run --config test/vitest/vitest.tui-pty.config.tspnpm test                                     # vitest testspnpm test:changed                             # cheap smart changed Vitest targetspnpm test:channelspnpm test:contracts:channelspnpm check:docs                               # docs format + lint + broken linkspnpm build                                    # build dist when CI artifact/smoke checks matterpnpm ios:build                                # generate and build the iOS app projectpnpm ci:timings                               # summarize the latest origin/main push CI runpnpm ci:timings:recent                        # compare recent successful main CI runsnode scripts/ci-run-timings.mjs <run-id>      # summarize wall time, queue time, and slowest jobsnode scripts/ci-run-timings.mjs --latest-main # ignore issue/comment noise and choose origin/main push CInode scripts/ci-run-timings.mjs --recent 10   # compare recent successful main CI runspnpm test:perf:groups --full-suite --allow-failures --output .artifacts/test-perf/baseline-before.jsonpnpm test:perf:groups:compare .artifacts/test-perf/baseline-before.json .artifacts/test-perf/after-agent.jsonpnpm test:startup:memorypnpm test:extensions:memory -- --json .artifacts/openclaw-performance/source/mock-provider/extension-memory.jsonpnpm perf:kova:summary --report .artifacts/kova/reports/mock-provider/report.json --output .artifacts/kova/summary.md

Performa OpenClaw

OpenClaw Performance adalah alur kerja performa produk/runtime. Alur ini berjalan setiap hari di main dan dapat dijalankan secara manual:

bash

gh workflow run openclaw-performance.yml --ref main -f profile=diagnostic -f repeat=3gh workflow run openclaw-performance.yml --ref main -f profile=smoke -f repeat=1 -f deep_profile=true -f live_openai_candidate=truegh workflow run openclaw-performance.yml --ref main -f target_ref=v2026.5.2 -f profile=diagnostic -f repeat=3

Dispatch manual biasanya melakukan benchmark terhadap ref alur kerja. Atur target_ref untuk melakukan benchmark terhadap tag rilis atau cabang lain dengan implementasi alur kerja saat ini. Jalur laporan yang dipublikasikan dan pointer terbaru dikunci berdasarkan ref yang diuji, dan setiap index.md mencatat ref/SHA yang diuji, ref/SHA alur kerja, ref Kova, profil, mode otorisasi lane, model, jumlah pengulangan, dan filter skenario.

Alur kerja menginstal OCM dari rilis yang disematkan dan Kova dari openclaw/Kova pada input kova_ref yang disematkan, lalu menjalankan tiga lane:

mock-provider: skenario diagnostik Kova terhadap runtime build lokal dengan otorisasi palsu kompatibel OpenAI yang deterministik.
mock-deep-profile: profiling CPU/heap/trace untuk hotspot startup, Gateway, dan giliran agen.
live-openai-candidate: giliran agen OpenAI openai/gpt-5.5 nyata, dilewati saat OPENAI_API_KEY tidak tersedia.

Lane mock-provider juga menjalankan probe sumber native OpenClaw setelah lintasan Kova: waktu boot Gateway dan memori di berbagai kasus startup default, hook, dan 50-Plugin; RSS impor Plugin bawaan, loop hello mock-OpenAI channel-chat-baseline berulang, perintah startup CLI terhadap Gateway yang sudah boot, dan probe performa smoke state SQLite. Saat laporan sumber mock-provider yang dipublikasikan sebelumnya tersedia untuk ref yang diuji, ringkasan sumber membandingkan nilai RSS dan heap saat ini terhadap baseline tersebut dan menandai kenaikan RSS besar sebagai watch. Ringkasan Markdown probe sumber berada di source/index.md dalam bundel laporan, dengan JSON mentah di sampingnya.

Setiap lane mengunggah artefak GitHub. Saat CLAWGRIT_REPORTS_TOKEN dikonfigurasi, alur kerja juga melakukan commit report.json, report.md, bundel, index.md, dan artefak probe sumber ke openclaw/clawgrit-reports di bawah openclaw-performance/<tested-ref>/<run-id>-<attempt>/<lane>/. Pointer ref yang diuji saat ini ditulis sebagai openclaw-performance/<tested-ref>/latest-<lane>.json.

Validasi Rilis Lengkap

Full Release Validation adalah alur kerja payung manual untuk "menjalankan semuanya sebelum rilis." Alur ini menerima cabang, tag, atau SHA commit lengkap, menjalankan alur kerja manual CI dengan target tersebut, menjalankan Plugin Prerelease untuk bukti Plugin/paket/statis/Docker khusus rilis, dan menjalankan OpenClaw Release Checks untuk smoke instalasi, penerimaan paket, pemeriksaan paket lintas OS, rendering scorecard kematangan dari bukti profil QA, paritas QA Lab, Matrix, dan lane Telegram. Profil stabil dan lengkap selalu menyertakan cakupan soak live/E2E dan jalur rilis Docker yang menyeluruh; profil beta dapat ikut serta dengan run_release_soak=true. E2E Telegram paket kanonis berjalan di dalam Package Acceptance, sehingga kandidat lengkap tidak memulai poller live duplikat. Setelah publikasi, teruskan release_package_spec untuk menggunakan ulang paket npm yang sudah dikirim di seluruh release checks, Package Acceptance, Docker, lintas OS, dan Telegram tanpa build ulang. Gunakan npm_telegram_package_spec hanya untuk rerun Telegram paket terpublikasi yang terfokus. Lane paket live Plugin Codex menggunakan state terpilih yang sama secara default: release_package_spec=openclaw@<tag> yang dipublikasikan menurunkan codex_plugin_spec=npm:@openclaw/codex@<tag>, sementara run SHA/artefak mengepak extensions/codex dari ref yang dipilih. Atur codex_plugin_spec secara eksplisit untuk sumber Plugin kustom seperti spesifikasi npm:, npm-pack:, atau git:.

Lihat Validasi rilis lengkap untuk matriks tahap, nama job alur kerja yang persis, perbedaan profil, artefak, dan handle rerun terfokus.

OpenClaw Release Publish adalah alur kerja rilis manual yang melakukan mutasi. Jalankan dari release/YYYY.M.PATCH atau main setelah tag rilis ada dan setelah preflight npm OpenClaw berhasil. Alur ini memverifikasi pnpm plugins:sync:check, menjalankan Plugin NPM Release untuk semua paket Plugin yang dapat dipublikasikan, menjalankan Plugin ClawHub Release untuk SHA rilis yang sama, dan baru kemudian menjalankan OpenClaw NPM Release dengan preflight_run_id yang tersimpan. Publikasi stabil juga memerlukan windows_node_tag yang persis; alur kerja memverifikasi rilis sumber Windows dan membandingkan installer x64/ARM64-nya dengan input windows_node_installer_digests yang disetujui kandidat sebelum child publikasi apa pun, lalu mempromosikan dan memverifikasi digest installer yang disematkan yang sama beserta aset pendamping yang persis dan kontrak checksum sebelum memublikasikan draf rilis GitHub.

bash

gh workflow run openclaw-release-publish.yml \  --ref release/YYYY.M.PATCH \  -f tag=vYYYY.M.PATCH-beta.N \  -f preflight_run_id=<successful-openclaw-npm-preflight-run-id> \  -f full_release_validation_run_id=<successful-full-release-validation-run-id> \  -f npm_dist_tag=beta

Untuk bukti commit yang disematkan pada cabang yang bergerak cepat, gunakan helper alih-alih gh workflow run ... --ref main -f ref=<sha>:

bash

pnpm ci:full-release --sha <full-sha>

Ref dispatch alur kerja GitHub harus berupa cabang atau tag, bukan SHA commit mentah. Helper mendorong cabang sementara release-ci/<sha>-... pada SHA target, menjalankan Full Release Validation dari ref yang disematkan itu, memverifikasi setiap headSha alur kerja child cocok dengan target, dan menghapus cabang sementara saat run selesai. Verifier payung juga gagal jika ada alur kerja child yang berjalan pada SHA berbeda.

release_profile mengontrol cakupan live/provider yang diteruskan ke release checks. Alur kerja rilis manual default ke stable; gunakan full hanya saat Anda secara sengaja menginginkan matriks provider/media advisory yang luas. Release checks stabil dan lengkap selalu menjalankan soak live/E2E dan jalur rilis Docker yang menyeluruh; profil beta dapat ikut serta dengan run_release_soak=true.

minimum mempertahankan lane OpenAI/core release-critical yang paling cepat.
stable menambahkan set provider/backend stabil.
full menjalankan matriks provider/media advisory yang luas.

Payung mencatat id run child yang dijalankan, dan job akhir Verify full validation memeriksa ulang conclusion run child saat ini serta menambahkan tabel job terlambat untuk setiap run child. Jika alur kerja child dijalankan ulang dan menjadi hijau, jalankan ulang hanya job verifier induk untuk menyegarkan hasil payung dan ringkasan waktu.

Untuk pemulihan, baik Full Release Validation maupun OpenClaw Release Checks menerima rerun_group. Gunakan all untuk kandidat rilis, ci hanya untuk child CI lengkap normal, plugin-prerelease hanya untuk child prerelease Plugin, release-checks untuk setiap child rilis, atau grup yang lebih sempit: install-smoke, cross-os, live-e2e, package, qa, qa-parity, qa-live, atau npm-telegram pada payung. Ini menjaga rerun kotak rilis yang gagal tetap terbatas setelah perbaikan terfokus. Untuk satu lane lintas OS yang gagal, gabungkan rerun_group=cross-os dengan cross_os_suite_filter, misalnya windows/packaged-upgrade; perintah lintas OS yang panjang mengeluarkan baris Heartbeat dan ringkasan packaged-upgrade menyertakan waktu per fase. Lane release-check QA bersifat advisory kecuali gate cakupan tool runtime standar, yang memblokir saat tool dinamis OpenClaw yang diperlukan bergeser atau hilang dari ringkasan tier standar.

OpenClaw Release Checks menggunakan ref alur kerja tepercaya untuk menyelesaikan ref yang dipilih sekali menjadi tarball release-package-under-test, lalu meneruskan artefak itu ke pemeriksaan lintas OS dan Package Acceptance, ditambah alur kerja Docker jalur rilis live/E2E saat cakupan soak berjalan. Ini menjaga byte paket tetap konsisten di seluruh kotak rilis dan menghindari pengepakan ulang kandidat yang sama di beberapa job child. Untuk lane live Plugin npm Codex, release checks meneruskan spesifikasi Plugin terpublikasi yang cocok yang diturunkan dari release_package_spec, meneruskan codex_plugin_spec yang disediakan operator, atau membiarkan input kosong agar skrip Docker mengepak Plugin Codex dari checkout yang dipilih.

Run Full Release Validation duplikat untuk ref=main dan rerun_group=all menggantikan payung yang lebih lama. Monitor induk membatalkan alur kerja child apa pun yang telah dijalankannya saat induk dibatalkan, sehingga validasi main yang lebih baru tidak tertahan di belakang run release-check dua jam yang usang. Validasi cabang/tag rilis dan grup rerun terfokus mempertahankan cancel-in-progress: false.

Shard Live dan E2E

Child live/E2E rilis mempertahankan cakupan native pnpm test:live yang luas, tetapi menjalankannya sebagai shard bernama melalui scripts/test-live-shard.mjs alih-alih satu job serial:

native-live-src-agents
native-live-src-gateway-core
job native-live-src-gateway-profiles yang difilter provider
native-live-src-gateway-backends
native-live-test
native-live-extensions-a-k
native-live-extensions-l-n
native-live-extensions-openai
native-live-extensions-o-z-other
native-live-extensions-xai
shard media audio/video terpisah dan shard musik yang difilter provider

Ini mempertahankan cakupan file yang sama sambil membuat kegagalan provider live yang lambat lebih mudah dijalankan ulang dan didiagnosis. Nama shard agregat native-live-extensions-o-z, native-live-extensions-media, dan native-live-extensions-media-music tetap valid untuk rerun manual sekali jalan.

Shard media live native berjalan di ghcr.io/openclaw/openclaw-live-media-runner:ubuntu-24.04, yang dibangun oleh alur kerja Live Media Runner Image. Image itu sudah memasang ffmpeg dan ffprobe; job media hanya memverifikasi biner sebelum setup. Pertahankan suite live berbasis Docker pada runner Blacksmith normal — job kontainer bukan tempat yang tepat untuk meluncurkan pengujian Docker bertingkat.

Shard model/backend live yang didukung Docker menggunakan image bersama ghcr.io/openclaw/openclaw-live-test:<sha> terpisah untuk tiap commit yang dipilih. Alur kerja rilis live membangun dan mendorong image tersebut satu kali, lalu shard model live Docker, Gateway yang di-shard per penyedia, backend CLI, bind ACP, dan harness Codex berjalan dengan OPENCLAW_SKIP_DOCKER_BUILD=1. Shard Docker Gateway membawa batas timeout eksplisit di tingkat skrip di bawah timeout job alur kerja sehingga container yang macet atau jalur cleanup gagal cepat alih-alih menghabiskan seluruh anggaran pemeriksaan rilis. Jika shard tersebut membangun ulang target Docker sumber lengkap secara independen, run rilis salah konfigurasi dan akan membuang waktu wall clock untuk build image duplikat.

Penerimaan Paket

Gunakan Package Acceptance saat pertanyaannya adalah "apakah paket OpenClaw yang dapat diinstal ini berfungsi sebagai produk?" Ini berbeda dari CI normal: CI normal memvalidasi source tree, sedangkan penerimaan paket memvalidasi satu tarball melalui harness E2E Docker yang sama dengan yang digunakan pengguna setelah instalasi atau pembaruan.

Job

resolve_package melakukan checkout workflow_ref, menyelesaikan satu kandidat paket, menulis .artifacts/docker-e2e-package/openclaw-current.tgz, menulis .artifacts/docker-e2e-package/package-candidate.json, mengunggah keduanya sebagai artefak package-under-test, dan mencetak sumber, ref alur kerja, ref paket, versi, SHA-256, serta profil dalam ringkasan langkah GitHub.
docker_acceptance memanggil openclaw-live-and-e2e-checks-reusable.yml dengan ref=workflow_ref dan package_artifact_name=package-under-test. Alur kerja reusable mengunduh artefak tersebut, memvalidasi inventaris tarball, menyiapkan image Docker package-digest bila diperlukan, dan menjalankan lane Docker yang dipilih terhadap paket tersebut alih-alih mengepak checkout alur kerja. Saat profil memilih beberapa docker_lanes tertarget, alur kerja reusable menyiapkan paket dan image bersama satu kali, lalu mem-fan-out lane tersebut sebagai job Docker tertarget paralel dengan artefak unik.
package_telegram secara opsional memanggil NPM Telegram Beta E2E. Ini berjalan saat telegram_mode bukan none dan menginstal artefak package-under-test yang sama saat Penerimaan Paket menyelesaikan satu paket; dispatch Telegram mandiri tetap dapat menginstal spec npm yang dipublikasikan.
summary menggagalkan alur kerja jika resolusi paket, penerimaan Docker, atau lane Telegram opsional gagal.

Sumber kandidat

source=npm hanya menerima openclaw@beta, openclaw@latest, atau versi rilis OpenClaw persis seperti openclaw@2026.4.27-beta.2. Gunakan ini untuk penerimaan prarilis/stabil yang dipublikasikan.
source=ref mengepak branch, tag, atau SHA commit lengkap package_ref tepercaya. Resolver mengambil branch/tag OpenClaw, memverifikasi commit yang dipilih dapat dijangkau dari riwayat branch repositori atau tag rilis, menginstal dependensi di worktree terlepas, dan mengepaknya dengan scripts/package-openclaw-for-docker.mjs.
source=url mengunduh .tgz HTTPS publik; package_sha256 wajib. Jalur ini menolak kredensial URL, port HTTPS non-default, hostname atau IP hasil resolusi yang privat/internal/penggunaan-khusus, dan redirect di luar kebijakan keamanan publik yang sama.
source=trusted-url mengunduh .tgz HTTPS dari kebijakan trusted-source bernama di .github/package-trusted-sources.json; package_sha256 dan trusted_source_id wajib. Gunakan ini hanya untuk mirror enterprise milik maintainer atau repositori paket privat yang memerlukan host, port, prefiks jalur, host redirect, atau resolusi jaringan privat yang dikonfigurasi. Jika kebijakan mendeklarasikan bearer auth, alur kerja menggunakan secret tetap OPENCLAW_TRUSTED_PACKAGE_TOKEN; kredensial yang disematkan dalam URL tetap ditolak.
source=artifact mengunduh satu .tgz dari artifact_run_id dan artifact_name; package_sha256 opsional tetapi sebaiknya disediakan untuk artefak yang dibagikan secara eksternal.

Pisahkan workflow_ref dan package_ref. workflow_ref adalah kode alur kerja/harness tepercaya yang menjalankan pengujian. package_ref adalah commit sumber yang dipaketkan saat source=ref. Ini memungkinkan harness pengujian saat ini memvalidasi commit sumber tepercaya yang lebih lama tanpa menjalankan logika alur kerja lama.

Profil suite

smoke — npm-onboard-channel-agent, gateway-network, config-reload
package — npm-onboard-channel-agent, doctor-switch, update-channel-switch, skill-install, update-corrupt-plugin, upgrade-survivor, published-upgrade-survivor, update-restart-auth, plugins-offline, plugin-update
product — package plus mcp-channels, cron-mcp-cleanup, openai-web-search-minimal, openwebui
full — chunk jalur rilis Docker penuh dengan OpenWebUI
custom — docker_lanes persis; wajib saat suite_profile=custom

Profil package menggunakan cakupan plugin offline sehingga validasi paket yang dipublikasikan tidak bergantung pada ketersediaan ClawHub live. Lane Telegram opsional menggunakan ulang artefak package-under-test di NPM Telegram Beta E2E, dengan jalur spec npm yang dipublikasikan tetap dipertahankan untuk dispatch mandiri.

Untuk kebijakan pengujian pembaruan dan plugin khusus, termasuk perintah lokal, lane Docker, input Penerimaan Paket, default rilis, dan triase kegagalan, lihat Menguji pembaruan dan plugin.

Pemeriksaan rilis memanggil Penerimaan Paket dengan source=artifact, artefak paket rilis yang disiapkan, suite_profile=custom, docker_lanes='doctor-switch update-channel-switch skill-install update-corrupt-plugin upgrade-survivor published-upgrade-survivor update-restart-auth plugins-offline plugin-update', dan telegram_mode=mock-openai. Ini menjaga migrasi paket, pembaruan, instalasi skill ClawHub live, cleanup dependensi plugin basi, perbaikan instalasi plugin yang dikonfigurasi, plugin offline, plugin-update, dan bukti Telegram pada tarball paket terselesaikan yang sama. Setel release_package_spec pada Validasi Rilis Penuh atau Pemeriksaan Rilis OpenClaw setelah memublikasikan beta untuk menjalankan matriks yang sama terhadap paket npm yang telah dikirim tanpa membangun ulang; setel package_acceptance_package_spec hanya saat Penerimaan Paket memerlukan paket yang berbeda dari validasi rilis lainnya. Pemeriksaan rilis lintas OS tetap mencakup onboarding, installer, dan perilaku platform spesifik OS; validasi produk paket/pembaruan harus dimulai dengan Penerimaan Paket. Lane Docker published-upgrade-survivor memvalidasi satu baseline paket yang dipublikasikan per run dalam jalur rilis blocking. Dalam Penerimaan Paket, tarball package-under-test yang terselesaikan selalu menjadi kandidat dan published_upgrade_survivor_baseline memilih baseline fallback yang dipublikasikan, defaultnya openclaw@latest; perintah rerun lane yang gagal mempertahankan baseline tersebut. Validasi Rilis Penuh dengan run_release_soak=true atau release_profile=full menyetel published_upgrade_survivor_baselines='last-stable-4 2026.4.23 2026.5.2 2026.4.15' dan published_upgrade_survivor_scenarios=reported-issues untuk memperluas cakupan ke empat rilis npm stabil terbaru ditambah rilis batas kompatibilitas plugin yang dipin dan fixture berbentuk isu untuk konfigurasi Feishu, file bootstrap/persona yang dipertahankan, instalasi plugin OpenClaw yang dikonfigurasi, jalur log tilde, dan root dependensi plugin legacy yang basi. Pilihan published-upgrade survivor multi-baseline di-shard berdasarkan baseline ke job runner Docker tertarget terpisah. Alur kerja Update Migration terpisah menggunakan lane Docker update-migration dengan all-since-2026.4.23 dan plugin-deps-cleanup saat pertanyaannya adalah cleanup pembaruan yang dipublikasikan secara menyeluruh, bukan keluasan CI Rilis Penuh normal. Run agregat lokal dapat meneruskan spec paket persis dengan OPENCLAW_UPGRADE_SURVIVOR_BASELINE_SPECS, mempertahankan satu lane dengan OPENCLAW_UPGRADE_SURVIVOR_BASELINE_SPEC seperti openclaw@2026.4.15, atau menyetel OPENCLAW_UPGRADE_SURVIVOR_SCENARIOS untuk matriks skenario. Lane yang dipublikasikan mengonfigurasi baseline dengan resep perintah openclaw config set yang sudah dibaked, mencatat langkah resep di summary.json, dan mem-probe /healthz, /readyz, plus status RPC setelah Gateway start. Lane fresh paket dan installer Windows juga memverifikasi bahwa paket terinstal dapat mengimpor override browser-control dari jalur Windows absolut mentah. Smoke agent-turn OpenAI lintas OS default ke OPENCLAW_CROSS_OS_OPENAI_MODEL saat disetel, jika tidak ke openai/gpt-5.5, sehingga bukti instalasi dan Gateway tetap berada pada model uji GPT-5 sambil menghindari default GPT-4.x.

Jendela kompatibilitas legacy

Penerimaan Paket memiliki jendela kompatibilitas legacy yang dibatasi untuk paket yang sudah dipublikasikan. Paket hingga 2026.4.25, termasuk 2026.4.25-beta.*, dapat menggunakan jalur kompatibilitas:

entri QA privat yang dikenal di dist/postinstall-inventory.json boleh menunjuk ke file yang tidak disertakan dalam tarball;
doctor-switch boleh melewati subkasus persistensi gateway install --wrapper saat paket tidak mengekspos flag tersebut;
update-channel-switch boleh memangkas patchedDependencies pnpm yang hilang dari fixture git palsu turunan tarball dan boleh mencatat update.channel persisten yang hilang;
smoke plugin boleh membaca lokasi install-record legacy atau menerima persistensi install-record marketplace yang hilang;
plugin-update boleh mengizinkan migrasi metadata konfigurasi sambil tetap mewajibkan install record dan perilaku tanpa reinstall tetap tidak berubah.

Paket 2026.4.26 yang dipublikasikan juga boleh memberi peringatan untuk file stamp metadata build lokal yang sudah dikirim. Paket yang lebih baru harus memenuhi kontrak modern; kondisi yang sama gagal alih-alih memperingatkan atau melewati.

Contoh

bash

# Validate the current beta package with product-level coverage.gh workflow run package-acceptance.yml \  --ref main \  -f workflow_ref=main \  -f source=npm \  -f package_spec=openclaw@beta \  -f suite_profile=product \  -f telegram_mode=mock-openai # Pack and validate a release branch with the current harness.gh workflow run package-acceptance.yml \  --ref main \  -f workflow_ref=main \  -f source=ref \  -f package_ref=release/YYYY.M.PATCH \  -f suite_profile=package \  -f telegram_mode=mock-openai # Validate a tarball URL. SHA-256 is mandatory for source=url.gh workflow run package-acceptance.yml \  --ref main \  -f workflow_ref=main \  -f source=url \  -f package_url=https://example.com/openclaw-current.tgz \  -f package_sha256=<64-char-sha256> \  -f suite_profile=smoke # Validate a tarball from a named trusted private mirror policy.gh workflow run package-acceptance.yml \  --ref main \  -f workflow_ref=main \  -f source=trusted-url \  -f trusted_source_id=enterprise-artifactory \  -f package_url=https://packages.example.internal:8443/artifactory/openclaw/openclaw-current.tgz \  -f package_sha256=<64-char-sha256> \  -f suite_profile=smoke # Reuse a tarball uploaded by another Actions run.gh workflow run package-acceptance.yml \  --ref main \  -f workflow_ref=main \  -f source=artifact \  -f artifact_run_id=<run-id> \  -f artifact_name=package-under-test \  -f suite_profile=custom \  -f docker_lanes='install-e2e plugin-update'

Saat men-debug run penerimaan paket yang gagal, mulai dari ringkasan resolve_package untuk mengonfirmasi sumber paket, versi, dan SHA-256. Lalu periksa run turunan docker_acceptance dan artefak Dockernya: .artifacts/docker-tests/**/summary.json, failures.json, log lane, timing fase, dan perintah rerun. Lebih baik jalankan ulang profil paket yang gagal atau lane Docker persis daripada menjalankan ulang validasi rilis penuh.

Smoke instalasi

Alur kerja Install Smoke terpisah menggunakan ulang skrip cakupan yang sama melalui job preflight miliknya sendiri. Ini membagi cakupan smoke menjadi run_fast_install_smoke dan run_full_install_smoke.

Jalur cepat berjalan untuk pull request yang menyentuh permukaan Docker/paket, perubahan paket/manifes plugin bawaan, atau permukaan plugin/channel/gateway/Plugin SDK inti yang dijalankan oleh job smoke Docker. Perubahan plugin bawaan yang hanya source, edit yang hanya test, dan edit yang hanya docs tidak memesan worker Docker. Jalur cepat membangun image Dockerfile root sekali, memeriksa CLI, menjalankan smoke CLI agents delete shared-workspace, menjalankan e2e gateway-network kontainer, memverifikasi arg build ekstensi bawaan, dan menjalankan profil Docker bundled-plugin terbatas di bawah batas waktu perintah agregat 240 detik (setiap run Docker skenario dibatasi terpisah).
Jalur penuh mempertahankan cakupan instal paket QR dan Docker/update installer untuk run terjadwal nightly, dispatch manual, pemeriksaan rilis workflow-call, dan pull request yang benar-benar menyentuh permukaan installer/paket/Docker. Dalam mode penuh, install-smoke menyiapkan atau menggunakan ulang satu image smoke Dockerfile root GHCR target-SHA, lalu menjalankan instal paket QR, smoke Dockerfile root/Gateway, smoke installer/update, dan E2E Docker bundled-plugin cepat sebagai job terpisah sehingga pekerjaan installer tidak menunggu di belakang smoke image root.

Push main (termasuk commit merge) tidak memaksa jalur penuh; ketika logika cakupan perubahan akan meminta cakupan penuh pada push, workflow mempertahankan smoke Docker cepat dan menyerahkan smoke instal penuh ke validasi nightly atau rilis.

Smoke image-provider instal global Bun yang lambat digerbangkan secara terpisah oleh run_bun_global_install_smoke. Ini berjalan pada jadwal nightly dan dari workflow pemeriksaan rilis, dan dispatch manual Install Smoke dapat ikut mengaktifkannya, tetapi pull request dan push main tidak. CI PR normal tetap menjalankan lane regresi launcher Bun cepat untuk perubahan yang relevan dengan Node. Test Docker QR dan installer mempertahankan Dockerfile mereka sendiri yang berfokus pada instal.

E2E Docker Lokal

pnpm test:docker:all melakukan prebuild satu image live-test bersama, mengemas OpenClaw sekali sebagai tarball npm, dan membangun dua image scripts/e2e/Dockerfile bersama:

runner Node/Git kosong untuk lane installer/update/plugin-dependency;
image fungsional yang menginstal tarball yang sama ke /app untuk lane fungsionalitas normal.

Definisi lane Docker berada di scripts/lib/docker-e2e-scenarios.mjs, logika planner berada di scripts/lib/docker-e2e-plan.mjs, dan runner hanya menjalankan plan yang dipilih. Scheduler memilih image per lane dengan OPENCLAW_DOCKER_E2E_BARE_IMAGE dan OPENCLAW_DOCKER_E2E_FUNCTIONAL_IMAGE, lalu menjalankan lane dengan OPENCLAW_SKIP_DOCKER_BUILD=1.

Parameter yang Dapat Disetel

Variabel	Default	Tujuan
`OPENCLAW_DOCKER_ALL_PARALLELISM`	10	Jumlah slot pool utama untuk lane normal.
`OPENCLAW_DOCKER_ALL_TAIL_PARALLELISM`	10	Jumlah slot pool akhir yang sensitif terhadap provider.
`OPENCLAW_DOCKER_ALL_LIVE_LIMIT`	9	Batas lane live serentak agar provider tidak melakukan throttle.
`OPENCLAW_DOCKER_ALL_NPM_LIMIT`	5	Batas lane instal npm serentak.
`OPENCLAW_DOCKER_ALL_SERVICE_LIMIT`	7	Batas lane multi-service serentak.
`OPENCLAW_DOCKER_ALL_START_STAGGER_MS`	2000	Jeda antar-start lane untuk menghindari lonjakan create daemon Docker; setel `0` untuk tanpa jeda.
`OPENCLAW_DOCKER_ALL_LANE_TIMEOUT_MS`	7200000	Batas waktu fallback per lane (120 menit); lane live/akhir tertentu memakai batas lebih ketat.
`OPENCLAW_DOCKER_ALL_DRY_RUN`	unset	`1` mencetak plan scheduler tanpa menjalankan lane.
`OPENCLAW_DOCKER_ALL_LANES`	unset	Daftar lane persis yang dipisahkan koma; melewati smoke cleanup agar agent dapat mereproduksi satu lane gagal.

Lane yang lebih berat daripada batas efektifnya tetap dapat mulai dari pool kosong, lalu berjalan sendiri hingga melepas kapasitas. Agregat lokal melakukan preflight Docker, menghapus kontainer E2E OpenClaw lama, memancarkan status lane aktif, menyimpan timing lane untuk pengurutan terlama-terlebih-dahulu, dan berhenti menjadwalkan lane pool baru setelah kegagalan pertama secara default.

Workflow live/E2E yang dapat digunakan ulang

Workflow live/E2E yang dapat digunakan ulang meminta scripts/test-docker-all.mjs --plan-json untuk menentukan cakupan paket, jenis image, image live, lane, dan kredensial yang diperlukan. scripts/docker-e2e.mjs lalu mengonversi plan itu menjadi output dan ringkasan GitHub. Workflow tersebut mengemas OpenClaw melalui scripts/package-openclaw-for-docker.mjs, mengunduh artefak paket current-run, atau mengunduh artefak paket dari package_artifact_run_id; memvalidasi inventaris tarball; membangun dan mendorong image E2E Docker GHCR bare/functional bertag digest paket melalui cache layer Docker Blacksmith ketika plan memerlukan lane dengan paket terinstal; dan menggunakan ulang input docker_e2e_bare_image/docker_e2e_functional_image yang diberikan atau image digest paket yang sudah ada alih-alih membangun ulang. Pull image Docker dicoba ulang dengan batas waktu 180 detik per percobaan yang terbatas sehingga stream registry/cache yang macet dicoba ulang dengan cepat alih-alih menghabiskan sebagian besar jalur kritis CI.

Chunk jalur rilis

Cakupan Docker rilis menjalankan job kecil yang dipecah menjadi chunk dengan OPENCLAW_SKIP_DOCKER_BUILD=1 sehingga setiap chunk hanya menarik jenis image yang dibutuhkan dan menjalankan beberapa lane melalui scheduler berbobot yang sama:

OPENCLAW_DOCKER_ALL_PROFILE=release-path
OPENCLAW_DOCKER_ALL_CHUNK=core | package-update-openai | package-update-anthropic | package-update-core | plugins-runtime-plugins | plugins-runtime-services | plugins-runtime-install-a..h

Chunk Docker rilis saat ini adalah core, package-update-openai, package-update-anthropic, package-update-core, plugins-runtime-plugins, plugins-runtime-services, dan plugins-runtime-install-a sampai plugins-runtime-install-h. package-update-openai mencakup lane paket plugin Codex live, yang menginstal paket kandidat OpenClaw, menginstal plugin Codex dari codex_plugin_spec atau tarball same-ref dengan persetujuan instal CLI Codex eksplisit, menjalankan preflight CLI Codex, lalu menjalankan beberapa giliran agent OpenClaw dalam sesi yang sama terhadap OpenAI. plugins-runtime-core, plugins-runtime, dan plugins-integrations tetap menjadi alias agregat plugin/runtime. Alias lane install-e2e tetap menjadi alias rerun manual agregat untuk kedua lane installer provider.

OpenWebUI digabungkan ke plugins-runtime-services ketika cakupan release-path penuh memintanya, dan mempertahankan chunk mandiri openwebui hanya untuk dispatch khusus OpenWebUI. Lane update bundled-channel mencoba ulang sekali untuk kegagalan jaringan npm sementara.

Setiap chunk mengunggah .artifacts/docker-tests/ dengan log lane, timing, summary.json, failures.json, timing fase, JSON plan scheduler, tabel lane lambat, dan perintah rerun per lane. Input workflow docker_lanes menjalankan lane terpilih terhadap image yang sudah disiapkan alih-alih job chunk, sehingga debugging lane gagal tetap terbatas pada satu job Docker tertarget dan menyiapkan, mengunduh, atau menggunakan ulang artefak paket untuk run tersebut; jika lane yang dipilih adalah lane Docker live, job tertarget membangun image live-test secara lokal untuk rerun itu. Perintah rerun GitHub per lane yang dihasilkan menyertakan package_artifact_run_id, package_artifact_name, dan input image yang sudah disiapkan ketika nilai tersebut ada, sehingga lane yang gagal dapat menggunakan ulang paket dan image persis dari run yang gagal.

bash

pnpm test:docker:rerun <run-id>      # unduh artefak Docker dan cetak perintah rerun tertarget gabungan/per-lanepnpm test:docker:timings <summary>   # ringkasan jalur kritis fase dan lane lambat

Workflow live/E2E terjadwal menjalankan suite Docker release-path penuh setiap hari.

Prarilis Plugin

Plugin Prerelease adalah cakupan produk/paket yang lebih mahal, jadi ini adalah workflow terpisah yang dijalankan oleh Full Release Validation atau oleh operator eksplisit. Pull request normal, push main, dan dispatch CI manual mandiri menonaktifkan suite itu. Workflow ini menyeimbangkan test plugin bawaan di delapan worker ekstensi; job shard ekstensi tersebut menjalankan hingga dua grup konfigurasi plugin sekaligus dengan satu worker Vitest per grup dan heap Node yang lebih besar agar batch plugin yang berat impor tidak membuat job CI tambahan. Jalur prarilis Docker khusus rilis mengelompokkan lane Docker tertarget dalam grup kecil untuk menghindari pemesanan puluhan runner bagi job satu sampai tiga menit. Workflow juga mengunggah artefak informasional plugin-inspector-advisory dari @openclaw/plugin-inspector; temuan inspector adalah input triase dan tidak mengubah gerbang pemblokir Plugin Prerelease.

QA Lab

QA Lab memiliki lane CI khusus di luar workflow utama yang smart-scoped. Paritas agentic berada di bawah harness QA dan rilis yang luas, bukan workflow PR mandiri. Gunakan Full Release Validation dengan rerun_group=qa-parity ketika paritas harus ikut dalam run validasi luas.

Workflow QA-Lab - All Lanes berjalan nightly pada main dan pada dispatch manual; workflow ini menyebarkan lane mock parity, lane Matrix live, serta lane Telegram dan Discord live sebagai job paralel. Job live menggunakan environment qa-live-shared, dan Telegram/Discord menggunakan lease Convex.

Pemeriksaan rilis menjalankan lane transport live Matrix dan Telegram dengan provider mock deterministik dan model yang memenuhi syarat mock (mock-openai/gpt-5.5 dan mock-openai/gpt-5.5-alt) sehingga kontrak channel terisolasi dari latensi model live dan startup provider-plugin normal. Gateway transport live menonaktifkan pencarian memori karena paritas QA mencakup perilaku memori secara terpisah; konektivitas provider dicakup oleh suite model live, provider native, dan provider Docker yang terpisah.

Matrix menggunakan --profile fast untuk gerbang terjadwal dan rilis, menambahkan --fail-fast hanya ketika CLI yang di-checkout mendukungnya. Default CLI dan input workflow manual tetap all; dispatch manual matrix_profile=all selalu memecah cakupan Matrix penuh ke job transport, media, e2ee-smoke, e2ee-deep, dan e2ee-cli.

OpenClaw Release Checks juga menjalankan lane QA Lab yang kritis untuk rilis sebelum persetujuan rilis; gerbang paritas QA-nya menjalankan pack kandidat dan baseline sebagai job lane paralel, lalu mengunduh kedua artefak ke job laporan kecil untuk perbandingan paritas akhir.

Untuk PR normal, ikuti bukti CI/check yang terscoped alih-alih memperlakukan paritas sebagai status wajib.

CodeQL

Workflow CodeQL sengaja merupakan pemindai keamanan first-pass yang sempit, bukan sweep repositori penuh. Run guard harian, manual, dan pull request non-draft memindai kode workflow Actions plus permukaan JavaScript/TypeScript berisiko tertinggi dengan kueri keamanan keyakinan tinggi yang difilter ke security-severity tinggi/kritis.

Guard pull request tetap ringan: ini hanya dimulai untuk perubahan di bawah .github/actions, .github/codeql, .github/workflows, packages, scripts, src, atau path runtime plugin bawaan yang memiliki proses, dan menjalankan matriks keamanan keyakinan tinggi yang sama seperti workflow terjadwal. CodeQL Android dan macOS tetap berada di luar default PR.

Kategori keamanan

Kategori	Permukaan
`/codeql-security-high/core-auth-secrets`	Auth, rahasia, sandbox, Cron, dan baseline Gateway
`/codeql-security-high/channel-runtime-boundary`	Kontrak implementasi channel inti ditambah runtime Plugin channel, Gateway, Plugin SDK, rahasia, titik sentuh audit
`/codeql-security-high/network-ssrf-boundary`	Permukaan kebijakan SSRF inti, parsing IP, penjaga jaringan, web-fetch, dan SSRF Plugin SDK
`/codeql-security-high/mcp-process-tool-boundary`	Server MCP, helper eksekusi proses, pengiriman keluar, dan gerbang eksekusi tool agen
`/codeql-security-high/process-exec-boundary`	Shell lokal, helper spawn proses, runtime Plugin bawaan yang memiliki subprocess, dan perekat skrip workflow
`/codeql-security-high/plugin-trust-boundary`	Permukaan kepercayaan instalasi Plugin, loader, manifest, registry, instalasi package-manager, pemuatan sumber, dan kontrak paket Plugin SDK

Shard keamanan khusus platform

CodeQL Android Critical Security — shard keamanan Android terjadwal. Membangun aplikasi Android secara manual untuk CodeQL pada runner Blacksmith Linux terkecil yang diterima oleh kewajaran workflow. Mengunggah di bawah /codeql-critical-security/android.
CodeQL macOS Critical Security — shard keamanan macOS mingguan/manual. Membangun aplikasi macOS secara manual untuk CodeQL di Blacksmith macOS, menyaring hasil build dependensi dari SARIF yang diunggah, dan mengunggah di bawah /codeql-critical-security/macos. Dipertahankan di luar default harian karena build macOS mendominasi runtime bahkan saat bersih.

Kategori Kualitas Kritis

CodeQL Critical Quality adalah shard non-keamanan yang sepadan. Ini hanya menjalankan kueri kualitas JavaScript/TypeScript non-keamanan dengan tingkat keparahan error pada permukaan bernilai tinggi yang sempit di runner Linux yang dihosting GitHub agar pemindaian kualitas tidak menghabiskan anggaran registrasi runner Blacksmith. Guard pull request-nya sengaja lebih kecil daripada profil terjadwal: PR non-draft hanya menjalankan shard agent-runtime-boundary, config-boundary, core-auth-secrets, channel-runtime-boundary, gateway-runtime-boundary, memory-runtime-boundary, mcp-process-runtime-boundary, provider-runtime-boundary, session-diagnostics-boundary, plugin-boundary, plugin-sdk-package-contract, dan plugin-sdk-reply-runtime yang sesuai untuk perubahan kode eksekusi perintah/model/tool agen dan dispatch balasan, kode skema/migrasi/IO konfigurasi, kode auth/rahasia/sandbox/keamanan, runtime channel inti dan Plugin channel bawaan, protokol/metode-server Gateway, perekat runtime/SDK memori, MCP/proses/pengiriman keluar, katalog model/runtime provider, diagnostik sesi/antrean pengiriman, loader Plugin, kontrak paket/Plugin SDK, atau runtime balasan Plugin SDK. Perubahan konfigurasi CodeQL dan workflow kualitas menjalankan semua dua belas shard kualitas PR.

Dispatch manual menerima:

Code

profile=all|agent-runtime-boundary|config-boundary|core-auth-secrets|channel-runtime-boundary|gateway-runtime-boundary|memory-runtime-boundary|mcp-process-runtime-boundary|plugin-boundary|plugin-sdk-package-contract|plugin-sdk-reply-runtime|provider-runtime-boundary|session-diagnostics-boundary

Profil sempit adalah hook pengajaran/iterasi untuk menjalankan satu shard kualitas secara terpisah.

Kategori	Permukaan
`/codeql-critical-quality/core-auth-secrets`	Kode batas keamanan auth, rahasia, sandbox, Cron, dan Gateway
`/codeql-critical-quality/config-boundary`	Kontrak skema konfigurasi, migrasi, normalisasi, dan IO
`/codeql-critical-quality/gateway-runtime-boundary`	Skema protokol Gateway dan kontrak metode server
`/codeql-critical-quality/channel-runtime-boundary`	Kontrak implementasi channel inti dan Plugin channel bawaan
`/codeql-critical-quality/agent-runtime-boundary`	Kontrak runtime eksekusi perintah, dispatch model/provider, dispatch dan antrean auto-reply, serta control-plane ACP
`/codeql-critical-quality/mcp-process-runtime-boundary`	Server MCP dan bridge tool, helper supervisi proses, dan kontrak pengiriman keluar
`/codeql-critical-quality/memory-runtime-boundary`	SDK host memori, facade runtime memori, alias Plugin SDK memori, perekat aktivasi runtime memori, dan perintah doctor memori
`/codeql-critical-quality/session-diagnostics-boundary`	Internal antrean balasan, antrean pengiriman sesi, helper binding/pengiriman sesi keluar, permukaan bundel event/log diagnostik, dan kontrak CLI doctor sesi
`/codeql-critical-quality/plugin-sdk-reply-runtime`	Dispatch balasan masuk Plugin SDK, helper payload/pemotongan/runtime balasan, opsi balasan channel, antrean pengiriman, dan helper binding sesi/thread
`/codeql-critical-quality/provider-runtime-boundary`	Normalisasi katalog model, auth dan discovery provider, registrasi runtime provider, default/katalog provider, serta registry web/search/fetch/embedding
`/codeql-critical-quality/ui-control-plane`	Bootstrap Control UI, persistensi lokal, alur kontrol Gateway, dan kontrak runtime control-plane tugas
`/codeql-critical-quality/web-media-runtime-boundary`	Kontrak runtime fetch/search web inti, IO media, pemahaman media, image-generation, dan media-generation
`/codeql-critical-quality/plugin-boundary`	Kontrak loader, registry, permukaan publik, dan entrypoint Plugin SDK
`/codeql-critical-quality/plugin-sdk-package-contract`	Sumber Plugin SDK sisi paket yang dipublikasikan dan helper kontrak paket Plugin

Kualitas tetap terpisah dari keamanan agar temuan kualitas dapat dijadwalkan, diukur, dinonaktifkan, atau diperluas tanpa mengaburkan sinyal keamanan. Ekspansi CodeQL Swift, Python, dan Plugin bawaan sebaiknya ditambahkan kembali sebagai pekerjaan lanjutan yang scoped atau di-shard hanya setelah profil sempit memiliki runtime dan sinyal yang stabil.

Workflow pemeliharaan

Agen Docs

Workflow Docs Agent adalah lane pemeliharaan Codex berbasis event untuk menjaga dokumen yang ada tetap selaras dengan perubahan yang baru saja mendarat. Ini tidak memiliki jadwal murni: run CI push non-bot yang berhasil di main dapat memicunya, dan dispatch manual dapat menjalankannya langsung. Invokasi workflow-run dilewati saat main telah bergerak maju atau saat run Docs Agent non-dilewati lain dibuat dalam satu jam terakhir. Saat berjalan, ini meninjau rentang commit dari SHA sumber Docs Agent non-dilewati sebelumnya hingga main saat ini, sehingga satu run per jam dapat mencakup semua perubahan main yang terkumpul sejak pass dokumen terakhir.

Agen Performa Test

Workflow Test Performance Agent adalah lane pemeliharaan Codex berbasis event untuk test yang lambat. Ini tidak memiliki jadwal murni: run CI push non-bot yang berhasil di main dapat memicunya, tetapi dilewati jika invokasi workflow-run lain sudah berjalan atau sedang berjalan pada hari UTC tersebut. Dispatch manual melewati gerbang aktivitas harian itu. Lane ini membangun laporan performa Vitest full-suite yang dikelompokkan, memungkinkan Codex hanya membuat perbaikan performa test kecil yang mempertahankan cakupan alih-alih refactor luas, lalu menjalankan ulang laporan full-suite dan menolak perubahan yang mengurangi jumlah test baseline yang lulus. Laporan yang dikelompokkan mencatat wall time per-config dan RSS maksimum di Linux dan macOS, sehingga perbandingan sebelum/sesudah memunculkan delta memori test di samping delta durasi. Jika baseline memiliki test yang gagal, Codex hanya boleh memperbaiki kegagalan yang jelas dan laporan full-suite setelah agen harus lulus sebelum apa pun di-commit. Saat main maju sebelum push bot mendarat, lane ini melakukan rebase patch yang telah divalidasi, menjalankan ulang pnpm check:changed, dan mencoba ulang push; patch basi yang konflik dilewati. Ini menggunakan Ubuntu yang dihosting GitHub agar action Codex dapat mempertahankan postur keamanan drop-sudo yang sama seperti agen docs.

PR Duplikat Setelah Merge

Workflow Duplicate PRs After Merge adalah workflow maintainer manual untuk pembersihan duplikat pasca-land. Default-nya dry-run dan hanya menutup PR yang dicantumkan secara eksplisit saat apply=true. Sebelum mengubah GitHub, ini memverifikasi bahwa PR yang mendarat sudah di-merge dan bahwa setiap duplikat memiliki issue referensi bersama atau hunk perubahan yang tumpang tindih.

bash

gh workflow run duplicate-after-merge.yml \  -f landed_pr=70532 \  -f duplicate_prs='70530,70592' \  -f apply=true

Gerbang pemeriksaan lokal dan routing perubahan

Logika changed-lane lokal berada di scripts/changed-lanes.mjs dan dieksekusi oleh scripts/check-changed.mjs. Gerbang pemeriksaan lokal itu lebih ketat tentang batas arsitektur daripada cakupan platform CI yang luas:

perubahan produksi inti menjalankan typecheck prod inti dan test inti ditambah lint/guard inti;
perubahan khusus test inti hanya menjalankan typecheck test inti ditambah lint inti;
perubahan produksi extension menjalankan typecheck prod extension dan test extension ditambah lint extension;
perubahan khusus test extension menjalankan typecheck test extension ditambah lint extension;
perubahan Plugin SDK publik atau kontrak Plugin meluas ke typecheck extension karena extension bergantung pada kontrak inti tersebut (sweep extension Vitest tetap merupakan pekerjaan test eksplisit);
bump versi metadata-only rilis menjalankan pemeriksaan versi/konfigurasi/dependensi root yang ditargetkan;
perubahan root/konfigurasi yang tidak diketahui fail safe ke semua lane pemeriksaan.

Routing changed-test lokal berada di scripts/test-projects.test-support.mjs dan sengaja lebih murah daripada check:changed: edit test langsung menjalankan dirinya sendiri, edit sumber lebih memilih pemetaan eksplisit, lalu test saudara dan dependen import-graph. Konfigurasi pengiriman group-room bersama adalah salah satu pemetaan eksplisit: perubahan pada konfigurasi balasan terlihat grup, mode pengiriman balasan sumber, atau prompt sistem message-tool dirutekan melalui test balasan inti ditambah regresi pengiriman Discord dan Slack sehingga perubahan default bersama gagal sebelum push PR pertama. Gunakan OPENCLAW_TEST_CHANGED_BROAD=1 pnpm test:changed hanya saat perubahan cukup luas di seluruh harness sehingga set terpetakan yang murah bukan proxy yang dapat dipercaya.

Validasi Testbox

Crabbox adalah pembungkus remote-box milik repo untuk pembuktian Linux maintainer. Gunakan dari root repo saat pemeriksaan terlalu luas untuk loop edit lokal, saat kesetaraan CI penting, atau saat bukti memerlukan secret, Docker, lane paket, box yang dapat digunakan ulang, atau log jarak jauh. Backend OpenClaw normal adalah blacksmith-testbox; kapasitas AWS/Hetzner milik sendiri adalah fallback untuk gangguan Blacksmith, masalah kuota, atau pengujian kapasitas milik sendiri secara eksplisit.

Run Blacksmith yang didukung Crabbox melakukan warm, claim, sync, run, report, dan cleanup Testbox sekali pakai. Pemeriksaan kewajaran sync bawaan gagal cepat saat file root wajib seperti pnpm-lock.yaml hilang atau saat git status --short menampilkan setidaknya 200 penghapusan terlacak. Untuk PR penghapusan besar yang disengaja, atur OPENCLAW_TESTBOX_ALLOW_MASS_DELETIONS=1 untuk perintah jarak jauh.

Crabbox juga menghentikan pemanggilan CLI Blacksmith lokal yang tetap berada di fase sync selama lebih dari lima menit tanpa output pasca-sync. Atur CRABBOX_BLACKSMITH_SYNC_TIMEOUT_MS=0 untuk menonaktifkan guard tersebut, atau gunakan nilai milidetik yang lebih besar untuk diff lokal yang sangat besar.

Sebelum run pertama, periksa pembungkus dari root repo:

bash

pnpm crabbox:run -- --help | sed -n '1,120p'

Pembungkus repo menolak biner Crabbox usang yang tidak mengiklankan blacksmith-testbox. Berikan provider secara eksplisit meskipun .crabbox.yaml memiliki default owned-cloud. Di worktree Codex atau checkout linked/sparse, hindari skrip lokal pnpm crabbox:run karena pnpm dapat merekonsiliasi dependensi sebelum Crabbox dimulai; panggil pembungkus node secara langsung sebagai gantinya:

bash

node scripts/crabbox-wrapper.mjs run --provider blacksmith-testbox --timing-json --shell -- "pnpm test <path-or-filter>"

Run yang didukung Blacksmith memerlukan Crabbox 0.22.0 atau yang lebih baru agar pembungkus mendapatkan perilaku sync, antrean, dan cleanup Testbox saat ini. Saat menggunakan checkout sibling, bangun ulang biner lokal yang diabaikan sebelum pekerjaan timing atau proof:

bash

version="$(git -C ../crabbox describe --tags --always --dirty | sed 's/^v//')" \  && go build -C ../crabbox -trimpath -ldflags "-s -w -X github.com/openclaw/crabbox/internal/cli.version=${version}" -o bin/crabbox ./cmd/crabbox

Gate perubahan:

bash

pnpm crabbox:run -- --provider blacksmith-testbox \  --blacksmith-org openclaw \  --blacksmith-workflow .github/workflows/ci-check-testbox.yml \  --blacksmith-job check \  --blacksmith-ref main \  --idle-timeout 90m \  --ttl 240m \  --timing-json \  --shell -- \  "corepack pnpm check:changed"

Rerun tes terfokus:

bash

pnpm crabbox:run -- --provider blacksmith-testbox \  --blacksmith-org openclaw \  --blacksmith-workflow .github/workflows/ci-check-testbox.yml \  --blacksmith-job check \  --blacksmith-ref main \  --idle-timeout 90m \  --ttl 240m \  --timing-json \  --shell -- \  "corepack pnpm test <path-or-filter>"

Suite penuh:

bash

pnpm crabbox:run -- --provider blacksmith-testbox \  --blacksmith-org openclaw \  --blacksmith-workflow .github/workflows/ci-check-testbox.yml \  --blacksmith-job check \  --blacksmith-ref main \  --idle-timeout 90m \  --ttl 240m \  --timing-json \  --shell -- \  "corepack pnpm test"

Baca ringkasan JSON final. Field yang berguna adalah provider, leaseId, syncDelegated, exitCode, commandMs, dan totalMs. Untuk run Blacksmith Testbox terdelegasi, exit code pembungkus Crabbox dan ringkasan JSON adalah hasil perintah. Run GitHub Actions yang ditautkan memiliki hydration dan keepalive; run tersebut dapat selesai sebagai cancelled saat Testbox dihentikan secara eksternal setelah perintah SSH sudah kembali. Perlakukan itu sebagai artefak cleanup/status kecuali exitCode pembungkus bukan nol atau output perintah menunjukkan tes gagal. Run Crabbox sekali pakai yang didukung Blacksmith seharusnya menghentikan Testbox secara otomatis; jika run terinterupsi atau cleanup tidak jelas, periksa box aktif dan hentikan hanya box yang Anda buat:

bash

blacksmith testbox list --allblacksmith testbox status --id <tbx_id>blacksmith testbox stop --id <tbx_id>

Gunakan reuse hanya saat Anda secara sengaja memerlukan beberapa perintah pada box hydrated yang sama:

bash

pnpm crabbox:run -- --provider blacksmith-testbox --id <tbx_id> --no-sync --timing-json --shell -- "pnpm test <path-or-filter>"pnpm crabbox:stop -- <tbx_id>

Jika Crabbox adalah lapisan yang rusak tetapi Blacksmith sendiri berfungsi, gunakan Blacksmith langsung hanya untuk diagnostik seperti list, status, dan cleanup. Perbaiki jalur Crabbox sebelum memperlakukan run Blacksmith langsung sebagai bukti maintainer.

Jika blacksmith testbox list --all dan blacksmith testbox status berfungsi tetapi warmup baru tetap queued tanpa IP atau URL run Actions setelah beberapa menit, perlakukan itu sebagai tekanan provider, antrean, billing, atau batas org Blacksmith. Hentikan id antrean yang Anda buat, hindari memulai Testbox tambahan, dan pindahkan bukti ke jalur kapasitas Crabbox milik sendiri di bawah sementara seseorang memeriksa dashboard, billing, dan batas org Blacksmith.

Eskalasi ke kapasitas Crabbox milik sendiri hanya saat Blacksmith sedang down, dibatasi kuota, tidak memiliki lingkungan yang dibutuhkan, atau kapasitas milik sendiri secara eksplisit menjadi tujuan:

bash

CRABBOX_CAPACITY_REGIONS=eu-west-1,eu-west-2,eu-central-1,us-east-1,us-west-2 \  pnpm crabbox:warmup -- --provider aws --class standard --market on-demand --idle-timeout 90mpnpm crabbox:hydrate -- --id <cbx_id-or-slug>pnpm crabbox:run -- --id <cbx_id-or-slug> --timing-json --shell -- "pnpm check:changed"pnpm crabbox:stop -- <cbx_id-or-slug>

Di bawah tekanan AWS, hindari class=beast kecuali tugas benar-benar memerlukan CPU kelas 48xlarge. Permintaan beast dimulai dari 192 vCPU dan merupakan cara termudah untuk memicu kuota regional EC2 Spot atau On-Demand Standard. Default .crabbox.yaml milik repo adalah standard, beberapa region kapasitas, dan capacity.hints: true sehingga lease AWS yang dibrokeri mencetak region/market terpilih, tekanan kuota, fallback Spot, dan peringatan kelas tekanan tinggi. Gunakan fast untuk pemeriksaan luas yang lebih berat, large hanya setelah standard/fast tidak cukup, dan beast hanya untuk lane terikat CPU yang luar biasa seperti full-suite atau matriks Docker semua Plugin, validasi release/blocker eksplisit, atau profiling performa high-core. Jangan gunakan beast untuk pnpm check:changed, tes terfokus, pekerjaan khusus docs, lint/typecheck biasa, repro E2E kecil, atau triase gangguan Blacksmith. Gunakan --market on-demand untuk diagnosis kapasitas agar gejolak market Spot tidak tercampur ke dalam sinyal.

.crabbox.yaml memiliki default provider, sync, dan hydration GitHub Actions untuk lane owned-cloud. File ini mengecualikan .git lokal agar checkout Actions yang di-hydrate mempertahankan metadata Git remote miliknya sendiri alih-alih menyinkronkan remote dan object store lokal maintainer, dan mengecualikan artefak runtime/build lokal yang tidak boleh pernah ditransfer. .github/workflows/crabbox-hydrate.yml memiliki checkout, setup Node/pnpm, fetch origin/main, dan handoff lingkungan non-secret untuk perintah owned-cloud crabbox run --id <cbx_id>.

Terkait

Was this useful?

Pipeline CI

Gambaran umum pipeline

Urutan fail-fast

Konteks dan bukti PR

Cakupan dan routing

Penerusan aktivitas ClawSweeper

Dispatch manual

Runner

Anggaran pendaftaran runner

Padanan lokal

Performa OpenClaw

Validasi Rilis Lengkap

Shard Live dan E2E

Penerimaan Paket

Job

Sumber kandidat

Profil suite

Jendela kompatibilitas legacy

Contoh

Smoke instalasi

E2E Docker Lokal

Parameter yang Dapat Disetel

Workflow live/E2E yang dapat digunakan ulang

Chunk jalur rilis

Prarilis Plugin

QA Lab

CodeQL

Kategori keamanan

Shard keamanan khusus platform

Kategori Kualitas Kritis

Workflow pemeliharaan

Agen Docs

Agen Performa Test

PR Duplikat Setelah Merge

Gerbang pemeriksaan lokal dan routing perubahan

Validasi Testbox

Terkait

On this page

Molty