Technical reference
Penggunaan token dan biaya
OpenClaw melacak token, bukan karakter. Token bersifat spesifik untuk model, tetapi sebagian besar model bergaya OpenAI rata-rata sekitar ~4 karakter per token untuk teks bahasa Inggris.
Cara prompt sistem dibuat
OpenClaw merakit prompt sistemnya sendiri pada setiap run. Prompt ini mencakup:
- Daftar tool + deskripsi singkat
- Daftar Skills (hanya metadata; instruksi dimuat sesuai kebutuhan dengan
read). Giliran Codex native menerima blok skills ringkas sebagai instruksi developer kolaborasi yang dicakup per giliran; harness lain menerimanya di permukaan prompt normal. Ini dibatasi olehskills.limits.maxSkillsPromptChars, dengan override opsional per agen diagents.list[].skillsLimits.maxSkillsPromptChars. - Instruksi pembaruan mandiri
- Workspace + file bootstrap (
AGENTS.md,SOUL.md,TOOLS.md,IDENTITY.md,USER.md,HEARTBEAT.md,BOOTSTRAP.mdsaat baru, plusMEMORY.mdjika ada). Giliran Codex native tidak menempelkanMEMORY.mdmentah dari workspace agen yang dikonfigurasi saat tool memori tersedia untuk workspace tersebut; giliran itu menyertakan pointer memori kecil dalam instruksi developer kolaborasi yang dicakup per giliran dan menggunakan tool memori sesuai kebutuhan. Jika tool dinonaktifkan, pencarian memori tidak tersedia, atau workspace aktif berbeda dari workspace memori agen,MEMORY.mdmenggunakan jalur konteks giliran berbatas normal. Rootmemory.mdhuruf kecil tidak disuntikkan; itu adalah input perbaikan lama untukopenclaw doctor --fixsaat dipasangkan denganMEMORY.md. File besar yang disuntikkan dipotong olehagents.defaults.bootstrapMaxChars(default: 20000), dan total injeksi bootstrap dibatasi olehagents.defaults.bootstrapTotalMaxChars(default: 60000). File harianmemory/*.mdbukan bagian dari prompt bootstrap normal; file tersebut tetap tersedia sesuai kebutuhan melalui tool memori pada giliran biasa, tetapi run model reset/startup dapat menambahkan blok konteks startup sekali pakai dengan memori harian terbaru untuk giliran pertama itu. Perintah chat polos/newdan/resetdiakui tanpa memanggil model. Prelude startup dikendalikan olehagents.defaults.startupContext. Kutipan AGENTS.md pasca-Compaction terpisah dan memerlukan opt-in eksplisitagents.defaults.compaction.postCompactionSections. - Waktu (UTC + zona waktu pengguna)
- Tag balasan + perilaku Heartbeat
- Metadata runtime (host/OS/model/thinking)
Lihat uraian lengkap di Prompt Sistem.
Saat mendokumentasikan kredensial atau cuplikan autentikasi, gunakan Konvensi Placeholder Rahasia untuk menghindari false positive secret-scanner pada perubahan khusus dokumentasi.
Apa saja yang dihitung dalam jendela konteks
Semua yang diterima model dihitung terhadap batas konteks:
- Prompt sistem (semua bagian yang tercantum di atas)
- Riwayat percakapan (pesan pengguna + asisten)
- Panggilan tool dan hasil tool
- Lampiran/transkrip (gambar, audio, file)
- Ringkasan Compaction dan artefak pruning
- Wrapper penyedia atau header keamanan (tidak terlihat, tetapi tetap dihitung)
Beberapa permukaan yang berat runtime memiliki batas eksplisitnya sendiri:
agents.defaults.contextLimits.memoryGetMaxCharsagents.defaults.contextLimits.memoryGetDefaultLinesagents.defaults.contextLimits.toolResultMaxCharsagents.defaults.contextLimits.postCompactionMaxChars
Override per agen berada di bawah agents.list[].contextLimits. Knob ini adalah
untuk kutipan runtime berbatas dan blok yang disuntikkan milik runtime. Knob ini
terpisah dari batas bootstrap, batas konteks startup, dan batas prompt skills.
toolResultMaxChars adalah plafon lanjutan (hingga 1000000 karakter). Saat tidak disetel, OpenClaw memilih
batas hasil tool live dari jendela konteks model efektif: 16000 karakter
di bawah 100K token, 32000 karakter pada 100K+ token, dan 64000 karakter pada 200K+
token, tetap dibatasi oleh guard porsi konteks runtime.
Untuk gambar, OpenClaw menurunkan skala payload gambar transkrip/tool sebelum panggilan penyedia.
Gunakan agents.defaults.imageMaxDimensionPx (default: 1200) untuk menyesuaikannya:
- Nilai lebih rendah biasanya mengurangi penggunaan token visi dan ukuran payload.
- Nilai lebih tinggi mempertahankan lebih banyak detail visual untuk screenshot yang berat OCR/UI.
Untuk uraian praktis (per file yang disuntikkan, tool, skills, dan ukuran prompt sistem), gunakan /context list atau /context detail. Lihat Konteks.
Cara melihat penggunaan token saat ini
Gunakan ini di chat:
/status→ kartu status kaya emoji dengan model sesi, penggunaan konteks, token input/output respons terakhir, dan estimasi biaya saat harga lokal dikonfigurasi untuk model aktif./usage off|tokens|full→ menambahkan footer penggunaan per respons ke setiap balasan.- Bertahan per sesi (disimpan sebagai
responseUsage). /usage reset(alias:inherit,clear,default) — menghapus override sesi sehingga sesi kembali mewarisi default yang dikonfigurasi./usage tokensmenampilkan detail token/cache giliran./usage fullmenampilkan detail model/konteks/biaya yang ringkas; estimasi biaya muncul hanya saat OpenClaw memiliki metadata penggunaan dan harga lokal untuk model aktif. Layoutmessages.usageTemplatekustom dapat menyertakan field token/cache.
- Bertahan per sesi (disimpan sebagai
/usage cost→ menampilkan ringkasan biaya lokal dari log sesi OpenClaw.
Permukaan lain:
- TUI/Web TUI:
/status+/usagedidukung. - CLI:
openclaw status --usagedanopenclaw channels listmenampilkan jendela kuota penyedia yang dinormalisasi (X% left, bukan biaya per respons). Penyedia jendela penggunaan saat ini: Anthropic, GitHub Copilot, Gemini CLI, OpenAI Codex, MiniMax, Xiaomi, dan z.ai.
Permukaan penggunaan menormalisasi alias field native penyedia yang umum sebelum ditampilkan.
Untuk traffic Responses keluarga OpenAI, ini mencakup input_tokens /
output_tokens dan prompt_tokens / completion_tokens, sehingga nama field
khusus transport tidak mengubah /status, /usage, atau ringkasan sesi.
Penggunaan Gemini CLI juga dinormalisasi: parser default stream-json membaca
event message asisten, dan stats.cached dipetakan ke cacheRead dengan
stats.input_tokens - stats.cached digunakan saat CLI menghilangkan field
stats.input eksplisit. Override JSON lama tetap membaca teks balasan dari
response.
Untuk traffic Responses native keluarga OpenAI, alias penggunaan WebSocket/SSE
dinormalisasi dengan cara yang sama, dan total fallback ke input + output yang dinormalisasi saat
total_tokens hilang atau 0.
Saat snapshot sesi saat ini jarang, /status dan session_status juga dapat
memulihkan penghitung token/cache dan label model runtime aktif dari log penggunaan
transkrip terbaru. Nilai live bukan nol yang ada tetap
diprioritaskan atas nilai fallback transkrip, dan total transkrip yang lebih besar
berorientasi prompt dapat menang saat total tersimpan hilang atau lebih kecil.
Autentikasi penggunaan untuk jendela kuota penyedia berasal dari hook khusus penyedia saat
tersedia; jika tidak, OpenClaw fallback ke kredensial OAuth/API-key yang cocok
dari profil auth, env, atau config.
Entri transkrip asisten mempertahankan bentuk penggunaan ternormalisasi yang sama, termasuk
usage.cost saat model aktif memiliki harga yang dikonfigurasi dan penyedia
mengembalikan metadata penggunaan. Ini memberi /usage cost dan status sesi
berbasis transkrip sumber yang stabil bahkan setelah status runtime live hilang.
OpenClaw menjaga akuntansi penggunaan penyedia terpisah dari snapshot konteks
saat ini. usage.total penyedia dapat mencakup input yang di-cache, output, dan beberapa
panggilan model tool-loop, sehingga berguna untuk biaya dan telemetri tetapi dapat melebih-lebihkan
jendela konteks live. Tampilan konteks dan diagnostik menggunakan snapshot prompt terbaru
(promptTokens, atau panggilan model terakhir saat tidak ada snapshot prompt
tersedia) untuk context.used.
Estimasi biaya (saat ditampilkan)
Biaya diestimasi dari config harga model Anda:
models.providers.<provider>.models[].costIni adalah USD per 1M token untuk input, output, cacheRead, dan
cacheWrite. Jika harga hilang, /usage full menghilangkan biaya; gunakan /usage tokens
atau messages.usageTemplate kustom saat Anda membutuhkan detail token/cache di setiap
balasan. Tampilan biaya tidak terbatas pada auth API-key: penyedia non-API-key seperti
aws-sdk dapat menampilkan estimasi biaya saat entri model yang dikonfigurasi mencakup
harga lokal dan penyedia mengembalikan metadata penggunaan.
Setelah sidecar dan channel mencapai jalur siap Gateway, OpenClaw memulai
bootstrap harga latar belakang opsional untuk ref model yang dikonfigurasi yang belum
memiliki harga lokal. Bootstrap itu mengambil katalog harga OpenRouter dan LiteLLM
jarak jauh. Setel models.pricing.enabled: false untuk melewati pengambilan katalog itu
pada jaringan offline atau terbatas; entri eksplisit
models.providers.*.models[].cost tetap menggerakkan estimasi biaya lokal.
Cache TTL dan dampak pruning
Caching prompt penyedia hanya berlaku dalam jendela cache TTL. OpenClaw dapat secara opsional menjalankan pruning cache-ttl: ia memangkas sesi setelah cache TTL kedaluwarsa, lalu mereset jendela cache sehingga permintaan berikutnya dapat menggunakan ulang konteks yang baru di-cache alih-alih melakukan cache ulang untuk seluruh riwayat. Ini menjaga biaya penulisan cache lebih rendah saat sesi idle melewati TTL.
Konfigurasikan di konfigurasi Gateway dan lihat detail perilakunya di Pruning sesi.
Heartbeat dapat menjaga cache tetap hangat melewati jeda idle. Jika cache TTL model Anda
adalah 1h, menyetel interval heartbeat sedikit di bawah itu (misalnya, 55m) dapat menghindari
cache ulang prompt penuh, sehingga mengurangi biaya penulisan cache.
Dalam setup multi-agen, Anda dapat mempertahankan satu config model bersama dan menyesuaikan perilaku cache
per agen dengan agents.list[].params.cacheRetention.
Untuk panduan lengkap knob per knob, lihat Caching Prompt.
Untuk harga API Anthropic, pembacaan cache jauh lebih murah daripada token input, sementara penulisan cache ditagih dengan pengali lebih tinggi. Lihat harga caching prompt Anthropic untuk tarif terbaru dan pengali TTL: https://docs.anthropic.com/docs/build-with-claude/prompt-caching
Contoh: menjaga cache 1j tetap hangat dengan heartbeat
agents: defaults: model: primary: "anthropic/claude-opus-4-6" models: "anthropic/claude-opus-4-6": params: cacheRetention: "long" heartbeat: every: "55m"Contoh: traffic campuran dengan strategi cache per agen
agents: defaults: model: primary: "anthropic/claude-opus-4-6" models: "anthropic/claude-opus-4-6": params: cacheRetention: "long" # default baseline for most agents list: - id: "research" default: true heartbeat: every: "55m" # keep long cache warm for deep sessions - id: "alerts" params: cacheRetention: "none" # avoid cache writes for bursty notificationsagents.list[].params digabungkan di atas params model yang dipilih, sehingga Anda dapat
hanya meng-override cacheRetention dan mewarisi default model lain tanpa perubahan.
Konteks 1M Anthropic
OpenClaw mengukur model Claude 4.x yang mampu GA seperti Opus 4.8, Opus 4.7, Opus 4.6, dan
Sonnet 4.6 dengan jendela konteks 1M Anthropic. Anda tidak memerlukan
params.context1m: true untuk model tersebut.
agents: defaults: models: "anthropic/claude-opus-4-6": alias: opusConfig lama dapat mempertahankan context1m: true, tetapi OpenClaw tidak lagi mengirim
header beta Anthropic context-1m-2025-08-07 yang telah pensiun untuk setelan ini dan
tidak memperluas model Claude lama yang tidak didukung menjadi 1M.
Persyaratan: kredensial harus memenuhi syarat untuk penggunaan konteks panjang. Jika tidak, Anthropic merespons dengan error batas laju dari sisi penyedia untuk permintaan tersebut.
Jika Anda mengautentikasi Anthropic dengan token OAuth/langganan (sk-ant-oat-*),
OpenClaw mempertahankan header beta Anthropic yang diwajibkan OAuth sekaligus menghapus
beta context-1m-* yang telah pensiun jika masih ada di config lama.
Tips untuk mengurangi tekanan token
- Gunakan
/compactuntuk meringkas sesi panjang. - Pangkas keluaran tool yang besar dalam alur kerja Anda.
- Turunkan
agents.defaults.imageMaxDimensionPxuntuk sesi yang banyak menggunakan screenshot. - Jaga deskripsi skill tetap singkat (daftar skill disisipkan ke dalam prompt).
- Utamakan model yang lebih kecil untuk pekerjaan eksploratif yang panjang.
Lihat Skills untuk rumus overhead daftar skill yang tepat.