Technical reference

Penggunaan token dan biaya

OpenClaw melacak token, bukan karakter. Token bersifat spesifik untuk model, tetapi sebagian besar model bergaya OpenAI rata-rata sekitar ~4 karakter per token untuk teks bahasa Inggris.

Cara prompt sistem dibuat

OpenClaw merakit prompt sistemnya sendiri pada setiap run. Prompt ini mencakup:

  • Daftar tool + deskripsi singkat
  • Daftar Skills (hanya metadata; instruksi dimuat sesuai kebutuhan dengan read). Giliran Codex native menerima blok skills ringkas sebagai instruksi developer kolaborasi yang dicakup per giliran; harness lain menerimanya di permukaan prompt normal. Ini dibatasi oleh skills.limits.maxSkillsPromptChars, dengan override opsional per agen di agents.list[].skillsLimits.maxSkillsPromptChars.
  • Instruksi pembaruan mandiri
  • Workspace + file bootstrap (AGENTS.md, SOUL.md, TOOLS.md, IDENTITY.md, USER.md, HEARTBEAT.md, BOOTSTRAP.md saat baru, plus MEMORY.md jika ada). Giliran Codex native tidak menempelkan MEMORY.md mentah dari workspace agen yang dikonfigurasi saat tool memori tersedia untuk workspace tersebut; giliran itu menyertakan pointer memori kecil dalam instruksi developer kolaborasi yang dicakup per giliran dan menggunakan tool memori sesuai kebutuhan. Jika tool dinonaktifkan, pencarian memori tidak tersedia, atau workspace aktif berbeda dari workspace memori agen, MEMORY.md menggunakan jalur konteks giliran berbatas normal. Root memory.md huruf kecil tidak disuntikkan; itu adalah input perbaikan lama untuk openclaw doctor --fix saat dipasangkan dengan MEMORY.md. File besar yang disuntikkan dipotong oleh agents.defaults.bootstrapMaxChars (default: 20000), dan total injeksi bootstrap dibatasi oleh agents.defaults.bootstrapTotalMaxChars (default: 60000). File harian memory/*.md bukan bagian dari prompt bootstrap normal; file tersebut tetap tersedia sesuai kebutuhan melalui tool memori pada giliran biasa, tetapi run model reset/startup dapat menambahkan blok konteks startup sekali pakai dengan memori harian terbaru untuk giliran pertama itu. Perintah chat polos /new dan /reset diakui tanpa memanggil model. Prelude startup dikendalikan oleh agents.defaults.startupContext. Kutipan AGENTS.md pasca-Compaction terpisah dan memerlukan opt-in eksplisit agents.defaults.compaction.postCompactionSections.
  • Waktu (UTC + zona waktu pengguna)
  • Tag balasan + perilaku Heartbeat
  • Metadata runtime (host/OS/model/thinking)

Lihat uraian lengkap di Prompt Sistem.

Saat mendokumentasikan kredensial atau cuplikan autentikasi, gunakan Konvensi Placeholder Rahasia untuk menghindari false positive secret-scanner pada perubahan khusus dokumentasi.

Apa saja yang dihitung dalam jendela konteks

Semua yang diterima model dihitung terhadap batas konteks:

  • Prompt sistem (semua bagian yang tercantum di atas)
  • Riwayat percakapan (pesan pengguna + asisten)
  • Panggilan tool dan hasil tool
  • Lampiran/transkrip (gambar, audio, file)
  • Ringkasan Compaction dan artefak pruning
  • Wrapper penyedia atau header keamanan (tidak terlihat, tetapi tetap dihitung)

Beberapa permukaan yang berat runtime memiliki batas eksplisitnya sendiri:

  • agents.defaults.contextLimits.memoryGetMaxChars
  • agents.defaults.contextLimits.memoryGetDefaultLines
  • agents.defaults.contextLimits.toolResultMaxChars
  • agents.defaults.contextLimits.postCompactionMaxChars

Override per agen berada di bawah agents.list[].contextLimits. Knob ini adalah untuk kutipan runtime berbatas dan blok yang disuntikkan milik runtime. Knob ini terpisah dari batas bootstrap, batas konteks startup, dan batas prompt skills.

toolResultMaxChars adalah plafon lanjutan (hingga 1000000 karakter). Saat tidak disetel, OpenClaw memilih batas hasil tool live dari jendela konteks model efektif: 16000 karakter di bawah 100K token, 32000 karakter pada 100K+ token, dan 64000 karakter pada 200K+ token, tetap dibatasi oleh guard porsi konteks runtime.

Untuk gambar, OpenClaw menurunkan skala payload gambar transkrip/tool sebelum panggilan penyedia. Gunakan agents.defaults.imageMaxDimensionPx (default: 1200) untuk menyesuaikannya:

  • Nilai lebih rendah biasanya mengurangi penggunaan token visi dan ukuran payload.
  • Nilai lebih tinggi mempertahankan lebih banyak detail visual untuk screenshot yang berat OCR/UI.

Untuk uraian praktis (per file yang disuntikkan, tool, skills, dan ukuran prompt sistem), gunakan /context list atau /context detail. Lihat Konteks.

Cara melihat penggunaan token saat ini

Gunakan ini di chat:

  • /statuskartu status kaya emoji dengan model sesi, penggunaan konteks, token input/output respons terakhir, dan estimasi biaya saat harga lokal dikonfigurasi untuk model aktif.
  • /usage off|tokens|full → menambahkan footer penggunaan per respons ke setiap balasan.
    • Bertahan per sesi (disimpan sebagai responseUsage).
    • /usage reset (alias: inherit, clear, default) — menghapus override sesi sehingga sesi kembali mewarisi default yang dikonfigurasi.
    • /usage tokens menampilkan detail token/cache giliran.
    • /usage full menampilkan detail model/konteks/biaya yang ringkas; estimasi biaya muncul hanya saat OpenClaw memiliki metadata penggunaan dan harga lokal untuk model aktif. Layout messages.usageTemplate kustom dapat menyertakan field token/cache.
  • /usage cost → menampilkan ringkasan biaya lokal dari log sesi OpenClaw.

Permukaan lain:

  • TUI/Web TUI: /status + /usage didukung.
  • CLI: openclaw status --usage dan openclaw channels list menampilkan jendela kuota penyedia yang dinormalisasi (X% left, bukan biaya per respons). Penyedia jendela penggunaan saat ini: Anthropic, GitHub Copilot, Gemini CLI, OpenAI Codex, MiniMax, Xiaomi, dan z.ai.

Permukaan penggunaan menormalisasi alias field native penyedia yang umum sebelum ditampilkan. Untuk traffic Responses keluarga OpenAI, ini mencakup input_tokens / output_tokens dan prompt_tokens / completion_tokens, sehingga nama field khusus transport tidak mengubah /status, /usage, atau ringkasan sesi. Penggunaan Gemini CLI juga dinormalisasi: parser default stream-json membaca event message asisten, dan stats.cached dipetakan ke cacheRead dengan stats.input_tokens - stats.cached digunakan saat CLI menghilangkan field stats.input eksplisit. Override JSON lama tetap membaca teks balasan dari response. Untuk traffic Responses native keluarga OpenAI, alias penggunaan WebSocket/SSE dinormalisasi dengan cara yang sama, dan total fallback ke input + output yang dinormalisasi saat total_tokens hilang atau 0. Saat snapshot sesi saat ini jarang, /status dan session_status juga dapat memulihkan penghitung token/cache dan label model runtime aktif dari log penggunaan transkrip terbaru. Nilai live bukan nol yang ada tetap diprioritaskan atas nilai fallback transkrip, dan total transkrip yang lebih besar berorientasi prompt dapat menang saat total tersimpan hilang atau lebih kecil. Autentikasi penggunaan untuk jendela kuota penyedia berasal dari hook khusus penyedia saat tersedia; jika tidak, OpenClaw fallback ke kredensial OAuth/API-key yang cocok dari profil auth, env, atau config. Entri transkrip asisten mempertahankan bentuk penggunaan ternormalisasi yang sama, termasuk usage.cost saat model aktif memiliki harga yang dikonfigurasi dan penyedia mengembalikan metadata penggunaan. Ini memberi /usage cost dan status sesi berbasis transkrip sumber yang stabil bahkan setelah status runtime live hilang.

OpenClaw menjaga akuntansi penggunaan penyedia terpisah dari snapshot konteks saat ini. usage.total penyedia dapat mencakup input yang di-cache, output, dan beberapa panggilan model tool-loop, sehingga berguna untuk biaya dan telemetri tetapi dapat melebih-lebihkan jendela konteks live. Tampilan konteks dan diagnostik menggunakan snapshot prompt terbaru (promptTokens, atau panggilan model terakhir saat tidak ada snapshot prompt tersedia) untuk context.used.

Estimasi biaya (saat ditampilkan)

Biaya diestimasi dari config harga model Anda:

Code
models.providers.<provider>.models[].cost

Ini adalah USD per 1M token untuk input, output, cacheRead, dan cacheWrite. Jika harga hilang, /usage full menghilangkan biaya; gunakan /usage tokens atau messages.usageTemplate kustom saat Anda membutuhkan detail token/cache di setiap balasan. Tampilan biaya tidak terbatas pada auth API-key: penyedia non-API-key seperti aws-sdk dapat menampilkan estimasi biaya saat entri model yang dikonfigurasi mencakup harga lokal dan penyedia mengembalikan metadata penggunaan.

Setelah sidecar dan channel mencapai jalur siap Gateway, OpenClaw memulai bootstrap harga latar belakang opsional untuk ref model yang dikonfigurasi yang belum memiliki harga lokal. Bootstrap itu mengambil katalog harga OpenRouter dan LiteLLM jarak jauh. Setel models.pricing.enabled: false untuk melewati pengambilan katalog itu pada jaringan offline atau terbatas; entri eksplisit models.providers.*.models[].cost tetap menggerakkan estimasi biaya lokal.

Cache TTL dan dampak pruning

Caching prompt penyedia hanya berlaku dalam jendela cache TTL. OpenClaw dapat secara opsional menjalankan pruning cache-ttl: ia memangkas sesi setelah cache TTL kedaluwarsa, lalu mereset jendela cache sehingga permintaan berikutnya dapat menggunakan ulang konteks yang baru di-cache alih-alih melakukan cache ulang untuk seluruh riwayat. Ini menjaga biaya penulisan cache lebih rendah saat sesi idle melewati TTL.

Konfigurasikan di konfigurasi Gateway dan lihat detail perilakunya di Pruning sesi.

Heartbeat dapat menjaga cache tetap hangat melewati jeda idle. Jika cache TTL model Anda adalah 1h, menyetel interval heartbeat sedikit di bawah itu (misalnya, 55m) dapat menghindari cache ulang prompt penuh, sehingga mengurangi biaya penulisan cache.

Dalam setup multi-agen, Anda dapat mempertahankan satu config model bersama dan menyesuaikan perilaku cache per agen dengan agents.list[].params.cacheRetention.

Untuk panduan lengkap knob per knob, lihat Caching Prompt.

Untuk harga API Anthropic, pembacaan cache jauh lebih murah daripada token input, sementara penulisan cache ditagih dengan pengali lebih tinggi. Lihat harga caching prompt Anthropic untuk tarif terbaru dan pengali TTL: https://docs.anthropic.com/docs/build-with-claude/prompt-caching

Contoh: menjaga cache 1j tetap hangat dengan heartbeat

yaml
agents:  defaults:    model:      primary: "anthropic/claude-opus-4-6"    models:      "anthropic/claude-opus-4-6":        params:          cacheRetention: "long"    heartbeat:      every: "55m"

Contoh: traffic campuran dengan strategi cache per agen

yaml
agents:  defaults:    model:      primary: "anthropic/claude-opus-4-6"    models:      "anthropic/claude-opus-4-6":        params:          cacheRetention: "long" # default baseline for most agents  list:    - id: "research"      default: true      heartbeat:        every: "55m" # keep long cache warm for deep sessions    - id: "alerts"      params:        cacheRetention: "none" # avoid cache writes for bursty notifications

agents.list[].params digabungkan di atas params model yang dipilih, sehingga Anda dapat hanya meng-override cacheRetention dan mewarisi default model lain tanpa perubahan.

Konteks 1M Anthropic

OpenClaw mengukur model Claude 4.x yang mampu GA seperti Opus 4.8, Opus 4.7, Opus 4.6, dan Sonnet 4.6 dengan jendela konteks 1M Anthropic. Anda tidak memerlukan params.context1m: true untuk model tersebut.

yaml
agents:  defaults:    models:      "anthropic/claude-opus-4-6":        alias: opus

Config lama dapat mempertahankan context1m: true, tetapi OpenClaw tidak lagi mengirim header beta Anthropic context-1m-2025-08-07 yang telah pensiun untuk setelan ini dan tidak memperluas model Claude lama yang tidak didukung menjadi 1M.

Persyaratan: kredensial harus memenuhi syarat untuk penggunaan konteks panjang. Jika tidak, Anthropic merespons dengan error batas laju dari sisi penyedia untuk permintaan tersebut.

Jika Anda mengautentikasi Anthropic dengan token OAuth/langganan (sk-ant-oat-*), OpenClaw mempertahankan header beta Anthropic yang diwajibkan OAuth sekaligus menghapus beta context-1m-* yang telah pensiun jika masih ada di config lama.

Tips untuk mengurangi tekanan token

  • Gunakan /compact untuk meringkas sesi panjang.
  • Pangkas keluaran tool yang besar dalam alur kerja Anda.
  • Turunkan agents.defaults.imageMaxDimensionPx untuk sesi yang banyak menggunakan screenshot.
  • Jaga deskripsi skill tetap singkat (daftar skill disisipkan ke dalam prompt).
  • Utamakan model yang lebih kecil untuk pekerjaan eksploratif yang panjang.

Lihat Skills untuk rumus overhead daftar skill yang tepat.

Terkait

Was this useful?
On this page

On this page