Langsung ke konten utama

CLI Inference

openclaw infer adalah permukaan headless kanonis untuk alur kerja inference berbasis provider. CLI ini secara sengaja mengekspos keluarga kapabilitas, bukan nama RPC Gateway mentah dan bukan id tool agent mentah.

Ubah infer menjadi skill

Salin dan tempel ini ke agent:
Baca https://docs.openclaw.ai/cli/infer, lalu buat skill yang merutekan alur kerja umum saya ke `openclaw infer`.
Fokus pada eksekusi model, pembuatan gambar, pembuatan video, transkripsi audio, TTS, pencarian web, dan embedding.
Skill berbasis infer yang baik seharusnya:
  • memetakan intent pengguna umum ke subperintah infer yang benar
  • menyertakan beberapa contoh infer kanonis untuk alur kerja yang dicakupnya
  • mengutamakan openclaw infer ... dalam contoh dan saran
  • menghindari mendokumentasikan ulang seluruh permukaan infer di dalam isi skill
Cakupan skill berfokus infer yang umum:
  • openclaw infer model run
  • openclaw infer image generate
  • openclaw infer audio transcribe
  • openclaw infer tts convert
  • openclaw infer web search
  • openclaw infer embedding create

Mengapa menggunakan infer

openclaw infer menyediakan satu CLI yang konsisten untuk tugas inference berbasis provider di dalam OpenClaw. Manfaat:
  • Gunakan provider dan model yang sudah dikonfigurasi di OpenClaw alih-alih memasang wrapper satu kali pakai untuk setiap backend.
  • Pertahankan alur kerja model, gambar, transkripsi audio, TTS, video, web, dan embedding di bawah satu pohon perintah.
  • Gunakan bentuk output --json yang stabil untuk skrip, otomatisasi, dan alur kerja yang digerakkan agent.
  • Utamakan permukaan OpenClaw pihak pertama ketika tugasnya pada dasarnya adalah “menjalankan inference.”
  • Gunakan jalur lokal normal tanpa memerlukan Gateway untuk sebagian besar perintah infer.

Pohon perintah

 openclaw infer
  list
  inspect

  model
    run
    list
    inspect
    providers
    auth login
    auth logout
    auth status

  image
    generate
    edit
    describe
    describe-many
    providers

  audio
    transcribe
    providers

  tts
    convert
    voices
    providers
    status
    enable
    disable
    set-provider

  video
    generate
    describe
    providers

  web
    search
    fetch
    providers

  embedding
    create
    providers

Tugas umum

Tabel ini memetakan tugas inference umum ke perintah infer yang sesuai.
TugasPerintahCatatan
Jalankan prompt teks/modelopenclaw infer model run --prompt "..." --jsonMenggunakan jalur lokal normal secara default
Buat gambaropenclaw infer image generate --prompt "..." --jsonGunakan image edit saat memulai dari file yang ada
Deskripsikan file gambaropenclaw infer image describe --file ./image.png --json--model harus berupa <provider/model> yang mendukung gambar
Transkripsikan audioopenclaw infer audio transcribe --file ./memo.m4a --json--model harus berupa <provider/model>
Sintesis ucapanopenclaw infer tts convert --text "..." --output ./speech.mp3 --jsontts status berorientasi pada Gateway
Buat videoopenclaw infer video generate --prompt "..." --json
Deskripsikan file videoopenclaw infer video describe --file ./clip.mp4 --json--model harus berupa <provider/model>
Cari di webopenclaw infer web search --query "..." --json
Ambil halaman webopenclaw infer web fetch --url https://example.com --json
Buat embeddingopenclaw infer embedding create --text "..." --json

Perilaku

  • openclaw infer ... adalah permukaan CLI utama untuk alur kerja ini.
  • Gunakan --json saat output akan dikonsumsi oleh perintah atau skrip lain.
  • Gunakan --provider atau --model provider/model saat backend tertentu diperlukan.
  • Untuk image describe, audio transcribe, dan video describe, --model harus menggunakan bentuk <provider/model>.
  • Untuk image describe, --model eksplisit menjalankan provider/model tersebut secara langsung. Model tersebut harus mendukung gambar dalam katalog model atau config provider.
  • Perintah eksekusi stateless default ke lokal.
  • Perintah state yang dikelola Gateway default ke Gateway.
  • Jalur lokal normal tidak memerlukan Gateway berjalan.

Model

Gunakan model untuk inference teks berbasis provider dan inspeksi model/provider.
openclaw infer model run --prompt "Reply with exactly: smoke-ok" --json
openclaw infer model run --prompt "Summarize this changelog entry" --provider openai --json
openclaw infer model providers --json
openclaw infer model inspect --name gpt-5.4 --json
Catatan:
  • model run menggunakan ulang runtime agent sehingga override provider/model berperilaku seperti eksekusi agent normal.
  • model auth login, model auth logout, dan model auth status mengelola state auth provider tersimpan.

Gambar

Gunakan image untuk pembuatan, pengeditan, dan deskripsi.
openclaw infer image generate --prompt "friendly lobster illustration" --json
openclaw infer image generate --prompt "cinematic product photo of headphones" --json
openclaw infer image describe --file ./photo.jpg --json
openclaw infer image describe --file ./ui-screenshot.png --model openai/gpt-4.1-mini --json
openclaw infer image describe --file ./photo.jpg --model ollama/qwen2.5vl:7b --json
Catatan:
  • Gunakan image edit saat memulai dari file input yang sudah ada.
  • Untuk image describe, --model harus berupa <provider/model> yang mendukung gambar.
  • Untuk model vision Ollama lokal, tarik modelnya terlebih dahulu dan setel OLLAMA_API_KEY ke nilai placeholder apa pun, misalnya ollama-local. Lihat Ollama.

Audio

Gunakan audio untuk transkripsi file.
openclaw infer audio transcribe --file ./memo.m4a --json
openclaw infer audio transcribe --file ./team-sync.m4a --language en --prompt "Focus on names and action items" --json
openclaw infer audio transcribe --file ./memo.m4a --model openai/whisper-1 --json
Catatan:
  • audio transcribe digunakan untuk transkripsi file, bukan manajemen sesi realtime.
  • --model harus berupa <provider/model>.

TTS

Gunakan tts untuk sintesis ucapan dan state provider TTS.
openclaw infer tts convert --text "hello from openclaw" --output ./hello.mp3 --json
openclaw infer tts convert --text "Your build is complete" --output ./build-complete.mp3 --json
openclaw infer tts providers --json
openclaw infer tts status --json
Catatan:
  • tts status default ke Gateway karena mencerminkan state TTS yang dikelola Gateway.
  • Gunakan tts providers, tts voices, dan tts set-provider untuk memeriksa dan mengonfigurasi perilaku TTS.

Video

Gunakan video untuk pembuatan dan deskripsi.
openclaw infer video generate --prompt "cinematic sunset over the ocean" --json
openclaw infer video generate --prompt "slow drone shot over a forest lake" --json
openclaw infer video describe --file ./clip.mp4 --json
openclaw infer video describe --file ./clip.mp4 --model openai/gpt-4.1-mini --json
Catatan:
  • --model harus berupa <provider/model> untuk video describe.

Web

Gunakan web untuk alur kerja pencarian dan pengambilan.
openclaw infer web search --query "OpenClaw docs" --json
openclaw infer web search --query "OpenClaw infer web providers" --json
openclaw infer web fetch --url https://docs.openclaw.ai/cli/infer --json
openclaw infer web providers --json
Catatan:
  • Gunakan web providers untuk memeriksa provider yang tersedia, dikonfigurasi, dan dipilih.

Embedding

Gunakan embedding untuk pembuatan vektor dan inspeksi provider embedding.
openclaw infer embedding create --text "friendly lobster" --json
openclaw infer embedding create --text "customer support ticket: delayed shipment" --model openai/text-embedding-3-large --json
openclaw infer embedding providers --json

Output JSON

Perintah infer menormalkan output JSON di bawah envelope bersama:
{
  "ok": true,
  "capability": "image.generate",
  "transport": "local",
  "provider": "openai",
  "model": "gpt-image-2",
  "attempts": [],
  "outputs": []
}
Field level atas stabil:
  • ok
  • capability
  • transport
  • provider
  • model
  • attempts
  • outputs
  • error

Kekeliruan umum

# Buruk
openclaw infer media image generate --prompt "friendly lobster"

# Baik
openclaw infer image generate --prompt "friendly lobster"
# Buruk
openclaw infer audio transcribe --file ./memo.m4a --model whisper-1 --json

# Baik
openclaw infer audio transcribe --file ./memo.m4a --model openai/whisper-1 --json

Catatan

  • openclaw capability ... adalah alias untuk openclaw infer ....