CLI di inferenza
openclaw infer è la superficie headless canonica per i flussi di lavoro di inferenza supportati dal provider.
Espone intenzionalmente famiglie di capacità, non nomi RPC raw del gateway e non ID raw degli strumenti dell’agente.
Trasforma infer in una skill
Copia e incolla questo a un agente:- mappare gli intent comuni dell’utente al sottocomando infer corretto
- includere alcuni esempi infer canonici per i flussi di lavoro che copre
- preferire
openclaw infer ...negli esempi e nei suggerimenti - evitare di ridocumentare l’intera superficie infer nel corpo della skill
openclaw infer model runopenclaw infer image generateopenclaw infer audio transcribeopenclaw infer tts convertopenclaw infer web searchopenclaw infer embedding create
Perché usare infer
openclaw infer fornisce una CLI coerente per le attività di inferenza supportate dal provider all’interno di OpenClaw.
Vantaggi:
- Usa i provider e i modelli già configurati in OpenClaw invece di collegare wrapper una tantum per ogni backend.
- Mantieni i flussi di lavoro di modello, immagine, trascrizione audio, TTS, video, web ed embedding sotto un unico albero di comandi.
- Usa una forma di output
--jsonstabile per script, automazione e flussi di lavoro guidati da agenti. - Preferisci una superficie OpenClaw di prima parte quando l’attività è fondamentalmente “eseguire inferenza”.
- Usa il normale percorso locale senza richiedere il gateway per la maggior parte dei comandi infer.
Albero dei comandi
Attività comuni
Questa tabella mappa le attività di inferenza comuni al comando infer corrispondente.| Attività | Comando | Note |
|---|---|---|
| Eseguire un prompt di testo/modello | openclaw infer model run --prompt "..." --json | Usa per impostazione predefinita il normale percorso locale |
| Generare un’immagine | openclaw infer image generate --prompt "..." --json | Usa image edit quando parti da un file esistente |
| Descrivere un file immagine | openclaw infer image describe --file ./image.png --json | --model deve essere un <provider/model> compatibile con immagini |
| Trascrivere audio | openclaw infer audio transcribe --file ./memo.m4a --json | --model deve essere <provider/model> |
| Sintetizzare parlato | openclaw infer tts convert --text "..." --output ./speech.mp3 --json | tts status è orientato al gateway |
| Generare un video | openclaw infer video generate --prompt "..." --json | |
| Descrivere un file video | openclaw infer video describe --file ./clip.mp4 --json | --model deve essere <provider/model> |
| Cercare sul web | openclaw infer web search --query "..." --json | |
| Recuperare una pagina web | openclaw infer web fetch --url https://example.com --json | |
| Creare embedding | openclaw infer embedding create --text "..." --json |
Comportamento
openclaw infer ...è la superficie CLI principale per questi flussi di lavoro.- Usa
--jsonquando l’output verrà consumato da un altro comando o script. - Usa
--providero--model provider/modelquando è richiesto un backend specifico. - Per
image describe,audio transcribeevideo describe,--modeldeve usare la forma<provider/model>. - Per
image describe, un--modelesplicito esegue direttamente quel provider/modello. Il modello deve essere compatibile con immagini nel catalogo modelli o nella config del provider. - I comandi di esecuzione stateless usano per impostazione predefinita local.
- I comandi di stato gestiti dal gateway usano per impostazione predefinita gateway.
- Il normale percorso locale non richiede che il gateway sia in esecuzione.
Model
Usamodel per inferenza testuale supportata dal provider e ispezione di modelli/provider.
model runriutilizza il runtime dell’agente, quindi gli override di provider/modello si comportano come la normale esecuzione dell’agente.model auth login,model auth logoutemodel auth statusgestiscono lo stato di autenticazione provider salvato.
Image
Usaimage per generazione, modifica e descrizione.
- Usa
image editquando parti da file di input esistenti. - Per
image describe,--modeldeve essere un<provider/model>compatibile con immagini. - Per i modelli vision Ollama locali, scarica prima il modello e imposta
OLLAMA_API_KEYsu un qualsiasi valore segnaposto, ad esempioollama-local. Vedi Ollama.
Audio
Usaaudio per la trascrizione di file.
audio transcribeserve per la trascrizione di file, non per la gestione di sessioni in tempo reale.--modeldeve essere<provider/model>.
TTS
Usatts per la sintesi vocale e lo stato del provider TTS.
tts statususa per impostazione predefinita gateway perché riflette lo stato TTS gestito dal gateway.- Usa
tts providers,tts voicesetts set-providerper ispezionare e configurare il comportamento TTS.
Video
Usavideo per generazione e descrizione.
--modeldeve essere<provider/model>pervideo describe.
Web
Usaweb per i flussi di lavoro di ricerca e recupero.
- Usa
web providersper ispezionare i provider disponibili, configurati e selezionati.
Embedding
Usaembedding per la creazione di vettori e l’ispezione dei provider di embedding.
Output JSON
I comandi infer normalizzano l’output JSON sotto un envelope condiviso:okcapabilitytransportprovidermodelattemptsoutputserror
Errori comuni
Note
openclaw capability ...è un alias diopenclaw infer ....