CLI de inferencia
openclaw infer es la superficie sin interfaz gráfica canónica para flujos de trabajo de inferencia respaldados por proveedores.
Expone intencionalmente familias de capacidades, no nombres RPC sin procesar del Gateway ni identificadores sin procesar de herramientas de agente.
Convertir infer en una skill
Copia y pega esto en un agente:- asignar intenciones comunes del usuario al subcomando infer correcto
- incluir algunos ejemplos infer canónicos para los flujos de trabajo que cubre
- preferir
openclaw infer ...en ejemplos y sugerencias - evitar volver a documentar toda la superficie de infer dentro del cuerpo de la skill
openclaw infer model runopenclaw infer image generateopenclaw infer audio transcribeopenclaw infer tts convertopenclaw infer web searchopenclaw infer embedding create
Por qué usar infer
openclaw infer proporciona una CLI consistente para tareas de inferencia respaldadas por proveedores dentro de OpenClaw.
Beneficios:
- Usa los proveedores y modelos ya configurados en OpenClaw en lugar de conectar wrappers puntuales para cada backend.
- Mantén los flujos de trabajo de modelo, imagen, transcripción de audio, TTS, video, web y embeddings bajo un solo árbol de comandos.
- Usa una forma de salida
--jsonestable para scripts, automatización y flujos de trabajo impulsados por agentes. - Prefiere una superficie nativa de OpenClaw cuando la tarea es fundamentalmente “ejecutar inferencia”.
- Usa la ruta local normal sin requerir el Gateway para la mayoría de los comandos infer.
Árbol de comandos
Tareas comunes
Esta tabla asigna tareas comunes de inferencia al comando infer correspondiente.| Task | Command | Notes |
|---|---|---|
| Ejecutar una indicación de texto/modelo | openclaw infer model run --prompt "..." --json | Usa la ruta local normal de forma predeterminada |
| Generar una imagen | openclaw infer image generate --prompt "..." --json | Usa image edit al partir de un archivo existente |
| Describir un archivo de imagen | openclaw infer image describe --file ./image.png --json | --model debe ser un <provider/model> con capacidad de imagen |
| Transcribir audio | openclaw infer audio transcribe --file ./memo.m4a --json | --model debe ser <provider/model> |
| Sintetizar voz | openclaw infer tts convert --text "..." --output ./speech.mp3 --json | tts status está orientado al Gateway |
| Generar un video | openclaw infer video generate --prompt "..." --json | |
| Describir un archivo de video | openclaw infer video describe --file ./clip.mp4 --json | --model debe ser <provider/model> |
| Buscar en la web | openclaw infer web search --query "..." --json | |
| Obtener una página web | openclaw infer web fetch --url https://example.com --json | |
| Crear embeddings | openclaw infer embedding create --text "..." --json |
Comportamiento
openclaw infer ...es la superficie principal de la CLI para estos flujos de trabajo.- Usa
--jsoncuando la salida vaya a ser consumida por otro comando o script. - Usa
--providero--model provider/modelcuando se requiera un backend específico. - Para
image describe,audio transcribeyvideo describe,--modeldebe usar el formato<provider/model>. - Para
image describe, un--modelexplícito ejecuta directamente ese proveedor/modelo. El modelo debe tener capacidad de imagen en el catálogo de modelos o en la configuración del proveedor. - Los comandos de ejecución sin estado usan la ruta local de forma predeterminada.
- Los comandos de estado administrado por Gateway usan el Gateway de forma predeterminada.
- La ruta local normal no requiere que el Gateway esté en ejecución.
Modelo
Usamodel para inferencia de texto respaldada por proveedores e inspección de modelos/proveedores.
model runreutiliza el tiempo de ejecución del agente para que las sobrescrituras de proveedor/modelo se comporten como en la ejecución normal del agente.model auth login,model auth logoutymodel auth statusadministran el estado guardado de autenticación del proveedor.
Imagen
Usaimage para generación, edición y descripción.
- Usa
image edital partir de archivos de entrada existentes. - Para
image describe,--modeldebe ser un<provider/model>con capacidad de imagen. - Para modelos locales de visión de Ollama, primero descarga el modelo y establece
OLLAMA_API_KEYen cualquier valor de marcador de posición, por ejemploollama-local. Consulta Ollama.
Audio
Usaaudio para transcripción de archivos.
audio transcribees para transcripción de archivos, no para administración de sesiones en tiempo real.--modeldebe ser<provider/model>.
TTS
Usatts para síntesis de voz y estado del proveedor TTS.
tts statususa el Gateway de forma predeterminada porque refleja el estado de TTS administrado por Gateway.- Usa
tts providers,tts voicesytts set-providerpara inspeccionar y configurar el comportamiento de TTS.
Video
Usavideo para generación y descripción.
--modeldebe ser<provider/model>paravideo describe.
Web
Usaweb para flujos de trabajo de búsqueda y obtención.
- Usa
web providerspara inspeccionar los proveedores disponibles, configurados y seleccionados.
Embedding
Usaembedding para creación de vectores e inspección del proveedor de embeddings.
Salida JSON
Los comandos infer normalizan la salida JSON bajo un sobre compartido:okcapabilitytransportprovidermodelattemptsoutputserror
Errores comunes
Notas
openclaw capability ...es un alias deopenclaw infer ....