CLI de inferência
openclaw infer é a superfície headless canônica para fluxos de inferência com suporte de provedor.
Ela expõe intencionalmente famílias de capacidades, não nomes brutos de RPC do Gateway nem IDs brutos de ferramentas de agente.
Transforme infer em uma skill
Copie e cole isto em um agente:- mapear intenções comuns do usuário para o subcomando infer correto
- incluir alguns exemplos canônicos de infer para os fluxos que ela cobre
- preferir
openclaw infer ...em exemplos e sugestões - evitar redocumentar toda a superfície de infer dentro do corpo da skill
openclaw infer model runopenclaw infer image generateopenclaw infer audio transcribeopenclaw infer tts convertopenclaw infer web searchopenclaw infer embedding create
Por que usar infer
openclaw infer fornece uma CLI consistente para tarefas de inferência com suporte de provedor dentro do OpenClaw.
Benefícios:
- Use os provedores e modelos já configurados no OpenClaw em vez de criar wrappers pontuais para cada backend.
- Mantenha fluxos de modelo, imagem, transcrição de áudio, TTS, vídeo, web e embedding sob uma única árvore de comandos.
- Use um formato de saída
--jsonestável para scripts, automação e fluxos dirigidos por agente. - Prefira uma superfície nativa do OpenClaw quando a tarefa for fundamentalmente “executar inferência”.
- Use o caminho local normal sem exigir o Gateway para a maioria dos comandos infer.
Árvore de comandos
Tarefas comuns
Esta tabela mapeia tarefas comuns de inferência para o comando infer correspondente.| Tarefa | Comando | Observações |
|---|---|---|
| Executar um prompt de texto/modelo | openclaw infer model run --prompt "..." --json | Usa o caminho local normal por padrão |
| Gerar uma imagem | openclaw infer image generate --prompt "..." --json | Use image edit ao partir de um arquivo existente |
| Descrever um arquivo de imagem | openclaw infer image describe --file ./image.png --json | --model deve ser um <provider/model> com suporte a imagem |
| Transcrever áudio | openclaw infer audio transcribe --file ./memo.m4a --json | --model deve ser <provider/model> |
| Sintetizar fala | openclaw infer tts convert --text "..." --output ./speech.mp3 --json | tts status é orientado ao Gateway |
| Gerar um vídeo | openclaw infer video generate --prompt "..." --json | |
| Descrever um arquivo de vídeo | openclaw infer video describe --file ./clip.mp4 --json | --model deve ser <provider/model> |
| Pesquisar na web | openclaw infer web search --query "..." --json | |
| Buscar uma página web | openclaw infer web fetch --url https://example.com --json | |
| Criar embeddings | openclaw infer embedding create --text "..." --json |
Comportamento
openclaw infer ...é a principal superfície de CLI para esses fluxos.- Use
--jsonquando a saída for consumida por outro comando ou script. - Use
--providerou--model provider/modelquando um backend específico for necessário. - Para
image describe,audio transcribeevideo describe,--modeldeve usar o formato<provider/model>. - Para
image describe, um--modelexplícito executa diretamente esse provedor/modelo. O modelo deve ter suporte a imagem no catálogo de modelos ou na configuração do provedor. - Comandos de execução stateless usam o modo local por padrão.
- Comandos de estado gerenciado pelo Gateway usam o Gateway por padrão.
- O caminho local normal não exige que o Gateway esteja em execução.
Modelo
Usemodel para inferência de texto com suporte de provedor e inspeção de modelo/provedor.
model runreutiliza o runtime do agente para que substituições de provedor/modelo se comportem como na execução normal do agente.model auth login,model auth logoutemodel auth statusgerenciam o estado salvo de autenticação do provedor.
Imagem
Useimage para geração, edição e descrição.
- Use
image editao partir de arquivos de entrada existentes. - Para
image describe,--modeldeve ser um<provider/model>com suporte a imagem. - Para modelos de visão locais do Ollama, baixe o modelo primeiro e defina
OLLAMA_API_KEYcom qualquer valor placeholder, por exemploollama-local. Veja Ollama.
Áudio
Useaudio para transcrição de arquivos.
audio transcribeé para transcrição de arquivos, não para gerenciamento de sessão em tempo real.--modeldeve ser<provider/model>.
TTS
Usetts para síntese de fala e estado do provedor de TTS.
tts statususa o Gateway por padrão porque reflete o estado de TTS gerenciado pelo Gateway.- Use
tts providers,tts voicesetts set-providerpara inspecionar e configurar o comportamento de TTS.
Vídeo
Usevideo para geração e descrição.
--modeldeve ser<provider/model>paravideo describe.
Web
Useweb para fluxos de pesquisa e busca.
- Use
web providerspara inspecionar provedores disponíveis, configurados e selecionados.
Embedding
Useembedding para criação de vetores e inspeção do provedor de embeddings.
Saída JSON
Os comandos infer normalizam a saída JSON sob um envelope compartilhado:okcapabilitytransportprovidermodelattemptsoutputserror
Armadilhas comuns
Observações
openclaw capability ...é um alias paraopenclaw infer ....