CLI commands
CLI инференса
openclaw infer — каноническая headless-поверхность для рабочих процессов инференса, поддерживаемых провайдерами.
Она намеренно раскрывает семейства возможностей, а не сырые имена RPC Gateway и не сырые идентификаторы инструментов агента.
Превратите infer в skill
Скопируйте и вставьте это агенту:
Read https://docs.openclaw.ai/cli/infer, then create a skill that routes my common workflows to `openclaw infer`.Focus on model runs, image generation, video generation, audio transcription, TTS, web search, and embeddings.Хороший skill на основе infer должен:
- сопоставлять распространенные намерения пользователя с правильной подкомандой infer
- включать несколько канонических примеров infer для рабочих процессов, которые он покрывает
- предпочитать
openclaw infer ...в примерах и рекомендациях - избегать повторного документирования всей поверхности infer внутри тела skill
Типичное покрытие skill, сфокусированного на infer:
openclaw infer model runopenclaw infer image generateopenclaw infer audio transcribeopenclaw infer tts convertopenclaw infer web searchopenclaw infer embedding create
Зачем использовать infer
openclaw infer предоставляет единый согласованный CLI для задач инференса, поддерживаемых провайдерами внутри OpenClaw.
Преимущества:
- Используйте провайдеры и модели, уже настроенные в OpenClaw, вместо настройки одноразовых оберток для каждого backend.
- Держите рабочие процессы с моделями, изображениями, аудиотранскрибацией, TTS, видео, вебом и embeddings в одном дереве команд.
- Используйте стабильную форму вывода
--jsonдля скриптов, автоматизации и рабочих процессов, управляемых агентами. - Предпочитайте первичную поверхность OpenClaw, когда задача по сути сводится к "запустить инференс".
- Используйте обычный локальный путь без необходимости Gateway для большинства команд infer.
Для сквозных проверок провайдера предпочитайте openclaw infer ..., когда низкоуровневые
тесты провайдера уже проходят. Это проверяет поставляемый CLI, загрузку конфигурации,
разрешение агента по умолчанию, активацию встроенного Plugin и общую среду выполнения
возможностей до отправки запроса провайдеру.
Дерево команд
openclaw infer list inspect model run list inspect providers auth login auth logout auth status image generate edit describe describe-many providers audio transcribe providers tts convert voices providers status enable disable set-provider video generate describe providers web search fetch providers embedding create providersРаспространенные задачи
Эта таблица сопоставляет распространенные задачи инференса с соответствующей командой infer.
| Задача | Команда | Примечания |
|---|---|---|
| Запустить текстовый/model prompt | openclaw infer model run --prompt "..." --json |
По умолчанию использует обычный локальный путь |
| Запустить model prompt на изображениях | openclaw infer model run --prompt "Describe this" --file ./image.png --model provider/model |
Повторите --file для нескольких входных изображений |
| Сгенерировать изображение | openclaw infer image generate --prompt "..." --json |
Используйте image edit, если начинаете с существующего файла |
| Описать файл изображения или URL | openclaw infer image describe --file ./image.png --prompt "..." --json |
--model должен быть image-capable <provider/model> |
| Транскрибировать аудио | openclaw infer audio transcribe --file ./memo.m4a --json |
--model должен быть <provider/model> |
| Синтезировать речь | openclaw infer tts convert --text "..." --output ./speech.mp3 --json |
tts status ориентирован на Gateway |
| Сгенерировать видео | openclaw infer video generate --prompt "..." --json |
Поддерживает подсказки провайдера, такие как --resolution |
| Описать видеофайл | openclaw infer video describe --file ./clip.mp4 --json |
--model должен быть <provider/model> |
| Искать в вебе | openclaw infer web search --query "..." --json |
|
| Получить веб-страницу | openclaw infer web fetch --url https://example.com --json |
|
| Создать embeddings | openclaw infer embedding create --text "..." --json |
Поведение
openclaw infer ...— основная поверхность CLI для этих рабочих процессов.- Используйте
--json, когда вывод будет потребляться другой командой или скриптом. - Используйте
--providerили--model provider/model, когда требуется конкретный backend. - Используйте
model run --thinking <level>, чтобы передать одноразовый уровень thinking/reasoning (off,minimal,low,medium,high,adaptive,xhighилиmax), сохранив запуск сырым. - Для
image describe,audio transcribeиvideo describe--modelдолжен использовать форму<provider/model>. - Для
image describe--fileпринимает локальные пути и HTTP(S) URL изображений. Удаленные URL используют обычную SSRF-политику получения медиа. - Для
image describeявный--modelзапускает этот provider/model напрямую. Модель должна быть image-capable в каталоге моделей или конфигурации провайдера.codex/<model>запускает ограниченный ход понимания изображений через app-server Codex;openai/<model>использует путь провайдера OpenAI с аутентификацией через API-key или ChatGPT/Codex OAuth. - Команды stateless-выполнения по умолчанию локальные.
- Команды состояния, управляемого Gateway, по умолчанию используют Gateway.
- Обычный локальный путь не требует запущенного Gateway.
- Локальный
model run— компактное одноразовое completion провайдера. Он разрешает настроенную модель агента и auth, но не запускает ход chat-agent, не загружает инструменты и не открывает встроенные MCP-серверы. model run --fileпринимает файлы изображений, определяет их MIME type и отправляет их вместе с переданным prompt в выбранную модель. Повторите--fileдля нескольких изображений.model run --fileотклоняет входные данные, не являющиеся изображениями. Используйтеinfer audio transcribeдля аудиофайлов иinfer video describeдля видеофайлов.model run --gatewayпроверяет маршрутизацию Gateway, сохраненную auth, выбор провайдера и встроенную среду выполнения, но все равно выполняется как сырой пробный запуск модели: он отправляет переданный prompt и любые вложения изображений без предыдущего transcript сеанса, bootstrap/AGENTS context, сборки context-engine, инструментов или встроенных MCP-серверов.model run --gateway --model <provider/model>требует доверенные учетные данные оператора Gateway, потому что запрос просит Gateway выполнить одноразовое переопределение provider/model.- Локальный
model run --thinkingиспользует компактный путь provider-completion; специфичные для провайдера уровни, такие какadaptiveиmax, сопоставляются с ближайшим переносимым уровнем simple-completion.
Модель
Используйте model для текстового инференса, поддерживаемого провайдерами, и инспекции модели/провайдера.
openclaw infer model run --prompt "Reply with exactly: smoke-ok" --jsonopenclaw infer model run --prompt "Summarize this changelog entry" --model openai/gpt-5.4 --jsonopenclaw infer model run --prompt "Describe this image in one sentence" --file ./photo.jpg --model google/gemini-2.5-flash --jsonopenclaw infer model run --prompt "Use more reasoning here" --thinking high --jsonopenclaw infer model providers --jsonopenclaw infer model inspect --name gpt-5.5 --jsonИспользуйте полные ссылки <provider/model>, чтобы выполнить smoke-test конкретного провайдера без
запуска Gateway или загрузки полной поверхности инструментов агента:
openclaw infer model run --local --model anthropic/claude-sonnet-4-6 --prompt "Reply with exactly: pong" --jsonopenclaw infer model run --local --model cerebras/zai-glm-4.7 --prompt "Reply with exactly: pong" --jsonopenclaw infer model run --local --model google/gemini-2.5-flash --prompt "Reply with exactly: pong" --jsonopenclaw infer model run --local --model groq/llama-3.1-8b-instant --prompt "Reply with exactly: pong" --jsonopenclaw infer model run --local --model mistral/mistral-medium-3-5 --prompt "Reply with exactly: pong" --jsonopenclaw infer model run --local --model mistral/mistral-small-latest --prompt "Reply with exactly: pong" --jsonopenclaw infer model run --local --model openai/gpt-5.5 --prompt "Reply with exactly: pong" --jsonopenclaw infer model run --local --model ollama/qwen2.5vl:7b --prompt "Describe this image." --file ./photo.jpg --jsonПримечания:
- Локальный
model run— самый узкий CLI smoke для проверки работоспособности provider/model/auth, потому что для не-Codex провайдеров он отправляет только переданный prompt в выбранную модель. - Локальный
model run --model <provider/model>может использовать точные встроенные статические строки каталога изmodels list --allдо того, как этот провайдер записан в конфигурацию. Auth провайдера все равно требуется; отсутствующие учетные данные завершаются ошибками auth, а неUnknown model. - Для reasoning-проб Mistral Medium 3.5 оставьте temperature неустановленной/по умолчанию. Mistral отклоняет
reasoning_effort="high"плюсtemperature: 0; используйтеmistral/mistral-medium-3-5с temperature по умолчанию или ненулевым значением reasoning-mode, например0.7. - Локальные пробы Codex Responses — узкое исключение: OpenClaw добавляет минимальную системную инструкцию, чтобы транспорт мог заполнить обязательное поле
instructions, не добавляя полный контекст агента, инструменты, память или transcript сеанса. - Локальный
model run --fileсохраняет этот компактный путь и прикрепляет содержимое изображения напрямую к единственному сообщению пользователя. Распространенные файлы изображений, такие как PNG, JPEG и WebP, работают, когда их MIME type определяется какimage/*; неподдерживаемые или нераспознанные файлы завершаются ошибкой до вызова провайдера. model run --fileлучше всего подходит, когда вы хотите напрямую протестировать выбранную multimodal text model. Используйтеinfer image describe, когда вам нужны выбор OpenClaw провайдера для понимания изображений и маршрутизация image-model по умолчанию.- Выбранная модель должна поддерживать ввод изображений; text-only модели могут отклонить запрос на уровне провайдера.
model run --promptдолжен содержать непустой не-whitespace текст; пустые prompts отклоняются до вызова локальных провайдеров или Gateway.- Локальный
model runзавершается с ненулевым кодом, когда провайдер не возвращает текстовый вывод, поэтому недоступные локальные провайдеры и пустые completions не выглядят как успешные пробы. - Используйте
model run --gateway, когда нужно протестировать маршрутизацию Gateway, настройку agent-runtime или состояние провайдера, управляемое Gateway, сохраняя при этом сырой ввод модели. Используйтеopenclaw agentили chat-поверхности, когда нужен полный контекст агента, инструменты, память и transcript сеанса. model auth login,model auth logoutиmodel auth statusуправляют сохраненным состоянием auth провайдера.
Изображение
Используйте image для генерации, редактирования и описания.
openclaw infer image generate --prompt "friendly lobster illustration" --jsonopenclaw infer image generate --prompt "cinematic product photo of headphones" --jsonopenclaw infer image generate --model openai/gpt-image-1.5 --output-format png --background transparent --prompt "simple red circle sticker on a transparent background" --jsonopenclaw infer image generate --model openai/gpt-image-2 --quality low --openai-moderation low --prompt "low-cost draft poster" --jsonopenclaw infer image generate --prompt "slow image backend" --timeout-ms 180000 --jsonopenclaw infer image edit --file ./logo.png --model openai/gpt-image-1.5 --output-format png --background transparent --prompt "keep the logo, remove the background" --jsonopenclaw infer image edit --file ./poster.png --prompt "make this a vertical story ad" --size 2160x3840 --aspect-ratio 9:16 --resolution 4K --jsonopenclaw infer image describe --file ./photo.jpg --jsonopenclaw infer image describe --file https://example.com/photo.png --jsonopenclaw infer image describe --file ./receipt.jpg --prompt "Extract the merchant, date, and total" --jsonopenclaw infer image describe-many --file ./before.png --file ./after.png --prompt "Compare the screenshots and list visible UI changes" --jsonopenclaw infer image describe --file ./ui-screenshot.png --model openai/gpt-5.4-mini --jsonopenclaw infer image describe --file ./photo.jpg --model ollama/qwen2.5vl:7b --prompt "Describe the image in one sentence" --timeout-ms 300000 --jsonПримечания:
-
Используйте
image edit, когда начинаете с существующих входных файлов. -
Используйте
--size,--aspect-ratioили--resolutionсimage editдля провайдеров/моделей, которые поддерживают подсказки геометрии при редактировании по эталонным изображениям. -
Используйте
--output-format png --background transparentс--model openai/gpt-image-1.5для вывода OpenAI PNG с прозрачным фоном;--openai-backgroundостается доступным как специфичный для OpenAI псевдоним. Провайдеры, которые не заявляют поддержку фона, сообщают подсказку как проигнорированное переопределение. -
Используйте
--quality low|medium|high|autoдля провайдеров, которые поддерживают подсказки качества изображения, включая OpenAI. OpenAI также принимает--openai-moderation low|autoдля специфичной для провайдера подсказки модерации. -
Используйте
image providers --json, чтобы проверить, какие встроенные провайдеры изображений обнаруживаются, настроены, выбраны и какие возможности генерации/редактирования предоставляет каждый провайдер. -
Используйте
image generate --model <provider/model> --jsonкак самый узкий живой CLI smoke для изменений генерации изображений. Пример:bash openclaw infer image providers --jsonopenclaw infer image generate \ --model google/gemini-3.1-flash-image-preview \ --prompt "Minimal flat test image: one blue square on a white background, no text." \ --output ./openclaw-infer-image-smoke.png \ --jsonJSON-ответ сообщает
ok,provider,model,attemptsи записанные пути вывода. Когда задан--output, итоговое расширение может соответствовать MIME-типу, возвращенному провайдером. -
Для
image describeиimage describe-manyиспользуйте--prompt, чтобы дать модели зрения инструкцию для конкретной задачи, например OCR, сравнение, инспекцию UI или краткую подпись. -
Используйте
--timeout-msс медленными локальными моделями зрения или холодными запусками Ollama. -
Для
image describe--modelдолжен быть моделью<provider/model>с поддержкой изображений. -
Для локальных моделей зрения Ollama сначала загрузите модель и задайте
OLLAMA_API_KEYлюбым значением-заполнителем, напримерollama-local. См. Ollama.
Аудио
Используйте audio для транскрибации файлов.
openclaw infer audio transcribe --file ./memo.m4a --jsonopenclaw infer audio transcribe --file ./team-sync.m4a --language en --prompt "Focus on names and action items" --jsonopenclaw infer audio transcribe --file ./memo.m4a --model openai/whisper-1 --jsonПримечания:
audio transcribeпредназначен для транскрибации файлов, а не для управления сеансами в реальном времени.--modelдолжен быть<provider/model>.
TTS
Используйте tts для синтеза речи и состояния провайдера TTS.
openclaw infer tts convert --text "hello from openclaw" --output ./hello.mp3 --jsonopenclaw infer tts convert --text "Your build is complete" --output ./build-complete.mp3 --jsonopenclaw infer tts providers --jsonopenclaw infer tts status --jsonПримечания:
tts statusпо умолчанию использует Gateway, потому что отражает состояние TTS, управляемое Gateway.- Используйте
tts providers,tts voicesиtts set-provider, чтобы просматривать и настраивать поведение TTS.
Видео
Используйте video для генерации и описания.
openclaw infer video generate --prompt "cinematic sunset over the ocean" --jsonopenclaw infer video generate --prompt "slow drone shot over a forest lake" --resolution 768P --duration 6 --jsonopenclaw infer video describe --file ./clip.mp4 --jsonopenclaw infer video describe --file ./clip.mp4 --model openai/gpt-5.4-mini --jsonПримечания:
video generateпринимает--size,--aspect-ratio,--resolution,--duration,--audio,--watermarkи--timeout-msи передает их среде выполнения генерации видео.--modelдолжен быть<provider/model>дляvideo describe.
Веб
Используйте web для рабочих процессов поиска и получения данных.
openclaw infer web search --query "OpenClaw docs" --jsonopenclaw infer web search --query "OpenClaw infer web providers" --jsonopenclaw infer web fetch --url https://docs.openclaw.ai/cli/infer --jsonopenclaw infer web providers --jsonПримечания:
- Используйте
web providers, чтобы просмотреть доступных, настроенных и выбранных провайдеров.
Эмбеддинг
Используйте embedding для создания векторов и инспекции провайдера эмбеддингов.
openclaw infer embedding create --text "friendly lobster" --jsonopenclaw infer embedding create --text "customer support ticket: delayed shipment" --model openai/text-embedding-3-large --jsonopenclaw infer embedding providers --jsonВывод JSON
Команды Infer нормализуют вывод JSON в общей оболочке:
{ "ok": true, "capability": "image.generate", "transport": "local", "provider": "openai", "model": "gpt-image-2", "attempts": [], "outputs": []}Поля верхнего уровня стабильны:
okcapabilitytransportprovidermodelattemptsoutputserror
Для команд генерации медиа outputs содержит файлы, записанные OpenClaw. Используйте
path, mimeType, size и любые специфичные для медиа размеры в этом массиве
для автоматизации вместо разбора человекочитаемого stdout.
Распространенные ошибки
# Badopenclaw infer media image generate --prompt "friendly lobster" # Goodopenclaw infer image generate --prompt "friendly lobster"# Badopenclaw infer audio transcribe --file ./memo.m4a --model whisper-1 --json # Goodopenclaw infer audio transcribe --file ./memo.m4a --model openai/whisper-1 --jsonПримечания
openclaw capability ...— псевдоним дляopenclaw infer ....