Documentation Index
Fetch the complete documentation index at: https://docs.openclaw.ai/llms.txt
Use this file to discover all available pages before exploring further.
openclaw infer est la surface headless canonique pour les workflows d’inférence adossés à des fournisseurs.
Il expose volontairement des familles de capacités, pas les noms RPC bruts du Gateway ni les identifiants bruts d’outils d’agent.
Transformer infer en Skill
Copiez-collez ceci dans un agent :- associer les intentions utilisateur courantes à la bonne sous-commande infer
- inclure quelques exemples infer canoniques pour les workflows qu’elle couvre
- préférer
openclaw infer ...dans les exemples et suggestions - éviter de redocumenter toute la surface infer dans le corps de la Skill
openclaw infer model runopenclaw infer image generateopenclaw infer audio transcribeopenclaw infer tts convertopenclaw infer web searchopenclaw infer embedding create
Pourquoi utiliser infer
openclaw infer fournit une CLI cohérente pour les tâches d’inférence adossées à des fournisseurs dans OpenClaw.
Avantages :
- Utilisez les fournisseurs et modèles déjà configurés dans OpenClaw au lieu de câbler des wrappers ponctuels pour chaque backend.
- Gardez les workflows de modèle, image, transcription audio, TTS, vidéo, web et embedding sous une seule arborescence de commandes.
- Utilisez une forme de sortie
--jsonstable pour les scripts, l’automatisation et les workflows pilotés par agent. - Préférez une surface OpenClaw de première partie lorsque la tâche consiste fondamentalement à « exécuter une inférence ».
- Utilisez le chemin local normal sans exiger le Gateway pour la plupart des commandes infer.
openclaw infer ... une fois les tests de fournisseur de plus bas niveau au vert. Cela exerce la CLI distribuée, le chargement de configuration, la résolution de l’agent par défaut, l’activation des plugins groupés et le runtime de capacités partagé avant l’émission de la requête au fournisseur.
Arborescence des commandes
Tâches courantes
Ce tableau associe les tâches d’inférence courantes à la commande infer correspondante.| Tâche | Commande | Remarques |
|---|---|---|
| Exécuter un prompt texte/modèle | openclaw infer model run --prompt "..." --json | Utilise le chemin local normal par défaut |
| Exécuter un prompt de modèle sur des images | openclaw infer model run --prompt "Describe this" --file ./image.png --model provider/model | Répétez --file pour plusieurs entrées image |
| Générer une image | openclaw infer image generate --prompt "..." --json | Utilisez image edit en partant d’un fichier existant |
| Décrire un fichier image | openclaw infer image describe --file ./image.png --prompt "..." --json | --model doit être un <provider/model> capable de traiter des images |
| Transcrire de l’audio | openclaw infer audio transcribe --file ./memo.m4a --json | --model doit être <provider/model> |
| Synthétiser la parole | openclaw infer tts convert --text "..." --output ./speech.mp3 --json | tts status est orienté Gateway |
| Générer une vidéo | openclaw infer video generate --prompt "..." --json | Prend en charge les indications de fournisseur comme --resolution |
| Décrire un fichier vidéo | openclaw infer video describe --file ./clip.mp4 --json | --model doit être <provider/model> |
| Rechercher sur le web | openclaw infer web search --query "..." --json | |
| Récupérer une page web | openclaw infer web fetch --url https://example.com --json | |
| Créer des embeddings | openclaw infer embedding create --text "..." --json |
Comportement
openclaw infer ...est la surface CLI principale pour ces workflows.- Utilisez
--jsonlorsque la sortie sera consommée par une autre commande ou un script. - Utilisez
--providerou--model provider/modellorsqu’un backend spécifique est requis. - Utilisez
model run --thinking <level>pour transmettre un niveau de réflexion/raisonnement ponctuel (off,minimal,low,medium,high,adaptive,xhighoumax) tout en gardant l’exécution brute. - Pour
image describe,audio transcribeetvideo describe,--modeldoit utiliser la forme<provider/model>. - Pour
image describe, un--modelexplicite exécute directement ce fournisseur/modèle. Le modèle doit être capable de traiter des images dans le catalogue de modèles ou la configuration du fournisseur.codex/<model>exécute un tour borné de compréhension d’image du serveur d’application Codex ;openai-codex/<model>utilise le chemin du fournisseur OAuth OpenAI Codex. - Les commandes d’exécution sans état utilisent local par défaut.
- Les commandes d’état gérées par le Gateway utilisent le Gateway par défaut.
- Le chemin local normal n’exige pas que le Gateway soit en cours d’exécution.
model runlocal est une complétion fournisseur ponctuelle légère. Il résout le modèle et l’authentification de l’agent configuré, mais ne démarre pas de tour d’agent de chat, ne charge pas d’outils et n’ouvre pas les serveurs MCP groupés.model run --fileaccepte les fichiers image, détecte leur type MIME et les envoie avec le prompt fourni au modèle sélectionné. Répétez--filepour plusieurs images.model run --filerejette les entrées non image. Utilisezinfer audio transcribepour les fichiers audio etinfer video describepour les fichiers vidéo.model run --gatewayexerce le routage Gateway, l’authentification enregistrée, la sélection de fournisseur et le runtime intégré, mais s’exécute toujours comme une sonde de modèle brute : il envoie le prompt fourni et les éventuelles pièces jointes image sans transcript de session antérieur, contexte bootstrap/AGENTS, assemblage du moteur de contexte, outils ou serveurs MCP groupés.model run --gateway --model <provider/model>exige un identifiant Gateway d’opérateur approuvé, car la requête demande au Gateway d’exécuter un remplacement ponctuel de fournisseur/modèle.model run --thinkinglocal utilise le chemin léger de complétion fournisseur ; les niveaux propres aux fournisseurs commeadaptiveetmaxsont mappés au niveau de complétion simple portable le plus proche.
Modèle
Utilisezmodel pour l’inférence texte adossée à un fournisseur et l’inspection des modèles/fournisseurs.
<provider/model> complètes pour effectuer un smoke-test d’un fournisseur spécifique sans démarrer le Gateway ni charger toute la surface d’outils de l’agent :
model runlocal est le smoke CLI le plus étroit pour l’état de santé fournisseur/modèle/authentification, car, pour les fournisseurs non-Codex, il envoie uniquement le prompt fourni au modèle sélectionné.model run --model <provider/model>local peut utiliser les lignes exactes du catalogue statique groupé depuismodels list --allavant que ce fournisseur soit écrit dans la configuration. L’authentification du fournisseur reste requise ; les identifiants manquants échouent comme erreurs d’authentification, pas commeUnknown model.- Pour les sondes de raisonnement Mistral Medium 3.5, laissez la température non définie/par défaut. Mistral rejette
reasoning_effort="high"plustemperature: 0; utilisezmistral/mistral-medium-3-5avec la température par défaut ou une valeur de mode raisonnement non nulle comme0.7. - Les sondes locales
openai-codex/*sont l’exception étroite : OpenClaw ajoute une instruction système minimale afin que le transport Codex Responses puisse renseigner son champinstructionsrequis, sans ajouter le contexte complet de l’agent, les outils, la mémoire ou le transcript de session. model run --filelocal garde ce chemin léger et joint le contenu image directement au message utilisateur unique. Les fichiers image courants comme PNG, JPEG et WebP fonctionnent lorsque leur type MIME est détecté commeimage/*; les fichiers non pris en charge ou non reconnus échouent avant l’appel au fournisseur.model run --fileest préférable lorsque vous voulez tester directement le modèle texte multimodal sélectionné. Utilisezinfer image describelorsque vous voulez la sélection de fournisseur de compréhension d’image d’OpenClaw et le routage par défaut du modèle image.- Le modèle sélectionné doit prendre en charge les entrées image ; les modèles texte uniquement peuvent rejeter la requête au niveau du fournisseur.
model run --promptdoit contenir du texte non composé uniquement d’espaces ; les prompts vides sont rejetés avant l’appel aux fournisseurs locaux ou au Gateway.model runlocal se termine avec un code non nul lorsque le fournisseur ne renvoie aucune sortie texte, afin que les fournisseurs locaux inaccessibles et les complétions vides ne ressemblent pas à des sondes réussies.- Utilisez
model run --gatewaylorsque vous devez tester le routage Gateway, la configuration du runtime d’agent ou l’état fournisseur géré par le Gateway tout en gardant l’entrée du modèle brute. Utilisezopenclaw agentou les surfaces de chat lorsque vous voulez le contexte complet de l’agent, les outils, la mémoire et le transcript de session. model auth login,model auth logoutetmodel auth statusgèrent l’état d’authentification fournisseur enregistré.
Image
Utilisezimage pour la génération, la modification et la description.
-
Utilisez
image editlorsque vous partez de fichiers d’entrée existants. -
Utilisez
--size,--aspect-ratioou--resolutionavecimage editpour les fournisseurs/modèles qui prennent en charge les indications de géométrie lors des modifications d’images de référence. -
Utilisez
--output-format png --background transparentavec--model openai/gpt-image-1.5pour produire une sortie PNG OpenAI avec arrière-plan transparent ;--openai-backgroundreste disponible comme alias propre à OpenAI. Les fournisseurs qui ne déclarent pas la prise en charge de l’arrière-plan signalent l’indication comme une surcharge ignorée. -
Utilisez
image providers --jsonpour vérifier quels fournisseurs d’images intégrés sont détectables, configurés, sélectionnés, et quelles capacités de génération/modification chaque fournisseur expose. -
Utilisez
image generate --model <provider/model> --jsoncomme test de fumée CLI en direct le plus ciblé pour les changements de génération d’images. Exemple :La réponse JSON indiqueok,provider,model,attemptset les chemins de sortie écrits. Lorsque--outputest défini, l’extension finale peut suivre le type MIME renvoyé par le fournisseur. -
Pour
image describeetimage describe-many, utilisez--promptafin de donner au modèle de vision une instruction propre à la tâche, comme l’OCR, la comparaison, l’inspection d’interface utilisateur ou un sous-titrage concis. -
Utilisez
--timeout-msavec les modèles de vision locaux lents ou les démarrages à froid d’Ollama. -
Pour
image describe,--modeldoit être un<provider/model>compatible avec l’image. -
Pour les modèles de vision Ollama locaux, récupérez d’abord le modèle et définissez
OLLAMA_API_KEYsur n’importe quelle valeur d’espace réservé, par exempleollama-local. Consultez Ollama.
Audio
Utilisezaudio pour la transcription de fichiers.
audio transcribesert à transcrire des fichiers, pas à gérer des sessions en temps réel.--modeldoit être<provider/model>.
TTS
Utiliseztts pour la synthèse vocale et l’état du fournisseur TTS.
tts statusutilise Gateway par défaut, car il reflète l’état TTS géré par Gateway.- Utilisez
tts providers,tts voicesettts set-providerpour inspecter et configurer le comportement TTS.
Vidéo
Utilisezvideo pour la génération et la description.
video generateaccepte--size,--aspect-ratio,--resolution,--duration,--audio,--watermarket--timeout-ms, puis les transmet au runtime de génération vidéo.--modeldoit être<provider/model>pourvideo describe.
Web
Utilisezweb pour les flux de recherche et de récupération.
- Utilisez
web providerspour inspecter les fournisseurs disponibles, configurés et sélectionnés.
Plongement vectoriel
Utilisezembedding pour la création de vecteurs et l’inspection des fournisseurs de plongements vectoriels.
Sortie JSON
Les commandes d’inférence normalisent la sortie JSON dans une enveloppe partagée :okcapabilitytransportprovidermodelattemptsoutputserror
outputs contient les fichiers écrits par OpenClaw. Utilisez
path, mimeType, size et toute dimension propre au média dans ce tableau
pour l’automatisation, au lieu d’analyser la sortie stdout lisible par l’humain.
Pièges courants
Remarques
openclaw capability ...est un alias deopenclaw infer ....