الانتقال إلى المحتوى الرئيسي

Inference CLI

openclaw infer هو السطح القياسي بدون واجهة interactive لسير عمل الاستدلال المدعوم من المزوّد. وهو يتعمد عرض عائلات القدرات، لا أسماء RPC الخام الخاصة بـ gateway ولا معرّفات أدوات الوكيل الخام.

حوّل infer إلى Skill

انسخ هذا والصقه إلى وكيل:
Read https://docs.openclaw.ai/cli/infer, then create a skill that routes my common workflows to `openclaw infer`.
Focus on model runs, image generation, video generation, audio transcription, TTS, web search, and embeddings.
يجب أن تقوم Skill جيدة تعتمد على infer بما يلي:
  • ربط نوايا المستخدم الشائعة بالأمر الفرعي الصحيح في infer
  • تضمين بعض أمثلة infer القياسية لسير العمل التي تغطيها
  • تفضيل openclaw infer ... في الأمثلة والاقتراحات
  • تجنب إعادة توثيق سطح infer بالكامل داخل متن Skill
التغطية النموذجية لـ Skill تركز على infer:
  • openclaw infer model run
  • openclaw infer image generate
  • openclaw infer audio transcribe
  • openclaw infer tts convert
  • openclaw infer web search
  • openclaw infer embedding create

لماذا تستخدم infer

يوفر openclaw infer واجهة CLI واحدة ومتسقة لمهام الاستدلال المدعومة من المزوّد داخل OpenClaw. الفوائد:
  • استخدم المزوّدين والنماذج المضبوطة مسبقًا في OpenClaw بدلًا من توصيل مغلفات مخصصة منفصلة لكل واجهة خلفية.
  • حافظ على سير عمل النموذج، والصور، ونسخ الصوت، وTTS، والفيديو، والويب، والتضمين ضمن شجرة أوامر واحدة.
  • استخدم صيغة إخراج --json ثابتة للنصوص البرمجية، والأتمتة، وسير العمل الذي يقوده الوكيل.
  • فضّل سطح OpenClaw أصليًا عندما تكون المهمة في جوهرها هي “تشغيل استدلال”.
  • استخدم المسار المحلي المعتاد من دون الحاجة إلى gateway لمعظم أوامر infer.

شجرة الأوامر

 openclaw infer
  list
  inspect

  model
    run
    list
    inspect
    providers
    auth login
    auth logout
    auth status

  image
    generate
    edit
    describe
    describe-many
    providers

  audio
    transcribe
    providers

  tts
    convert
    voices
    providers
    status
    enable
    disable
    set-provider

  video
    generate
    describe
    providers

  web
    search
    fetch
    providers

  embedding
    create
    providers

المهام الشائعة

يربط هذا الجدول مهام الاستدلال الشائعة بأمر infer المقابل.
المهمةالأمرملاحظات
تشغيل مطالبة نص/نموذجopenclaw infer model run --prompt "..." --jsonيستخدم المسار المحلي المعتاد افتراضيًا
إنشاء صورةopenclaw infer image generate --prompt "..." --jsonاستخدم image edit عند البدء من ملف موجود
وصف ملف صورةopenclaw infer image describe --file ./image.png --jsonيجب أن يكون --model من نوع <provider/model> يدعم الصور
نسخ صوت إلى نصopenclaw infer audio transcribe --file ./memo.m4a --jsonيجب أن يكون --model بصيغة <provider/model>
توليد كلامopenclaw infer tts convert --text "..." --output ./speech.mp3 --jsontts status موجه نحو gateway
إنشاء فيديوopenclaw infer video generate --prompt "..." --json
وصف ملف فيديوopenclaw infer video describe --file ./clip.mp4 --jsonيجب أن يكون --model بصيغة <provider/model>
البحث في الويبopenclaw infer web search --query "..." --json
جلب صفحة ويبopenclaw infer web fetch --url https://example.com --json
إنشاء تضميناتopenclaw infer embedding create --text "..." --json

السلوك

  • openclaw infer ... هو سطح CLI الأساسي لهذه التدفقات.
  • استخدم --json عندما يستهلك أمر آخر أو نص برمجي هذا الإخراج.
  • استخدم --provider أو --model provider/model عندما تكون واجهة خلفية محددة مطلوبة.
  • بالنسبة إلى image describe وaudio transcribe وvideo describe، يجب أن يستخدم --model الصيغة <provider/model>.
  • بالنسبة إلى image describe، يؤدي --model الصريح إلى تشغيل ذلك المزوّد/النموذج مباشرة. ويجب أن يكون النموذج قادرًا على التعامل مع الصور في فهرس النماذج أو إعدادات المزوّد.
  • أوامر التنفيذ عديمة الحالة تستخدم المسار المحلي افتراضيًا.
  • أوامر الحالة المُدارة بواسطة Gateway تستخدم gateway افتراضيًا.
  • لا يتطلب المسار المحلي المعتاد تشغيل gateway.

Model

استخدم model للاستدلال النصي المدعوم من المزوّد ولتفحّص النموذج/المزوّد.
openclaw infer model run --prompt "Reply with exactly: smoke-ok" --json
openclaw infer model run --prompt "Summarize this changelog entry" --provider openai --json
openclaw infer model providers --json
openclaw infer model inspect --name gpt-5.4 --json
ملاحظات:
  • يعيد model run استخدام بيئة تشغيل الوكيل بحيث تتصرف تجاوزات المزوّد/النموذج مثل تنفيذ الوكيل المعتاد.
  • تدير model auth login وmodel auth logout وmodel auth status حالة مصادقة المزوّد المحفوظة.

Image

استخدم image للإنشاء، والتحرير، والوصف.
openclaw infer image generate --prompt "friendly lobster illustration" --json
openclaw infer image generate --prompt "cinematic product photo of headphones" --json
openclaw infer image describe --file ./photo.jpg --json
openclaw infer image describe --file ./ui-screenshot.png --model openai/gpt-4.1-mini --json
openclaw infer image describe --file ./photo.jpg --model ollama/qwen2.5vl:7b --json
ملاحظات:
  • استخدم image edit عند البدء من ملفات إدخال موجودة.
  • بالنسبة إلى image describe، يجب أن يكون --model من نوع <provider/model> يدعم الصور.
  • بالنسبة إلى نماذج الرؤية المحلية في Ollama، اسحب النموذج أولًا واضبط OLLAMA_API_KEY على أي قيمة نائبة، مثل ollama-local. راجع Ollama.

Audio

استخدم audio لنسخ الملفات صوتيًا.
openclaw infer audio transcribe --file ./memo.m4a --json
openclaw infer audio transcribe --file ./team-sync.m4a --language en --prompt "Focus on names and action items" --json
openclaw infer audio transcribe --file ./memo.m4a --model openai/whisper-1 --json
ملاحظات:
  • يُستخدم audio transcribe لنسخ الملفات، وليس لإدارة الجلسات الفورية.
  • يجب أن يكون --model بصيغة <provider/model>.

TTS

استخدم tts لتوليف الكلام وحالة مزوّد TTS.
openclaw infer tts convert --text "hello from openclaw" --output ./hello.mp3 --json
openclaw infer tts convert --text "Your build is complete" --output ./build-complete.mp3 --json
openclaw infer tts providers --json
openclaw infer tts status --json
ملاحظات:
  • يستخدم tts status gateway افتراضيًا لأنه يعكس حالة TTS المُدارة بواسطة gateway.
  • استخدم tts providers وtts voices وtts set-provider لتفحّص سلوك TTS وتهيئته.

Video

استخدم video للإنشاء والوصف.
openclaw infer video generate --prompt "cinematic sunset over the ocean" --json
openclaw infer video generate --prompt "slow drone shot over a forest lake" --json
openclaw infer video describe --file ./clip.mp4 --json
openclaw infer video describe --file ./clip.mp4 --model openai/gpt-4.1-mini --json
ملاحظات:
  • يجب أن يكون --model بصيغة <provider/model> في video describe.

Web

استخدم web لتدفقات البحث والجلب.
openclaw infer web search --query "OpenClaw docs" --json
openclaw infer web search --query "OpenClaw infer web providers" --json
openclaw infer web fetch --url https://docs.openclaw.ai/cli/infer --json
openclaw infer web providers --json
ملاحظات:
  • استخدم web providers لتفحّص المزوّدين المتاحين والمهيئين والمحددين.

Embedding

استخدم embedding لإنشاء المتجهات وتفحّص مزوّدات التضمين.
openclaw infer embedding create --text "friendly lobster" --json
openclaw infer embedding create --text "customer support ticket: delayed shipment" --model openai/text-embedding-3-large --json
openclaw infer embedding providers --json

إخراج JSON

تقوم أوامر infer بتوحيد إخراج JSON ضمن غلاف مشترك:
{
  "ok": true,
  "capability": "image.generate",
  "transport": "local",
  "provider": "openai",
  "model": "gpt-image-2",
  "attempts": [],
  "outputs": []
}
الحقول العليا ثابتة:
  • ok
  • capability
  • transport
  • provider
  • model
  • attempts
  • outputs
  • error

الأخطاء الشائعة

# Bad
openclaw infer media image generate --prompt "friendly lobster"

# Good
openclaw infer image generate --prompt "friendly lobster"
# Bad
openclaw infer audio transcribe --file ./memo.m4a --model whisper-1 --json

# Good
openclaw infer audio transcribe --file ./memo.m4a --model openai/whisper-1 --json

ملاحظات

  • openclaw capability ... هو اسم مستعار لـ openclaw infer ....