Hugging Face Inference Providers は、単一のルーター API を通じて OpenAI 互換の chat completions を提供します。1 つの token で多数のモデル(DeepSeek、Llama など)にアクセスできます。OpenClaw は OpenAI 互換エンドポイント(chat completions のみ)を使います。text-to-image、embeddings、speech には、代わりに HF inference clients を直接使ってください。Documentation Index
Fetch the complete documentation index at: https://docs.openclaw.ai/llms.txt
Use this file to discover all available pages before exploring further.
- プロバイダ:
huggingface - 認証:
HUGGINGFACE_HUB_TOKENまたはHF_TOKEN(Make calls to Inference Providers 権限を持つ fine-grained token) - API: OpenAI 互換(
https://router.huggingface.co/v1) - 課金: 単一の HF token。pricing は free tier 付きで provider 料金に従います。
はじめに
fine-grained token を作成
Hugging Face Settings Tokens にアクセスし、新しい fine-grained token を作成してください。
デフォルトモデルを選ぶ
Default Hugging Face model ドロップダウンで、使いたいモデルを選んでください。有効な token がある場合は Inference API から一覧が読み込まれ、そうでなければ組み込み一覧が表示されます。選択内容はデフォルトモデルとして保存されます。後から config でデフォルトモデルを設定または変更することもできます:
非対話セットアップ
huggingface/deepseek-ai/DeepSeek-R1 がデフォルトモデルとして設定されます。
モデル ID
モデル参照はhuggingface/<org>/<model> 形式(Hub 形式 ID)です。以下の一覧は GET https://router.huggingface.co/v1/models に基づくものです。あなたのカタログにはさらに多く含まれている場合があります。
| モデル | 参照(huggingface/ を先頭に付ける) |
|---|---|
| DeepSeek R1 | deepseek-ai/DeepSeek-R1 |
| DeepSeek V3.2 | deepseek-ai/DeepSeek-V3.2 |
| Qwen3 8B | Qwen/Qwen3-8B |
| Qwen2.5 7B Instruct | Qwen/Qwen2.5-7B-Instruct |
| Qwen3 32B | Qwen/Qwen3-32B |
| Llama 3.3 70B Instruct | meta-llama/Llama-3.3-70B-Instruct |
| Llama 3.1 8B Instruct | meta-llama/Llama-3.1-8B-Instruct |
| GPT-OSS 120B | openai/gpt-oss-120b |
| GLM 4.7 | zai-org/GLM-4.7 |
| Kimi K2.5 | moonshotai/Kimi-K2.5 |
高度な設定
モデル検出とオンボーディングのドロップダウン
モデル検出とオンボーディングのドロップダウン
モデル名、エイリアス、ポリシーサフィックス
モデル名、エイリアス、ポリシーサフィックス
- API 由来の名前: モデル表示名は、API が
name,title,display_nameを返した場合、それを GET /v1/models から hydrate します。そうでない場合はモデル ID から導出されます(例:deepseek-ai/DeepSeek-R1は「DeepSeek R1」になります)。 - 表示名を上書き: config でモデルごとにカスタムラベルを設定すると、CLI や UI 上で好きな表示名にできます:
-
ポリシーサフィックス: OpenClaw の同梱 Hugging Face ドキュメントと helper は現在、この 2 つのサフィックスを組み込みポリシーバリアントとして扱います:
:fastest— 最大スループット:cheapest— 出力トークン単価が最安
models.providers.huggingface.modelsに別エントリとして追加することも、model.primaryにサフィックス付きで設定することもできます。デフォルトの provider 順序は Inference Provider settings でも設定できます(サフィックスなし = その順序を使う)。 -
Config merge:
models.providers.huggingface.models内の既存エントリ(例:models.json内)は、config マージ時に保持されます。そのため、そこに設定したカスタムname,alias, またはモデルオプションは保持されます。
環境と daemon セットアップ
環境と daemon セットアップ
Gateway を daemon(launchd / systemd)として動かす場合、
HUGGINGFACE_HUB_TOKEN または HF_TOKEN がそのプロセスから利用可能であることを確認してください(たとえば ~/.openclaw/.env または env.shellEnv 経由)。OpenClaw は
HUGGINGFACE_HUB_TOKEN と HF_TOKEN の両方を env var エイリアスとして受け付けます。どちらでも動作します。両方が設定されている場合は HUGGINGFACE_HUB_TOKEN が優先されます。Config: Qwen fallback 付き DeepSeek R1
Config: Qwen fallback 付き DeepSeek R1
Config: cheapest と fastest バリアント付き Qwen
Config: cheapest と fastest バリアント付き Qwen
Config: エイリアス付き DeepSeek + Llama + GPT-OSS
Config: エイリアス付き DeepSeek + Llama + GPT-OSS
Config: ポリシーサフィックス付き複数の Qwen と DeepSeek
Config: ポリシーサフィックス付き複数の Qwen と DeepSeek
関連
モデル選択
すべてのプロバイダ、モデル参照、failover 動作の概要。
モデル選択
モデルの選び方と設定方法。
Inference Providers docs
公式 Hugging Face Inference Providers ドキュメント。
設定
完全な設定リファレンス。