Перейти до основного вмісту

Documentation Index

Fetch the complete documentation index at: https://docs.openclaw.ai/llms.txt

Use this file to discover all available pages before exploring further.

Провайдери Hugging Face Inference надають OpenAI-compatible chat completions через єдиний router API. Ви отримуєте доступ до багатьох моделей (DeepSeek, Llama та інших) з одним токеном. OpenClaw використовує OpenAI-compatible endpoint (лише chat completions); для text-to-image, embeddings або speech використовуйте HF inference clients напряму.
  • Provider: huggingface
  • Auth: HUGGINGFACE_HUB_TOKEN або HF_TOKEN (fine-grained token з дозволом Make calls to Inference Providers)
  • API: OpenAI-compatible (https://router.huggingface.co/v1)
  • Billing: один HF token; pricing відповідає тарифам провайдера з безкоштовним рівнем.

Початок роботи

1

Створіть fine-grained token

Перейдіть до Hugging Face Settings Tokens і створіть новий fine-grained token.
У токена має бути ввімкнено дозвіл Make calls to Inference Providers, інакше API-запити буде відхилено.
2

Запустіть onboarding

Виберіть Hugging Face у списку провайдерів, а потім введіть свій API key, коли буде запитано:
openclaw onboard --auth-choice huggingface-api-key
3

Виберіть типову модель

У списку Default Hugging Face model виберіть потрібну модель. Список завантажується з Inference API, коли у вас є валідний токен; інакше показується вбудований список. Ваш вибір зберігається як типова модель.Ви також можете задати або змінити типову модель пізніше в конфігурації:
{
  agents: {
    defaults: {
      model: { primary: "huggingface/deepseek-ai/DeepSeek-R1" },
    },
  },
}
4

Переконайтеся, що модель доступна

openclaw models list --provider huggingface

Неінтерактивне налаштування

openclaw onboard --non-interactive \
  --mode local \
  --auth-choice huggingface-api-key \
  --huggingface-api-key "$HF_TOKEN"
Це встановить huggingface/deepseek-ai/DeepSeek-R1 як типову модель.

ID моделей

Model ref мають формат huggingface/<org>/<model> (ідентифікатори у стилі Hub). Список нижче отримано з GET https://router.huggingface.co/v1/models; у вашому каталозі може бути більше.
ModelRef (prefix with huggingface/)
DeepSeek R1deepseek-ai/DeepSeek-R1
DeepSeek V3.2deepseek-ai/DeepSeek-V3.2
Qwen3 8BQwen/Qwen3-8B
Qwen2.5 7B InstructQwen/Qwen2.5-7B-Instruct
Qwen3 32BQwen/Qwen3-32B
Llama 3.3 70B Instructmeta-llama/Llama-3.3-70B-Instruct
Llama 3.1 8B Instructmeta-llama/Llama-3.1-8B-Instruct
GPT-OSS 120Bopenai/gpt-oss-120b
GLM 4.7zai-org/GLM-4.7
Kimi K2.5moonshotai/Kimi-K2.5
Ви можете додати :fastest або :cheapest до будь-якого ID моделі. Задайте типовий порядок у налаштуваннях Inference Provider; див. Inference Providers і GET https://router.huggingface.co/v1/models для повного списку.

Розширене налаштування

OpenClaw виявляє моделі, викликаючи Inference endpoint напряму:
GET https://router.huggingface.co/v1/models
(Необов’язково: передайте Authorization: Bearer $HUGGINGFACE_HUB_TOKEN або $HF_TOKEN, щоб отримати повний список; деякі endpoint-и повертають лише підмножину без auth.) Відповідь має стиль OpenAI: { "object": "list", "data": [ { "id": "Qwen/Qwen3-8B", "owned_by": "Qwen", ... }, ... ] }.Коли ви налаштовуєте API key Hugging Face (через onboarding, HUGGINGFACE_HUB_TOKEN або HF_TOKEN), OpenClaw використовує цей GET для виявлення доступних моделей chat completion. Під час інтерактивного setup, після введення токена ви бачите список Default Hugging Face model, заповнений із цього списку (або з вбудованого каталогу, якщо запит завершується помилкою). Під час runtime (наприклад під час запуску Gateway), коли ключ наявний, OpenClaw знову викликає GET https://router.huggingface.co/v1/models, щоб оновити каталог. Список об’єднується з вбудованим каталогом (для metadata на кшталт context window і cost). Якщо запит завершується помилкою або ключ не задано, використовується лише вбудований каталог.
  • Name from API: display name моделі гідратується з GET /v1/models, коли API повертає name, title або display_name; інакше він виводиться з ID моделі (наприклад deepseek-ai/DeepSeek-R1 стає “DeepSeek R1”).
  • Override display name: ви можете задати custom label для кожної моделі в конфігурації, щоб вона відображалася в CLI та UI так, як вам потрібно:
{
  agents: {
    defaults: {
      models: {
        "huggingface/deepseek-ai/DeepSeek-R1": { alias: "DeepSeek R1 (fast)" },
        "huggingface/deepseek-ai/DeepSeek-R1:cheapest": { alias: "DeepSeek R1 (cheap)" },
      },
    },
  },
}
  • Policy suffixes: вбудована документація та helper-и Hugging Face в OpenClaw наразі трактують ці два suffix як вбудовані policy-варіанти:
    • :fastest — найвища пропускна здатність.
    • :cheapest — найнижча вартість за output token.
    Ви можете додавати їх як окремі записи в models.providers.huggingface.models або задавати model.primary із цим suffix. Ви також можете встановити типовий порядок провайдерів у налаштуваннях Inference Provider (без suffix = використовувати цей порядок).
  • Config merge: наявні записи в models.providers.huggingface.models (наприклад у models.json) зберігаються під час merge конфігурації. Тож будь-які custom name, alias або параметри моделі, які ви там задасте, буде збережено.
Якщо Gateway працює як daemon (launchd/systemd), переконайтеся, що HUGGINGFACE_HUB_TOKEN або HF_TOKEN доступний цьому процесу (наприклад у ~/.openclaw/.env або через env.shellEnv).
OpenClaw приймає і HUGGINGFACE_HUB_TOKEN, і HF_TOKEN як alias-и env var. Працює будь-який з них; якщо задано обидва, перевагу має HUGGINGFACE_HUB_TOKEN.
{
  agents: {
    defaults: {
      model: {
        primary: "huggingface/deepseek-ai/DeepSeek-R1",
        fallbacks: ["huggingface/Qwen/Qwen3-8B"],
      },
      models: {
        "huggingface/deepseek-ai/DeepSeek-R1": { alias: "DeepSeek R1" },
        "huggingface/Qwen/Qwen3-8B": { alias: "Qwen3 8B" },
      },
    },
  },
}
{
  agents: {
    defaults: {
      model: { primary: "huggingface/Qwen/Qwen3-8B" },
      models: {
        "huggingface/Qwen/Qwen3-8B": { alias: "Qwen3 8B" },
        "huggingface/Qwen/Qwen3-8B:cheapest": { alias: "Qwen3 8B (cheapest)" },
        "huggingface/Qwen/Qwen3-8B:fastest": { alias: "Qwen3 8B (fastest)" },
      },
    },
  },
}
{
  agents: {
    defaults: {
      model: {
        primary: "huggingface/deepseek-ai/DeepSeek-V3.2",
        fallbacks: [
          "huggingface/meta-llama/Llama-3.3-70B-Instruct",
          "huggingface/openai/gpt-oss-120b",
        ],
      },
      models: {
        "huggingface/deepseek-ai/DeepSeek-V3.2": { alias: "DeepSeek V3.2" },
        "huggingface/meta-llama/Llama-3.3-70B-Instruct": { alias: "Llama 3.3 70B" },
        "huggingface/openai/gpt-oss-120b": { alias: "GPT-OSS 120B" },
      },
    },
  },
}
{
  agents: {
    defaults: {
      model: { primary: "huggingface/Qwen/Qwen2.5-7B-Instruct:cheapest" },
      models: {
        "huggingface/Qwen/Qwen2.5-7B-Instruct": { alias: "Qwen2.5 7B" },
        "huggingface/Qwen/Qwen2.5-7B-Instruct:cheapest": { alias: "Qwen2.5 7B (cheap)" },
        "huggingface/deepseek-ai/DeepSeek-R1:fastest": { alias: "DeepSeek R1 (fast)" },
        "huggingface/meta-llama/Llama-3.1-8B-Instruct": { alias: "Llama 3.1 8B" },
      },
    },
  },
}

Пов’язане

Вибір провайдера моделі

Огляд усіх провайдерів, model ref і поведінки failover.

Вибір моделі

Як вибирати й налаштовувати моделі.

Документація Inference Providers

Офіційна документація Hugging Face Inference Providers.

Налаштування

Повний довідник конфігурації.