Hugging Face Inference Providers oferują zgodne z OpenAI chat completions przez jedno API routera. Otrzymujesz dostęp do wielu modeli (DeepSeek, Llama i innych) za pomocą jednego tokenu. OpenClaw używa punktu końcowego zgodnego z OpenAI (tylko chat completions); dla text-to-image, embeddingów lub mowy używaj bezpośrednio klientów HF inference.Documentation Index
Fetch the complete documentation index at: https://docs.openclaw.ai/llms.txt
Use this file to discover all available pages before exploring further.
- Provider:
huggingface - Auth:
HUGGINGFACE_HUB_TOKENlubHF_TOKEN(token fine-grained z uprawnieniem Make calls to Inference Providers) - API: zgodne z OpenAI (
https://router.huggingface.co/v1) - Billing: pojedynczy token HF; cennik jest zgodny ze stawkami dostawców i obejmuje darmowy poziom.
Pierwsze kroki
Utwórz token fine-grained
Przejdź do Hugging Face Settings Tokens i utwórz nowy token fine-grained.
Uruchom onboarding
Wybierz Hugging Face z listy dostawców, a następnie podaj klucz API, gdy pojawi się monit:
Wybierz domyślny model
Z listy Default Hugging Face model wybierz model, którego chcesz używać. Lista jest ładowana z Inference API, gdy masz prawidłowy token; w przeciwnym razie pokazywana jest lista wbudowana. Twój wybór jest zapisywany jako model domyślny.Możesz też ustawić lub zmienić model domyślny później w konfiguracji:
Konfiguracja nieinteraktywna
huggingface/deepseek-ai/DeepSeek-R1 jako model domyślny.
Identyfikatory modeli
Model ref mają postaćhuggingface/<org>/<model> (identyfikatory w stylu Hub). Poniższa lista pochodzi z GET https://router.huggingface.co/v1/models; twój katalog może zawierać więcej.
| Model | Ref (dodaj prefiks huggingface/) |
|---|---|
| DeepSeek R1 | deepseek-ai/DeepSeek-R1 |
| DeepSeek V3.2 | deepseek-ai/DeepSeek-V3.2 |
| Qwen3 8B | Qwen/Qwen3-8B |
| Qwen2.5 7B Instruct | Qwen/Qwen2.5-7B-Instruct |
| Qwen3 32B | Qwen/Qwen3-32B |
| Llama 3.3 70B Instruct | meta-llama/Llama-3.3-70B-Instruct |
| Llama 3.1 8B Instruct | meta-llama/Llama-3.1-8B-Instruct |
| GPT-OSS 120B | openai/gpt-oss-120b |
| GLM 4.7 | zai-org/GLM-4.7 |
| Kimi K2.5 | moonshotai/Kimi-K2.5 |
Konfiguracja zaawansowana
Wykrywanie modeli i lista rozwijana w onboardingu
Wykrywanie modeli i lista rozwijana w onboardingu
OpenClaw wykrywa modele, wywołując bezpośrednio punkt końcowy Inference:(Opcjonalnie: wyślij
Authorization: Bearer $HUGGINGFACE_HUB_TOKEN albo $HF_TOKEN, aby uzyskać pełną listę; niektóre punkty końcowe zwracają podzbiór bez auth.) Odpowiedź ma styl OpenAI: { "object": "list", "data": [ { "id": "Qwen/Qwen3-8B", "owned_by": "Qwen", ... }, ... ] }.Gdy skonfigurujesz klucz API Hugging Face (przez onboarding, HUGGINGFACE_HUB_TOKEN albo HF_TOKEN), OpenClaw używa tego GET do wykrywania dostępnych modeli chat-completion. Podczas interaktywnej konfiguracji, po podaniu tokenu zobaczysz listę rozwijaną Default Hugging Face model wypełnioną danymi z tej listy (albo z wbudowanego katalogu, jeśli żądanie się nie powiedzie). W czasie działania (np. przy uruchamianiu Gateway), gdy klucz jest obecny, OpenClaw ponownie wywołuje GET https://router.huggingface.co/v1/models, aby odświeżyć katalog. Lista jest scalana z katalogiem wbudowanym (dla metadanych takich jak okno kontekstu i koszt). Jeśli żądanie się nie powiedzie albo nie ustawiono klucza, używany jest tylko katalog wbudowany.Nazwy modeli, aliasy i sufiksy polityk
Nazwy modeli, aliasy i sufiksy polityk
- Nazwa z API: Wyświetlana nazwa modelu jest uzupełniana z GET /v1/models, gdy API zwraca
name,titlealbodisplay_name; w przeciwnym razie jest wyprowadzana z identyfikatora modelu (np.deepseek-ai/DeepSeek-R1staje się „DeepSeek R1”). - Nadpisanie nazwy wyświetlanej: Możesz ustawić własną etykietę per model w konfiguracji, tak aby była wyświetlana w CLI i UI dokładnie tak, jak chcesz:
-
Sufiksy polityk: Dołączona dokumentacja i helpery Hugging Face w OpenClaw obecnie traktują te dwa sufiksy jako wbudowane warianty polityk:
:fastest— najwyższa przepustowość.:cheapest— najniższy koszt na token wyjściowy.
models.providers.huggingface.modelsalbo ustawićmodel.primaryz tym sufiksem. Możesz też ustawić domyślną kolejność dostawców w ustawieniach Inference Provider (bez sufiksu = użyj tej kolejności). -
Scalanie konfiguracji: Istniejące wpisy w
models.providers.huggingface.models(np. wmodels.json) są zachowywane podczas scalania konfiguracji. Oznacza to, że wszelkie własnename,aliasalbo opcje modeli ustawione w tym miejscu zostaną zachowane.
Środowisko i konfiguracja daemona
Środowisko i konfiguracja daemona
Jeśli Gateway działa jako daemon (launchd/systemd), upewnij się, że
HUGGINGFACE_HUB_TOKEN albo HF_TOKEN jest dostępne dla tego procesu (na przykład w ~/.openclaw/.env albo przez env.shellEnv).OpenClaw akceptuje zarówno
HUGGINGFACE_HUB_TOKEN, jak i HF_TOKEN jako aliasy zmiennych env. Działa dowolna z nich; jeśli ustawione są obie, pierwszeństwo ma HUGGINGFACE_HUB_TOKEN.Config: DeepSeek R1 z fallbackiem Qwen
Config: DeepSeek R1 z fallbackiem Qwen
Config: Qwen z wariantami cheapest i fastest
Config: Qwen z wariantami cheapest i fastest
Config: DeepSeek + Llama + GPT-OSS z aliasami
Config: DeepSeek + Llama + GPT-OSS z aliasami
Config: Wiele modeli Qwen i DeepSeek z sufiksami polityk
Config: Wiele modeli Qwen i DeepSeek z sufiksami polityk
Powiązane
Wybór modelu
Przegląd wszystkich dostawców, model ref i zachowania failoveru.
Wybór modelu
Jak wybierać i konfigurować modele.
Dokumentacja Inference Providers
Oficjalna dokumentacja Hugging Face Inference Providers.
Konfiguracja
Pełna dokumentacja konfiguracji.