I provider Hugging Face Inference offrono chat completions compatibili con OpenAI tramite una singola API router. Ottieni accesso a molti modelli (DeepSeek, Llama e altri) con un solo token. OpenClaw usa l’endpoint compatibile con OpenAI (solo chat completions); per text-to-image, embeddings o speech usa direttamente i client HF inference.Documentation Index
Fetch the complete documentation index at: https://docs.openclaw.ai/llms.txt
Use this file to discover all available pages before exploring further.
- Provider:
huggingface - Auth:
HUGGINGFACE_HUB_TOKENoHF_TOKEN(token a granularità fine con Make calls to Inference Providers) - API: compatibile con OpenAI (
https://router.huggingface.co/v1) - Billing: singolo token HF; i prezzi seguono le tariffe del provider con un free tier.
Per iniziare
Crea un token a granularità fine
Vai a Hugging Face Settings Tokens e crea un nuovo token a granularità fine.
Esegui l'onboarding
Scegli Hugging Face nel menu a discesa del provider, poi inserisci la tua chiave API quando richiesto:
Seleziona un modello predefinito
Nel menu a discesa Default Hugging Face model, scegli il modello desiderato. L’elenco viene caricato dalla Inference API quando hai un token valido; altrimenti viene mostrato un elenco integrato. La tua scelta viene salvata come modello predefinito.Puoi anche impostare o cambiare il modello predefinito successivamente nella configurazione:
Configurazione non interattiva
huggingface/deepseek-ai/DeepSeek-R1 come modello predefinito.
ID modello
I riferimenti ai modelli usano la formahuggingface/<org>/<model> (ID in stile Hub). L’elenco qui sotto proviene da GET https://router.huggingface.co/v1/models; il tuo catalogo potrebbe includerne altri.
| Model | Ref (prefix with huggingface/) |
|---|---|
| DeepSeek R1 | deepseek-ai/DeepSeek-R1 |
| DeepSeek V3.2 | deepseek-ai/DeepSeek-V3.2 |
| Qwen3 8B | Qwen/Qwen3-8B |
| Qwen2.5 7B Instruct | Qwen/Qwen2.5-7B-Instruct |
| Qwen3 32B | Qwen/Qwen3-32B |
| Llama 3.3 70B Instruct | meta-llama/Llama-3.3-70B-Instruct |
| Llama 3.1 8B Instruct | meta-llama/Llama-3.1-8B-Instruct |
| GPT-OSS 120B | openai/gpt-oss-120b |
| GLM 4.7 | zai-org/GLM-4.7 |
| Kimi K2.5 | moonshotai/Kimi-K2.5 |
Configurazione avanzata
Rilevamento dei modelli e menu a discesa dell'onboarding
Rilevamento dei modelli e menu a discesa dell'onboarding
Nomi dei modelli, alias e suffissi di policy
Nomi dei modelli, alias e suffissi di policy
- Nome dall’API: il nome visualizzato del modello viene idrato da GET /v1/models quando l’API restituisce
name,titleodisplay_name; altrimenti viene derivato dall’id del modello (per esempiodeepseek-ai/DeepSeek-R1diventa “DeepSeek R1”). - Override del nome visualizzato: puoi impostare un’etichetta personalizzata per modello nella configurazione così appare come vuoi nella CLI e nella UI:
-
Suffissi di policy: la documentazione e gli helper Hugging Face inclusi in OpenClaw trattano attualmente questi due suffissi come varianti di policy integrate:
:fastest— throughput massimo.:cheapest— costo minimo per token in uscita.
models.providers.huggingface.modelsoppure impostaremodel.primarycon il suffisso. Puoi anche impostare l’ordine predefinito del provider in Inference Provider settings (senza suffisso = usa quell’ordine). -
Merge della configurazione: le voci esistenti in
models.providers.huggingface.models(per esempio inmodels.json) vengono mantenute quando la configurazione viene unita. Quindi qualsiasiname,aliaso opzione del modello che imposti lì viene preservata.
Ambiente e configurazione del daemon
Ambiente e configurazione del daemon
Se il Gateway gira come daemon (launchd/systemd), assicurati che
HUGGINGFACE_HUB_TOKEN o HF_TOKEN sia disponibile per quel processo (per esempio in ~/.openclaw/.env o tramite env.shellEnv).OpenClaw accetta sia
HUGGINGFACE_HUB_TOKEN sia HF_TOKEN come alias di variabile env. Entrambi funzionano; se sono impostati entrambi, HUGGINGFACE_HUB_TOKEN ha la precedenza.Configurazione: DeepSeek R1 con fallback Qwen
Configurazione: DeepSeek R1 con fallback Qwen
Configurazione: Qwen con varianti cheapest e fastest
Configurazione: Qwen con varianti cheapest e fastest
Configurazione: DeepSeek + Llama + GPT-OSS con alias
Configurazione: DeepSeek + Llama + GPT-OSS con alias
Configurazione: più Qwen e DeepSeek con suffissi di policy
Configurazione: più Qwen e DeepSeek con suffissi di policy
Correlati
Selezione del provider di modelli
Panoramica di tutti i provider, dei riferimenti ai modelli e del comportamento di failover.
Selezione del modello
Come scegliere e configurare i modelli.
Documentazione Inference Providers
Documentazione ufficiale di Hugging Face Inference Providers.
Configurazione
Riferimento completo della configurazione.