inferrs pode servir modelos locais por trás de uma APIDocumentation Index
Fetch the complete documentation index at: https://docs.openclaw.ai/llms.txt
Use this file to discover all available pages before exploring further.
/v1 compatível com OpenAI. O OpenClaw funciona com inferrs pelo caminho genérico openai-completions.
| Propriedade | Valor |
|---|---|
| ID do provedor | inferrs (personalizado; configure em models.providers.inferrs) |
| Plugin | nenhum — inferrs não é um plugin de provedor OpenClaw incluído |
| Var. env de auth | Opcional. Qualquer valor funciona se o seu servidor inferrs não tiver auth |
| API | compatível com OpenAI (openai-completions) |
| URL base sugerida | http://127.0.0.1:8080/v1 (ou onde quer que seu servidor inferrs esteja) |
No momento,
inferrs é melhor tratado como um backend personalizado auto-hospedado compatível com OpenAI, não como um plugin de provedor OpenClaw dedicado. Você o configura por models.providers.inferrs, em vez de uma flag de escolha de integração. Se você precisar de um plugin realmente incluído com descoberta automática, veja SGLang ou vLLM.Primeiros passos
Exemplo completo de configuração
Este exemplo usa Gemma 4 em um servidorinferrs local.
Inicialização sob demanda
O Inferrs também pode ser iniciado pelo OpenClaw apenas quando um modeloinferrs/...
for selecionado. Adicione localService à mesma entrada de provedor:
command deve ser absoluto. Use which inferrs no host do Gateway e coloque esse
caminho na configuração. Para a referência completa dos campos, veja
Serviços de modelos locais.
Configuração avançada
Why requiresStringContent matters
Why requiresStringContent matters
Algumas rotas de Chat Completions do O OpenClaw transformará partes de conteúdo de texto puro em strings simples antes de enviar
a solicitação.
inferrs aceitam apenas
messages[].content como string, não arrays estruturados de partes de conteúdo.Gemma and tool-schema caveat
Gemma and tool-schema caveat
Algumas combinações atuais de Isso desativa a superfície de esquema de ferramentas do OpenClaw para o modelo e pode reduzir a pressão
do prompt em backends locais mais restritos.Se solicitações diretas mínimas ainda funcionarem, mas turnos normais de agente do OpenClaw continuarem
travando dentro do
inferrs + Gemma aceitam pequenas solicitações diretas
para /v1/chat/completions, mas ainda falham em turnos completos de agent-runtime
do OpenClaw.Se isso acontecer, tente isto primeiro:inferrs, o problema restante normalmente está no comportamento
upstream do modelo/servidor, e não na camada de transporte do OpenClaw.Manual smoke test
Manual smoke test
Depois de configurado, teste as duas camadas:Se o primeiro comando funcionar, mas o segundo falhar, consulte a seção de solução de problemas abaixo.
Proxy-style behavior
Proxy-style behavior
inferrs é tratado como um backend /v1 compatível com OpenAI em estilo proxy, não como um
endpoint OpenAI nativo.- A modelagem de solicitações exclusiva da OpenAI nativa não se aplica aqui
- Sem
service_tier, semstorede Responses, sem dicas de cache de prompt e sem modelagem de payload de compatibilidade de raciocínio da OpenAI - Cabeçalhos ocultos de atribuição do OpenClaw (
originator,version,User-Agent) não são injetados em URLs base personalizadas doinferrs
Solução de problemas
curl /v1/models fails
curl /v1/models fails
inferrs não está em execução, não está acessível ou não está vinculado ao
host/porta esperado. Verifique se o servidor foi iniciado e está escutando no endereço que você
configurou.messages[].content expected a string
messages[].content expected a string
Defina
compat.requiresStringContent: true na entrada do modelo. Veja a seção
requiresStringContent acima para detalhes.Direct /v1/chat/completions calls pass but openclaw infer model run fails
Direct /v1/chat/completions calls pass but openclaw infer model run fails
Tente definir
compat.supportsTools: false para desativar a superfície de esquema de ferramentas.
Veja a observação sobre o esquema de ferramentas do Gemma acima.inferrs still crashes on larger agent turns
inferrs still crashes on larger agent turns
Se o OpenClaw não recebe mais erros de esquema, mas
inferrs ainda trava em turnos maiores
de agente, trate isso como uma limitação upstream do inferrs ou do modelo. Reduza
a pressão do prompt ou mude para outro backend ou modelo local.Relacionados
Local models
Executando o OpenClaw com servidores de modelos locais.
Local model services
Iniciando servidores de modelos locais sob demanda para provedores configurados.
Gateway troubleshooting
Depurando backends locais compatíveis com OpenAI que passam nas sondagens, mas falham em execuções de agente.
Model selection
Visão geral de todos os provedores, refs de modelo e comportamento de failover.