inferrs có thể phục vụ các mô hình cục bộ phía sau APIDocumentation Index
Fetch the complete documentation index at: https://docs.openclaw.ai/llms.txt
Use this file to discover all available pages before exploring further.
/v1 tương thích với OpenAI. OpenClaw hoạt động với inferrs thông qua đường dẫn openai-completions chung.
inferrs hiện nên được xem là backend tương thích với OpenAI tự lưu trữ tùy chỉnh, chứ không phải Plugin nhà cung cấp OpenClaw chuyên dụng.
Bắt đầu
Ví dụ cấu hình đầy đủ
Ví dụ này dùng Gemma 4 trên một máy chủinferrs cục bộ.
Cấu hình nâng cao
Vì sao requiresStringContent quan trọng
Vì sao requiresStringContent quan trọng
Một số tuyến Chat Completions của OpenClaw sẽ làm phẳng các phần nội dung thuần văn bản thành chuỗi thông thường trước khi gửi yêu cầu.
inferrs chỉ chấp nhận
messages[].content dạng chuỗi, không phải mảng phần nội dung có cấu trúc.Lưu ý về Gemma và tool-schema
Lưu ý về Gemma và tool-schema
Một số kết hợp Cấu hình đó tắt bề mặt lược đồ công cụ của OpenClaw cho mô hình và có thể giảm áp lực prompt lên các backend cục bộ nghiêm ngặt hơn.Nếu các yêu cầu trực tiếp rất nhỏ vẫn hoạt động nhưng các lượt agent OpenClaw thông thường tiếp tục
sập bên trong
inferrs + Gemma hiện tại chấp nhận các yêu cầu
/v1/chat/completions trực tiếp nhỏ nhưng vẫn thất bại trong các lượt
agent-runtime đầy đủ của OpenClaw.Nếu điều đó xảy ra, trước tiên hãy thử:inferrs, vấn đề còn lại thường là hành vi của mô hình/máy chủ upstream
hơn là lớp truyền tải của OpenClaw.Kiểm thử smoke thủ công
Kiểm thử smoke thủ công
Sau khi cấu hình xong, hãy kiểm thử cả hai lớp:Nếu lệnh đầu tiên hoạt động nhưng lệnh thứ hai thất bại, hãy kiểm tra phần khắc phục sự cố bên dưới.
Hành vi kiểu proxy
Hành vi kiểu proxy
inferrs được xem là backend /v1 tương thích với OpenAI theo kiểu proxy, không phải endpoint OpenAI gốc.- Định hình yêu cầu chỉ dành cho OpenAI gốc không áp dụng ở đây
- Không có
service_tier, không có Responsesstore, không có gợi ý prompt-cache, và không có định hình payload tương thích reasoning của OpenAI - Các header ghi công OpenClaw ẩn (
originator,version,User-Agent) không được chèn vào các URL cơ sởinferrstùy chỉnh
Khắc phục sự cố
curl /v1/models thất bại
curl /v1/models thất bại
inferrs không chạy, không thể truy cập, hoặc không được bind vào host/port mong đợi. Hãy bảo đảm máy chủ đã được khởi động và đang lắng nghe trên địa chỉ bạn đã cấu hình.messages[].content mong đợi một chuỗi
messages[].content mong đợi một chuỗi
Đặt
compat.requiresStringContent: true trong mục mô hình. Xem phần
requiresStringContent ở trên để biết chi tiết.Các lệnh gọi /v1/chat/completions trực tiếp thành công nhưng openclaw infer model run thất bại
Các lệnh gọi /v1/chat/completions trực tiếp thành công nhưng openclaw infer model run thất bại
Thử đặt
compat.supportsTools: false để tắt bề mặt lược đồ công cụ.
Xem lưu ý về tool-schema của Gemma ở trên.inferrs vẫn sập trên các lượt agent lớn hơn
inferrs vẫn sập trên các lượt agent lớn hơn
Nếu OpenClaw không còn gặp lỗi lược đồ nhưng
inferrs vẫn sập trên các lượt
agent lớn hơn, hãy xem đây là giới hạn của inferrs upstream hoặc mô hình. Giảm
áp lực prompt hoặc chuyển sang một backend cục bộ hoặc mô hình khác.Liên quan
Mô hình cục bộ
Chạy OpenClaw với các máy chủ mô hình cục bộ.
Khắc phục sự cố Gateway
Gỡ lỗi các backend cục bộ tương thích với OpenAI vượt qua probe nhưng thất bại khi chạy agent.
Chọn mô hình
Tổng quan về tất cả nhà cung cấp, tham chiếu mô hình, và hành vi failover.