OpenClaw інтегрується з нативним API Ollama (Documentation Index
Fetch the complete documentation index at: https://docs.openclaw.ai/llms.txt
Use this file to discover all available pages before exploring further.
/api/chat) для розміщених хмарних моделей і локальних/self-hosted серверів Ollama. Ви можете використовувати Ollama у трьох режимах: Cloud + Local через доступний хост Ollama, Cloud only з https://ollama.com або Local only з доступним хостом Ollama.
Конфігурація провайдера Ollama використовує baseUrl як канонічний ключ. OpenClaw також приймає baseURL для сумісності з прикладами в стилі OpenAI SDK, але нова конфігурація має віддавати перевагу baseUrl.
Правила автентифікації
Local and LAN hosts
Local and LAN hosts
ollama-local лише для loopback, приватної мережі, .local і базових URL Ollama з простим іменем хоста.Remote and Ollama Cloud hosts
Remote and Ollama Cloud hosts
https://ollama.com) потребують справжніх облікових даних через OLLAMA_API_KEY, профіль автентифікації або apiKey провайдера.Custom provider ids
Custom provider ids
api: "ollama", дотримуються тих самих правил. Наприклад, провайдер ollama-remote, який вказує на приватний LAN-хост Ollama, може використовувати apiKey: "ollama-local", а субагенти розв’язуватимуть цей маркер через хук провайдера Ollama замість того, щоб трактувати його як відсутні облікові дані. Пошук пам’яті також може задати agents.defaults.memorySearch.provider на цей користувацький ідентифікатор провайдера, щоб embeddings використовували відповідну кінцеву точку Ollama.Auth profiles
Auth profiles
auth-profiles.json зберігає облікові дані для ідентифікатора провайдера. Розміщуйте налаштування кінцевої точки (baseUrl, api, ідентифікатори моделей, заголовки, тайм-аути) у models.providers.<id>. Старі пласкі файли auth-profile на кшталт { "ollama-windows": { "apiKey": "ollama-local" } } не є runtime-форматом; запустіть openclaw doctor --fix, щоб переписати їх у канонічний профіль API-ключа ollama-windows:default із резервною копією. baseUrl у цьому файлі є шумом сумісності, і його слід перенести до конфігурації провайдера.Memory embedding scope
Memory embedding scope
- Ключ рівня провайдера надсилається лише до хоста Ollama цього провайдера.
agents.*.memorySearch.remote.apiKeyнадсилається лише до його віддаленого хоста embeddings.- Чисте значення env
OLLAMA_API_KEYтрактується як домовленість Ollama Cloud і за замовчуванням не надсилається до локальних або self-hosted хостів.
Початок роботи
Виберіть бажаний спосіб налаштування та режим.- Onboarding (recommended)
- Manual setup
Choose your mode
- Cloud + Local — локальний хост Ollama плюс хмарні моделі, маршрутизовані через цей хост
- Cloud only — розміщені моделі Ollama через
https://ollama.com - Local only — лише локальні моделі
Select a model
Cloud only запитує OLLAMA_API_KEY і пропонує розміщені хмарні значення за замовчуванням. Cloud + Local і Local only запитують базову URL-адресу Ollama, виявляють доступні моделі та автоматично завантажують вибрану локальну модель, якщо вона ще недоступна. Коли Ollama повідомляє про встановлений тег :latest, наприклад gemma4:latest, налаштування показує цю встановлену модель один раз замість того, щоб показувати і gemma4, і gemma4:latest або знову завантажувати голий псевдонім. Cloud + Local також перевіряє, чи цей хост Ollama увійшов в обліковий запис для хмарного доступу.Неінтерактивний режим
Хмарні моделі
- Cloud + Local
- Cloud only
- Local only
Cloud + Local використовує доступний хост Ollama як контрольну точку і для локальних, і для хмарних моделей. Це бажаний гібридний потік Ollama.Використовуйте Cloud + Local під час налаштування. OpenClaw запитує базову URL-адресу Ollama, виявляє локальні моделі з цього хоста та перевіряє, чи хост увійшов в обліковий запис для хмарного доступу за допомогою ollama signin. Коли хост увійшов в обліковий запис, OpenClaw також пропонує розміщені хмарні значення за замовчуванням, як-от kimi-k2.5:cloud, minimax-m2.7:cloud і glm-5.1:cloud.Якщо хост ще не увійшов в обліковий запис, OpenClaw зберігає налаштування лише локальним, доки ви не запустите ollama signin.Виявлення моделей (неявний провайдер)
Коли ви задаєтеOLLAMA_API_KEY (або профіль автентифікації) і не визначаєте models.providers.ollama чи іншого користувацького віддаленого провайдера з api: "ollama", OpenClaw виявляє моделі з локального екземпляра Ollama за адресою http://127.0.0.1:11434.
| Поведінка | Подробиці |
|---|---|
| Запит каталогу | Запитує /api/tags |
| Виявлення можливостей | Використовує best-effort пошуки /api/show, щоб прочитати contextWindow, розширені параметри Modelfile num_ctx і можливості, зокрема vision/tools |
| Vision-моделі | Моделі з можливістю vision, повідомленою /api/show, позначаються як придатні для зображень (input: ["text", "image"]), тож OpenClaw автоматично вставляє зображення в prompt |
| Виявлення reasoning | Використовує можливості /api/show, коли вони доступні, зокрема thinking; повертається до евристики за назвою моделі (r1, reasoning, think), коли Ollama пропускає можливості |
| Обмеження токенів | Задає maxTokens на стандартну максимальну межу токенів Ollama, яку використовує OpenClaw |
| Вартість | Задає всі вартості як 0 |
ollama/<pulled-model>:latest у локальному infer model run; OpenClaw розв’язує цю встановлену модель із живого каталогу Ollama без потреби у власноруч написаному записі models.json.
Для хостів Ollama, які увійшли в обліковий запис, деякі моделі :cloud можуть бути доступні через /api/chat
і /api/show до того, як вони з’являться в /api/tags. Коли ви явно вибираєте
повне посилання ollama/<model>:cloud, OpenClaw перевіряє саме цю відсутню модель через
/api/show і додає її до runtime-каталогу лише якщо Ollama підтверджує
метадані моделі. Одруки все одно завершуються помилкою як невідомі моделі, а не створюються автоматично.
infer model run із повним посиланням на модель Ollama:
infer model run. Це надсилає prompt і зображення безпосередньо до
вибраної vision-моделі Ollama без завантаження chat-інструментів, пам’яті або попереднього
контексту сесії:
model run --file приймає файли, визначені як image/*, зокрема поширені вхідні PNG,
JPEG і WebP. Файли, що не є зображеннями, відхиляються до виклику Ollama.
Для розпізнавання мовлення використовуйте натомість openclaw infer audio transcribe.
Коли ви перемикаєте розмову за допомогою /model ollama/<model>, OpenClaw трактує
це як точний вибір користувача. Якщо налаштований baseUrl Ollama
недоступний, наступна відповідь завершується помилкою провайдера замість того, щоб непомітно
відповісти з іншої налаштованої резервної моделі.
Ізольовані Cron-завдання виконують одну додаткову локальну перевірку безпеки перед запуском ходу агента. Якщо вибрана модель розв’язується до локального, приватно-мережевого або .local провайдера Ollama і /api/tags недоступний, OpenClaw записує цей запуск Cron як skipped із вибраним ollama/<model> у тексті помилки. Передперевірка кінцевої точки кешується на 5 хвилин, тому кілька Cron-завдань, спрямованих на той самий зупинений демон Ollama, не запускають усі невдалі запити до моделі.
Перевірте наживо локальний текстовий шлях, шлях нативного потоку й embeddings для локального Ollama за допомогою:
models.providers.ollama або налаштовуєте власного віддаленого провайдера, наприклад models.providers.ollama-cloud з api: "ollama", автоматичне виявлення пропускається, і моделі потрібно визначати вручну. Власні loopback-провайдери, як-от http://127.0.0.2:11434, усе одно вважаються локальними. Див. розділ явної конфігурації нижче.Зір і опис зображень
Вбудований Ollama Plugin реєструє Ollama як медіа-провайдера з підтримкою зображень для розуміння медіа. Це дає OpenClaw змогу маршрутизувати явні запити на опис зображень і налаштовані типові значення моделей зображень через локальні або хостингові vision-моделі Ollama. Для локального зору завантажте модель, що підтримує зображення:--model має бути повним посиланням <provider/model>. Коли його задано, openclaw infer image describe запускає цю модель напряму замість пропуску опису через те, що модель підтримує нативний зір.
Використовуйте infer image describe, коли потрібні потік провайдера розуміння зображень OpenClaw, налаштований agents.defaults.imageModel і форма вихідного опису зображення. Використовуйте infer model run --file, коли потрібна сира перевірка мультимодальної моделі з власним prompt і одним або кількома зображеннями.
Щоб зробити Ollama типовою моделлю розуміння зображень для вхідних медіа, налаштуйте agents.defaults.imageModel:
ollama/<model>. Якщо та сама модель перелічена в models.providers.ollama.models з input: ["text", "image"] і жоден інший налаштований провайдер зображень не надає цей голий ID моделі, OpenClaw також нормалізує голе посилання imageModel, наприклад qwen2.5vl:7b, до ollama/qwen2.5vl:7b. Якщо більше ніж один налаштований провайдер зображень має той самий голий ID, явно використовуйте префікс провайдера.
Повільним локальним vision-моделям може знадобитися довший timeout для розуміння зображень, ніж хмарним моделям. Вони також можуть аварійно завершуватися або зупинятися, коли Ollama намагається виділити повний заявлений vision-контекст на обмеженому обладнанні. Задайте timeout для capability і обмежте num_ctx у записі моделі, коли вам потрібен лише звичайний хід опису зображення:
image, який агент може викликати під час ходу. models.providers.ollama.timeoutSeconds на рівні провайдера й надалі керує базовим запобіжником HTTP-запиту Ollama для звичайних викликів моделі.
Перевірте наживо явний інструмент зображень для локального Ollama за допомогою:
models.providers.ollama.models, позначайте vision-моделі підтримкою введення зображень:
/api/show повідомляє про vision capability.
Конфігурація
- Basic (implicit discovery)
- Explicit (manual models)
- Custom base URL
Поширені рецепти
Використовуйте їх як стартові точки й замінюйте ID моделей на точні назви зollama list або openclaw models list --provider ollama.
Local model with auto-discovery
Local model with auto-discovery
models.providers.ollama, якщо не хочете визначати моделі вручну.LAN Ollama host with manual models
LAN Ollama host with manual models
/v1.contextWindow — це бюджет контексту на боці OpenClaw. params.num_ctx надсилається до Ollama для запиту. Тримайте їх узгодженими, коли ваше обладнання не може запустити повний заявлений контекст моделі.Ollama Cloud only
Ollama Cloud only
Cloud plus local through a signed-in daemon
Cloud plus local through a signed-in daemon
ollama signin і має обслуговувати як локальні моделі, так і моделі :cloud.Multiple Ollama hosts
Multiple Ollama hosts
ollama-large/qwen3.5:27b доходить до Ollama як qwen3.5:27b.Lean local model profile
Lean local model profile
compat.supportsTools: false лише тоді, коли модель або сервер стабільно не працюють зі схемами інструментів. Це обмінює можливості агента на стабільність.
localModelLean прибирає браузер, cron та інструменти повідомлень із поверхні агента, але не змінює runtime-контекст Ollama або режим мислення. Поєднуйте це з явними params.num_ctx і params.thinking: false для невеликих моделей мислення у стилі Qwen, які зациклюються або витрачають бюджет відповіді на приховане міркування.Вибір моделі
Після налаштування всі ваші моделі Ollama доступні:ollama-spark/qwen3:32b, OpenClaw видаляє лише цей префікс перед викликом Ollama, щоб сервер отримав qwen3:32b.
Для повільних локальних моделей віддавайте перевагу налаштуванню запитів у межах провайдера перед збільшенням загального тайм-ауту runtime агента:
timeoutSeconds застосовується до HTTP-запиту моделі, включно з установленням з’єднання, заголовками, потоковою передачею тіла та загальним перериванням guarded-fetch. params.keep_alive передається до Ollama як верхньорівневий keep_alive у нативних запитах /api/chat; встановлюйте його для окремої моделі, коли час завантаження першого ходу є вузьким місцем.
Швидка перевірка
127.0.0.1 на хост, використаний у baseUrl. Якщо curl працює, а OpenClaw ні, перевірте, чи Gateway не працює на іншій машині, у контейнері або під іншим службовим обліковим записом.
Вебпошук Ollama
OpenClaw підтримує вебпошук Ollama як вбудованого провайдераweb_search.
| Властивість | Деталь |
|---|---|
| Хост | Використовує налаштований хост Ollama (models.providers.ollama.baseUrl, якщо задано, інакше http://127.0.0.1:11434); https://ollama.com використовує розміщений API напряму |
| Автентифікація | Без ключа для локальних хостів Ollama з виконаним входом; OLLAMA_API_KEY або налаштована автентифікація провайдера для прямого пошуку через https://ollama.com чи хостів, захищених автентифікацією |
| Вимога | Локальні/самостійно розміщені хости мають бути запущені та з виконаним входом через ollama signin; прямий розміщений пошук потребує baseUrl: "https://ollama.com" і справжнього API-ключа Ollama |
openclaw onboard або openclaw configure --section web, або задайте:
/api/experimental/web_search цього daemon. Для https://ollama.com він напряму викликає розміщений endpoint /api/web_search.
Розширена конфігурація
Застарілий OpenAI-сумісний режим
Застарілий OpenAI-сумісний режим
api: "openai-completions":params: { streaming: false } у конфігурації моделі.Коли api: "openai-completions" використовується з Ollama, OpenClaw типово ін’єктує options.num_ctx, щоб Ollama не повертався непомітно до контекстного вікна 4096. Якщо ваш проксі/upstream відхиляє невідомі поля options, вимкніть цю поведінку:Контекстні вікна
Контекстні вікна
PARAMETER num_ctx із користувацьких Modelfile. Інакше він повертається до стандартного контекстного вікна Ollama, яке використовує OpenClaw.Ви можете встановити стандартні значення contextWindow, contextTokens і maxTokens на рівні провайдера для кожної моделі під цим провайдером Ollama, а потім за потреби перевизначати їх для окремих моделей. contextWindow — це бюджет prompt і Compaction в OpenClaw. Нативні запити Ollama залишають options.num_ctx незаданим, якщо ви явно не налаштуєте params.num_ctx, щоб Ollama міг застосувати власне стандартне значення моделі, OLLAMA_CONTEXT_LENGTH або значення на основі VRAM. Щоб обмежити або примусово задати runtime-контекст Ollama для окремого запиту без перебудови Modelfile, задайте params.num_ctx; недійсні, нульові, від’ємні та нескінченні значення ігноруються. OpenAI-сумісний адаптер Ollama все ще типово ін’єктує options.num_ctx із налаштованого params.num_ctx або contextWindow; вимкніть це за допомогою injectNumCtxForOpenAICompat: false, якщо ваш upstream відхиляє options.Нативні записи моделей Ollama також приймають загальні runtime-параметри Ollama у params, включно з temperature, top_p, top_k, min_p, num_predict, stop, repeat_penalty, num_batch, num_thread і use_mmap. OpenClaw передає лише ключі запиту Ollama, тому runtime-параметри OpenClaw, такі як streaming, не потрапляють до Ollama. Використовуйте params.think або params.thinking, щоб надсилати верхньорівневий Ollama think; false вимикає мислення на рівні API для моделей мислення у стилі Qwen.agents.defaults.models["ollama/<model>"].params.num_ctx для окремої моделі. Якщо налаштовано обидва варіанти, явний запис моделі провайдера має пріоритет над стандартним значенням агента.Керування мисленням
Керування мисленням
think, а не options.think. Автоматично виявлені моделі, відповідь /api/show яких містить можливість thinking, показують /think low, /think medium, /think high і /think max; моделі без мислення показують лише /think off.params.think або params.thinking для окремої моделі може вимкнути або примусово ввімкнути мислення Ollama API для конкретної налаштованої моделі. OpenClaw зберігає ці явні параметри моделі, коли активний запуск має лише неявне стандартне значення off; runtime-команди не off, такі як /think medium, усе одно перевизначають активний запуск.Моделі міркування
Моделі міркування
deepseek-r1, reasoning або think здатними до міркування.Вартість моделей
Вартість моделей
Вбудовування пам’яті
Вбудовування пам’яті
/api/embed Ollama та за можливості об’єднує
кілька фрагментів пам’яті в один запит input.| Властивість | Значення |
|---|---|
| Стандартна модель | nomic-embed-text |
| Автоматичне завантаження | Так — модель вбудовувань автоматично завантажується, якщо її немає локально |
nomic-embed-text, qwen3-embedding і mxbai-embed-large. Пакети документів пам’яті залишаються необробленими, щоб наявні індекси не потребували міграції формату.Щоб вибрати Ollama як провайдера вбудовувань для пошуку в пам’яті:Конфігурація потокового передавання
Конфігурація потокового передавання
/api/chat), який повністю підтримує потокове передавання та виклик інструментів одночасно. Спеціальна конфігурація не потрібна.Для нативних запитів /api/chat OpenClaw також передає керування міркуванням безпосередньо в Ollama: /think off і openclaw agent --thinking off надсилають верхньорівневе think: false, якщо не налаштовано явне значення моделі params.think/params.thinking, тоді як /think low|medium|high надсилають відповідний верхньорівневий рядок зусилля think. /think max зіставляється з найвищим нативним зусиллям Ollama, think: "high".Усунення несправностей
Цикл аварійного завершення WSL2 (повторні перезавантаження)
Цикл аварійного завершення WSL2 (повторні перезавантаження)
ollama.service з Restart=always. Якщо цей сервіс автоматично запускається і завантажує модель із підтримкою GPU під час запуску WSL2, Ollama може закріпити пам’ять хоста під час завантаження моделі. Механізм повернення пам’яті Hyper-V не завжди може звільнити ці закріплені сторінки, тому Windows може завершити VM WSL2, systemd знову запускає Ollama, і цикл повторюється.Типові ознаки:- повторні перезавантаження або завершення WSL2 з боку Windows
- високе навантаження CPU в
app.sliceабоollama.serviceневдовзі після запуску WSL2 - SIGTERM від systemd, а не подія Linux OOM-killer
ollama.service з Restart=always і видимі маркери CUDA.Пом’якшення:%USERPROFILE%\.wslconfig на боці Windows, а потім виконайте wsl --shutdown:Ollama не виявлено
Ollama не виявлено
OLLAMA_API_KEY (або профіль автентифікації), і що ви не визначили явний запис models.providers.ollama:Немає доступних моделей
Немає доступних моделей
models.providers.ollama.У з'єднанні відмовлено
У з'єднанні відмовлено
Віддалений хост працює з curl, але не з OpenClaw
Віддалений хост працює з curl, але не з OpenClaw
baseUrlвказує наlocalhost, але Gateway працює в Docker або на іншому хості.- URL використовує
/v1, що вибирає OpenAI-сумісну поведінку замість нативної Ollama. - Віддалений хост потребує змін firewall або прив’язування LAN на боці Ollama.
- Модель присутня в daemon на вашому ноутбуці, але не у віддаленому daemon.
Модель виводить JSON інструмента як текст
Модель виводить JSON інструмента як текст
compat.supportsTools: false для цього запису моделі та повторіть тест.Kimi або GLM повертає спотворені символи
Kimi або GLM повертає спотворені символи
Cloud + Local або Cloud only, а потім спробуйте нову сесію та fallback-модель:Холодна локальна модель перевищує час очікування
Холодна локальна модель перевищує час очікування
timeoutSeconds також розширює захищений timeout підключення Undici для цього провайдера.Модель із великим контекстом надто повільна або вичерпує пам'ять
Модель із великим контекстом надто повільна або вичерпує пам'ять
params.num_ctx. Обмежте і бюджет OpenClaw, і контекст запиту Ollama, коли потрібна передбачувана затримка до першого токена:contextWindow, якщо OpenClaw надсилає забагато prompt. Зменште params.num_ctx, якщо Ollama завантажує runtime-контекст, який завеликий для машини. Зменште maxTokens, якщо генерація триває надто довго.