OpenClaw は、ホストされたクラウドモデルとローカル/セルフホストの Ollama サーバー向けに、Ollama のネイティブ API(Documentation Index
Fetch the complete documentation index at: https://docs.openclaw.ai/llms.txt
Use this file to discover all available pages before exploring further.
/api/chat)と統合します。Ollama は、到達可能な Ollama ホスト経由の Cloud + Local、https://ollama.com に対する Cloud only、到達可能な Ollama ホストに対する Local only の 3 つのモードで使用できます。
Ollama プロバイダー設定では、baseUrl を正規キーとして使用します。OpenClaw は OpenAI SDK 形式の例との互換性のために baseURL も受け付けますが、新しい設定では baseUrl を優先してください。
認証ルール
Local and LAN hosts
Local and LAN hosts
ローカルおよび LAN の Ollama ホストには、実際の bearer トークンは不要です。OpenClaw は、loopback、プライベートネットワーク、
.local、および素のホスト名の Ollama ベース URL に対してのみ、ローカルの ollama-local マーカーを使用します。Remote and Ollama Cloud hosts
Remote and Ollama Cloud hosts
リモートの公開ホストおよび Ollama Cloud(
https://ollama.com)では、OLLAMA_API_KEY、認証プロファイル、またはプロバイダーの apiKey を通じた実際の認証情報が必要です。Custom provider ids
Custom provider ids
api: "ollama" を設定するカスタムプロバイダー ID も同じルールに従います。たとえば、プライベート LAN の Ollama ホストを指す ollama-remote プロバイダーは apiKey: "ollama-local" を使用でき、サブエージェントはそれを認証情報の欠落として扱うのではなく、Ollama プロバイダーフックを通じてそのマーカーを解決します。メモリ検索でも agents.defaults.memorySearch.provider をそのカスタムプロバイダー ID に設定して、埋め込みが対応する Ollama エンドポイントを使用するようにできます。Auth profiles
Auth profiles
auth-profiles.json はプロバイダー ID の認証情報を保存します。エンドポイント設定(baseUrl、api、モデル ID、ヘッダー、タイムアウト)は models.providers.<id> に配置してください。{ "ollama-windows": { "apiKey": "ollama-local" } } のような古いフラットな認証プロファイルファイルはランタイム形式ではありません。openclaw doctor --fix を実行して、バックアップ付きで正規の ollama-windows:default API キープロファイルに書き換えてください。そのファイル内の baseUrl は互換性のためのノイズであり、プロバイダー設定に移動する必要があります。Memory embedding scope
Memory embedding scope
Ollama がメモリ埋め込みに使用される場合、bearer 認証は宣言されたホストにスコープされます。
- プロバイダーレベルのキーは、そのプロバイダーの Ollama ホストにのみ送信されます。
agents.*.memorySearch.remote.apiKeyは、そのリモート埋め込みホストにのみ送信されます。- 純粋な
OLLAMA_API_KEY環境値は Ollama Cloud の慣例として扱われ、デフォルトではローカルまたはセルフホストのホストには送信されません。
はじめに
好みのセットアップ方法とモードを選択します。- Onboarding (recommended)
- Manual setup
最適な用途: 動作する Ollama クラウドまたはローカルセットアップへの最速経路。任意でカスタムベース URL またはモデルを指定します。
Choose your mode
- Cloud + Local — ローカル Ollama ホストと、そのホスト経由でルーティングされるクラウドモデル
- Cloud only —
https://ollama.com経由のホストされた Ollama モデル - Local only — ローカルモデルのみ
Select a model
Cloud only は OLLAMA_API_KEY の入力を求め、ホストされたクラウドのデフォルトを提案します。Cloud + Local と Local only は Ollama ベース URL を求め、利用可能なモデルを検出し、選択されたローカルモデルがまだ利用できない場合は自動的に pull します。Ollama が gemma4:latest のようなインストール済みの :latest タグを報告した場合、セットアップは gemma4 と gemma4:latest の両方を表示したり、素のエイリアスを再度 pull したりせず、そのインストール済みモデルを一度だけ表示します。Cloud + Local は、その Ollama ホストがクラウドアクセス用にサインイン済みかどうかも確認します。非対話モード
クラウドモデル
- Cloud + Local
- Cloud only
- Local only
Cloud + Local は、ローカルモデルとクラウドモデルの両方の制御点として、到達可能な Ollama ホストを使用します。これは Ollama が推奨するハイブリッドフローです。セットアップ中に Cloud + Local を使用します。OpenClaw は Ollama ベース URL の入力を求め、そのホストからローカルモデルを検出し、ollama signin によるクラウドアクセス用のサインイン状態を確認します。ホストがサインイン済みの場合、OpenClaw は kimi-k2.5:cloud、minimax-m2.7:cloud、glm-5.1:cloud などのホストされたクラウドのデフォルトも提案します。ホストがまだサインインしていない場合、ollama signin を実行するまで OpenClaw はセットアップをローカル専用のままにします。モデル検出(暗黙のプロバイダー)
OLLAMA_API_KEY(または認証プロファイル)を設定し、かつ models.providers.ollama や api: "ollama" を持つ別のカスタムリモートプロバイダーを定義していない場合、OpenClaw は http://127.0.0.1:11434 のローカル Ollama インスタンスからモデルを検出します。
| 動作 | 詳細 |
|---|---|
| カタログクエリ | /api/tags をクエリします |
| 機能検出 | ベストエフォートの /api/show 参照を使用して、contextWindow、展開された num_ctx Modelfile パラメーター、vision/tools を含む機能を読み取ります |
| Vision モデル | /api/show が報告する vision 機能を持つモデルは画像対応(input: ["text", "image"])としてマークされるため、OpenClaw は画像をプロンプトに自動挿入します |
| 推論検出 | 利用可能な場合は thinking を含む /api/show の機能を使用します。Ollama が機能を省略した場合は、モデル名ヒューリスティック(r1、reasoning、think)にフォールバックします |
| トークン制限 | maxTokens を、OpenClaw が使用するデフォルトの Ollama 最大トークン上限に設定します |
| コスト | すべてのコストを 0 に設定します |
infer model run では ollama/<pulled-model>:latest のような完全な参照を使用できます。OpenClaw は、手書きの models.json エントリを要求せずに、Ollama のライブカタログからそのインストール済みモデルを解決します。
サインイン済みの Ollama ホストでは、一部の :cloud モデルが /api/tags に現れる前に /api/chat
および /api/show 経由で利用できる場合があります。完全な ollama/<model>:cloud 参照を明示的に選択すると、OpenClaw はその正確な欠落モデルを
/api/show で検証し、Ollama がモデルメタデータを確認した場合にのみランタイムカタログへ追加します。入力ミスは自動作成されず、不明なモデルとして失敗します。
infer model run を使用します。
infer model run に追加します。これにより、チャットツール、メモリ、以前の
セッションコンテキストを読み込まずに、プロンプトと画像を選択した Ollama vision モデルへ直接送信します。
model run --file は、一般的な PNG、
JPEG、WebP 入力を含む、image/* として検出されたファイルを受け付けます。画像以外のファイルは Ollama が呼び出される前に拒否されます。
音声認識には、代わりに openclaw infer audio transcribe を使用してください。
/model ollama/<model> で会話を切り替えると、OpenClaw はそれを正確なユーザー選択として扱います。設定された Ollama baseUrl に
到達できない場合、次の応答は、別の設定済みフォールバックモデルから黙って
回答するのではなく、プロバイダーエラーで失敗します。
隔離された cron ジョブは、agent turn を開始する前に追加のローカル安全性チェックを 1 つ実行します。選択されたモデルがローカル、プライベートネットワーク、または .local の Ollama provider に解決され、/api/tags に到達できない場合、OpenClaw はその cron 実行を、エラーテキスト内の選択された ollama/<model> とともに skipped として記録します。エンドポイントの事前チェックは 5 分間キャッシュされるため、停止中の同じ Ollama デーモンを指す複数の cron ジョブが、失敗するモデルリクエストをすべて起動することはありません。
ローカルのテキストパス、ネイティブストリームパス、埋め込みを、ローカル Ollama に対してライブ検証するには次を使います。
models.providers.ollama を明示的に設定した場合、または api: "ollama" を指定して models.providers.ollama-cloud のようなカスタムリモート provider を構成した場合、自動検出はスキップされ、モデルを手動で定義する必要があります。http://127.0.0.2:11434 のようなループバックカスタム provider は引き続きローカルとして扱われます。下記の明示的な設定セクションを参照してください。Vision と画像説明
バンドルされた Ollama Plugin は、Ollama を画像対応のメディア理解 provider として登録します。これにより、OpenClaw は明示的な画像説明リクエストと、構成済みの画像モデル default を、ローカルまたはホストされた Ollama vision モデルにルーティングできます。 ローカル vision では、画像をサポートするモデルを pull します。--model は完全な <provider/model> ref である必要があります。設定されている場合、openclaw infer image describe は、モデルがネイティブ vision をサポートしているために説明をスキップするのではなく、そのモデルを直接実行します。
OpenClaw の画像理解 provider フロー、構成済みの agents.defaults.imageModel、および画像説明の出力形状を使いたい場合は、infer image describe を使用します。カスタムプロンプトと 1 つ以上の画像を使って、生のマルチモーダルモデルを調べたい場合は、infer model run --file を使用します。
Ollama を受信メディアのデフォルト画像理解モデルにするには、agents.defaults.imageModel を構成します。
ollama/<model> ref を推奨します。同じモデルが models.providers.ollama.models の下に input: ["text", "image"] として列挙されており、同じ bare model ID を公開する他の構成済み画像 provider がない場合、OpenClaw は qwen2.5vl:7b のような bare imageModel ref も ollama/qwen2.5vl:7b に正規化します。複数の構成済み画像 provider が同じ bare ID を持つ場合は、provider prefix を明示的に使用してください。
遅いローカル vision モデルでは、クラウドモデルよりも長い画像理解タイムアウトが必要になる場合があります。また、制約のあるハードウェアで Ollama が公開されている完全な vision context を割り当てようとすると、クラッシュまたは停止することがあります。通常の画像説明 turn だけが必要な場合は、capability timeout を設定し、モデルエントリで num_ctx を制限します。
image tool に適用されます。provider レベルの models.providers.ollama.timeoutSeconds は、通常のモデル呼び出しに対する基盤の Ollama HTTP リクエストガードを引き続き制御します。
明示的な image tool をローカル Ollama に対してライブ検証するには次を使います。
models.providers.ollama.models を手動で定義する場合は、vision モデルに画像入力サポートをマークします。
/api/show が vision capability を報告したときに、OpenClaw はこれを Ollama から読み取ります。
設定
- 基本(暗黙的な検出)
- 明示的(手動モデル)
- カスタム base URL
最も単純なローカル専用の有効化パスは環境変数を使う方法です。
一般的なレシピ
これらを出発点として使い、モデル ID をollama list または openclaw models list --provider ollama の正確な名前に置き換えてください。
自動検出付きローカルモデル
自動検出付きローカルモデル
Ollama が Gateway と同じマシンで実行されており、インストール済みモデルを OpenClaw に自動検出させたい場合に使用します。このパスでは設定を最小限に保てます。モデルを手動で定義したい場合を除き、
models.providers.ollama ブロックを追加しないでください。手動モデルを使う LAN Ollama ホスト
手動モデルを使う LAN Ollama ホスト
LAN ホストにはネイティブ Ollama URL を使用します。
/v1 は追加しないでください。contextWindow は OpenClaw 側の context budget です。params.num_ctx はリクエストで Ollama に送信されます。ハードウェアがモデルの公開されている完全な context を実行できない場合は、これらを揃えてください。Ollama Cloud のみ
Ollama Cloud のみ
ローカルデーモンを実行せず、ホストされた Ollama モデルを直接使いたい場合に使用します。
サインイン済みデーモン経由のクラウドとローカルの併用
サインイン済みデーモン経由のクラウドとローカルの併用
ローカルまたは LAN の Ollama デーモンが
ollama signin でサインイン済みで、ローカルモデルと :cloud モデルの両方を提供する必要がある場合に使用します。複数の Ollama ホスト
複数の Ollama ホスト
複数の Ollama server がある場合は、カスタム provider ID を使用します。各 provider は独自のホスト、モデル、認証、タイムアウト、モデル ref を持ちます。OpenClaw がリクエストを送信するとき、アクティブな provider prefix は削除されるため、
ollama-large/qwen3.5:27b は qwen3.5:27b として Ollama に到達します。軽量なローカルモデルプロファイル
軽量なローカルモデルプロファイル
一部のローカルモデルは単純なプロンプトには回答できますが、完全な agent tool surface では苦戦することがあります。グローバルランタイム設定を変更する前に、まず tools と context を制限してください。
compat.supportsTools: false は、モデルまたはサーバーがツールスキーマで確実に失敗する場合にのみ使用します。これは安定性と引き換えにエージェント機能を制限します。
localModelLean はエージェントの表面からブラウザー、cron、メッセージツールを削除しますが、Ollama のランタイムコンテキストや思考モードは変更しません。ループしたり、応答予算を隠れた推論に費やしたりする小さな Qwen スタイルの思考モデルでは、明示的な params.num_ctx と params.thinking: false を組み合わせてください。モデル選択
設定後、すべての Ollama モデルが利用できます。ollama-spark/qwen3:32b のようにアクティブなプロバイダープレフィックスを使用する場合、OpenClaw は Ollama を呼び出す前にそのプレフィックスだけを取り除くため、サーバーは qwen3:32b を受け取ります。
遅いローカルモデルでは、エージェントランタイム全体のタイムアウトを引き上げる前に、プロバイダー単位のリクエスト調整を優先してください。
timeoutSeconds は、接続セットアップ、ヘッダー、本文ストリーミング、保護された fetch の中断全体を含むモデル HTTP リクエストに適用されます。params.keep_alive はネイティブの /api/chat リクエストでトップレベルの keep_alive として Ollama に転送されます。初回ターンの読み込み時間がボトルネックの場合はモデルごとに設定してください。
クイック検証
127.0.0.1 を baseUrl で使用しているホストに置き換えてください。curl は動作するのに OpenClaw が動作しない場合は、Gateway が別のマシン、コンテナー、またはサービスアカウントで実行されていないか確認してください。
Ollama Web Search
OpenClaw は、バンドルされたweb_search プロバイダーとして Ollama Web Search をサポートします。
| プロパティ | 詳細 |
|---|---|
| ホスト | 設定済みの Ollama ホストを使用します(設定されている場合は models.providers.ollama.baseUrl、それ以外は http://127.0.0.1:11434)。https://ollama.com はホスト型 API を直接使用します |
| 認証 | サインイン済みのローカル Ollama ホストではキー不要です。直接の https://ollama.com 検索または認証で保護されたホストでは OLLAMA_API_KEY または設定済みプロバイダー認証を使用します |
| 要件 | ローカル/セルフホストのホストは実行中で、ollama signin でサインイン済みである必要があります。直接のホスト型検索には baseUrl: "https://ollama.com" と実際の Ollama API キーが必要です |
openclaw onboard または openclaw configure --section web で Ollama Web Search を選択するか、次を設定します。
/api/experimental/web_search プロキシを使用します。https://ollama.com の場合は、ホスト型の /api/web_search エンドポイントを直接呼び出します。
完全なセットアップと挙動の詳細については、Ollama Web Search を参照してください。
高度な設定
レガシー OpenAI 互換モード
レガシー OpenAI 互換モード
代わりに OpenAI 互換エンドポイントを使用する必要がある場合(たとえば、OpenAI 形式のみをサポートするプロキシの背後にある場合)は、このモードでは、ストリーミングとツール呼び出しを同時にサポートしない場合があります。モデル設定で
api: "openai-completions" を明示的に設定します。params: { streaming: false } を使ってストリーミングを無効にする必要があるかもしれません。Ollama で api: "openai-completions" が使用される場合、OpenClaw はデフォルトで options.num_ctx を注入し、Ollama が暗黙的に 4096 のコンテキストウィンドウへフォールバックしないようにします。プロキシまたはアップストリームが未知の options フィールドを拒否する場合は、この挙動を無効にしてください。コンテキストウィンドウ
コンテキストウィンドウ
自動検出されたモデルでは、OpenClaw は利用可能な場合、カスタム Modelfile のより大きな モデルごとの
PARAMETER num_ctx 値を含め、Ollama が報告するコンテキストウィンドウを使用します。それ以外の場合は、OpenClaw が使用するデフォルトの Ollama コンテキストウィンドウにフォールバックします。その Ollama プロバイダー配下のすべてのモデルに対して、プロバイダーレベルの contextWindow、contextTokens、maxTokens のデフォルトを設定し、必要に応じてモデルごとに上書きできます。contextWindow は OpenClaw のプロンプトと Compaction の予算です。ネイティブの Ollama リクエストでは、params.num_ctx を明示的に設定しない限り options.num_ctx は未設定のままになるため、Ollama は独自のモデル、OLLAMA_CONTEXT_LENGTH、または VRAM ベースのデフォルトを適用できます。Modelfile を再ビルドせずに Ollama のリクエストごとのランタイムコンテキストを上限設定または強制するには、params.num_ctx を設定します。無効、ゼロ、負数、非有限の値は無視されます。OpenAI 互換 Ollama アダプターは、設定された params.num_ctx または contextWindow からデフォルトで引き続き options.num_ctx を注入します。アップストリームが options を拒否する場合は、injectNumCtxForOpenAICompat: false で無効にしてください。ネイティブ Ollama モデルエントリは、temperature、top_p、top_k、min_p、num_predict、stop、repeat_penalty、num_batch、num_thread、use_mmap など、一般的な Ollama ランタイムオプションも params 配下で受け付けます。OpenClaw は Ollama リクエストキーだけを転送するため、streaming のような OpenClaw ランタイムパラメーターが Ollama に漏れることはありません。トップレベルの Ollama think を送信するには params.think または params.thinking を使用します。false は Qwen スタイルの思考モデルで API レベルの思考を無効にします。agents.defaults.models["ollama/<model>"].params.num_ctx も機能します。両方が設定されている場合は、明示的なプロバイダーモデルエントリがエージェントデフォルトより優先されます。思考制御
思考制御
ネイティブ Ollama モデルでは、OpenClaw は Ollama が期待する形式で思考制御を転送します。つまり モデルデフォルトも設定できます。モデルごとの
options.think ではなく、トップレベルの think です。/api/show レスポンスに thinking 機能が含まれる自動検出モデルは、/think low、/think medium、/think high、/think max を公開します。思考非対応モデルは /think off のみを公開します。params.think または params.thinking は、特定の設定済みモデルに対して Ollama API の思考を無効化または強制できます。アクティブな実行に暗黙的なデフォルト off しかない場合、OpenClaw はそれらの明示的なモデルパラメーターを保持します。/think medium のような off 以外のランタイムコマンドは、引き続きアクティブな実行を上書きします。推論モデル
推論モデル
OpenClaw は、追加設定は不要です。OpenClaw が自動的にマークします。
deepseek-r1、reasoning、think のような名前のモデルをデフォルトで推論対応として扱います。モデルコスト
モデルコスト
Ollama は無料でローカル実行されるため、すべてのモデルコストは $0 に設定されます。これは自動検出モデルと手動定義モデルの両方に適用されます。
メモリエンベディング
メモリエンベディング
バンドルされた Ollama Plugin は、メモリ検索 用のメモリエンベディングプロバイダーを登録します。設定済みの Ollama ベース URL と API キーを使用し、Ollama の現在の
クエリ時のエンベディングは、リモートエンベディングホストでは、認証をそのホストに限定してください。
/api/embed エンドポイントを呼び出し、可能な場合は複数のメモリチャンクを 1 つの input リクエストにバッチ化します。| プロパティ | 値 |
|---|---|
| デフォルトモデル | nomic-embed-text |
| 自動 pull | はい — エンベディングモデルがローカルに存在しない場合、自動的に pull されます |
nomic-embed-text、qwen3-embedding、mxbai-embed-large など、それを必要とする、または推奨するモデル向けに検索プレフィックスを使用します。メモリドキュメントのバッチは生のままに保たれるため、既存のインデックスで形式移行は不要です。メモリ検索エンベディングプロバイダーとして Ollama を選択するには:ストリーミング設定
ストリーミング設定
OpenClaw の Ollama 連携は、デフォルトで ネイティブ Ollama API (
/api/chat) を使用します。これはストリーミングとツール呼び出しの同時利用を完全にサポートしています。特別な設定は不要です。ネイティブ /api/chat リクエストでは、OpenClaw は thinking 制御も Ollama に直接転送します。/think off と openclaw agent --thinking off は、明示的なモデル params.think/params.thinking 値が設定されていない限り、トップレベルの think: false を送信します。一方、/think low|medium|high は対応するトップレベルの think effort 文字列を送信します。/think max は Ollama のネイティブの最大 effort である think: "high" に対応します。トラブルシューティング
WSL2 クラッシュループ(繰り返し再起動)
WSL2 クラッシュループ(繰り返し再起動)
NVIDIA/CUDA を使用する WSL2 では、公式の Ollama Linux インストーラーが これを Windows 側の Ollama サービス環境でより短い keep-alive を設定するか、必要なときだけ Ollama を手動で起動します。ollama/ollama#11317 を参照してください。
Restart=always を持つ ollama.service systemd ユニットを作成します。そのサービスが自動起動し、WSL2 の起動中に GPU 対応モデルを読み込むと、モデルの読み込み中に Ollama がホストメモリを固定することがあります。Hyper-V のメモリ回収では、それらの固定ページを常に回収できるとは限らないため、Windows が WSL2 VM を終了し、systemd が再び Ollama を起動して、ループが繰り返されます。よくある証拠:- Windows 側からの WSL2 の繰り返し再起動または終了
- WSL2 起動直後の
app.sliceまたはollama.serviceでの高い CPU 使用率 - Linux OOM-killer イベントではなく systemd からの SIGTERM
Restart=always が有効な ollama.service、および可視の CUDA マーカーを検出すると、起動時警告をログに記録します。緩和策:%USERPROFILE%\.wslconfig に追加し、その後 wsl --shutdown を実行します。Ollama が検出されない
Ollama が検出されない
Ollama が実行中であり、API にアクセスできることを確認します。
OLLAMA_API_KEY(または認証プロファイル)を設定していて、明示的な models.providers.ollama エントリを定義していないことを確認してください。利用可能なモデルがない
利用可能なモデルがない
モデルが一覧にない場合は、そのモデルをローカルに pull するか、
models.providers.ollama で明示的に定義してください。接続が拒否される
接続が拒否される
Ollama が正しいポートで実行されていることを確認してください。
リモートホストは curl では動作するが OpenClaw では動作しない
リモートホストは curl では動作するが OpenClaw では動作しない
Gateway を実行している同じマシンとランタイムから確認してください。よくある原因:
baseUrlがlocalhostを指しているが、Gateway は Docker 内または別のホストで実行されている。- URL が
/v1を使用しており、ネイティブ Ollama ではなく OpenAI 互換の動作が選択されている。 - リモートホスト側で、Ollama 側のファイアウォールまたは LAN バインドの変更が必要。
- モデルがノート PC のデーモンには存在するが、リモートデーモンには存在しない。
モデルがツール JSON をテキストとして出力する
モデルがツール JSON をテキストとして出力する
これは通常、プロバイダーが OpenAI 互換モードを使用しているか、モデルがツールスキーマを扱えないことを意味します。ネイティブ Ollama モードを優先してください。小さなローカルモデルがツールスキーマでまだ失敗する場合は、そのモデルエントリで
compat.supportsTools: false を設定して再テストしてください。Kimi または GLM が文字化けした記号を返す
Kimi または GLM が文字化けした記号を返す
長い非言語的な記号列であるホスト型 Kimi/GLM レスポンスは、成功したアシスタント回答ではなく、失敗したプロバイダー出力として扱われます。これにより、破損したテキストをセッションに永続化せずに、通常の再試行、フォールバック、またはエラー処理へ移行できます。繰り返し発生する場合は、生のモデル名、現在のセッションファイル、実行が
Cloud + Local と Cloud only のどちらを使用したかを記録し、その後、新しいセッションとフォールバックモデルを試してください。コールドなローカルモデルがタイムアウトする
コールドなローカルモデルがタイムアウトする
大規模なローカルモデルでは、ストリーミングが始まる前に最初の読み込みに長い時間が必要な場合があります。タイムアウトは Ollama プロバイダーに限定し、必要に応じてターン間でモデルを読み込んだままにするよう Ollama に依頼します。ホスト自体が接続の受け付けに時間がかかる場合、
timeoutSeconds はこのプロバイダーに対して保護された Undici 接続タイムアウトも延長します。大きなコンテキストのモデルが遅すぎる、またはメモリ不足になる
大きなコンテキストのモデルが遅すぎる、またはメモリ不足になる
多くの Ollama モデルは、ハードウェアで快適に実行できる範囲を超えるコンテキストを advertised しています。ネイティブ Ollama は、OpenClaw が送信するプロンプトが多すぎる場合は、まず
params.num_ctx を設定しない限り、Ollama 独自のランタイムコンテキスト既定値を使用します。予測可能な初回トークンレイテンシが必要な場合は、OpenClaw のバジェットと Ollama のリクエストコンテキストの両方を上限設定してください。contextWindow を下げてください。Ollama がマシンに対して大きすぎるランタイムコンテキストを読み込んでいる場合は、params.num_ctx を下げてください。生成が長すぎる場合は、maxTokens を下げてください。さらにヘルプが必要な場合: トラブルシューティング と FAQ。
関連
モデルプロバイダー
すべてのプロバイダー、モデル参照、フェイルオーバー動作の概要。
モデル選択
モデルの選択と設定方法。
Ollama Web Search
Ollama を利用した Web 検索の完全なセットアップと動作詳細。
設定
完全な設定リファレンス。