Перейти до основного вмісту

Venice AI (огляд Venice)

Venice — це наш рекомендований варіант налаштування Venice для inference з пріоритетом конфіденційності та необов’язковим анонімізованим доступом до пропрієтарних моделей. Venice AI надає AI-inference, орієнтований на конфіденційність, із підтримкою нецензурованих моделей і доступом до основних пропрієтарних моделей через свій анонімізований проксі. Увесь inference є приватним за замовчуванням — без навчання на ваших даних і без журналювання.

Чому Venice в OpenClaw

  • Приватний inference для open-source моделей (без журналювання).
  • Нецензуровані моделі, коли вони вам потрібні.
  • Анонімізований доступ до пропрієтарних моделей (Opus/GPT/Gemini), коли важлива якість.
  • OpenAI-compatible кінцеві точки /v1.

Режими конфіденційності

Venice пропонує два рівні конфіденційності — розуміння цього є ключовим для вибору моделі:
РежимОписМоделі
PrivateПовністю приватний. Підказки/відповіді ніколи не зберігаються і не журналюються. Ефемерний режим.Llama, Qwen, DeepSeek, Kimi, MiniMax, Venice Uncensored тощо.
AnonymizedПроксіюється через Venice із видаленими метаданими. Базовий провайдер (OpenAI, Anthropic, Google, xAI) бачить анонімізовані запити.Claude, GPT, Gemini, Grok

Можливості

  • Орієнтація на конфіденційність: вибір між режимами “private” (повністю приватний) і “anonymized” (через проксі)
  • Нецензуровані моделі: доступ до моделей без обмежень контенту
  • Доступ до основних моделей: використовуйте Claude, GPT, Gemini і Grok через анонімізований проксі Venice
  • OpenAI-compatible API: стандартні кінцеві точки /v1 для простої інтеграції
  • Streaming: ✅ підтримується для всіх моделей
  • Function calling: ✅ підтримується для вибраних моделей (перевіряйте можливості моделі)
  • Vision: ✅ підтримується для моделей із можливістю vision
  • Без жорстких лімітів rate: для екстремального використання може застосовуватися fair-use throttling

Налаштування

1. Отримайте API key

  1. Зареєструйтеся на venice.ai
  2. Перейдіть до Settings → API Keys → Create new key
  3. Скопіюйте свій API key (формат: vapi_xxxxxxxxxxxx)

2. Налаштуйте OpenClaw

Варіант A: змінна середовища
export VENICE_API_KEY="vapi_xxxxxxxxxxxx"
Варіант B: інтерактивне налаштування (рекомендовано)
openclaw onboard --auth-choice venice-api-key
Це:
  1. Запитає ваш API key (або використає наявний VENICE_API_KEY)
  2. Покажe всі доступні моделі Venice
  3. Дозволить вибрати типову модель
  4. Автоматично налаштує провайдера
Варіант C: неінтерактивно
openclaw onboard --non-interactive \
  --auth-choice venice-api-key \
  --venice-api-key "vapi_xxxxxxxxxxxx"

3. Перевірте налаштування

openclaw agent --model venice/kimi-k2-5 --message "Hello, are you working?"

Вибір моделі

Після налаштування OpenClaw показує всі доступні моделі Venice. Вибирайте відповідно до своїх потреб:
  • Типова модель: venice/kimi-k2-5 для сильного приватного reasoning плюс vision.
  • Варіант із високими можливостями: venice/claude-opus-4-6 для найсильнішого анонімізованого шляху Venice.
  • Конфіденційність: вибирайте моделі “private” для повністю приватного inference.
  • Можливості: вибирайте моделі “anonymized”, щоб отримати доступ до Claude, GPT, Gemini через проксі Venice.
Змінити типову модель можна будь-коли:
openclaw models set venice/kimi-k2-5
openclaw models set venice/claude-opus-4-6
Список усіх доступних моделей:
openclaw models list | grep venice

Налаштування через openclaw configure

  1. Виконайте openclaw configure
  2. Виберіть Model/auth
  3. Виберіть Venice AI

Яку модель мені використовувати?

Випадок використанняРекомендована модельЧому
Загальний чат (типово)kimi-k2-5Сильний приватний reasoning плюс vision
Найкраща загальна якістьclaude-opus-4-6Найсильніший анонімізований варіант Venice
Конфіденційність + кодуванняqwen3-coder-480b-a35b-instructПриватна модель для кодування з великим контекстом
Приватний visionkimi-k2-5Підтримка vision без виходу з приватного режиму
Швидко + дешевоqwen3-4bЛегка reasoning-модель
Складні приватні завданняdeepseek-v3.2Сильний reasoning, але без підтримки інструментів Venice
Нецензурованоvenice-uncensoredБез обмежень контенту

Доступні моделі (усього 41)

Приватні моделі (26) - повністю приватні, без журналювання

Model IDНазваКонтекстМожливості
kimi-k2-5Kimi K2.5256kТипова, reasoning, vision
kimi-k2-thinkingKimi K2 Thinking256kReasoning
llama-3.3-70bLlama 3.3 70B128kЗагальні
llama-3.2-3bLlama 3.2 3B128kЗагальні
hermes-3-llama-3.1-405bHermes 3 Llama 3.1 405B128kЗагальні, інструменти вимкнені
qwen3-235b-a22b-thinking-2507Qwen3 235B Thinking128kReasoning
qwen3-235b-a22b-instruct-2507Qwen3 235B Instruct128kЗагальні
qwen3-coder-480b-a35b-instructQwen3 Coder 480B256kКодування
qwen3-coder-480b-a35b-instruct-turboQwen3 Coder 480B Turbo256kКодування
qwen3-5-35b-a3bQwen3.5 35B A3B256kReasoning, vision
qwen3-next-80bQwen3 Next 80B256kЗагальні
qwen3-vl-235b-a22bQwen3 VL 235B (Vision)256kVision
qwen3-4bVenice Small (Qwen3 4B)32kШвидка, reasoning
deepseek-v3.2DeepSeek V3.2160kReasoning, інструменти вимкнені
venice-uncensoredVenice Uncensored (Dolphin-Mistral)32kНецензурована, інструменти вимкнені
mistral-31-24bVenice Medium (Mistral)128kVision
google-gemma-3-27b-itGoogle Gemma 3 27B Instruct198kVision
openai-gpt-oss-120bOpenAI GPT OSS 120B128kЗагальні
nvidia-nemotron-3-nano-30b-a3bNVIDIA Nemotron 3 Nano 30B128kЗагальні
olafangensan-glm-4.7-flash-hereticGLM 4.7 Flash Heretic128kReasoning
zai-org-glm-4.6GLM 4.6198kЗагальні
zai-org-glm-4.7GLM 4.7198kReasoning
zai-org-glm-4.7-flashGLM 4.7 Flash128kReasoning
zai-org-glm-5GLM 5198kReasoning
minimax-m21MiniMax M2.1198kReasoning
minimax-m25MiniMax M2.5198kReasoning

Анонімізовані моделі (15) - через проксі Venice

Model IDНазваКонтекстМожливості
claude-opus-4-6Claude Opus 4.6 (через Venice)1MReasoning, vision
claude-opus-4-5Claude Opus 4.5 (через Venice)198kReasoning, vision
claude-sonnet-4-6Claude Sonnet 4.6 (через Venice)1MReasoning, vision
claude-sonnet-4-5Claude Sonnet 4.5 (через Venice)198kReasoning, vision
openai-gpt-54GPT-5.4 (через Venice)1MReasoning, vision
openai-gpt-53-codexGPT-5.3 Codex (через Venice)400kReasoning, vision, кодування
openai-gpt-52GPT-5.2 (через Venice)256kReasoning
openai-gpt-52-codexGPT-5.2 Codex (через Venice)256kReasoning, vision, кодування
openai-gpt-4o-2024-11-20GPT-4o (через Venice)128kVision
openai-gpt-4o-mini-2024-07-18GPT-4o Mini (через Venice)128kVision
gemini-3-1-pro-previewGemini 3.1 Pro (через Venice)1MReasoning, vision
gemini-3-pro-previewGemini 3 Pro (через Venice)198kReasoning, vision
gemini-3-flash-previewGemini 3 Flash (через Venice)256kReasoning, vision
grok-41-fastGrok 4.1 Fast (через Venice)1MReasoning, vision
grok-code-fast-1Grok Code Fast 1 (через Venice)256kReasoning, кодування

Виявлення моделей

OpenClaw автоматично виявляє моделі з API Venice, коли встановлено VENICE_API_KEY. Якщо API недоступний, він переходить до статичного каталогу. Кінцева точка /models є публічною (автентифікація не потрібна для перегляду списку), але для inference потрібен чинний API key.

Підтримка streaming та інструментів

МожливістьПідтримка
Streaming✅ Усі моделі
Function calling✅ Більшість моделей (перевіряйте supportsFunctionCalling в API)
Vision/Images✅ Моделі, позначені можливістю “Vision”
JSON mode✅ Підтримується через response_format

Ціни

Venice використовує систему на основі кредитів. Актуальні тарифи див. на venice.ai/pricing:
  • Private models: зазвичай нижча вартість
  • Anonymized models: приблизно як пряме ціноутворення API + невелика комісія Venice

Порівняння: Venice vs Direct API

АспектVenice (Anonymized)Direct API
КонфіденційністьМетадані видалено, анонімізованоВаш обліковий запис пов’язано
Затримка+10-50 мс (проксі)Напряму
МожливостіПідтримується більшість можливостейУсі можливості
БілінгКредити VeniceБілінг провайдера

Приклади використання

# Use the default private model
openclaw agent --model venice/kimi-k2-5 --message "Quick health check"

# Use Claude Opus via Venice (anonymized)
openclaw agent --model venice/claude-opus-4-6 --message "Summarize this task"

# Use uncensored model
openclaw agent --model venice/venice-uncensored --message "Draft options"

# Use vision model with image
openclaw agent --model venice/qwen3-vl-235b-a22b --message "Review attached image"

# Use coding model
openclaw agent --model venice/qwen3-coder-480b-a35b-instruct --message "Refactor this function"

Усунення несправностей

API key не розпізнається

echo $VENICE_API_KEY
openclaw models list | grep venice
Переконайтеся, що ключ починається з vapi_.

Модель недоступна

Каталог моделей Venice оновлюється динамічно. Виконайте openclaw models list, щоб побачити моделі, доступні зараз. Деякі моделі можуть бути тимчасово офлайн.

Проблеми з підключенням

API Venice доступний за адресою https://api.venice.ai/api/v1. Переконайтеся, що ваша мережа дозволяє HTTPS-з’єднання.

Приклад файла конфігурації

{
  env: { VENICE_API_KEY: "vapi_..." },
  agents: { defaults: { model: { primary: "venice/kimi-k2-5" } } },
  models: {
    mode: "merge",
    providers: {
      venice: {
        baseUrl: "https://api.venice.ai/api/v1",
        apiKey: "${VENICE_API_KEY}",
        api: "openai-completions",
        models: [
          {
            id: "kimi-k2-5",
            name: "Kimi K2.5",
            reasoning: true,
            input: ["text", "image"],
            cost: { input: 0, output: 0, cacheRead: 0, cacheWrite: 0 },
            contextWindow: 256000,
            maxTokens: 65536,
          },
        ],
      },
    },
  },
}

Посилання