Venice AI

Venice AI는 비검열 모델 지원과 익명화 프록시를 통한 주요 독점 모델 접근을 제공하는 개인정보 보호 중심 AI 추론을 제공합니다. 모든 추론은 기본적으로 비공개입니다. 데이터 학습도, 로깅도 없습니다.

OpenClaw에서 Venice를 사용하는 이유

오픈소스 모델을 위한 비공개 추론(로깅 없음).
필요할 때 사용할 수 있는 비검열 모델.
품질이 중요할 때 독점 모델(Opus/GPT/Gemini)에 대한 익명화 접근.
OpenAI 호환 /v1 엔드포인트.

개인정보 보호 모드

Venice는 두 가지 개인정보 보호 수준을 제공합니다. 이를 이해하는 것이 모델 선택의 핵심입니다.

모드	설명	모델
비공개	완전히 비공개입니다. 프롬프트/응답은 절대 저장되거나 로깅되지 않습니다. 일시적입니다.	Llama, Qwen, DeepSeek, Kimi, MiniMax, Venice Uncensored 등
익명화	Venice를 통해 프록시되며 메타데이터가 제거됩니다. 기본 제공자(OpenAI, Anthropic, Google, xAI)는 익명화된 요청을 봅니다.	Claude, GPT, Gemini, Grok

익명화 모델은 완전히 비공개가 아닙니다. Venice는 전달 전에 메타데이터를 제거하지만, 기본 제공자(OpenAI, Anthropic, Google, xAI)는 여전히 요청을 처리합니다. 완전한 개인정보 보호가 필요한 경우 비공개 모델을 선택하세요.

기능

개인정보 보호 중심: “비공개”(완전 비공개) 및 “익명화”(프록시) 모드 중 선택
비검열 모델: 콘텐츠 제한이 없는 모델에 접근
주요 모델 접근: Venice의 익명화 프록시를 통해 Claude, GPT, Gemini, Grok 사용
OpenAI 호환 API: 쉬운 통합을 위한 표준 /v1 엔드포인트
스트리밍: 모든 모델에서 지원
함수 호출: 일부 모델에서 지원(모델 기능 확인)
비전: 비전 기능이 있는 모델에서 지원
엄격한 속도 제한 없음: 극단적인 사용량에는 공정 사용 제한이 적용될 수 있음

시작하기

API 키 받기

venice.ai에서 가입합니다
Settings > API Keys > Create new key로 이동합니다
API 키를 복사합니다(형식: vapi_xxxxxxxxxxxx)

OpenClaw 구성

선호하는 설정 방법을 선택합니다.

대화형(권장)
환경 변수
비대화형

openclaw onboard --auth-choice venice-api-key

이렇게 하면 다음을 수행합니다.

API 키를 입력하라는 메시지를 표시합니다(또는 기존 VENICE_API_KEY 사용)
사용 가능한 모든 Venice 모델을 표시합니다
기본 모델을 선택할 수 있게 합니다
제공자를 자동으로 구성합니다

export VENICE_API_KEY="vapi_xxxxxxxxxxxx"

openclaw onboard --non-interactive \
  --auth-choice venice-api-key \
  --venice-api-key "vapi_xxxxxxxxxxxx"

설정 확인

openclaw agent --model venice/kimi-k2-5 --message "Hello, are you working?"

모델 선택

설정 후 OpenClaw는 사용 가능한 모든 Venice 모델을 표시합니다. 필요에 따라 선택하세요.

기본 모델: 강력한 비공개 추론과 비전을 위해 venice/kimi-k2-5.
고성능 옵션: 가장 강력한 익명화 Venice 경로를 위해 venice/claude-opus-4-6.
개인정보 보호: 완전 비공개 추론을 위해 “비공개” 모델을 선택합니다.
기능: Venice의 프록시를 통해 Claude, GPT, Gemini에 접근하려면 “익명화” 모델을 선택합니다.

언제든지 기본 모델을 변경할 수 있습니다.

openclaw models set venice/kimi-k2-5
openclaw models set venice/claude-opus-4-6

사용 가능한 모든 모델을 나열합니다.

openclaw models list --all --provider venice

openclaw configure를 실행하고 Model/auth를 선택한 다음 Venice AI를 선택할 수도 있습니다.

아래 표를 사용해 사용 사례에 맞는 모델을 선택하세요.

사용 사례	권장 모델	이유
일반 채팅(기본값)	`kimi-k2-5`	강력한 비공개 추론과 비전
최고의 전체 품질	`claude-opus-4-6`	가장 강력한 익명화 Venice 옵션
개인정보 보호 + 코딩	`qwen3-coder-480b-a35b-instruct`	큰 컨텍스트를 갖춘 비공개 코딩 모델
비공개 비전	`kimi-k2-5`	비공개 모드를 벗어나지 않는 비전 지원
빠르고 저렴함	`qwen3-4b`	경량 추론 모델
복잡한 비공개 작업	`deepseek-v3.2`	강력한 추론, 하지만 Venice 도구 지원 없음
비검열	`venice-uncensored`	콘텐츠 제한 없음

DeepSeek V4 재생 동작

Venice가 venice/deepseek-v4-pro 또는 venice/deepseek-v4-flash 같은 DeepSeek V4 모델을 노출하는 경우, OpenClaw는 프록시가 이를 생략하면 어시스턴트 메시지에 필요한 DeepSeek V4 reasoning_content 재생 자리 표시자를 채웁니다. Venice는 DeepSeek의 네이티브 최상위 thinking 제어를 거부하므로 OpenClaw는 해당 제공자별 재생 수정 사항을 네이티브 DeepSeek 제공자의 thinking 제어와 분리해 유지합니다.

내장 카탈로그(총 41개)

비공개 모델(26개) — 완전 비공개, 로깅 없음

모델 ID	이름	컨텍스트	기능
`kimi-k2-5`	Kimi K2.5	256k	기본값, 추론, 비전
`kimi-k2-thinking`	Kimi K2 Thinking	256k	추론
`llama-3.3-70b`	Llama 3.3 70B	128k	일반
`llama-3.2-3b`	Llama 3.2 3B	128k	일반
`hermes-3-llama-3.1-405b`	Hermes 3 Llama 3.1 405B	128k	일반, 도구 비활성화
`qwen3-235b-a22b-thinking-2507`	Qwen3 235B Thinking	128k	추론
`qwen3-235b-a22b-instruct-2507`	Qwen3 235B Instruct	128k	일반
`qwen3-coder-480b-a35b-instruct`	Qwen3 Coder 480B	256k	코딩
`qwen3-coder-480b-a35b-instruct-turbo`	Qwen3 Coder 480B Turbo	256k	코딩
`qwen3-5-35b-a3b`	Qwen3.5 35B A3B	256k	추론, 비전
`qwen3-next-80b`	Qwen3 Next 80B	256k	일반
`qwen3-vl-235b-a22b`	Qwen3 VL 235B (Vision)	256k	비전
`qwen3-4b`	Venice Small (Qwen3 4B)	32k	빠름, 추론
`deepseek-v3.2`	DeepSeek V3.2	160k	추론, 도구 비활성화
`venice-uncensored`	Venice Uncensored (Dolphin-Mistral)	32k	비검열, 도구 비활성화
`mistral-31-24b`	Venice Medium (Mistral)	128k	비전
`google-gemma-3-27b-it`	Google Gemma 3 27B Instruct	198k	비전
`openai-gpt-oss-120b`	OpenAI GPT OSS 120B	128k	일반
`nvidia-nemotron-3-nano-30b-a3b`	NVIDIA Nemotron 3 Nano 30B	128k	일반
`olafangensan-glm-4.7-flash-heretic`	GLM 4.7 Flash Heretic	128k	추론
`zai-org-glm-4.6`	GLM 4.6	198k	일반
`zai-org-glm-4.7`	GLM 4.7	198k	추론
`zai-org-glm-4.7-flash`	GLM 4.7 Flash	128k	추론
`zai-org-glm-5`	GLM 5	198k	추론
`minimax-m21`	MiniMax M2.1	198k	추론
`minimax-m25`	MiniMax M2.5	198k	추론

익명화 모델(15개) — Venice 프록시 경유

모델 ID	이름	컨텍스트	기능
`claude-opus-4-6`	Claude Opus 4.6 (Venice 경유)	1M	추론, 비전
`claude-opus-4-5`	Claude Opus 4.5 (Venice 경유)	198k	추론, 비전
`claude-sonnet-4-6`	Claude Sonnet 4.6 (Venice 경유)	1M	추론, 비전
`claude-sonnet-4-5`	Claude Sonnet 4.5 (Venice 경유)	198k	추론, 비전
`openai-gpt-54`	GPT-5.4 (Venice 경유)	1M	추론, 비전
`openai-gpt-53-codex`	GPT-5.3 Codex (Venice 경유)	400k	추론, 비전, 코딩
`openai-gpt-52`	GPT-5.2 (Venice 경유)	256k	추론
`openai-gpt-52-codex`	GPT-5.2 Codex (Venice 경유)	256k	추론, 비전, 코딩
`openai-gpt-4o-2024-11-20`	GPT-4o (Venice 경유)	128k	비전
`openai-gpt-4o-mini-2024-07-18`	GPT-4o Mini (Venice 경유)	128k	비전
`gemini-3-1-pro-preview`	Gemini 3.1 Pro (Venice 경유)	1M	추론, 비전
`gemini-3-pro-preview`	Gemini 3 Pro (Venice 경유)	198k	추론, 비전
`gemini-3-flash-preview`	Gemini 3 Flash (Venice 경유)	256k	추론, 비전
`grok-41-fast`	Grok 4.1 Fast (Venice 경유)	1M	추론, 비전
`grok-code-fast-1`	Grok Code Fast 1 (Venice 경유)	256k	추론, 코딩

모델 탐색

OpenClaw는 읽기 전용 모델 목록을 위해 매니페스트 기반 Venice 시드 카탈로그를 제공합니다. 런타임 새로 고침은 여전히 Venice API에서 모델을 탐색할 수 있으며, API에 연결할 수 없는 경우 매니페스트 카탈로그로 대체됩니다. /models 엔드포인트는 공개입니다(목록 조회에는 인증 필요 없음). 하지만 추론에는 유효한 API 키가 필요합니다.

스트리밍 및 도구 지원

기능	지원
스트리밍	모든 모델
함수 호출	대부분의 모델(API에서 `supportsFunctionCalling` 확인)
비전/이미지	”Vision” 기능으로 표시된 모델
JSON 모드	`response_format`를 통해 지원

가격

Venice는 크레딧 기반 시스템을 사용합니다. 현재 요금은 venice.ai/pricing에서 확인하세요.

비공개 모델: 일반적으로 더 낮은 비용
익명화 모델: 직접 API 가격 + 소액의 Venice 수수료와 유사

Venice(익명화) vs 직접 API

측면	Venice(익명화)	직접 API
개인정보 보호	메타데이터 제거, 익명화	계정이 연결됨
지연 시간	+10-50ms(프록시)	직접 연결
기능	대부분의 기능 지원	전체 기능
청구	Venice 크레딧	제공자 청구

사용 예시

# Use the default private model
openclaw agent --model venice/kimi-k2-5 --message "Quick health check"

# Use Claude Opus via Venice (anonymized)
openclaw agent --model venice/claude-opus-4-6 --message "Summarize this task"

# Use uncensored model
openclaw agent --model venice/venice-uncensored --message "Draft options"

# Use vision model with image
openclaw agent --model venice/qwen3-vl-235b-a22b --message "Review attached image"

# Use coding model
openclaw agent --model venice/qwen3-coder-480b-a35b-instruct --message "Refactor this function"

문제 해결

API 키가 인식되지 않음

echo $VENICE_API_KEY
openclaw models list | grep venice

키가 vapi_로 시작하는지 확인하세요.

모델을 사용할 수 없음

Venice 모델 카탈로그는 동적으로 업데이트됩니다. 현재 사용 가능한 모델을 보려면 openclaw models list를 실행하세요. 일부 모델은 일시적으로 오프라인일 수 있습니다.

연결 문제

Venice API는 https://api.venice.ai/api/v1에 있습니다. 네트워크에서 HTTPS 연결을 허용하는지 확인하세요.

추가 도움말: 문제 해결 및 FAQ.

고급 구성

구성 파일 예시

{
  env: { VENICE_API_KEY: "vapi_..." },
  agents: { defaults: { model: { primary: "venice/kimi-k2-5" } } },
  models: {
    mode: "merge",
    providers: {
      venice: {
        baseUrl: "https://api.venice.ai/api/v1",
        apiKey: "${VENICE_API_KEY}",
        api: "openai-completions",
        models: [
          {
            id: "kimi-k2-5",
            name: "Kimi K2.5",
            reasoning: true,
            input: ["text", "image"],
            cost: { input: 0, output: 0, cacheRead: 0, cacheWrite: 0 },
            contextWindow: 256000,
            maxTokens: 65536,
          },
        ],
      },
    },
  },
}

모델 선택

제공자, 모델 참조, 장애 조치 동작을 선택합니다.

Venice AI 홈페이지 및 계정 가입.

API 문서

Venice API 참조 및 개발자 문서.

가격

현재 Venice 크레딧 요금 및 플랜.

Overview

Concepts and configuration

Providers

Venice AI

OpenClaw에서 Venice를 사용하는 이유

개인정보 보호 모드

기능

시작하기

모델 선택

DeepSeek V4 재생 동작

내장 카탈로그(총 41개)

모델 탐색

스트리밍 및 도구 지원

가격

Venice(익명화) vs 직접 API

사용 예시

문제 해결

고급 구성

관련 항목

모델 선택

Venice AI

API 문서

가격

Overview

Concepts and configuration

Providers

Documentation Index

​OpenClaw에서 Venice를 사용하는 이유

​개인정보 보호 모드

​기능

​시작하기

​모델 선택

​DeepSeek V4 재생 동작

​내장 카탈로그(총 41개)

​모델 탐색

​스트리밍 및 도구 지원

​가격

​Venice(익명화) vs 직접 API

​사용 예시

​문제 해결

​고급 구성

​관련 항목

모델 선택

Venice AI

API 문서

가격

OpenClaw에서 Venice를 사용하는 이유

개인정보 보호 모드

기능

시작하기

모델 선택

DeepSeek V4 재생 동작

내장 카탈로그(총 41개)

모델 탐색

스트리밍 및 도구 지원

가격

Venice(익명화) vs 직접 API

사용 예시

문제 해결

고급 구성

관련 항목