Saltar al contenido principal

Venice AI (destacado de Venice)

Venice es nuestra configuración destacada de Venice para inferencia centrada en la privacidad con acceso anonimizado opcional a modelos propietarios. Venice AI ofrece inferencia de IA centrada en la privacidad con soporte para modelos sin censura y acceso a los principales modelos propietarios a través de su proxy anonimizado. Toda la inferencia es privada de forma predeterminada: no se entrena con tus datos ni se registran.

Por qué usar Venice en OpenClaw

  • Inferencia privada para modelos de código abierto (sin registros).
  • Modelos sin censura cuando los necesites.
  • Acceso anonimizado a modelos propietarios (Opus/GPT/Gemini) cuando la calidad importe.
  • Endpoints /v1 compatibles con OpenAI.

Modos de privacidad

Venice ofrece dos niveles de privacidad; entender esto es clave para elegir tu modelo:
ModoDescripciónModelos
PrivadoTotalmente privado. Los prompts/respuestas nunca se almacenan ni se registran. Efímero.Llama, Qwen, DeepSeek, Kimi, MiniMax, Venice Uncensored, etc.
AnonimizadoSe canaliza a través de Venice con los metadatos eliminados. El proveedor subyacente (OpenAI, Anthropic, Google, xAI) ve solicitudes anonimizadas.Claude, GPT, Gemini, Grok

Funciones

  • Centrado en la privacidad: Elige entre los modos “private” (totalmente privado) y “anonymized” (con proxy)
  • Modelos sin censura: Accede a modelos sin restricciones de contenido
  • Acceso a modelos principales: Usa Claude, GPT, Gemini y Grok mediante el proxy anonimizado de Venice
  • API compatible con OpenAI: Endpoints /v1 estándar para una integración sencilla
  • Streaming: ✅ Compatible con todos los modelos
  • Llamada a funciones: ✅ Compatible en modelos seleccionados (consulta las capacidades del modelo)
  • Visión: ✅ Compatible en modelos con capacidad de visión
  • Sin límites de tasa estrictos: Puede aplicarse limitación por uso justo en casos de uso extremo

Configuración

1. Obtener la clave de API

  1. Regístrate en venice.ai
  2. Ve a Settings → API Keys → Create new key
  3. Copia tu clave de API (formato: vapi_xxxxxxxxxxxx)

2. Configurar OpenClaw

Opción A: Variable de entorno
export VENICE_API_KEY="vapi_xxxxxxxxxxxx"
Opción B: Configuración interactiva (recomendada)
openclaw onboard --auth-choice venice-api-key
Esto hará lo siguiente:
  1. Solicitar tu clave de API (o usar VENICE_API_KEY existente)
  2. Mostrar todos los modelos de Venice disponibles
  3. Permitirte elegir tu modelo predeterminado
  4. Configurar el proveedor automáticamente
Opción C: No interactiva
openclaw onboard --non-interactive \
  --auth-choice venice-api-key \
  --venice-api-key "vapi_xxxxxxxxxxxx"

3. Verificar la configuración

openclaw agent --model venice/kimi-k2-5 --message "Hola, ¿estás funcionando?"

Selección de modelo

Después de la configuración, OpenClaw muestra todos los modelos de Venice disponibles. Elige según tus necesidades:
  • Modelo predeterminado: venice/kimi-k2-5 para un razonamiento privado sólido más visión.
  • Opción de alta capacidad: venice/claude-opus-4-6 para la ruta anonimizada de Venice más potente.
  • Privacidad: Elige modelos “private” para una inferencia totalmente privada.
  • Capacidad: Elige modelos “anonymized” para acceder a Claude, GPT y Gemini mediante el proxy de Venice.
Cambia tu modelo predeterminado en cualquier momento:
openclaw models set venice/kimi-k2-5
openclaw models set venice/claude-opus-4-6
Muestra todos los modelos disponibles:
openclaw models list | grep venice

Configurar mediante openclaw configure

  1. Ejecuta openclaw configure
  2. Selecciona Model/auth
  3. Elige Venice AI

¿Qué modelo debería usar?

Caso de usoModelo recomendadoMotivo
Chat general (predeterminado)kimi-k2-5Razonamiento privado sólido más visión
Mejor calidad generalclaude-opus-4-6Opción anonimizada de Venice más potente
Privacidad + códigoqwen3-coder-480b-a35b-instructModelo privado para código con gran contexto
Visión privadakimi-k2-5Soporte de visión sin salir del modo privado
Rápido + baratoqwen3-4bModelo de razonamiento ligero
Tareas privadas complejasdeepseek-v3.2Razonamiento sólido, pero sin soporte de herramientas de Venice
Sin censuravenice-uncensoredSin restricciones de contenido

Modelos disponibles (41 en total)

Modelos privados (26) - Totalmente privados, sin registros

ID del modeloNombreContextoFunciones
kimi-k2-5Kimi K2.5256kPredeterminado, razonamiento, visión
kimi-k2-thinkingKimi K2 Thinking256kRazonamiento
llama-3.3-70bLlama 3.3 70B128kGeneral
llama-3.2-3bLlama 3.2 3B128kGeneral
hermes-3-llama-3.1-405bHermes 3 Llama 3.1 405B128kGeneral, herramientas deshabilitadas
qwen3-235b-a22b-thinking-2507Qwen3 235B Thinking128kRazonamiento
qwen3-235b-a22b-instruct-2507Qwen3 235B Instruct128kGeneral
qwen3-coder-480b-a35b-instructQwen3 Coder 480B256kCódigo
qwen3-coder-480b-a35b-instruct-turboQwen3 Coder 480B Turbo256kCódigo
qwen3-5-35b-a3bQwen3.5 35B A3B256kRazonamiento, visión
qwen3-next-80bQwen3 Next 80B256kGeneral
qwen3-vl-235b-a22bQwen3 VL 235B (Vision)256kVisión
qwen3-4bVenice Small (Qwen3 4B)32kRápido, razonamiento
deepseek-v3.2DeepSeek V3.2160kRazonamiento, herramientas deshabilitadas
venice-uncensoredVenice Uncensored (Dolphin-Mistral)32kSin censura, herramientas deshabilitadas
mistral-31-24bVenice Medium (Mistral)128kVisión
google-gemma-3-27b-itGoogle Gemma 3 27B Instruct198kVisión
openai-gpt-oss-120bOpenAI GPT OSS 120B128kGeneral
nvidia-nemotron-3-nano-30b-a3bNVIDIA Nemotron 3 Nano 30B128kGeneral
olafangensan-glm-4.7-flash-hereticGLM 4.7 Flash Heretic128kRazonamiento
zai-org-glm-4.6GLM 4.6198kGeneral
zai-org-glm-4.7GLM 4.7198kRazonamiento
zai-org-glm-4.7-flashGLM 4.7 Flash128kRazonamiento
zai-org-glm-5GLM 5198kRazonamiento
minimax-m21MiniMax M2.1198kRazonamiento
minimax-m25MiniMax M2.5198kRazonamiento

Modelos anonimizados (15) - A través del proxy de Venice

ID del modeloNombreContextoFunciones
claude-opus-4-6Claude Opus 4.6 (via Venice)1MRazonamiento, visión
claude-opus-4-5Claude Opus 4.5 (via Venice)198kRazonamiento, visión
claude-sonnet-4-6Claude Sonnet 4.6 (via Venice)1MRazonamiento, visión
claude-sonnet-4-5Claude Sonnet 4.5 (via Venice)198kRazonamiento, visión
openai-gpt-54GPT-5.4 (via Venice)1MRazonamiento, visión
openai-gpt-53-codexGPT-5.3 Codex (via Venice)400kRazonamiento, visión, código
openai-gpt-52GPT-5.2 (via Venice)256kRazonamiento
openai-gpt-52-codexGPT-5.2 Codex (via Venice)256kRazonamiento, visión, código
openai-gpt-4o-2024-11-20GPT-4o (via Venice)128kVisión
openai-gpt-4o-mini-2024-07-18GPT-4o Mini (via Venice)128kVisión
gemini-3-1-pro-previewGemini 3.1 Pro (via Venice)1MRazonamiento, visión
gemini-3-pro-previewGemini 3 Pro (via Venice)198kRazonamiento, visión
gemini-3-flash-previewGemini 3 Flash (via Venice)256kRazonamiento, visión
grok-41-fastGrok 4.1 Fast (via Venice)1MRazonamiento, visión
grok-code-fast-1Grok Code Fast 1 (via Venice)256kRazonamiento, código

Descubrimiento de modelos

OpenClaw detecta automáticamente los modelos desde la API de Venice cuando VENICE_API_KEY está configurada. Si la API no está accesible, recurre a un catálogo estático. El endpoint /models es público (no se necesita autenticación para listar), pero la inferencia requiere una clave de API válida.

Streaming y soporte de herramientas

FunciónSoporte
Streaming✅ Todos los modelos
Llamada a funciones✅ La mayoría de los modelos (consulta supportsFunctionCalling en la API)
Visión/Imágenes✅ Modelos marcados con la función “Vision”
Modo JSON✅ Compatible mediante response_format

Precios

Venice usa un sistema basado en créditos. Consulta venice.ai/pricing para ver las tarifas actuales:
  • Modelos privados: Generalmente de menor costo
  • Modelos anonimizados: Similares al precio directo de la API + una pequeña tarifa de Venice

Comparación: Venice frente a API directa

AspectoVenice (anonimizado)API directa
PrivacidadMetadatos eliminados, anonimizadoTu cuenta vinculada
Latencia+10-50ms (proxy)Directa
FuncionesLa mayoría de las funciones compatiblesFunciones completas
FacturaciónCréditos de VeniceFacturación del proveedor

Ejemplos de uso

# Usa el modelo privado predeterminado
openclaw agent --model venice/kimi-k2-5 --message "Quick health check"

# Usa Claude Opus mediante Venice (anonimizado)
openclaw agent --model venice/claude-opus-4-6 --message "Summarize this task"

# Usa un modelo sin censura
openclaw agent --model venice/venice-uncensored --message "Draft options"

# Usa un modelo de visión con imagen
openclaw agent --model venice/qwen3-vl-235b-a22b --message "Review attached image"

# Usa un modelo para código
openclaw agent --model venice/qwen3-coder-480b-a35b-instruct --message "Refactor this function"

Solución de problemas

Clave de API no reconocida

echo $VENICE_API_KEY
openclaw models list | grep venice
Asegúrate de que la clave comience con vapi_.

Modelo no disponible

El catálogo de modelos de Venice se actualiza dinámicamente. Ejecuta openclaw models list para ver los modelos actualmente disponibles. Algunos modelos pueden estar temporalmente fuera de línea.

Problemas de conexión

La API de Venice está en https://api.venice.ai/api/v1. Asegúrate de que tu red permita conexiones HTTPS.

Ejemplo de archivo de configuración

{
  env: { VENICE_API_KEY: "vapi_..." },
  agents: { defaults: { model: { primary: "venice/kimi-k2-5" } } },
  models: {
    mode: "merge",
    providers: {
      venice: {
        baseUrl: "https://api.venice.ai/api/v1",
        apiKey: "${VENICE_API_KEY}",
        api: "openai-completions",
        models: [
          {
            id: "kimi-k2-5",
            name: "Kimi K2.5",
            reasoning: true,
            input: ["text", "image"],
            cost: { input: 0, output: 0, cacheRead: 0, cacheWrite: 0 },
            contextWindow: 256000,
            maxTokens: 65536,
          },
        ],
      },
    },
  },
}

Enlaces