Saltar al contenido principal

Documentation Index

Fetch the complete documentation index at: https://docs.openclaw.ai/llms.txt

Use this file to discover all available pages before exploring further.

Venice AI proporciona inferencia de IA centrada en la privacidad con compatibilidad con modelos sin censura y acceso a modelos propietarios principales a través de su proxy anonimizado. Toda la inferencia es privada de forma predeterminada: sin entrenamiento con tus datos, sin registro.

Por qué Venice en OpenClaw

  • Inferencia privada para modelos de código abierto (sin registro).
  • Modelos sin censura cuando los necesites.
  • Acceso anonimizado a modelos propietarios (Opus/GPT/Gemini) cuando la calidad importa.
  • Endpoints /v1 compatibles con OpenAI.

Modos de privacidad

Venice ofrece dos niveles de privacidad; entender esto es clave para elegir tu modelo:
ModoDescripciónModelos
PrivadoTotalmente privado. Los prompts/respuestas nunca se almacenan ni se registran. Efímero.Llama, Qwen, DeepSeek, Kimi, MiniMax, Venice Uncensored, etc.
AnonimizadoEnrutado a través de Venice con los metadatos eliminados. El proveedor subyacente (OpenAI, Anthropic, Google, xAI) ve solicitudes anonimizadas.Claude, GPT, Gemini, Grok
Los modelos anonimizados no son totalmente privados. Venice elimina los metadatos antes de reenviar, pero el proveedor subyacente (OpenAI, Anthropic, Google, xAI) sigue procesando la solicitud. Elige modelos Privados cuando se requiera privacidad total.

Funciones

  • Centrado en la privacidad: elige entre modos “privado” (totalmente privado) y “anonimizado” (enrutado por proxy)
  • Modelos sin censura: acceso a modelos sin restricciones de contenido
  • Acceso a modelos principales: usa Claude, GPT, Gemini y Grok mediante el proxy anonimizado de Venice
  • API compatible con OpenAI: endpoints /v1 estándar para una integración sencilla
  • Transmisión: compatible con todos los modelos
  • Llamada a funciones: compatible con modelos seleccionados (comprueba las capacidades del modelo)
  • Visión: compatible con modelos con capacidad de visión
  • Sin límites de tasa estrictos: puede aplicarse limitación por uso justo en casos de uso extremo

Primeros pasos

1

Obtén tu clave de API

  1. Regístrate en venice.ai
  2. Ve a Settings > API Keys > Create new key
  3. Copia tu clave de API (formato: vapi_xxxxxxxxxxxx)
2

Configura OpenClaw

Elige tu método de configuración preferido:
openclaw onboard --auth-choice venice-api-key
Esto hará lo siguiente:
  1. Solicitar tu clave de API (o usar VENICE_API_KEY existente)
  2. Mostrar todos los modelos Venice disponibles
  3. Permitirte elegir tu modelo predeterminado
  4. Configurar el proveedor automáticamente
3

Verifica la configuración

openclaw agent --model venice/kimi-k2-5 --message "Hello, are you working?"

Selección de modelos

Después de la configuración, OpenClaw muestra todos los modelos Venice disponibles. Elige según tus necesidades:
  • Modelo predeterminado: venice/kimi-k2-5 para razonamiento privado sólido con visión.
  • Opción de alta capacidad: venice/claude-opus-4-6 para la ruta anonimizada de Venice más potente.
  • Privacidad: elige modelos “privados” para inferencia totalmente privada.
  • Capacidad: elige modelos “anonimizados” para acceder a Claude, GPT, Gemini mediante el proxy de Venice.
Cambia tu modelo predeterminado en cualquier momento:
openclaw models set venice/kimi-k2-5
openclaw models set venice/claude-opus-4-6
Enumera todos los modelos disponibles:
openclaw models list --all --provider venice
También puedes ejecutar openclaw configure, seleccionar Model/auth y elegir Venice AI.
Usa la tabla siguiente para elegir el modelo adecuado para tu caso de uso.
Caso de usoModelo recomendadoPor qué
Chat general (predeterminado)kimi-k2-5Razonamiento privado sólido con visión
Mejor calidad generalclaude-opus-4-6Opción anonimizada de Venice más potente
Privacidad + programaciónqwen3-coder-480b-a35b-instructModelo privado de programación con gran contexto
Visión privadakimi-k2-5Compatibilidad con visión sin salir del modo privado
Rápido + baratoqwen3-4bModelo ligero de razonamiento
Tareas privadas complejasdeepseek-v3.2Razonamiento sólido, pero sin compatibilidad con herramientas de Venice
Sin censuravenice-uncensoredSin restricciones de contenido

Comportamiento de reproducción de DeepSeek V4

Si Venice expone modelos DeepSeek V4 como venice/deepseek-v4-pro o venice/deepseek-v4-flash, OpenClaw completa el marcador de posición de reproducción reasoning_content requerido por DeepSeek V4 en los mensajes del asistente cuando el proxy lo omite. Venice rechaza el control thinking nativo de nivel superior de DeepSeek, por lo que OpenClaw mantiene esa corrección de reproducción específica del proveedor separada de los controles de pensamiento del proveedor DeepSeek nativo.

Catálogo integrado (41 en total)

ID de modeloNombreContextoFunciones
kimi-k2-5Kimi K2.5256kPredeterminado, razonamiento, visión
kimi-k2-thinkingKimi K2 Thinking256kRazonamiento
llama-3.3-70bLlama 3.3 70B128kGeneral
llama-3.2-3bLlama 3.2 3B128kGeneral
hermes-3-llama-3.1-405bHermes 3 Llama 3.1 405B128kGeneral, herramientas desactivadas
qwen3-235b-a22b-thinking-2507Qwen3 235B Thinking128kRazonamiento
qwen3-235b-a22b-instruct-2507Qwen3 235B Instruct128kGeneral
qwen3-coder-480b-a35b-instructQwen3 Coder 480B256kProgramación
qwen3-coder-480b-a35b-instruct-turboQwen3 Coder 480B Turbo256kProgramación
qwen3-5-35b-a3bQwen3.5 35B A3B256kRazonamiento, visión
qwen3-next-80bQwen3 Next 80B256kGeneral
qwen3-vl-235b-a22bQwen3 VL 235B (Vision)256kVisión
qwen3-4bVenice Small (Qwen3 4B)32kRápido, razonamiento
deepseek-v3.2DeepSeek V3.2160kRazonamiento, herramientas desactivadas
venice-uncensoredVenice Uncensored (Dolphin-Mistral)32kSin censura, herramientas desactivadas
mistral-31-24bVenice Medium (Mistral)128kVisión
google-gemma-3-27b-itGoogle Gemma 3 27B Instruct198kVisión
openai-gpt-oss-120bOpenAI GPT OSS 120B128kGeneral
nvidia-nemotron-3-nano-30b-a3bNVIDIA Nemotron 3 Nano 30B128kGeneral
olafangensan-glm-4.7-flash-hereticGLM 4.7 Flash Heretic128kRazonamiento
zai-org-glm-4.6GLM 4.6198kGeneral
zai-org-glm-4.7GLM 4.7198kRazonamiento
zai-org-glm-4.7-flashGLM 4.7 Flash128kRazonamiento
zai-org-glm-5GLM 5198kRazonamiento
minimax-m21MiniMax M2.1198kRazonamiento
minimax-m25MiniMax M2.5198kRazonamiento
ID de modeloNombreContextoFunciones
claude-opus-4-6Claude Opus 4.6 (a través de Venice)1MRazonamiento, visión
claude-opus-4-5Claude Opus 4.5 (a través de Venice)198kRazonamiento, visión
claude-sonnet-4-6Claude Sonnet 4.6 (a través de Venice)1MRazonamiento, visión
claude-sonnet-4-5Claude Sonnet 4.5 (a través de Venice)198kRazonamiento, visión
openai-gpt-54GPT-5.4 (a través de Venice)1MRazonamiento, visión
openai-gpt-53-codexGPT-5.3 Codex (a través de Venice)400kRazonamiento, visión, programación
openai-gpt-52GPT-5.2 (a través de Venice)256kRazonamiento
openai-gpt-52-codexGPT-5.2 Codex (a través de Venice)256kRazonamiento, visión, programación
openai-gpt-4o-2024-11-20GPT-4o (a través de Venice)128kVisión
openai-gpt-4o-mini-2024-07-18GPT-4o Mini (a través de Venice)128kVisión
gemini-3-1-pro-previewGemini 3.1 Pro (a través de Venice)1MRazonamiento, visión
gemini-3-pro-previewGemini 3 Pro (a través de Venice)198kRazonamiento, visión
gemini-3-flash-previewGemini 3 Flash (a través de Venice)256kRazonamiento, visión
grok-41-fastGrok 4.1 Fast (a través de Venice)1MRazonamiento, visión
grok-code-fast-1Grok Code Fast 1 (a través de Venice)256kRazonamiento, programación

Descubrimiento de modelos

OpenClaw incluye un catálogo semilla de Venice respaldado por manifiesto para el listado de modelos de solo lectura. La actualización en tiempo de ejecución aún puede descubrir modelos desde la API de Venice y recurre al catálogo del manifiesto si no se puede acceder a la API. El endpoint /models es público (no se necesita autenticación para listar), pero la inferencia requiere una clave de API válida.

Compatibilidad con transmisión y herramientas

FunciónCompatibilidad
StreamingTodos los modelos
Llamadas a funcionesLa mayoría de los modelos (consulta supportsFunctionCalling en la API)
Visión/ImágenesModelos marcados con la función “Visión”
Modo JSONCompatible mediante response_format

Precios

Venice usa un sistema basado en créditos. Consulta venice.ai/pricing para ver las tarifas actuales:
  • Modelos privados: Generalmente de menor costo
  • Modelos anonimizados: Similar al precio directo de la API + una pequeña tarifa de Venice

Venice (anonimizado) frente a API directa

AspectoVenice (anonimizado)API directa
PrivacidadMetadatos eliminados, anonimizadoTu cuenta vinculada
Latencia+10-50 ms (proxy)Directa
FuncionesLa mayoría de las funciones compatiblesFunciones completas
FacturaciónCréditos de VeniceFacturación del proveedor

Ejemplos de uso

# Use the default private model
openclaw agent --model venice/kimi-k2-5 --message "Quick health check"

# Use Claude Opus via Venice (anonymized)
openclaw agent --model venice/claude-opus-4-6 --message "Summarize this task"

# Use uncensored model
openclaw agent --model venice/venice-uncensored --message "Draft options"

# Use vision model with image
openclaw agent --model venice/qwen3-vl-235b-a22b --message "Review attached image"

# Use coding model
openclaw agent --model venice/qwen3-coder-480b-a35b-instruct --message "Refactor this function"

Solución de problemas

echo $VENICE_API_KEY
openclaw models list | grep venice
Asegúrate de que la clave comience con vapi_.
El catálogo de modelos de Venice se actualiza dinámicamente. Ejecuta openclaw models list para ver los modelos disponibles actualmente. Algunos modelos pueden estar temporalmente sin conexión.
La API de Venice está en https://api.venice.ai/api/v1. Asegúrate de que tu red permita conexiones HTTPS.

Configuración avanzada

{
  env: { VENICE_API_KEY: "vapi_..." },
  agents: { defaults: { model: { primary: "venice/kimi-k2-5" } } },
  models: {
    mode: "merge",
    providers: {
      venice: {
        baseUrl: "https://api.venice.ai/api/v1",
        apiKey: "${VENICE_API_KEY}",
        api: "openai-completions",
        models: [
          {
            id: "kimi-k2-5",
            name: "Kimi K2.5",
            reasoning: true,
            input: ["text", "image"],
            cost: { input: 0, output: 0, cacheRead: 0, cacheWrite: 0 },
            contextWindow: 256000,
            maxTokens: 65536,
          },
        ],
      },
    },
  },
}

Relacionado

Model selection

Elegir proveedores, referencias de modelo y comportamiento de conmutación por error.

Venice AI

Página principal de Venice AI y registro de cuenta.

API documentation

Referencia de la API de Venice y documentación para desarrolladores.

Pricing

Tarifas y planes actuales de créditos de Venice.