NVIDIA
NVIDIA 提供了一个兼容 OpenAI 的 API:https://integrate.api.nvidia.com/v1,可免费用于开放模型。使用来自 build.nvidia.com 的 API 密钥进行身份验证。
CLI 设置
导出一次密钥,然后运行新手引导并设置一个 NVIDIA 模型:--token,请记住它会出现在 shell 历史记录和 ps 输出中;尽可能优先使用环境变量。
配置片段
模型 ID
| Model ref | 名称 | 上下文长度 | 最大输出 |
|---|---|---|---|
nvidia/nvidia/nemotron-3-super-120b-a12b | NVIDIA Nemotron 3 Super 120B | 262,144 | 8,192 |
nvidia/moonshotai/kimi-k2.5 | Kimi K2.5 | 262,144 | 8,192 |
nvidia/minimaxai/minimax-m2.5 | Minimax M2.5 | 196,608 | 8,192 |
nvidia/z-ai/glm5 | GLM 5 | 202,752 | 8,192 |
注意事项
- 兼容 OpenAI 的
/v1端点;使用来自 build.nvidia.com 的 API 密钥。 - 设置
NVIDIA_API_KEY后,提供商会自动启用。 - 内置目录是静态的;费用在源码中默认设为
0。