Providers

NVIDIA

NVIDIA는 무료 오픈 모델을 위해 https://integrate.api.nvidia.com/v1에서 OpenAI 호환 API를 제공합니다. build.nvidia.com에서 받은 API 키로 인증하세요. OpenClaw는 NVIDIA 제공자의 기본값을 긴 컨텍스트 에이전트 작업을 위한 NVIDIA의 550B 전체 / 55B 활성 추론 모델인 Nemotron 3 Ultra로 설정합니다.

시작하기

API 키 받기

build.nvidia.com에서 API 키를 생성합니다.

키를 내보내고 온보딩 실행

bash

export NVIDIA_API_KEY="nvapi-..."openclaw onboard --auth-choice nvidia-api-key

NVIDIA 모델 설정

bash

openclaw models set nvidia/nvidia/nemotron-3-ultra-550b-a55b

비대화형 설정에서는 키를 직접 전달할 수도 있습니다.

bash

openclaw onboard --auth-choice nvidia-api-key --nvidia-api-key "nvapi-..."

구성 예시

json5

{  env: { NVIDIA_API_KEY: "nvapi-..." },  models: {    providers: {      nvidia: {        baseUrl: "https://integrate.api.nvidia.com/v1",        api: "openai-completions",      },    },  },  agents: {    defaults: {      model: { primary: "nvidia/nvidia/nemotron-3-ultra-550b-a55b" },    },  },}

Nemotron 3 Ultra

Nemotron 3 Ultra는 OpenClaw의 기본 NVIDIA 모델입니다. nvidia/nemotron-3-ultra-550b-a55b에 대한 NVIDIA 빌드 페이지는 이 모델을 1M 토큰 컨텍스트 사양이 있는 사용 가능한 무료 엔드포인트로 표시합니다. 번들 카탈로그는 호스팅된 엔드포인트에 대한 NVIDIA의 현재 OpenAI 호환 샘플 요청과 일치하도록 16,384 토큰 최대 출력을 기록합니다.

가장 높은 성능의 NVIDIA 기본값이 필요하면 Ultra를 사용하세요. 더 작은 Nemotron 3 옵션을 원하면 Super를 선택한 상태로 유지하거나, 컨텍스트, 지연 시간 또는 동작이 더 적합한 경우 NVIDIA 카탈로그에서 호스팅되는 타사 모델 중 하나를 선택하세요. 번들 Ultra 행은 기본적으로 chat_template_kwargs.enable_thinking: false와 force_nonempty_content: true를 보내므로 일반 채팅 출력은 추론 텍스트를 노출하지 않고 보이는 답변에 유지됩니다.

번들 대체 카탈로그

모델 ref	이름	컨텍스트	최대 출력	참고
`nvidia/nvidia/nemotron-3-ultra-550b-a55b`	NVIDIA Nemotron 3 Ultra 550B	1,000,000	16,384	기본값
`nvidia/nvidia/nemotron-3-super-120b-a12b`	NVIDIA Nemotron 3 Super 120B	1,048,576	8,192	추천 대체
`nvidia/moonshotai/kimi-k2.5`	Kimi K2.5	262,144	8,192	추천 대체
`nvidia/minimaxai/minimax-m2.7`	Minimax M2.7	196,608	8,192	추천 대체
`nvidia/z-ai/glm-5.1`	GLM 5.1	202,752	8,192	추천 대체
`nvidia/minimaxai/minimax-m2.5`	MiniMax M2.5	196,608	8,192	지원 중단됨, 업그레이드 호환성
`nvidia/z-ai/glm5`	GLM-5	202,752	8,192	지원 중단됨, 업그레이드 호환성

고급 구성

자동 활성화 동작

NVIDIA_API_KEY 환경 변수가 설정되면 제공자가 자동으로 활성화됩니다. 키 외에는 명시적인 제공자 구성이 필요하지 않습니다.

카탈로그 및 가격

OpenClaw는 NVIDIA 인증이 구성되어 있을 때 NVIDIA의 공개 추천 모델 카탈로그를 우선 사용하고 이를 24시간 동안 캐시합니다. 번들 대체 카탈로그는 정적이며 업그레이드 호환성을 위해 지원 중단된 출시 ref를 유지합니다. NVIDIA가 현재 나열된 모델에 대해 무료 API 액세스를 제공하므로 소스에서 비용은 기본적으로 0입니다.

OpenAI 호환 엔드포인트

NVIDIA는 표준 /v1 completions 엔드포인트를 사용합니다. 모든 OpenAI 호환 도구는 NVIDIA 기본 URL로 바로 작동해야 합니다.

Nemotron 3 Ultra 추론 매개변수

NVIDIA의 Ultra 샘플 요청은 추론 출력에 chat_template_kwargs.enable_thinking과 reasoning_budget을 사용합니다. OpenClaw의 번들 Ultra 행은 일반 채팅 사용을 위해 기본적으로 템플릿 사고를 비활성화합니다. NVIDIA 추론 출력을 선택하거나 다른 NVIDIA 전용 요청 필드를 강제로 적용해야 하는 경우 모델별 params를 설정하고 제공자별 override를 NVIDIA 모델로 한정하세요.

json5

{  agents: {    defaults: {      models: {        "nvidia/nvidia/nemotron-3-ultra-550b-a55b": {          params: {            chat_template_kwargs: { enable_thinking: true },            extra_body: { reasoning_budget: 16384 },          },        },      },    },  },}

params.extra_body는 최종 OpenAI 호환 요청 본문 override이므로 선택한 엔드포인트에 대해 NVIDIA가 문서화한 필드에만 사용하세요.

느린 사용자 지정 제공자 응답

일부 NVIDIA 호스팅 사용자 지정 모델은 첫 번째 응답 청크를 내보내기 전에 기본 모델 유휴 watchdog보다 더 오래 걸릴 수 있습니다. 사용자 지정 NVIDIA 제공자 항목의 경우 전체 에이전트 런타임 제한 시간을 늘리는 대신 제공자 제한 시간을 늘리세요.

json5

{  models: {    providers: {      "custom-integrate-api-nvidia-com": {        baseUrl: "https://integrate.api.nvidia.com/v1",        api: "openai-completions",        apiKey: "NVIDIA_API_KEY",        timeoutSeconds: 300,      },    },  },  agents: {    defaults: {      models: {        "custom-integrate-api-nvidia-com/meta/llama-3.1-70b-instruct": {          params: { thinking: "off" },        },      },    },  },}

NVIDIA

시작하기

API 키 받기

키를 내보내고 온보딩 실행

NVIDIA 모델 설정

구성 예시

추천 카탈로그

Nemotron 3 Ultra

번들 대체 카탈로그

고급 구성

관련 항목

On this page

Molty