skip to content

NVIDIA Build模型汇总

/ 2 min read

截至 2026年3月,NVIDIA Build 平台(build.nvidia.com)开放了一批完全免费的 LLM 端点,覆盖 Qwen、DeepSeek、Kimi、GLM 等主流开源模型,且全部兼容 OpenAI SDK,接入成本极低。


接入端点

所有模型统一走以下 Base URL:

https://integrate.api.nvidia.com/v1

API Key 在 build.nvidia.com 注册账号后即可获取。


OpenAI 兼容接入

由于 NVIDIA Build 完全兼容 OpenAI 接口协议,你可以直接用 openai Python 包或任何支持 OpenAI 格式的客户端无缝切换,只需替换 base_urlapi_key

from openai import OpenAI
client = OpenAI(
base_url="https://integrate.api.nvidia.com/v1",
api_key="your_nvidia_api_key"
)
response = client.chat.completions.create(
model="qwen/qwen3.5-122b-a10b", # 换成下表任意模型 ID
messages=[{"role": "user", "content": "你好!"}]
)
print(response.choices[0].message.content)

对于支持 tool_use 的模型,tools 参数传法和 OpenAI 完全一致,无需额外适配。


15 个模型一览

#完整模型 ID参数规模核心能力
1qwen/qwen3.5-122b-a10b122B MoE(10B active)编程、推理、多模态、Agent
2minimaxai/minimax-m2.1230B MoE(10B active)多语言编程、Web/App 开发、Agent
3stepfun-ai/step-3.5-flash200B MoE前沿推理、Agentic AI
4z-ai/glm-4.7358B MoE(32B active)多语言 Agent 编程、工具调用、UI
5deepseek-ai/deepseek-v3.2685B MoE推理、长上下文、Agent 工具
6moonshotai/kimi-k2-thinking1T MoE(32B active)深度推理、256K 上下文、工具调用
7deepseek-ai/deepseek-v3.1-terminus671B MoE(37B active)Think/Non-Think 混合、128K、函数调用
8moonshotai/kimi-k2-instruct-09051T MoE(32B active)长上下文、增强推理
9bytedance/seed-oss-36b-instruct36B 密集架构长上下文 512K、推理、Agentic
10qwen/qwen3-coder-480b-a35b-instruct480B MoE(35B active)Agentic 编程、浏览器使用、256K 上下文
11deepseek-ai/deepseek-v3.1671B MoE(37B active)快速推理、128K、强工具调用
12moonshotai/kimi-k2-instruct1T MoE(32B active)推理、编程、Agentic
13qwen/qwq-32b32B 密集架构深度推理、数学、难题
14qwen/qwen2.5-coder-7b-instruct7B 密集架构多语言代码补全、32K 上下文
15qwen/qwen2-7b-instruct7B 密集架构中英文通用、编程、数学、推理