英伟达开源 120B 智能体模型 Nemotron 3 Super，吞吐量最高提升 5 倍

GateNews

2026-03-12 01:27:22

Gate News 消息，3 月 12 日，英伟达发布开源大语言模型 Nemotron 3 Super，面向多智能体应用场景设计。模型总参数量 1200 亿，采用混合 Mamba-Transformer MoE 架构，推理时每个 token 仅激活 120 亿参数。其核心技术「潜在 MoE」（Latent MoE）将 token 嵌入压缩到低秩潜在空间后再路由至专家网络，实现以单个专家的计算成本同时激活 4 个专家，推理吞吐量较上一代 Nemotron Super 最高提升 5 倍。模型原生支持 100 万 token 上下文窗口，适用于需要长时间保持工作流状态的自主智能体。在评估智能体工作负载的 PinchBench 基准测试中，Nemotron 3 Super 得分 85.6%，是同类开源模型中的最高分。英伟达同步开源了超过 10 万亿 token 的训练数据集、15 个强化学习训练环境和评估方案，采用 NVIDIA Nemotron Open Model License 许可协议。模型已上线 Hugging Face、build.nvidia.com、Perplexity、OpenRouter 等平台，并支持通过 Google Cloud、Oracle、AWS Bedrock、Azure 等云服务部署。Perplexity、CodeRabbit、Cadence、达索系统、西门子等公司已率先采用。

免责声明：本页面信息可能来自第三方，不代表 Gate 的观点或意见。页面显示的内容仅供参考，不构成任何财务、投资或法律建议。Gate 对信息的准确性、完整性不作保证，对因使用本信息而产生的任何损失不承担责任。虚拟资产投资属高风险行为，价格波动剧烈，您可能损失全部投资本金。请充分了解相关风险，并根据自身财务状况和风险承受能力谨慎决策。具体内容详见声明。

0/400

暂无评论