英伟达在 Computex 发布 Nemotron 3 Ultra,并在智力排名中落后于中国的 Kimi K2.6

英伟达于 6 月 1 日在台北的 Computex 上发布了 Nemotron 3 Ultra,这是一款拥有 5,500 亿参数的开放权重 AI 模型,也是该公司迄今为止规模最大的开放式 AI 释出。首席执行官 Jensen Huang 在其主题演讲中宣布该模型,将其定位为在智能基准测试中排名最高的美国开放权重模型。此番发布加剧了开放权重 AI 领域的竞争,在该领域尽管英伟达在速度方面具有优势,中国模型(包括 Moonshot AI 的 Kimi K2.6)目前仍在全球智能排行榜中领先。

Nemotron 3 Ultra 智能指数基准得分为 48

人工分析(Artificial Analysis)与英伟达合作进行了预发布评估,将 Nemotron 3 Ultra 的 Artificial Analysis Intelligence Index(人工分析智能指数)评分定为 48。该复合基准汇总了 10 项评估,涵盖推理、编码、常识以及代理式表现。该分数使 Nemotron 3 Ultra 成为排名第一的美国开放权重模型,超过谷歌 Gemma 4 31B(39)、英伟达自家 Nemotron 3 Super(36)以及 OpenAI 的 gpt-oss-120b(33)。

该模型采用专家混合(mixture-of-experts)架构,总计 5,500 亿参数,但在任意时刻仅激活 5,500 亿参数。该设计在降低运行成本的同时,仍能在复杂推理任务中保持性能。

预发布端点每秒输出 300+ tokens

根据人工分析的测试,Nemotron 3 Ultra 在预发布的 DeepInfra 端点上实现了每秒超过 300 个输出 tokens。与其同一智能类别的中国模型——DeepSeek V4 Pro 和 Kimi K2.6——目前通过其商用 API 运行在每秒 50–100 个 tokens。英伟达宣称该模型比可比的开放权重替代方案快 5 倍,且成本更低 30%。

该架构结合了 Mamba-2 层、标准 Transformer 注意力以及 mixture-of-experts routing(专家混合路由)。模型支持 100 万 tokens 的上下文窗口,并引入多 tokens 预测(MTP),可同时生成多个未来 tokens,而非按顺序逐个生成。

Kimi K2.6 以 54 的智能得分领跑开放权重榜单

Moonshot AI 的 Kimi K2.6 在开放权重模型中占据首位,其智能指数得分为 54,较 Nemotron 3 Ultra 高出 6 分。Kimi K2.6 于 4 月发布,在所有 AI 模型中全球排名第 4,较 Anthropic、Google 和 OpenAI 的专有旗舰机型落后 3 分,后者并列为 57。

据 3 月的报道,中国开源模型的全球开放模型使用份额已从 2024 年年末的约 1.2% 提升至到 2025 年年底的约 30%。

Nemotron 家族自 2023 年以来覆盖三种模型规模

英伟达于 2023 年 11 月发布了首款 Nemotron 品牌模型,并在 2025 年 12 月宣布第三代。该家族包含三种规模:Nano 用于轻量级任务,Super 用于中端企业应用,Ultra 用于复杂推理工作负载。三款模型均共享混合架构,结合了 Mamba-2 层、Transformer 注意力以及专家混合路由。

Nemotron 3 Super 于 3 月发布,参数为 1,200 亿,智能指数得分为 36。Nemotron 3 Ultra 的提升 12 分,体现了产品线内的显著进步。

英伟达拨款 260 亿美元用于开放权重 AI 开发

英伟达披露了一项为期五年的计划:投入 260 亿美元用于开放权重 AI 开发。该公司于 3 月成立 Nemotron Coalition(Nemotron 联盟),该联盟由 8 家 AI 实验室组成,包括 Mistral AI 和 Perplexity,旨在在 DGX Cloud 基础设施上共同开发开放前沿模型。英伟达还宣布正在研发 Nemotron 4,该模型家族的下一代。

6 月 4 日通过英伟达 API 与云服务上线

Nemotron 3 Ultra 将于 6 月 4 日上线。该模型权重已公开,并将发布训练配方。用户可通过英伟达 API 或云服务提供商访问该模型,无需专用数据中心硬件。

常见问题(FAQ)

英伟达的 Nemotron 3 Ultra 在 6 月 1 日的智能得分是多少?
Nemotron 3 Ultra 在 Artificial Analysis Intelligence Index(人工分析智能指数)中获得 48 分,使其成为排名最高的美国开放权重模型。该基准汇总了 10 项评估,覆盖推理、编码、常识以及代理式表现。

Nemotron 3 Ultra 的速度与中国模型相比如何?
Nemotron 3 Ultra 在预发布的 DeepInfra 端点上实现了每秒超过 300 个输出 tokens,而中国模型 DeepSeek V4 Pro 和 Kimi K2.6 则通过其商用 API 运行在每秒 50–100 个 tokens。

英伟达的 Nemotron 3 Ultra 何时可用?
Nemotron 3 Ultra 将于 6 月 4 日上线。用户可通过英伟达的 API 或云服务提供商访问该模型,并且将发布公开权重与训练配方。

免责声明:本页面信息可能来自第三方,仅供参考,不代表 Gate 的观点或意见,亦不构成任何财务、投资或法律建议。数字资产交易风险较高,请勿仅依赖本页面信息作出决策。具体内容详见声明
评论
0/400
暂无评论