Nvidia、Nemotron 3 Ultraを公開。Mamba-TransformerのハイブリッドMoEアーキテクチャを備えた5,50Bパラメータのフラッグシップモデル

Beatingによると、Nvidiaは6月4日にフラッグシップの大型言語モデルであるNemotron 3 Ultraをリリースし、合計5500億(550 billion)のパラメータとアクティブパラメータ550億(55 billion)を搭載している。このモデルはArtificial Analysisの知能指数で48を獲得しており、最も強力なパフォーマンスを持つオープンソースの米国モデルで、54ポイントのKimi K2.6に次ぐ2番目だ。

このモデルは、Mamba-2の状態空間層とTransformerの注意(attention)層を交互に切り替えるハイブリッドなMamba-Transformer MoEアーキテクチャを採用している。二次的なKVキャッシュの増加を回避しつつ、1 millionトークンのコンテキストウィンドウをサポートする。同規模の密なモデルと比べて、ハイブリッドアーキテクチャはエージェントタスクでスループットが5倍高く、推論コストは30%低い。Nemotron 3 UltraはHugging Face、NVIDIA NIM、OpenRouterで利用可能だ。

免責事項:本ページの情報には第三者提供の内容が含まれる場合があり、参考目的のみで提供されています。これらはGateの見解や意見を示すものではなく、金融、投資、または法律上の助言を構成するものでもありません。暗号資産取引には高いリスクが伴います。意思決定を行う際には、本ページの情報のみに依存しないでください。詳細については、免責事項をご確認ください。
コメント
0/400
コメントなし