Beatingによると、NVIDIAは大規模言語モデルのテキスト生成を高速化するために設計された離散テキスト拡散アーキテクチャ「Nemotron-Labs-TwoTower」をオープンソース化した。デュアルタワー設計は、推論能力を保持する凍結された自己回帰モデルを、並列にテキストを生成する訓練可能なノイズ除去タワーから分離する。30BパラメータのMamba-Transformer mixture-of-expertsモデルにおいて、ベースラインの事前学習データのわずか1/12を使用して、TwoTowerはベースライン品質の98.7%を維持し、追加のメモリオーバーヘッドなしで生成速度を2.42倍向上させた。
免責事項:本ページの情報には第三者提供の内容が含まれる場合があり、参考目的のみで提供されています。これらはGateの見解や意見を示すものではなく、金融、投資、または法律上の助言を構成するものでもありません。暗号資産取引には高いリスクが伴います。意思決定を行う際には、本ページの情報のみに依存しないでください。詳細については、
免責事項をご確認ください。