メイトゥアンが5600億パラメータの定理証明モデルをオープンソース化、72回の推論で97.1%の成功率を達成し、オープンソースの最先端を更新
美团LongCatチームは3月21日にLongCat-Flash-Proverをオープンソース化しました。これは5600億パラメータのMoEモデルで、Lean4形式的定理証明に特化しています。モデルは自動形式化、スケッチ生成、完全証明生成の三つの能力に分かれており、推論ツールとLean4コンパイラを組み合わせてリアルタイム検証を実現しています。トレーニングにはHybrid-Experts Iteration FrameworkとHisPOアルゴリズムを採用し、報酬の不正行為を防止しています。ベンチマークテストの結果、このモデルは自動形式化と定理証明の分野でオープンソースの重みモデルの記録を更新しました。