ZhipuのGLM-5.2がARC-AGI-2で22.8%の精度を達成し、GPT-5.5 Light Reasoning Versionに匹敵する。

ARC Prizeによると、ZhipuのGLM-5.2モデルが最近、ARC-AGIベンチマークで公式検証を達成しました。ARC-AGI-2では、GLM-5.2は平均コスト0.25ドルで22.8%の精度を達成し、より簡単なARC-AGI-1ベンチマークでは、1回あたり0.19ドルで77.0%の精度を達成しました。

GLM-5.2の全体的な性能は、低推論努力モードのOpenAIのGPT-5.4およびGPT-5.5に匹敵します。ARC-AGIは、トレーニング中に一度も見たことのない抽象的なパターン認識タスクを通じて、AGIレベルの推論能力を評価するために設計されています。

免責事項:本ページの情報には第三者提供の内容が含まれる場合があり、参考目的のみで提供されています。これらはGateの見解や意見を示すものではなく、金融、投資、または法律上の助言を構成するものでもありません。暗号資産取引には高いリスクが伴います。意思決定を行う際には、本ページの情報のみに依存しないでください。詳細については、免責事項をご確認ください。
コメント
0/400
コメントなし