GLM-5.1 が LMArena のコードランキングで首位に到達し、コードベースはオープンソースの1位、世界3位です

Gate News のメッセージ。4月10日。今日、世界的に権威あるAI評価プラットフォームLMArena(百万ユーザーが参加するブラインドテスト型のAIモデル評価プラットフォーム)がCode Arenaの専門ランキングを更新し、GLM-5.1が世界のオープンソースモデル1位に登り、世界のモデル3位に位置しました。

GLM-5.1は、前世代モデルのオープンソースSOTAのコーディング能力を継承するだけでなく、長期タスク(Long-Horizon Task)でもブレークスルーを達成し、次を実現しました。ゼロからLinuxデスクトップを8時間で構築。655回の反復でベクトルデータベースの最適化におけるボトルネックを突破。1000ラウンドのツール呼び出し最適化で、実際の機械学習モデルの負荷を改善。

注目すべき点として、METRランキングにおける同等の評価基準のもとで、GLM-5.1は8時間級の継続稼働を達成した唯一のオープンソースモデルであり、また世界規模でClaude Opus 4.6を除くと、この能力を備える数少ないモデルでもあります。

免責事項:このページの情報は第三者から提供される場合があり、Gateの見解または意見を代表するものではありません。このページに表示される内容は参考情報のみであり、いかなる金融、投資、または法律上の助言を構成するものではありません。Gateは情報の正確性または完全性を保証せず、当該情報の利用に起因するいかなる損失についても責任を負いません。仮想資産への投資は高いリスクを伴い、大きな価格変動の影響を受けます。投資元本の全額を失う可能性があります。関連するリスクを十分に理解したうえで、ご自身の財務状況およびリスク許容度に基づき慎重に判断してください。詳細は免責事項をご参照ください。

関連記事

Stockcoin.aiがAmber Group主導でシード資金調達ラウンドを完了

公式発表によると、Stockcoin.ai は、株式および暗号先物取引のための AI 駆動プラットフォームであり、Amber Group が主導するシード資金調達ラウンドを完了しました。クリプトおよび伝統的金融のエンジェル投資家も参加しています。このプラットフォームは、オンチェーンデータを株式に橋渡しすることに重点を置いています。 m

GateNews39分前

Claude アプリの月間アクティブユーザーが1年で658%増加して85.79Mに到達、ダウンロードは2321%急増

BeatingによってモニタリングされたSimilarwebのデータによると、Claude Appの4月の前年同月比の指標は大きく伸びており、月間アクティブユーザー(MAU)は前年の11.31百万から85.79百万へ増加し、658%の増加でした;アプリストアのダウンロード数は1131万から2230万へ急増し、2321%の増加でした。

GateNews57分前

OpenAIの社長が、ムスクが5月5日に火星コロニーに対して完全な支配と$800B を求めたと証言

カリフォルニア州の裁判における第2週の5月5日の、OpenAI会長グレッグ・ブロクマンの証言によると、イーロン・マスクは以前、OpenAIを営利企業に転換することを支持しており、組織の完全な支配を要求していた。ブロクマンは、マスクが「8 billionを調達する必要があるため」と述べたとした。

GateNews58分前

Tessera Labsはa16zが主導したシリーズAを締結。6人のAIチームが60人のSAPコンサルタントに取って代わる

Beatingによると、AIシステム統合企業のTessera Labsは、a16zが主導したシリーズAの資金調達を完了した。同社は2024年に設立され、マルチエージェントのプラットフォームを用いて、従来3〜5年と1億ドル〜5億ドルを要していたSAP ECCからS/4HANAへの移行を自動化している。

GateNews1時間前

Consensus 2026で財団会長のLiu氏が語る――AIマシン・エコノミーのためのSolanaの決済レール

コンセンサス・マイアミ2026において、ソラナ財団のリリー・リウ最高責任者は、ウェスタン・ユニオンのような企業によるステーブルコインの採用が、人間と機械の両方の経済におけるソラナの金融インフラとしての役割を裏付けると主張した。

GateNews1時間前

日経先物は4万ポイントを維持しながら堅調で、米国株も史上最高値を更新したが、AI産業はまだ初期段階に入ったばかりなのだろうか?

ゴールドマン・サックスは、消費型エージェントのワークロードによってAI需要がトークン消費を大幅に押し上げ、2030年までに成長が12倍を超える可能性があり、月間のトークン演算は60兆に達し得ると指摘した。エージェントではないものとコンシューマー・エージェントの違いは、長時間にわたって自動化タスクを行う点にあり、もしそれが本当ならAIはエージェンティックな業務プロセスに入っていく。ラリー・フィンクは、計算能力の供給が深刻に不足しており、将来的に計算能力の先物が登場する可能性があると述べた。両者はともに、AI基盤整備を支える強気論の根拠となっている。この記事では、AIはまだ初期段階にあると考えられている。

ChainNewsAbmedia1時間前
コメント
0/400
コメントなし