最近発見された面白い実験——複数の大規模モデルに各$10,000を割り当て、サッカー予測市場で6週間取引を行う。結果はかなり劇的だった。



GPT-5.1は42.6%の上昇率でトップを走り、DeepSeekが続いて10.7%の利益を獲得、Gemini 3 Proは安定して5.5%を維持。Opus 4.2は3.9%、Grok 4.1 Fastは2.1%の成績を出した。ただし、GPT-5.2はつまずき、21.8%の下落——すべてのモデルがこの手法に長けているわけではないようだ。

この比較テストは予測市場プラットフォームとAI研究チームが共同で推進し、その背後にあるロジックは非常に興味深い:実資金を使って、非標準的な意思決定タスクにおける異なるAIのパフォーマンスをテストすること。サッカー予測市場はデータ分析、確率推定、リスク判断を含み——これはまさに大規模モデルの実戦取引能力を検証する良い場面だ。差異が大きいのは、パラメータ数やトレーニング規模だけでは市場の意思決定能力を示さず、戦略の実行とデータ理解の質も同じくらい重要であることを反映している。
原文表示
このページには第三者のコンテンツが含まれている場合があり、情報提供のみを目的としております(表明・保証をするものではありません)。Gateによる見解の支持や、金融・専門的な助言とみなされるべきものではありません。詳細については免責事項をご覧ください。
  • 報酬
  • 8
  • リポスト
  • 共有
コメント
0/400
RooftopReservervip
· 57分前
GPT-5.2のその負のリターンは本当にすごいですね。お金を払って学ぶ価値もないです...DeepSeekはむしろ堅実です。これは何を意味するのでしょうか、大規模モデルは市場の前ではやはり頭脳が重要で、体格ではないということです
原文表示返信0
BridgeTrustFundvip
· 9時間前
gpt5.1直接起飞42.6%,これは本気ですか、gpt5.2反手で損失21.8%、同門の兄弟弟子間でこれほど差があるのですか
原文表示返信0
DeFiCaffeinatorvip
· 10時間前
GPT-5.1 直接起飞,DeepSeek 稳健跟进,但 GPT-5.2 その操作は本当にすごかった...大規模パラメータモデルの失敗は何を意味するのか、やはり実戦での意思決定能力が重要だ。
原文表示返信0
MetaverseMortgagevip
· 10時間前
GPT-5.2直接亏爆了哈哈,这才是真正的"智能"测试啊...纸上谈兵和实盘两回事儿
返信0
ChainSherlockGirlvip
· 10時間前
GPT-5.2の血液喪失21.8%は本当にすごい、まさに年間最大のサプライズ…私の分析によると、この兄さんはある試合パターンに過度にフィットしてしまった可能性があり、その結果現実に打ちのめされたのだろう。対照的に、5.1の42.6%の上昇も非常に疑わしい。このデータが運に恵まれたものでなければ、彼は私たちが見逃している何かパターンを発見したのかもしれない。
原文表示返信0
0xInsomniavip
· 10時間前
GPT-5.2その一手は本当に絶妙だった。10万を2万8千に…これがAIによる仮想通貨取引の真の姿だ。
原文表示返信0
ProveMyZKvip
· 10時間前
GPT-5.2直接亏了,这有点离谱啊...就离谱 --- DeepSeek又来搅局了,这哥们就是有点东西 --- 说白了,模型炒股还是得看执行力,参数多没用 --- 42.6%?GPT-5.1これは何のチートだ、信じられないな --- サッカー予測市場でAIにプレッシャーテストをさせるのは、アイデアは本当に素晴らしい --- ハハGrokはなんでこんなにダメなんだ、Opusの方がまだマシだね --- この実験は一つの教訓を教えてくれる、大モデルでも戦略が必要だ --- ちょっと待って、10kドルで6週間のこのデータはちょっと理想的すぎる、現実的か? --- DeepSeekは嘘をついていない、少なくともお金を失っていない --- 本気でお金を使ってAIを検証するなんて、この連中は本当に度胸がある
原文表示返信0
SatsStackingvip
· 10時間前
gpt5.1直接起飞42%?このデータは非常識だ、ちょっと完璧すぎる気がするけど、5.2は直接21の損失だから当然だよね、ハハ
原文表示返信0
  • ピン