2026-01-17 07:27:46

最近発見された面白い実験——複数の大規模モデルに各$10,000を割り当て、サッカー予測市場で6週間取引を行う。結果はかなり劇的だった。

GPT-5.1は42.6%の上昇率でトップを走り、DeepSeekが続いて10.7%の利益を獲得、Gemini 3 Proは安定して5.5%を維持。Opus 4.2は3.9%、Grok 4.1 Fastは2.1%の成績を出した。ただし、GPT-5.2はつまずき、21.8%の下落——すべてのモデルがこの手法に長けているわけではないようだ。

この比較テストは予測市場プラットフォームとAI研究チームが共同で推進し、その背後にあるロジックは非常に興味深い：実資金を使って、非標準的な意思決定タスクにおける異なるAIのパフォーマンスをテストすること。サッカー予測市場はデータ分析、確率推定、リスク判断を含み——これはまさに大規模モデルの実戦取引能力を検証する良い場面だ。差異が大きいのは、パラメータ数やトレーニング規模だけでは市場の意思決定能力を示さず、戦略の実行とデータ理解の質も同じくらい重要であることを反映している。

原文表示

このページには第三者のコンテンツが含まれている場合があり、情報提供のみを目的としております（表明・保証をするものではありません）。Gateによる見解の支持や、金融・専門的な助言とみなされるべきものではありません。詳細については免責事項をご覧ください。

13 いいね

報酬
13
8
リポスト
共有

0/400

RooftopReserver

· 57分前

GPT-5.2のその負のリターンは本当にすごいですね。お金を払って学ぶ価値もないです...DeepSeekはむしろ堅実です。これは何を意味するのでしょうか、大規模モデルは市場の前ではやはり頭脳が重要で、体格ではないということです

原文表示返信0

BridgeTrustFund

· 9時間前

gpt5.1直接起飞42.6%，これは本気ですか、gpt5.2反手で損失21.8%、同門の兄弟弟子間でこれほど差があるのですか

原文表示返信0

DeFiCaffeinator

· 10時間前

GPT-5.1 直接起飞，DeepSeek 稳健跟进，但 GPT-5.2 その操作は本当にすごかった...大規模パラメータモデルの失敗は何を意味するのか、やはり実戦での意思決定能力が重要だ。

原文表示返信0

MetaverseMortgage

· 10時間前

GPT-5.2直接亏爆了哈哈，这才是真正的"智能"测试啊...纸上谈兵和实盘两回事儿

返信0

ChainSherlockGirl

· 10時間前

GPT-5.2の血液喪失21.8%は本当にすごい、まさに年間最大のサプライズ…私の分析によると、この兄さんはある試合パターンに過度にフィットしてしまった可能性があり、その結果現実に打ちのめされたのだろう。対照的に、5.1の42.6%の上昇も非常に疑わしい。このデータが運に恵まれたものでなければ、彼は私たちが見逃している何かパターンを発見したのかもしれない。

原文表示返信0

0xInsomnia

· 10時間前

GPT-5.2その一手は本当に絶妙だった。10万を2万8千に…これがAIによる仮想通貨取引の真の姿だ。

原文表示返信0

ProveMyZK

· 10時間前

GPT-5.2直接亏了，这有点离谱啊...就离谱 --- DeepSeek又来搅局了，这哥们就是有点东西 --- 说白了，模型炒股还是得看执行力，参数多没用 --- 42.6%？GPT-5.1これは何のチートだ、信じられないな --- サッカー予測市場でAIにプレッシャーテストをさせるのは、アイデアは本当に素晴らしい --- ハハGrokはなんでこんなにダメなんだ、Opusの方がまだマシだね --- この実験は一つの教訓を教えてくれる、大モデルでも戦略が必要だ --- ちょっと待って、10kドルで6週間のこのデータはちょっと理想的すぎる、現実的か？ --- DeepSeekは嘘をついていない、少なくともお金を失っていない --- 本気でお金を使ってAIを検証するなんて、この連中は本当に度胸がある

原文表示返信0

SatsStacking

· 10時間前

gpt5.1直接起飞42%？このデータは非常識だ、ちょっと完璧すぎる気がするけど、5.2は直接21の損失だから当然だよね、ハハ

原文表示返信0