最近发现了一个有趣的实验——多个大模型被分配各10000美元资金,在足球预测市场进行6周交易。结果相当戏剧化。



GPT-5.1以42.6%的涨幅领跑全场,DeepSeek紧随其后斩获10.7%收益,Gemini 3 Pro则稳定在5.5%。Opus 4.2贡献了3.9%,Grok 4.1 Fast交出2.1%的成绩。不过GPT-5.2掉了链子,跌幅达21.8%——看来不是所有模型都擅长这一套。

这个对比测试由预测市场平台和AI研究团队联合推进,背后的逻辑很有趣:用真实资金测试不同AI在非标准化决策任务中的表现。足球预测市场涉及数据分析、概率估算和风险判断——这正好是检验大模型实战交易能力的好场景。差异之大也反映出,光有参数量和训练规模不代表市场决策能力,执行策略和数据理解的质量同样关键。
此页面可能包含第三方内容,仅供参考(非陈述/保证),不应被视为 Gate 认可其观点表述,也不得被视为财务或专业建议。详见声明
  • 赞赏
  • 8
  • 转发
  • 分享
评论
0/400
天台预订师vip
· 4小时前
GPT-5.2那个负收益真的绝了,花钱学费也学不到啊...DeepSeek反而稳健,这说明啥呢,大模型在市场面前还是得看脑子不是看体型
回复0
BridgeTrustFundvip
· 13小时前
gpt5.1直接起飞42.6%,这是认真的吗,gpt5.2反手亏21.8%,同门师兄弟差距这么大的吗
回复0
DeFiCaffeinatorvip
· 13小时前
GPT-5.1 直接起飞,DeepSeek 稳健跟进,但 GPT-5.2 那波操作真的绝了...大参数模型翻车这事儿说明啥,还是得靠实战决策能力啊。
回复0
MetaverseMortgagevip
· 13小时前
GPT-5.2直接亏爆了哈哈,这才是真正的"智能"测试啊...纸上谈兵和实盘两回事儿
回复0
链上福尔摩斯妹vip
· 13小时前
GPT-5.2那个失血21.8%真的绝了,堪称年度最大悬念...据我分析这哥们可能过度拟合了某个赛事模式,结果被现实毒打。反观5.1的42.6%涨幅也很可疑啊,这数据要不是运气爆棚就是它发现了什么我们没看到的pattern
回复0
0xInsomniavip
· 13小时前
GPT-5.2那一手是真的绝了,十万进两万八...这就是AI炒币的真实面目啊
回复0
ProveMyZKvip
· 13小时前
GPT-5.2直接亏了,这有点离谱啊...就离谱 --- DeepSeek又来搅局了,这哥们就是有点东西 --- 说白了,模型炒股还是得看执行力,参数多没用 --- 42.6%?GPT-5.1这是开了什么挂,不太信啊 --- 足球预测市场搁这儿给AI做压力测试,创意是真不错 --- 哈哈Grok咋这么拉胯,还不如Opus呢 --- 这实验告诉我一个道理,大model也得讲策略 --- 等等,10k美元6周这数据有点太理想了吧,真实吗 --- DeepSeek没吹牛逼,至少没亏钱 --- 敢用真钱验证AI,这帮人是真有胆子
回复0
SatsStackingvip
· 13小时前
gpt5.1直接起飞42%?这数据离谱了,感觉有点太完美,但5.2直接亏21算是活该吧哈哈
回复0
交易,随时随地
qrCode
扫码下载 Gate App
社群列表
简体中文
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)