2026-01-17 07:27:46

最近发现了一个有趣的实验——多个大模型被分配各10000美元资金，在足球预测市场进行6周交易。结果相当戏剧化。

GPT-5.1以42.6%的涨幅领跑全场，DeepSeek紧随其后斩获10.7%收益，Gemini 3 Pro则稳定在5.5%。Opus 4.2贡献了3.9%，Grok 4.1 Fast交出2.1%的成绩。不过GPT-5.2掉了链子，跌幅达21.8%——看来不是所有模型都擅长这一套。

这个对比测试由预测市场平台和AI研究团队联合推进，背后的逻辑很有趣：用真实资金测试不同AI在非标准化决策任务中的表现。足球预测市场涉及数据分析、概率估算和风险判断——这正好是检验大模型实战交易能力的好场景。差异之大也反映出，光有参数量和训练规模不代表市场决策能力，执行策略和数据理解的质量同样关键。

此页面可能包含第三方内容，仅供参考（非陈述/保证），不应被视为 Gate 认可其观点表述，也不得被视为财务或专业建议。详见声明。

13人点赞了这条动态

赞赏
13
8
转发
分享

0/400

天台预订师

· 4小时前

GPT-5.2那个负收益真的绝了，花钱学费也学不到啊...DeepSeek反而稳健，这说明啥呢，大模型在市场面前还是得看脑子不是看体型

BridgeTrustFund

· 13小时前

gpt5.1直接起飞42.6%，这是认真的吗，gpt5.2反手亏21.8%，同门师兄弟差距这么大的吗

DeFiCaffeinator

· 13小时前

GPT-5.1 直接起飞，DeepSeek 稳健跟进，但 GPT-5.2 那波操作真的绝了...大参数模型翻车这事儿说明啥，还是得靠实战决策能力啊。

MetaverseMortgage

· 13小时前

GPT-5.2直接亏爆了哈哈，这才是真正的"智能"测试啊...纸上谈兵和实盘两回事儿

链上福尔摩斯妹

· 13小时前

GPT-5.2那个失血21.8%真的绝了，堪称年度最大悬念...据我分析这哥们可能过度拟合了某个赛事模式，结果被现实毒打。反观5.1的42.6%涨幅也很可疑啊，这数据要不是运气爆棚就是它发现了什么我们没看到的pattern

0xInsomnia

· 13小时前

GPT-5.2那一手是真的绝了，十万进两万八...这就是AI炒币的真实面目啊

ProveMyZK

· 13小时前

GPT-5.2直接亏了，这有点离谱啊...就离谱 --- DeepSeek又来搅局了，这哥们就是有点东西 --- 说白了，模型炒股还是得看执行力，参数多没用 --- 42.6%？GPT-5.1这是开了什么挂，不太信啊 --- 足球预测市场搁这儿给AI做压力测试，创意是真不错 --- 哈哈Grok咋这么拉胯，还不如Opus呢 --- 这实验告诉我一个道理，大model也得讲策略 --- 等等，10k美元6周这数据有点太理想了吧，真实吗 --- DeepSeek没吹牛逼，至少没亏钱 --- 敢用真钱验证AI，这帮人是真有胆子

SatsStacking

· 13小时前

gpt5.1直接起飞42%？这数据离谱了，感觉有点太完美，但5.2直接亏21算是活该吧哈哈

热门话题
查看更多
#
周末行情分析
2.62万热度
#
中文Meme币热潮
3.42万热度
#
GateLaunchpadIMU
2.57万热度
#
隐私币行情分化
7676 热度
#
BitMine持续加码ETH质押
7097 热度

热门 Gate Fun
查看更多

1
100000.00000
FREO
市值:$3565.51持有人数:1
0.00%
2
以梦为马
Alpha
市值:$3565.51持有人数:1
0.00%
3
NBHH
牛逼哄哄
市值:$3622.78持有人数:2
0.09%
4
芝麻人生
芝麻人生
市值:$3660.02持有人数:5
0.32%
5
小韭菜
小韭菜
市值:$3615.76持有人数:2
0.09%

最近发现了一个有趣的实验——多个大模型被分配各10000美元资金，在足球预测市场进行6周交易。结果相当戏剧化。

热门话题

周末行情分析

中文Meme币热潮

GateLaunchpadIMU

隐私币行情分化

BitMine持续加码ETH质押

热门 Gate Fun

100000.00000

FREO

以梦为马

Alpha

NBHH

牛逼哄哄

芝麻人生

芝麻人生

小韭菜

小韭菜

置顶