最近发现了一个有趣的实验——多个大模型被分配各10000美元资金,在足球预测市场进行6周交易。结果相当戏剧化。



GPT-5.1以42.6%的涨幅领跑全场,DeepSeek紧随其后斩获10.7%收益,Gemini 3 Pro则稳定在5.5%。Opus 4.2贡献了3.9%,Grok 4.1 Fast交出2.1%的成绩。不过GPT-5.2掉了链子,跌幅达21.8%——看来不是所有模型都擅长这一套。

这个对比测试由预测市场平台和AI研究团队联合推进,背后的逻辑很有趣:用真实资金测试不同AI在非标准化决策任务中的表现。足球预测市场涉及数据分析、概率估算和风险判断——这正好是检验大模型实战交易能力的好场景。差异之大也反映出,光有参数量和训练规模不代表市场决策能力,执行策略和数据理解的质量同样关键。
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
  • Phần thưởng
  • 10
  • Đăng lại
  • Retweed
Bình luận
0/400
rekt_but_resilientvip
· 01-20 07:25
GPT-5.2 trực tiếp gặp sự cố, lần này thật là ngại quá haha
Xem bản gốcTrả lời0
SorryRugPulledvip
· 01-18 06:35
GPT-5.1 trực tiếp tăng 42.6%, GPT-5.2 ngược lại giảm 21.8%…… hai cái này chắc là anh em ruột thất lạc nhiều năm rồi ha ha DeepSeek lặng lẽ kiếm được 10.7%, thuộc dạng ổn định. Tuy nhiên, thành thật mà nói, dự đoán bóng đá kiểu này… thật sự có thể nói lên điều gì không, cảm giác như dùng tiền thật để chơi cờ bạc kiểm tra AI vậy Nhiều tham số cũng không cứu được quyết định tồi của mô hình, điều này tôi tin. Nhưng dữ liệu trong 6 tuần… không chắc ý nghĩa lớn đến mức nào
Xem bản gốcTrả lời0
RooftopReservervip
· 01-17 17:00
GPT-5.2 đó âm lợi nhuận thật sự là đỉnh cao, tiêu tiền học phí cũng không học được... DeepSeek ngược lại ổn định hơn, điều này nói lên điều gì nhỉ, mô hình lớn vẫn phải dựa vào trí tuệ chứ không phải kích thước cơ thể
Xem bản gốcTrả lời0
BridgeTrustFundvip
· 01-17 07:57
gpt5.1 trực tiếp tăng 42.6%, bạn có chắc chắn không, gpt5.2 lại giảm 21.8%, cùng là anh em đồng môn mà chênh lệch lớn vậy sao
Xem bản gốcTrả lời0
DeFiCaffeinatorvip
· 01-17 07:57
GPT-5.1 trực tiếp khởi động, DeepSeek theo sát ổn định, nhưng pha thao tác của GPT-5.2 thật sự xuất sắc... Việc các mô hình lớn gặp sự cố cho thấy điều gì, vẫn phải dựa vào khả năng ra quyết định thực chiến.
Xem bản gốcTrả lời0
MetaverseMortgagevip
· 01-17 07:55
GPT-5.2 trực tiếp thua sạch rồi haha, đây mới là thử nghiệm "thông minh" thực sự... bàn giấy và thực chiến là hai chuyện hoàn toàn khác nhau
Xem bản gốcTrả lời0
ChainSherlockGirlvip
· 01-17 07:31
GPT-5.2 đó mất máu 21.8% thật sự là đỉnh cao, có thể xem là bí ẩn lớn nhất của năm... Theo phân tích của tôi, anh chàng này có thể đã quá mức phù hợp với một mô hình sự kiện nào đó, kết quả là bị thực tế đánh bạt. Ngược lại, mức tăng 42.6% của 5.1 cũng rất đáng ngờ, nếu không phải do may mắn rực rỡ thì chính là nó đã phát hiện ra một pattern mà chúng ta chưa thấy.
Xem bản gốcTrả lời0
0xInsomniavip
· 01-17 07:30
GPT-5.2 đó thực sự là đỉnh cao, từ 100.000 xuống còn 28.000... Đây chính là diện mạo thật sự của việc đầu tư tiền điện tử bằng AI đấy
Xem bản gốcTrả lời0
ProveMyZKvip
· 01-17 07:29
GPT-5.2 trực tiếp thua lỗ, điều này có vẻ hơi vô lý... thật là vô lý --- DeepSeek lại đến gây rối, cậu bạn này thật sự có chút gì đó --- Nói thẳng ra, mô hình đầu tư chứng khoán vẫn phải dựa vào khả năng thực thi, nhiều tham số cũng vô dụng --- 42.6%? GPT-5.1 đang bật chế độ gì vậy, tôi không tin lắm --- Thị trường dự đoán bóng đá đặt ở đây để AI thử nghiệm áp lực, sáng tạo thật sự không tồi --- Haha Grok sao lại kém như vậy, còn không bằng Opus nữa --- Thí nghiệm này cho tôi một chân lý, mô hình lớn cũng cần có chiến lược --- Chờ đã, dữ liệu 10k đô la trong 6 tuần này có vẻ quá lý tưởng rồi, có thật không --- DeepSeek không khoe khoang, ít nhất không thua lỗ --- Dám dùng tiền thật để kiểm chứng AI, đám người này thật sự rất dũng cảm
Xem bản gốcTrả lời0
SatsStackingvip
· 01-17 07:28
gpt5.1 trực tiếp tăng 42%?Dữ liệu này quá phi lý, cảm giác có chút quá hoàn hảo, nhưng 5.2 trực tiếp giảm 21 có phải đáng đời không haha
Xem bản gốcTrả lời0
Xem thêm
  • Ghim