Недавно был обнаружен интересный эксперимент — нескольким крупным моделям было выделено по 10000 долларов на проведение 6-недельной торговли на рынке футбольных прогнозов. Результаты оказались довольно драматичными.



GPT-5.1 с ростом на 42.6% лидирует во всем поле, DeepSeek занимает второе место с доходом 10.7%, Gemini 3 Pro стабильно показывает 5.5%. Opus 4.2 принес 3.9%, Grok 4.1 Fast — 2.1%. Однако GPT-5.2 потерял нить, снизившись на 21.8% — похоже, не все модели умеют справляться с этим.

Этот сравнительный тест был проведен совместно платформой прогнозных рынков и командой исследований ИИ, логика которого очень интересна: тестирование различных ИИ на реальных средствах в нестандартных задачах принятия решений. Рынок футбольных прогнозов включает анализ данных, оценку вероятностей и риск-менеджмент — именно это хорошая сцена для проверки практических торговых способностей крупных моделей. Различия также показывают, что наличие большого количества параметров и масштаб обучения не гарантирует способность к рыночным решениям, важны также качество стратегии исполнения и понимания данных.
Посмотреть Оригинал
На этой странице может содержаться сторонний контент, который предоставляется исключительно в информационных целях (не в качестве заявлений/гарантий) и не должен рассматриваться как поддержка взглядов компании Gate или как финансовый или профессиональный совет. Подробности смотрите в разделе «Отказ от ответственности» .
  • Награда
  • 10
  • Репост
  • Поделиться
комментарий
0/400
rekt_but_resilientvip
· 01-20 07:25
GPT-5.2 прямо умер, теперь неловко haha
Посмотреть ОригиналОтветить0
SorryRugPulledvip
· 01-18 06:35
GPT-5.1 прямо взлетел на 42.6%, GPT-5.2 в обратную сторону потерял 21.8%… Наверное, это два давно потерявших связь брата, ха-ха DeepSeek тихо заработал 10.7%, относится к консервативной группе. Но честно говоря, такие вещи, как футбольные прогнозы… действительно что-то могут показать? Кажется, это всё равно что играть в азартные игры на реальные деньги, чтобы проверить ИИ Много параметров тоже не спасут плохие решения модели, в это я верю. Но шесть недель данных… не уверен, насколько это имеет смысл
Посмотреть ОригиналОтветить0
RooftopReservervip
· 01-17 17:00
GPT-5.2 тот отрицательный доход действительно поразителен, за деньги учиться тоже не научишься... DeepSeek наоборот стабилен, что это говорит о том? Большие модели в условиях рынка всё равно зависят от ума, а не от размера
Посмотреть ОригиналОтветить0
BridgeTrustFundvip
· 01-17 07:57
gpt5.1直接起飞42.6%,这是认真的吗,gpt5.2反手亏21.8%,同门师兄弟差距这么大的吗
Ответить0
DeFiCaffeinatorvip
· 01-17 07:57
GPT-5.1 прямо взлетает, DeepSeek стабильно следит за ситуацией, но операция с GPT-5.2 действительно была на высоте... Провал больших моделей с параметрами показывает, что всё равно нужно полагаться на практические навыки принятия решений.
Посмотреть ОригиналОтветить0
MetaverseMortgagevip
· 01-17 07:55
GPT-5.2 прямо потерял все, ха-ха, это действительно настоящий тест "интеллекта"... теоретические рассуждения и реальная торговля — это две разные вещи
Посмотреть ОригиналОтветить0
ChainSherlockGirlvip
· 01-17 07:31
GPT-5.2, который потерял 21.8%, действительно поразил, считается крупнейшей загадкой года... По моему анализу, этот парень, возможно, переобучился на какой-то спортивный режим, и в итоге получил жесткий отпор от реальности. В то же время, рост на 42.6% у версии 5.1 тоже вызывает подозрения — если это не просто удача, значит, он обнаружил какой-то паттерн, который мы не заметили.
Посмотреть ОригиналОтветить0
0xInsomniavip
· 01-17 07:30
GPT-5.2那一手是真的绝了,十万进两万八...这就是AI炒币的真实面目啊
Ответить0
ProveMyZKvip
· 01-17 07:29
GPT-5.2 прямо в убытке, это немного странно... слишком странно --- DeepSeek снова вмешивается, этот парень действительно что-то из себя представляет --- Говоря откровенно, торговля на моделях всё ещё зависит от исполнительности, много параметров — бесполезно --- 42.6%? GPT-5.1 — что за чит-код, не очень верю --- Рынок футбольных прогнозов здесь для стресс-теста ИИ, идея действительно хорошая --- Ха-ха, Grok так отстойно работает, даже лучше Opus --- Этот эксперимент научил меня одному — даже большие модели должны иметь стратегию --- Подождите, 10k долларов за 6 недель — эти данные слишком идеальны, правда ли это --- DeepSeek не хвастался, по крайней мере не в убытке --- Дерзко использовать реальные деньги для проверки ИИ, у этих ребят действительно есть смелость
Посмотреть ОригиналОтветить0
SatsStackingvip
· 01-17 07:28
gpt5.1 прямо взлетает на 42%?Эти данные нереальны, кажется, немного слишком идеально, но 5.2 сразу потерял 21 — так и должно было быть, ха-ха
Посмотреть ОригиналОтветить0
Подробнее
  • Закрепить