2026-01-17 07:27:46

Недавно был обнаружен интересный эксперимент — нескольким крупным моделям было выделено по 10000 долларов на проведение 6-недельной торговли на рынке футбольных прогнозов. Результаты оказались довольно драматичными.

GPT-5.1 с ростом на 42.6% лидирует во всем поле, DeepSeek занимает второе место с доходом 10.7%, Gemini 3 Pro стабильно показывает 5.5%. Opus 4.2 принес 3.9%, Grok 4.1 Fast — 2.1%. Однако GPT-5.2 потерял нить, снизившись на 21.8% — похоже, не все модели умеют справляться с этим.

Этот сравнительный тест был проведен совместно платформой прогнозных рынков и командой исследований ИИ, логика которого очень интересна: тестирование различных ИИ на реальных средствах в нестандартных задачах принятия решений. Рынок футбольных прогнозов включает анализ данных, оценку вероятностей и риск-менеджмент — именно это хорошая сцена для проверки практических торговых способностей крупных моделей. Различия также показывают, что наличие большого количества параметров и масштаб обучения не гарантирует способность к рыночным решениям, важны также качество стратегии исполнения и понимания данных.

Посмотреть Оригинал

На этой странице может содержаться сторонний контент, который предоставляется исключительно в информационных целях (не в качестве заявлений/гарантий) и не должен рассматриваться как поддержка взглядов компании Gate или как финансовый или профессиональный совет. Подробности смотрите в разделе «Отказ от ответственности» .

17 Лайков

Награда
17
10
Репост
Поделиться

комментарий

0/400

rekt_but_resilient

· 01-20 07:25

GPT-5.2 прямо умер, теперь неловко haha

Посмотреть ОригиналОтветить0

SorryRugPulled

· 01-18 06:35

GPT-5.1 прямо взлетел на 42.6%, GPT-5.2 в обратную сторону потерял 21.8%… Наверное, это два давно потерявших связь брата, ха-ха DeepSeek тихо заработал 10.7%, относится к консервативной группе. Но честно говоря, такие вещи, как футбольные прогнозы… действительно что-то могут показать? Кажется, это всё равно что играть в азартные игры на реальные деньги, чтобы проверить ИИ Много параметров тоже не спасут плохие решения модели, в это я верю. Но шесть недель данных… не уверен, насколько это имеет смысл

Посмотреть ОригиналОтветить0

RooftopReserver

· 01-17 17:00

GPT-5.2 тот отрицательный доход действительно поразителен, за деньги учиться тоже не научишься... DeepSeek наоборот стабилен, что это говорит о том? Большие модели в условиях рынка всё равно зависят от ума, а не от размера

Посмотреть ОригиналОтветить0

BridgeTrustFund

· 01-17 07:57

gpt5.1直接起飞42.6%，这是认真的吗，gpt5.2反手亏21.8%，同门师兄弟差距这么大的吗

Ответить0

DeFiCaffeinator

· 01-17 07:57

GPT-5.1 прямо взлетает, DeepSeek стабильно следит за ситуацией, но операция с GPT-5.2 действительно была на высоте... Провал больших моделей с параметрами показывает, что всё равно нужно полагаться на практические навыки принятия решений.

Посмотреть ОригиналОтветить0

MetaverseMortgage

· 01-17 07:55

GPT-5.2 прямо потерял все, ха-ха, это действительно настоящий тест "интеллекта"... теоретические рассуждения и реальная торговля — это две разные вещи

Посмотреть ОригиналОтветить0

ChainSherlockGirl

· 01-17 07:31

GPT-5.2, который потерял 21.8%, действительно поразил, считается крупнейшей загадкой года... По моему анализу, этот парень, возможно, переобучился на какой-то спортивный режим, и в итоге получил жесткий отпор от реальности. В то же время, рост на 42.6% у версии 5.1 тоже вызывает подозрения — если это не просто удача, значит, он обнаружил какой-то паттерн, который мы не заметили.

Посмотреть ОригиналОтветить0

0xInsomnia

· 01-17 07:30

GPT-5.2那一手是真的绝了，十万进两万八...这就是AI炒币的真实面目啊

Ответить0

ProveMyZK

· 01-17 07:29

GPT-5.2 прямо в убытке, это немного странно... слишком странно --- DeepSeek снова вмешивается, этот парень действительно что-то из себя представляет --- Говоря откровенно, торговля на моделях всё ещё зависит от исполнительности, много параметров — бесполезно --- 42.6%? GPT-5.1 — что за чит-код, не очень верю --- Рынок футбольных прогнозов здесь для стресс-теста ИИ, идея действительно хорошая --- Ха-ха, Grok так отстойно работает, даже лучше Opus --- Этот эксперимент научил меня одному — даже большие модели должны иметь стратегию --- Подождите, 10k долларов за 6 недель — эти данные слишком идеальны, правда ли это --- DeepSeek не хвастался, по крайней мере не в убытке --- Дерзко использовать реальные деньги для проверки ИИ, у этих ребят действительно есть смелость

Посмотреть ОригиналОтветить0

SatsStacking

· 01-17 07:28

gpt5.1 прямо взлетает на 42%？Эти данные нереальны, кажется, немного слишком идеально, но 5.2 сразу потерял 21 — так и должно было быть, ха-ха

Посмотреть ОригиналОтветить0

Подробнее