Google Gemini 3 Deep Think крупное обновление: способность к рассуждению превосходит Opus 4.6, GPT-5.2, чтобы стать «самым научным ИИ»

BTC-0,61%

Google выпустила значительное обновление Gemini 3 Deep Think. В тесте ARC-AGI-2, специально разработанном для предотвращения обмана ИИ и оценки его способности самостоятельно выявлять закономерности по нескольким примерам, Gemini 3 Deep Think набрал 84,6%, значительно превзойдя Claude Opus 4.6 (68,8%) и GPT-5.2 (52,9%), а также достиг уровня «легендарного мастера» на Codeforces.
(Предыстория: Появление режима обучения ChatGPT: закат наставничества или рассвет золотой эпохи образования?)
(Дополнительный фон: Google официально запустила «Gemini 3»! Чем он выделяется среди самых умных ИИ моделей в мире?)

Содержание статьи

  • Не только умеет сдавать экзамены, но и выявлять ошибки человека
  • Изменения в рыночной доле
  • Влияние на индустрию криптовалют
  • Научные победы только начинаются

Сегодня (13-го числа) Google объявила о значительном обновлении Gemini 3 Deep Think. В тесте ARC-AGI-2, который не оценивает знания, а проверяет способность самостоятельно выявлять закономерности, Gemini 3 Deep Think набрал 84,6%.

Для сравнения, Claude Opus 4.6 (в режиме Thinking Max) получил 68,8%, GPT-5.2 (в режиме Thinking xhigh) — 52,9%, а средний показатель у человека составляет около 60%.

Еще более впечатляюще, что на оригинальной версии ARC-AGI-1 Deep Think достиг 96%, практически достигнув потолка по этому тесту, который ранее считался одним из самых сложных для ИИ.

В настоящее время Deep Think доступен подписчикам Google AI Ultra, а API — для раннего корпоративного доступа.

Не только умеет сдавать экзамены, но и выявлять ошибки человека

Помимо результатов тестов, в объявлении Google был отмечен важный кейс: Deep Think при рецензировании математической статьи, прошедшей экспертную проверку, обнаружил логическую ошибку, которую не заметили все предыдущие рецензенты. Статью подтвердили математики из Университета Рутгерса.

Этот пример важен тем, что речь идет не о стандартных тестах, а о реальных научных задачах. Рецензирование — ключевой механизм контроля качества в науке. Если ИИ сможет стабильно помогать в этом процессе, его вклад в ускорение научных исследований будет значительно выше, чем любые показатели тестов.

Кроме того, Deep Think достиг уровня золотого медалиста на международной олимпиаде по физике и химии 2025 года, а на платформе Codeforces его рейтинг Elo составляет 3455, что соответствует уровню «легендарного мастера» — немногие человеческие программисты могут похвастаться таким уровнем.

На «Последнем экзамене человечества» — стандарте, созданном экспертами из разных областей, чтобы усложнить задачу ИИ — Deep Think набрал 48,4% без использования инструментов, установив новый рекорд.

Изменения в рыночной доле

Гонка технологий между тремя гигантами ИИ меняет карту рынка. Доля ChatGPT снизилась с пика 87% до примерно 68%, а Gemini выросла с менее 5% до более 18%, в то время как Claude от Anthropic постепенно захватывает корпоративный сегмент.

Уникальное преимущество Google — в распространении. Gemini встроен в Android, Chrome, Google Workspace и поисковик, что позволяет даже при равных возможностях модели привлекать пользователей через каналы.

Однако распространение — это меч с двумя острицами. Если опыт использования Gemini окажется неудовлетворительным, он может быстрее потерять доверие пользователей, поскольку они «подвержены пассивному восприятию», а не «активному выбору». Пользователи OpenAI платят за услуги и, следовательно, более терпимы и лояльны.

Влияние на индустрию криптовалют

Каждое обновление в гонке ИИ увеличивает спрос на вычислительные ресурсы. Стоимость обучения передовых моделей выросла с сотен миллионов долларов в 2024 году до нескольких миллиардов в 2026-м. Это влияет на две ключевые области.

Первое — трансформация майнеров биткоина. Когда прибыльность майнинга снижается (по оценкам JPMorgan, себестоимость добычи BTC снизилась до 77 тысяч долларов, а цена колеблется около 66 тысяч), крупные майнинговые фермы ускоряют переход к предоставлению AI-вычислений.

Высокие издержки не означают «отход», а «переквалификацию»: майнеры меняют профиль с добычи биткоинов на предоставление AI-услуг по контрактам.

Второе — нарратив вокруг токенов AI. Каждое крупное обновление от Google, OpenAI или Anthropic вызывает краткосрочные спекуляции на рынке децентрализованных вычислительных протоколов и связанных с ними токенов.

Но фундаментальные проблемы остаются: децентрализованные вычисления по задержкам и пропускной способности пока далеки от требований корпоративных AI-обучений. Нарратив развивается быстро, а инфраструктура — нет.

Научные победы только начинаются

Обновление Deep Think возвращает Google в лидеры гонки ИИ, по крайней мере в области логики и науки. Но если внимательно прочитать заявление Google, заметна тонкая смена акцента: вместо «самого умного универсального ИИ» компания все чаще говорит о «создании для науки».

Когда стандарты общего ИИ становятся все более насыщенными и трудно дифференцировать, ценность «ИИ, который помогает в научных исследованиях» становится более убедительной, чем «мой ИИ показывает самые высокие результаты в тестах». Если Deep Think сможет стабильно помогать рецензентам, ускорять открытие лекарств или находить решения в физических моделях, это будет иметь гораздо больше значения, чем любые рейтинги.

Проблема в том, что переход от «высоких баллов в тестах» к «надежной помощи в реальной науке» может оказаться более сложным, чем намекает Google: тесты имеют правильные ответы, а наука — нет.

Посмотреть Оригинал
Отказ от ответственности: Информация на этой странице может поступать от третьих лиц и не отражает взгляды или мнения Gate. Содержание, представленное на этой странице, предназначено исключительно для справки и не является финансовой, инвестиционной или юридической консультацией. Gate не гарантирует точность или полноту информации и не несет ответственности за любые убытки, возникшие от использования этой информации. Инвестиции в виртуальные активы несут высокие риски и подвержены значительной ценовой волатильности. Вы можете потерять весь инвестированный капитал. Пожалуйста, полностью понимайте соответствующие риски и принимайте разумные решения, исходя из собственного финансового положения и толерантности к риску. Для получения подробностей, пожалуйста, обратитесь к Отказу от ответственности.

Связанные статьи

Владеет 40% акций Binance Japan! PayPay от SoftBank выходит на IPO в США, оценка в 13,4 миллиарда долларов

Японская платежная компания PayPay планирует выйти на биржу в США, цель — привлечь 1,1 миллиарда долларов, максимальная оценка — 13,4 миллиарда долларов. Количество пользователей превышает 72 миллиона, компания активно развивает криптовалюты. PayPay достигла сотрудничества с Binance Japan, интегрируя платежную инфраструктуру и блокчейн-технологии, чтобы стимулировать развитие Web3.

CryptoCity9м назад

Gate ежедневная газета (4 марта): Трамп обвиняет банки в блокировке закона «GENIUS»; Мицубиси повысила целевую цену Circle до 100 долларов

Биткойн (BTC) торгуется примерно по 68 040 долларов, не сумев продолжить рост. Трамп отметил, что законодательство о стейблкоинах сталкивается с угрозами со стороны банков и призвал к продвижению соответствующих законопроектов. Мицубиси UFJ Securities повысила целевую цену на Circle до 100 долларов и сохранила нейтральный рейтинг. Американские акции колебались и закрылись на понижении из-за влияния конфликта на Ближнем Востоке, инвесторы обеспокоены геополитической неопределенностью.

MarketWhisper15м назад

Гонконг объединяется с правительством Шанхая! Создание трансграничной платформы на базе блокчейн, продвижение цифровой торговли и пилотных проектов eBL

Департамент финансового управления Гонконга и Шанхай подписали меморандум о сотрудничестве, продвигая проект Ensemble, направленный на интеграцию рынка торгового финансирования и повышение цифровых приложений. Это сотрудничество использует технологию блокчейн для решения вопросов взаимосвязи торговых данных и финансовых услуг, а также способствует укреплению роли Гонконга как международного финансового центра. В то же время Гонконг продвигает политику цифровых активов и регулирование стабильных монет, с целью усиления своей цифровой экономики и привлечения зарубежных инвестиций, постепенно переходя к эпохе машинной экономики 2026.

CryptoCity34м назад

Почему сегодня падает биткойн? Трамп угрожает отправить наземные войска, неопределенность конфликта с Ираном продолжается

Президент США Трамп проявляет противоречивую позицию по поводу военных действий Ирана, что усложняет оценку рисков конфликта на рынке и приводит к давлению на рисковые активы, такие как биткойн. Технические аналитики предупреждают, что если биткойн не сможет пробить ключевой уровень сопротивления, он может опуститься ниже 60 000 долларов, что вызовет цепную ликвидацию и дальнейшее снижение. Рыночная неопределенность возрастает, но аналитики считают, что это лишь процесс очистки слабых инвесторов, и бычий рынок не завершен.

MarketWhisper46м назад

Биткойн ETF привлекает деньги против тренда, 1.5 миллиарда долларов, поколение бэби-бум поддерживает цену криптовалюты

Несмотря на то, что цена биткоина значительно снизилась более чем на 50% по сравнению с пиковым значением 2025 года, спотовый биткоин-ETF за последние пять торговых дней привлек примерно 1,5 миллиарда долларов чистого притока средств, что в основном связано с продолжающимися покупками инвесторов и институтов из поколения бэби-бумеров. В настоящее время объем активов в биткоин-ETF превысил 107 миллиардов долларов, а институциональные инвесторы владеют примерно 12% от общего предложения биткоинов, что свидетельствует о сохранении доверия инвесторов.

GateNews50м назад

Соломон: рынку потребуется несколько недель, чтобы переварить ситуацию в Иране, рискованные активы требуют более высокой премии

ChainCatcher сообщает, что, по данным из Jin10, генеральный директор Goldman Sachs Соломон заявил, что рынкам потребуется несколько недель, чтобы переварить ситуацию в Иране, и что для любого вида рискованных активов инвесторы ожидают более высокой риск-надбавки.

GateNews1ч назад
комментарий
0/400
Нет комментариев