Google Gemini 3.1 Flash-Lite Официально Запускается: Стоимость Ввода На 75% Дешевле, Чем Claude 4.5 Haiku, Результат GPQA — 86,9%

По данным Beating, Google Gemini 3.1 Flash-Lite перешёл из режима предпросмотра в общую доступность (GA) 8 мая, став самым дешёвым и быстрым в серии Gemini 3. Стоимость ввода установлена на уровне $0,25 за миллион токенов, а вывода — $1,50 за миллион токенов: ввод на 75% дешевле, чем у Claude 4.5 Haiku ($1,00), а вывод — на 70% дешевле ($5,00). Модель поддерживает контекстное окно в 1 миллион токенов и достигает пропускной способности 363 токена в секунду — на 45% быстрее, чем её предшественник Gemini 2.5 Flash.

Бенчмарки производительности показывают GPQA Diamond (рассуждения на уровне аспирантуры по науке) на уровне 86,9%, что выше Claude 4.5 Haiku (73,0%) и GPT-5 mini (82,3%). MMMU-Pro (мультимодальное рассуждение) достигает 76,8%. Среди ранних пользователей — платформа для клиентской поддержки Gladly, которая сообщает о снижении затрат на 60% и 99,6% успешности на рабочих нагрузках в продакшене, а также JetBrains, интегрировавшая Flash-Lite в инструменты IDE для помощи пользователям.

Отказ от ответственности: Информация на этой странице может поступать от третьих лиц и не отражает взгляды или мнения Gate. Содержание, представленное на этой странице, предназначено исключительно для справки и не является финансовой, инвестиционной или юридической консультацией. Gate не гарантирует точность или полноту информации и не несет ответственности за любые убытки, возникшие от использования этой информации. Инвестиции в виртуальные активы несут высокие риски и подвержены значительной ценовой волатильности. Вы можете потерять весь инвестированный капитал. Пожалуйста, полностью понимайте соответствующие риски и принимайте разумные решения, исходя из собственного финансового положения и толерантности к риску. Для получения подробностей, пожалуйста, обратитесь к Отказу от ответственности.

Связанные статьи

OpenAI переключает ChatGPT на модель GPT-5.5 по умолчанию — мгновенно, снижает галлюцинации на 52,5%

По данным OpenAI, компания 8 мая перевела модель по умолчанию ChatGPT на GPT-5.5 Instant. Во внутренних тестах модель генерировала на 52,5% меньше галлюцинированных утверждений, чем GPT-5.3 Instant, в запросах повышенной важности, при этом снижая число неточных утверждений на 37,3% в разговорах, которые пользователи помечали для фактической ошибк er

GateNews3м назад

Генеральный директор Nvidia Хуанг: Для инфраструктуры ИИ следующего поколения нужны масштабные оптические соединения, медь недостаточна 8 мая

Согласно BlockBeats, 8 мая глава Nvidia Дженсен Хуанг заявил, что для инфраструктуры ИИ следующего поколения потребуется большое количество оптических соединений, поскольку медь не справляется с быстро растущими вычислительными потребностями. Хуанг высоко оценил новую партнерскую инициативу Nvidia с Corning, назвав её важной возможностью

GateNews8м назад

Cloudflare увольняет более 1 100 сотрудников (20% персонала), чтобы перейти к работе, управляемой ИИ

Как сообщает Reuters, Cloudflare уволила более 1 100 сотрудников, что составляет примерно 20% от штата, 8 мая — чтобы реорганизовать работу вокруг AI-инструментов. Генеральный директор Мэтью Принс заявил, что компания заново проектирует каждую команду и каждую функцию, чтобы адаптироваться к эпохе агентного ИИ, отметив внутреннее использование ИИ

GateNews21м назад

Google запускает Fitbit Air за $99,99: неэкранный трекер станет хабом Gemini Health Coach 26 мая

По данным Beating, Google запустила Fitbit Air — бесэкранный трекер здоровья по цене $99,99, который должен поступить в продажу 26 мая. Устройство весит всего 5,2 грамма и оснащено батареей на 7 дней с функцией быстрой зарядки за 5 минут. Датчики отслеживают 24-часовой мониторинг частоты сердечных сокращений, выявление фибрилляции предсердий, уровень кислорода в крови, h

GateNews24м назад

OpenAI выпускает три голосовые модели в Realtime API; GPT-Realtime-2 предлагает контекстное окно на 128K

Beating: OpenAI выпустила три голосовые модели в своей Realtime API: GPT-Realtime-2 для голосового разговора с рассуждениями, GPT-Realtime-Translate для перевода в реальном времени и GPT-Realtime-Whisper для потоковой транскрипции. GPT-Realtime-2 — первая голосовая модель OpenAI с уровнем GPT-5-ре

GateNews40м назад

Прогноз Cloudflare не оправдал ожиданий: сокращение 1 100 сотрудников, а цена акций после закрытия торгов рухнула на 19%

Финансовый отчёт Cloudflare за первый квартал, опубликованный в четверг, показал, что выручка и прибыль компании оказались лучше ожиданий рынка, демонстрируя сильный импульс роста. Однако из-за того, что прогноз выручки компании на второй квартал оказался немного ниже оценок аналитиков, на рынке появились сомнения, сохранится ли этот импульс. В то же время Cloudflare объявила о сокращении примерно 1 100 сотрудников — около 20% от общего числа работников. Генеральный директор Matthew Prince подчеркнул, что ИИ и агенты уже стали ключевой производительной силой компании, а операционная модель переживает фундаментальные изменения. На фоне разочаровывающих прогнозов и новостей о масштабных сокращениях акциями компании (NET) в пострыночных торгах зафиксировано падение почти на 19%. Cloudflare разочаровала прогнозами по финансам, акции в аутсайде после закрытия просели на 19% Выручка Cloudflare за первый квартал составила 639,8 млн долларов

ChainNewsAbmedia1ч назад
комментарий
0/400
Нет комментариев