Исполнительный руководитель Google DeepMind: Каждая компания, создающая продукт на основе ИИ, должна разрабатывать собственные индивидуальные бенчмарки

Сообщение Gate News, 27 апреля — Логан Килпатрик, старший менеджер по продуктам в Google DeepMind и руководитель продуктового направления Google AI Studio, заявил в X, что каждая компания, создающая продукты на основе ИИ, должна разработать свои собственные индивидуальные бенчмарки для измерения эффективности ИИ-моделей. Он описал это как метод, позволяющий тому, чтобы улучшения модели «несоразмерно приносили выгоду вашей компании», и призвал основателей и руководителей бизнеса «начать уже завтра».

Большинство компаний сейчас полагаются на публичные лидерборды для выбора ИИ-моделей, но они измеряют общие возможности, которые часто не соответствуют конкретным сценариям бизнеса. Килпатрик привел пример компании по проверке контрактов, которая больше всего обеспокоена точностью извлечения пунктов — возможностью, отсутствующей в публичных бенчмарках, из-за чего невозможно оценить эффективность модели при выполнении этой задачи. Индивидуальные бенчмарки дают два ключевых преимущества: во-первых, они позволяют компаниям оценивать каждое обновление модели по своим бизнес-задачам и выбирать ту модель, которая лучше всего работает в их реальном сценарии использования, а не ту, что занимает наивысшее место в общем рейтинге; во-вторых, они позволяют компаниям делиться этими наборами тестов с поставщиками моделей, что способствует постоянной оптимизации в тех областях, которые важны для их бизнеса.

Килпатрик отметил, что такие компании, как Zapier и Sierra, уже внедряют этот подход, заявив, что «здесь можно создать много „альфы“».

Отказ от ответственности: Информация на этой странице может поступать от третьих лиц и не отражает взгляды или мнения Gate. Содержание, представленное на этой странице, предназначено исключительно для справки и не является финансовой, инвестиционной или юридической консультацией. Gate не гарантирует точность или полноту информации и не несет ответственности за любые убытки, возникшие от использования этой информации. Инвестиции в виртуальные активы несут высокие риски и подвержены значительной ценовой волатильности. Вы можете потерять весь инвестированный капитал. Пожалуйста, полностью понимайте соответствующие риски и принимайте разумные решения, исходя из собственного финансового положения и толерантности к риску. Для получения подробностей, пожалуйста, обратитесь к Отказу от ответственности.

Связанные статьи

Palantir сообщает о росте выручки за 1-й квартал на 85% до 1,633 млрд долларов, показатель Rule of 40 достигает 145%

Согласно отчёту о прибылях и убытках Palantir за 1 квартал 2026 года, выручка компании по итогам первого квартала, занимающейся аналитикой данных и ПО для ИИ, достигла $1,633 миллиарда, что на 85% больше в годовом исчислении, установив самый высокий темп роста за всю историю. Показатель компании Rule of 40 — метрика, измеряющая совокупный рост и прибыльность — взлетел до

GateNews8м назад

Meta ищет финансирование на 13 миллиардов долларов для дата-центра по данным ИИ в Техасе под руководством Morgan Stanley и JPMorgan

По сообщениям Beating, Meta ищет примерно 13 миллиардов долларов финансирования для центра обработки данных по искусственному интеллекту в Техасе; Morgan Stanley и JPMorgan возглавляют работу. Структура финансирования будет состоять в основном из долга, а остальное — из капитала, сообщают люди, знакомые с этим.

GateNews24м назад

Lattice Semiconductor приобретает AMI за 1,65 миллиарда долларов 4 мая, расширяясь в сегмент программного обеспечения для инфраструктуры ИИ

Как сообщает Reuters, Lattice Semiconductor объявила 4 мая о намерении приобрести AMI — компанию по разработке программного обеспечения для прошивки и инфраструктуры, — за $1,65 миллиарда, чтобы расшириться в более глубокое управление ИИ-системами и облачной инфраструктурой. AMI специализируется на BIOS-прошивке и программном обеспечении Baseboard Management Controller (BMC)

GateNews36м назад

Лаборатория в Гонконге запускает ИИ-модель HKGAI-V3 на китайских чипах в первой половине 2026 года

Согласно South China Morning Post, Гонконгский центр исследований и разработки генеративного ИИ планирует запустить свою модель HKGAI-V3 в первой половине 2026 года, при этом система будет оптимизирована для работы на чипах китайского производства, включая Ascend 910C от Huawei. Модель основана на архитектуре DeepSeek V4 с

GateNews46м назад

AlphaDrive запускает $100M израильский фонд для ИИ и кибербезопасности

Йорон Элад и Элик Эциони, бывшие руководители израильской Elron Ventures, запустили AlphaDrive — фонд на 100 миллионов долларов, ориентированный на кибербезопасность и искусственный интеллект, сообщает Calcalist. Структура фонда и инвестиционный подход AlphaDrive нацеливается на стартапы, основанные израильтянами

CryptoFrontier1ч назад

Глава продаж OpenAI Джеймс Дьетт присоединяется к Thrive Capital в качестве оператора по месту жительства

По данным Beating, старший руководитель по продажам OpenAI Джеймс Дьетт недавно объявил о своём уходе, чтобы присоединиться к Thrive Capital в качестве Operator in Residence. Дьетт, который пришёл в OpenAI во время бума ChatGPT в 2023 году, назвал предпочтение к ранней стадии этапа построения компании в качестве причины своего ухода. Он отметил t

GateNews1ч назад
комментарий
0/400
Нет комментариев