Sakana AI и Nvidia открыли исходный код TwELL — разреженного формата данных, который позволяет GPU H100 пропускать 80% недопустимых вычислений в больших языковых моделях без потери точности. Решение обеспечивает до 30% более быстрый инференс и 24% более быстрое обучение на H100, одновременно снижая пиковое потребление памяти. В тестах на модели с 1,5 миллиарда параметров подход сократил число активных нейронов до менее 2% за счёт лёгкой регуляризации во время обучения, при этом не наблюдалось ухудшения производительности на семи последующих задачах.
Отказ от ответственности: Информация на этой странице может поступать от третьих лиц и не отражает взгляды или мнения Gate. Содержание, представленное на этой странице, предназначено исключительно для справки и не является финансовой, инвестиционной или юридической консультацией. Gate не гарантирует точность или полноту информации и не несет ответственности за любые убытки, возникшие от использования этой информации. Инвестиции в виртуальные активы несут высокие риски и подвержены значительной ценовой волатильности. Вы можете потерять весь инвестированный капитал. Пожалуйста, полностью понимайте соответствующие риски и принимайте разумные решения, исходя из собственного финансового положения и толерантности к риску. Для получения подробностей, пожалуйста, обратитесь к
Отказу от ответственности.
Связанные статьи
Microsoft открывает исходный код модели Phi-Ground 4B, превосходит OpenAI Operator и Claude по точности кликов по экрану
Борясь с трудностями, Microsoft недавно открыла исходный код семейств модели Phi-Ground, предназначенных для решения проблемы того, где именно ИИ должен кликать по экрану компьютера. Версия на 4 миллиарда параметров в паре с более крупными языковыми моделями для планирования инструкций превзошла по точности кликов OpenAI Operator и Claude Computer Use в бенчмарке Showdown и заняла первое место среди всех моделей с менее чем 100 миллиардами параметров по пяти оценкам, включая ScreenSpot-Pro. Кома
GateNews1ч назад
Tilde Research обнаруживает, что оптимизатор Muon убивает 25% нейронов; Aurora Alternative обеспечивает прирост эффективности работы с данными в 100 раз
По данным Tilde Research, оптимизатор Muon, который используют ведущие AI-модели, включая DeepSeek V4 и Kimi K2.5, имеет скрытый недостаток: он приводит к тому, что более 25% нейронов в слоях MLP необратимо умирают в ходе раннего обучения. Команда разработала Aurora — альтернативный оптимизатор — и открыла его исходный код. Модель с 1,1 млрд параметров, обученная всего на 100 млрд токенов, показала сопоставимую производительность с Qwen3-1,7B, обученной на 36 трлн токенов, на бенчмарках понимани
GateNews1ч назад
Nvidia вкладывает более $40 млрд в ИИ-инвестиции в начале 2026 года, включая $30 млрд на OpenAI
По данным TechCrunch, Nvidia в первые месяцы 2026 года направила более 40 миллиардов долларов на долевые инвестиции в компании, работающие в сфере ИИ, при этом 30 миллиардов долларов — крупнейшее единовременное обязательство — она вложила в OpenAI. Производитель чипов также обязался инвестировать до 3,2 миллиарда долларов в Corning, производителя стекла, и до 2,1 миллиарда долларов в оператора центров обработки данных IREN, что включает пятилетний варрант и отдельный контракт на 3,4 миллиарда до
GateNews5ч назад
NVIDIA открывает долгосрочного партнёра по ИИ Deepinfra — 107 млн долларов серии B для создания «фабрики токенов»
AI компания DeepInfra объявила о завершении раунда B на 1,07 млрд долларов США, который возглавили 500 Global и ранний инженер Google Georges Harik; также в раунде приняли участие стратегические инвесторы, включая NVIDIA (Нвидиа), Samsung Next и Supermicro. Как сообщается в официальной информации, полученные средства будут направлены на расширение мощностей глобальных дата-центров, чтобы решить текущие вычислительные затраты и узкие места по эффективности, возникающие при переходе ИИ-приложений
ChainNewsAbmedia5ч назад
Член управляющего совета ЕЦБ Эсривá 9 мая предупреждает о рисках ИИ для финансовой инфраструктуры
Член Управляющего совета ЕЦБ Эскривá заявил 9 мая, что центральным банкам необходимо пересмотреть устойчивость финансовой инфраструктуры и уровень кибербезопасности с учётом развития искусственного интеллекта. По его словам на мероприятии, недавние достижения в сфере ИИ вынуждают пересмотреть способность финансовых систем противостоять возникающим рискам.
GateNews5ч назад
SpaceX переименовывает xAI в SpaceXAI, подаёт заявку на товарный знак в сфере орбитальных вычислений перед IPO на $1,75 трлн
Согласно поданным на регистрацию товарных знаков в Бюро по патентам и товарным знакам США, компания искусственного интеллекта Илона Маска xAI встраивается в SpaceX под новым брендом SpaceXAI. Переименование охватывает спутниковые центры обработки данных, орбитальные вычисления, облачные вычисления и управление ИИ-нагрузками через платформы в космосе. Маск подтвердил, что xAI прекратит существование как отдельная компания, а продукты на базе ИИ будут работать под SpaceXAI со собственным логотипом
GateNews7ч назад