Gate News-сообщение, 24 апреля — инженер OpenAI Клайв Чан высказал подробные возражения против главы с рекомендациями по оборудованию в техническом отчёте V4, назвав её «удивительно посредственной и склонной к ошибкам» по сравнению с получившей признание версией V3. Аппаратные рекомендации V3, которые включали сессии Q&A, ставшие самой популярной темой для обсуждений на академической конференции ISCA, предоставили конкретные рекомендации, согласованные с отраслевыми стандартами межсоединений. Напротив, V4 гораздо более расплывчата.
Чан систематически оспорил три ключевые рекомендации. По энергопотреблению отчёт предполагает, что оптимизация программного обеспечения позволяет чипам одновременно работать на полной мощности для вычислений, хранения и связи, и рекомендует производителям чипов закладывать дополнительный запас по мощности. Чан утверждает, что это контрпродуктивно: общая мощность чипа ограничена физическими ограничениями технологического процесса, поэтому резервирование большего запаса по мощности лишь снижает рабочую частоту, в конечном итоге уменьшая вычислительную производительность. Что касается передачи данных GPU-to-GPU, отчёт предлагает модель pull — когда GPU активно запрашивают данные — вместо модели push, ссылаясь на высокие издержки на уведомления при операциях push. Чан с этим не согласен: он утверждает, что pull на самом деле медленнее и что предпочтительнее улучшенные возможности сетевых адаптеров. Однако возможно, что они обсуждают разные уровни проблемы: отчёт говорит об издержках механизма уведомлений, тогда как Чан имеет в виду саму задержку передачи.
По функциям активации отчёт рекомендует заменить SwiGLU более простыми функциями, чтобы снизить вычислительную нагрузку. Чан не видит в этом смысла, отмечая, что Sonic MoE уже продемонстрировал оптимальную производительность, используя SwiGLU. Чан предполагает, что DeepSeek, возможно, «намеренно ослабил этот раздел».
Отказ от ответственности: Информация на этой странице может поступать от третьих лиц и не отражает взгляды или мнения Gate. Содержание, представленное на этой странице, предназначено исключительно для справки и не является финансовой, инвестиционной или юридической консультацией. Gate не гарантирует точность или полноту информации и не несет ответственности за любые убытки, возникшие от использования этой информации. Инвестиции в виртуальные активы несут высокие риски и подвержены значительной ценовой волатильности. Вы можете потерять весь инвестированный капитал. Пожалуйста, полностью понимайте соответствующие риски и принимайте разумные решения, исходя из собственного финансового положения и толерантности к риску. Для получения подробностей, пожалуйста, обратитесь к
Отказу от ответственности.
Связанные статьи
Claw Intelligence сотрудничает с Block Sec Arena, чтобы усилить безопасность BNB Chain
Согласно официальному объявлению Block Sec Arena от 30 апреля Claw Intelligence — платформы Web3, работающей на базе ИИ и построенной на BNB Chain, — объявила о стратегическом партнерстве с Block Sec Arena, чтобы интегрировать передовую инфраструктуру кибербезопасности в свою экосистему. Сотрудничество направлено на усиление p
GateNews2ч назад
NTT объявляет инициативу AI x OWN и планирует увеличить энергомощности для Японии до 1 ГВт к 2033 году
27 апреля президент NTT Акира Симада объявил инициативу AI x OWN — усилия компании по модернизации интернет-инфраструктуры для использования ИИ в реальном времени. NTT планирует утроить свою внутреннюю мощность электроснабжения с примерно 300 МВт сегодня до около 1 гигаватта к финансовому 2033 году, поскольку телеком-гигант
GateNews3ч назад
AI Platform Certifyde завершила раунд seed на 2 миллиона долларов 1 мая, при поддержке генерального директора Ripple Брэда Гарлингхауса
По данным TechfundingNews, платформа для AI-приложений Certifyde завершила раунд посевного финансирования на 2 миллиона долларов 1 мая. Среди инвесторов — K5 Global, Flamingo Capital, а также бизнес-ангелы, включая сооснователя Honey Джорджа Руана, CEO Ripple Брэд Гарлингхаус и сооснователя Nutra Роланда
GateNews4ч назад
Технологический директор Пентагона: Anthropic по-прежнему в черном списке, исключение для Mythos
Технологический руководитель Пентагона (chief) 1 мая заявил в Конгрессе: «Anthropic все еще находится в черном списке, но Mythos Preview — это уже другой вопрос», официально признав, что Пентагон относится к основному бренду Anthropic и его новой модели Mythos по-разному. Этот сигнал совпал с раскрытием Axios от 19 апреля о том, что NSA (Агентство национальной безопасности) фактически использовало Mythos для согласованных ответов, и тем самым официально закрепил политический курс в сторону «исключительного канала для Mythos» — одновременно это также означает, что Пентагон ранее в суде утверждал, что использование инструментов Anthropic будет угрожать нацбезопасности, что вступает в внутреннее противоречие в юридической аргументации с текущими фактическими действиями.
Anthropic vs Pentagon
ChainNewsAbmedia4ч назад
137 Ventures закрывает $700M в новых фондах, AUM достигает 15 млрд долларов
По данным ChainCatcher, 137 Ventures, ранний инвестор в SpaceX, недавно завершила сбор средств для двух новых фондов на общую сумму свыше $700 миллионов, доведя объем активов под управлением до более $15 миллиардов. Новые средства пойдут на инвестиции в AI-агентов, робототехнику и космическую силовую установку
GateNews5ч назад
Reddit взлетает на 16% на сильный прогноз на 2-й квартал; Apple сталкивается с дефицитом Mac из-за того, что спрос на ИИ опережает поставки
Акции Reddit выросли на 16% до открытия рынка в пятницу после того, как компания опубликовала прогноз по выручке на следующий квартал выше ожиданий. Ежедневная активная аудитория увеличилась на 17% до 126,8 миллиона, а средняя выручка на пользователя по всему миру подскочила на 44%, благодаря AI-powered
GateNews5ч назад