Інженер OpenAI Клайв Чан Оскаржує Рекомендації щодо Апаратного Забезпечення V4, Посилаючись на Помилки та Невизначеність Порівняно з V3

Повідомлення Gate News, 24 квітня — інженер OpenAI Клайв Чан висунув детальні заперечення до розділу з рекомендаціями щодо апаратного забезпечення у технічному звіті V4, назвавши його “дивовижно посереднім і таким, що схильний до помилок” порівняно з відомою версією V3. Апаратні рекомендації V3, які включали сесії Q&A, що стали найпопулярнішою темою для обговорення на академічній конференції ISCA, пропонували конкретні рекомендації, узгоджені з галузевими стандартами інтерконекту. Натомість V4 є значно більш невизначеним.

Чан системно оскаржив три ключові рекомендації. Щодо споживання електроенергії, у звіті стверджується, що оптимізація програмного забезпечення дозволяє чипам одночасно працювати на повну потужність для обчислень, зберігання та зв’язку, і рекомендується виробникам чипів залишати додатковий запас потужності. Чан вважає це контрпродуктивним: загальна потужність чипа обмежена фізичними обмеженнями процесу, тож резервування більшого запасу потужності лише знижує робочу частоту, зрештою зменшуючи обчислювальну продуктивність. Щодо передавання даних між GPU, у звіті пропонується модель pull — коли GPU активно отримують дані — замість моделі push, посилаючись на високу накладну вартість сповіщень у операціях push. Чан заперечує це, стверджуючи, що pull насправді повільніший і що були б кращими покращені можливості мережевих адаптерів. Однак вони можуть обговорювати різні рівні проблеми: звіт говорить про накладні витрати механізму сповіщень, тоді як Чан має на увазі саму затримку передавання.

Щодо функцій активації, у звіті рекомендується замінити SwiGLU на простіші функції, щоб зменшити обчислювальне навантаження. Чан не бачить у цьому жодної користі, зазначаючи, що Sonic MoE вже продемонстрував оптимальну продуктивність із використанням SwiGLU. Чан припускає, що DeepSeek може мати “навмисно ослабив цей розділ.”

Застереження: Інформація на цій сторінці може походити від третіх осіб і не відображає погляди або думки Gate. Вміст, що відображається на цій сторінці, є лише довідковим і не є фінансовою, інвестиційною або юридичною порадою. Gate не гарантує точність або повноту інформації і не несе відповідальності за будь-які збитки, що виникли в результаті використання цієї інформації. Інвестиції у віртуальні активи пов'язані з високим ризиком і піддаються значній ціновій волатильності. Ви можете втратити весь вкладений капітал. Будь ласка, повністю усвідомлюйте відповідні ризики та приймайте обережні рішення, виходячи з вашого фінансового становища та толерантності до ризику. Для отримання детальної інформації, будь ласка, зверніться до Застереження.

Пов'язані статті

AI-фінансова платформа Rogo залучила $160M у Серії D під керівництвом Kleiner Perkins менш ніж за 3 місяці

За даними Beating, AI-платформа Rogo, розроблена для високочастотних фінансових сценаріїв, у квітні 2026 року завершила раунд фінансування Серії D на $160 мільйонів, який очолила Kleiner Perkins за участі Sequoia, Thrive Capital, Khosla Ventures та J.P. Morgan. Залучення коштів відбулося менш ніж через три місяці

GateNews31хв. тому

29 квітня Китай блокує придбання Manus AI, яке підтримує Meta, посилаючись на занепокоєння щодо технологічної та даних безпеки

Згідно з PANews, 29 квітня Управління з огляду інвестиційної безпеки Комісії з національного розвитку та реформ Китаю заборонило іноземне придбання проєкту Manus і вимагало припинити угоду. Manus, якому приписували статус першого в світі агента загального штучного інтелекту, заявив про плани бути придбаним американським технічним гігантом Meta. Угоду заблокували через занепокоєння, пов’язані з міжнародним середовищем, критичними технологіями та безпекою даних. Рішення свідчить, що Китай, як і раніше, відкритий до іноземних інвестицій, але зберігає обережність щодо придбань, що стосуються чутливих секторів, підкреслюючи дотримання регуляторних стандартів.

GateNews54хв. тому

Alibaba Cloud знизила ціну неявного кешу DeepSeek-V4-Pro до 1 юаня за мільйон токенів 29 квітня

Згідно з Alibaba Cloud, її платформа Bailian знизить ціну для неявного кешу (Implicit Cache) моделі DeepSeek-V4-Pro до 1 юаня за мільйон токенів з 29 квітня 2026 року о 23:59:59 за пекинським часом. Неявний кеш застосовується лише тоді, коли запити потрапляють у кеш; кешовані вхідні токени виставляються за тарифом cached_token, тоді як некешовані вхідні токени стягуються за стандартними тарифами input_token. Коригування стосується лише ціни неявного кешу; тарифи базового рендерингу моделі залишаються без змін.

GateNews1год тому

AI-платформа Certifyde залучає $2M у seed-фінансуванні за участі CEO Ripple Бреда Гарлінгхауса

За даними ChainCatcher, платформа для AI-застосунків Certifyde оголосила про завершення раунду $2 мільйонів seed-фінансування. Інвесторами є K5 Global, Flamingo Capital, а також бізнес-ангели, зокрема CEO Ripple Бред Гарлінгхаус, співзасновник Honey Джордж Жуан і співзасновник Nutra Роланд

GateNews3год тому

DeepSeek запускає функцію розпізнавання зображень у режимі бета-тестування

Згідно з PANews, DeepSeek сьогодні запустила свою функцію розпізнавання зображень (29 квітня), наразі вона перебуває на бета-тестуванні. Як користувачі вебверсії, так і мобільного застосунку можуть бути відібрані для бета-розгортання.

GateNews4год тому

Anthropic запускає 8 конекторів творчих інструментів для Claude, зокрема Blender, Adobe, Autodesk

Anthropic оголосила набір конекторів творчих інструментів, які дають змогу Claude безпосередньо керувати професійним програмним забезпеченням, що використовується дизайнерами та музикантами. Початкові вісім конекторів охоплюють 3D-моделювання, візуальний дизайн, музичне продакшн-створення та живі виступи, а серед партнерів — Blender, Adobe,

GateNews4год тому
Прокоментувати
0/400
Немає коментарів