Команда Шеньчженя завершила тренування моделі DeepSeek-V4-Pro із 1,6 трильйона параметрів на власному чипі Ascend 910C від Huawei

Згідно із релізом Shenzhen Release, 5 червня команда проєкту з Shenzhen Hezhou Academy у співпраці з Harbin Institute of Technology (Shenzhen), Shenzhen Big Data Institute, Huawei та AI обчислювальною платформою Deep Intelligence City's завершила повне параметричне посттренування моделі DeepSeek-V4-Pro на 1,6 трильйона параметрів, використавши вітчизняний AI-обчислювальний кластер Ascend 910C. Це один із перших випадків, коли стороння організація завершила тренування моделі в такому масштабі на китайській вітчизняній обчислювальній платформі, демонструючи, що вітчизняні AI-чіпи здатні підтримувати тренування великомасштабних моделей світового рівня.
Застереження: інформація на цій сторінці може походити зі сторонніх джерел і надається виключно для ознайомлення. Вона не відображає позицію чи думку Gate і не є фінансовою, інвестиційною чи юридичною консультацією. Торгівля віртуальними активами пов’язана з високим ризиком. Будь ласка, не покладайтеся лише на інформацію з цієї сторінки під час прийняття рішень. Детальніше дивіться у Застереженні.
Прокоментувати
0/400
Немає коментарів