El equipo de Shenzhen completa el entrenamiento del modelo DeepSeek-V4-Pro con 1,6 billones de parámetros en un chip Ascend 910C desarrollado internamente

De acuerdo con el comunicado de Shenzhen, el 5 de junio, un equipo de proyecto de la Shenzhen Hezhou Academy, en colaboración con la Harbin Institute of Technology (Shenzhen), el Shenzhen Big Data Institute, Huawei y la plataforma de cómputo de IA de Deep Intelligence City's, completó el post-entrenamiento con parámetros completos del modelo DeepSeek-V4-Pro de 1,6 billones de parámetros utilizando el clúster nacional de cómputo de IA Ascend 910C. Esto marca uno de los primeros casos en que una organización de terceros completa el entrenamiento de un modelo a esta escala en una plataforma de cómputo nacional de China, demostrando que los chips de IA nacionales pueden respaldar el entrenamiento de modelos de gran tamaño de nivel mundial.
Aviso legal: La información en esta página puede provenir de fuentes de terceros y es solo para referencia. No representa las opiniones ni puntos de vista de Gate y no constituye asesoramiento financiero, de inversión ni legal. El comercio de activos virtuales implica un alto riesgo. No te bases únicamente en la información presentada en esta página para tomar decisiones. Para más detalles, consulta el Aviso legal.
Comentar
0/400
Sin comentarios