BlockBeats noticias, 21 de enero, según reporta Quantumbit, en el primer aniversario del lanzamiento de DeepSeek-R1 se ha revelado un nuevo modelo llamado «MODEL1». DeepSeek actualizó el código FlashMLA en GitHub, en 114 archivos se mencionan 28 veces MODEL1, apareciendo junto a V32 como modelos diferentes. Se sabe que V32 es DeepSeek-V3.2, y lo más probable es que MODEL1 sea una nueva arquitectura. Las diferencias específicas en el código se reflejan en la disposición de la caché KV, el manejo de la esparcidad y la decodificación FP8, con varias optimizaciones en la memoria.
Aviso legal: La información de esta página puede proceder de terceros y no representa los puntos de vista ni las opiniones de Gate. El contenido que aparece en esta página es solo para fines informativos y no constituye ningún tipo de asesoramiento financiero, de inversión o legal. Gate no garantiza la exactitud ni la integridad de la información y no se hace responsable de ninguna pérdida derivada del uso de esta información. Las inversiones en activos virtuales conllevan riesgos elevados y están sujetas a una volatilidad significativa de los precios. Podrías perder todo el capital invertido. Asegúrate de entender completamente los riesgos asociados y toma decisiones prudentes de acuerdo con tu situación financiera y tu tolerancia al riesgo. Para obtener más información, consulta el
Aviso legal.