Xiaomi Revela Detalles del Entrenamiento de MiMo-V2-Pro: Parámetros de Modelo 1T, Miles de GPUs Desplegadas

Mensaje de Gate News, 24 de abril — la jefa del equipo de modelos de lenguaje de Xiaomi, Luo Fuli, reveló en una entrevista en profundidad que el modelo MiMo-V2-Pro cuenta con un total de 1 billón de parámetros y que requirió miles de GPUs para el entrenamiento. Señaló que la escala de 1T representa el umbral mínimo para lograr un rendimiento cercano al nivel de Claude Opus 4.6 y asegurar un pase de entrada competitivo para la siguiente fase de agentes de IA.

Técnicamente, la versión Pro emplea un mecanismo extremo de atención dispersa con una proporción 7:1 entre la atención global y la atención de ventana deslizante, controlando los costos de inferencia para el procesamiento de contextos largos. El modelo también conserva la arquitectura MTP (Multi-Token Prediction) para aprovechar el exceso de potencia de cómputo y lograr una inferencia más rápida.

En el aspecto de gestión, el equipo MiMo de 100 personas solo cuenta con 30-40 integrantes involucrados directamente en las iteraciones principales. El equipo opera sin jerarquías formales ni divisiones explícitas de subgrupos, y sin fechas límite de entrega. Cuando se encuentran problemas numéricos inestables como picos en la pérdida de entrenamiento, el equipo prioriza detener el entrenamiento para investigarlo, incluso si eso significa detener las operaciones durante una o dos semanas y asumir costos de cómputo de millones de dólares.

Aviso legal: La información de esta página puede proceder de terceros y no representa los puntos de vista ni las opiniones de Gate. El contenido que aparece en esta página es solo para fines informativos y no constituye ningún tipo de asesoramiento financiero, de inversión o legal. Gate no garantiza la exactitud ni la integridad de la información y no se hace responsable de ninguna pérdida derivada del uso de esta información. Las inversiones en activos virtuales conllevan riesgos elevados y están sujetas a una volatilidad significativa de los precios. Podrías perder todo el capital invertido. Asegúrate de entender completamente los riesgos asociados y toma decisiones prudentes de acuerdo con tu situación financiera y tu tolerancia al riesgo. Para obtener más información, consulta el Aviso legal.

Artículos relacionados

Founders Fund cierra un fondo insignia de 6 mil millones de dólares, el más grande desde su creación, el 3 de mayo

Según Bloomberg, Founders Fund completó la recaudación de fondos para su último fondo insignia en 6 mil millones de dólares el 3 de mayo, superando significativamente su fondo anterior de aproximadamente 3,4 mil millones de dólares. El fondo, cofundado por el multimillonario Peter Thiel, se centrará en sectores de alto crecimiento, incluyendo inteligencia

GateNewsHace4m

Última encuesta POLITICO: 45% de los estadounidenses dicen que invertir en cripto es demasiado arriesgado, y 44% se preocupa de que la IA avance demasiado rápido

Según una encuesta de POLITICO, a pesar de que las industrias de la IA y las criptomonedas inyectaron una financiación política significativa en las elecciones legislativas de mitad de mandato de EE. UU. de 2026, el público estadounidense sigue en gran medida escéptico de ambos sectores. La encuesta encontró que el 45% de los estadounidenses cree que invertir en criptomonedas no vale la pena

GateNewsHace59m

OpenAI defiende una IPO para 2027, mientras Altman apoya el lanzamiento en Q4 2026

La directora financiera de OpenAI, Sarah Fryer, mantiene una postura prudente sobre el calendario de un IPO en 2026, y señala que los contratos de capacidad de cómputo y de centros de datos, que suman cerca de 1 billón de dólares, son muy superiores a los ingresos anuales actuales de 25.000 millones de dólares. Advirtió que, si el crecimiento no puede cubrir los compromisos, el mercado descontará el riesgo. Esto muestra la diferencia con el CEO, Sam Altman, quien ha defendido públicamente salir a bolsa en el Q4 de 2026. Fryer se inclina por posponerlo hasta 2027 para establecer disciplina financiera; la empresa ha emitido varias declaraciones para negar una supuesta división interna.

ChainNewsAbmediahace2h

El trabajador gana un caso histórico de sustitución de IA en China

Los expertos afirmaron que la decisión, que sienta un precedente para futuros casos de sustitución de IA, establece que la sustitución mediante IA no puede esgrimirse como justificación para abandonar un contrato laboral. China es el segundo centro de IA más grande del mundo. Puntos clave: El Tribunal de Hangzhou determinó que reemplazar a Zhou w

Coinpediahace3h

La Legislatura de Minnesota Prohíbe Herramientas de Desnudos Falsos con IA, Sanciones de Hasta $500K Por Infracción

Según Decrypt, el 2 de mayo la legislatura de Minnesota aprobó un proyecto de ley que prohíbe a los sitios web y a las aplicaciones ofrecer herramientas de IA que generen imágenes falsas realistas y desnudos de personas identificables. La medida, enviada al gobernador Tim Walz para su firma, impide que las plataformas permitan a los usuarios acceder

GateNewshace3h

OpenAI permite que las suscripciones de ChatGPT funcionen en la plataforma de agentes OpenClaw

Según el CEO de OpenAI, Sam Altman, el 2 de mayo, los usuarios de ChatGPT ahora pueden iniciar sesión en la plataforma de agentes OpenClaw con sus cuentas de ChatGPT y usar directamente sus suscripciones existentes de ChatGPT en la plataforma.

GateNewshace4h
Comentar
0/400
Sin comentarios