
Microsoft (微軟) anunció durante el evento Build en junio el lanzamiento de 7 nuevos modelos de IA, que abarcan los ámbitos de inferencia, código, imágenes, transcripción y voz. En 4 pruebas de referencia de programación central, MAI-Code-1-Flash superó por completo a Claude Haiku 4.5, y en SWE-Bench Verified el uso de tokens disminuyó hasta en un 60%.
Lista de 7 modelos: cobertura integral en cinco grandes áreas
En la conferencia Build, Microsoft ya ha publicado los nombres completos de 6 modelos: MAI Thinking-1 (inferencia), MAI Code-1-Flash (código), MAI Image-2.5 (imágenes), MAI Image-2.5-Flash (versión simplificada de imágenes), MAI Transcribe-1.5 (transcripción) y un modelo de voz; el nombre completo del modelo número 7 aún no se ha divulgado por completo en los reportes existentes. Microsoft señaló que el modelo insignia de inferencia MAI-Thinking-1 es competitivo en tareas de inferencia y codificación en STEM frente a modelos de su mismo tipo, pero no proporcionó datos concretos de referencia.
MAI-Code-1-Flash vs Claude Haiku 4.5: datos de 4 pruebas de referencia
MAI-Code-1-Flash tuvo tasas de aprobación más altas que Claude Haiku 4.5 en las siguientes 4 pruebas de referencia, y además usó menos tokens:
SWE-Bench Pro: MAI-Code-1-Flash 51,2% vs Claude Haiku 4.5 35,2%, ventaja de 16
SWE-Bench Verified: disminución del uso de tokens de hasta un 60% al resolver problemas complejos
IF Bench (seguimiento de instrucciones exactas): MAI-Code-1-Flash aventaja en 28,9 puntos
Advanced IF: MAI-Code-1-Flash aventaja en 14,5 puntos
La documentación oficial de Microsoft indica que la precisión de MAI-Code-1-Flash en categorías adversariales centrales como las trampas de Einstellung aún es inferior al 50%, y se trata de un espacio de mejora ya identificado.
Alcance actual de MAI-Code-1-Flash: sin configuración adicional para usuarios individuales
MAI-Code-1-Flash ya se ha lanzado en la versión para usuarios individuales de GitHub Copilot en VS Code, y se puede usar directamente mediante el selector de modelos, o Copilot lo selecciona automáticamente y enruta el modelo. El modelo utiliza control adaptativo de longitud de respuesta: mantiene las respuestas concisas para solicitudes simples, y dedica más recursos de razonamiento a tareas complejas. Los plazos de implementación de la versión empresarial y de otros grupos de usuarios de MAI-Code-1-Flash aún no se han anunciado.
Preguntas frecuentes
¿Cuáles son los 7 nuevos modelos anunciados por Microsoft Build 2026?
Incluye 6 modelos con nombres completos ya publicados: MAI Thinking-1, MAI Code-1-Flash, MAI Image-2.5, MAI Image-2.5-Flash, MAI Transcribe-1.5 y un modelo relacionado con voz; el nombre completo del modelo número 7 aún no se ha revelado por completo en los reportes oficiales existentes.
¿Cómo logra MAI-Code-1-Flash la reducción del 60% de tokens?
Microsoft afirma que el modelo se entrena con control adaptativo de longitud de resolución, ajustando automáticamente la profundidad de la respuesta según la complejidad de la tarea. Los resultados de Microsoft en las pruebas SWE-Bench Verified muestran que al resolver problemas complejos, el uso de tokens puede reducirse hasta en un 60%.
¿A qué usuarios está abierto actualmente MAI-Code-1-Flash y cuál es el calendario de la versión empresarial?
A junio de 2026, MAI-Code-1-Flash ya está disponible para usuarios individuales de VS Code GitHub Copilot, sin necesidad de configuración adicional. Microsoft aún no ha publicado los plazos de implementación de la versión empresarial o de otros grupos de usuarios.