Mercury 2 de Inception Labs alcanza el 90% en AIME 2026 y supera a DiffusionGemma de Google

El jueves (18 de junio), Inception Labs presentó Mercury 2, afirmándolo como el modelo de lenguaje de razonamiento más rápido del mundo, generando aproximadamente 1.000 tokens por segundo. Según el anuncio de la empresa, Mercury 2 obtuvo un 90% en AIME 2026 (problemas del American Invitational Mathematics Examination), frente al 69,1% de Google's DiffusionGemma en el mismo benchmark. El modelo también logró un 77% en GPQA, un benchmark científico de nivel de doctorado. Augment Code, una empresa de agentes de codificación con IA, informó una reducción del 82% en la latencia y una reducción de costos del 90% después de cambiar Mercury 2 por Anthropic's Claude Opus 4.7, manteniendo la calidad de salida.
Aviso legal: La información en esta página puede provenir de fuentes de terceros y es solo para referencia. No representa las opiniones ni puntos de vista de Gate y no constituye asesoramiento financiero, de inversión ni legal. El comercio de activos virtuales implica un alto riesgo. No te bases únicamente en la información presentada en esta página para tomar decisiones. Para más detalles, consulta el Aviso legal.
Comentar
0/400
Sin comentarios