Mensaje de Gate News, 24 de abril — V4 ha divulgado públicamente datos internos de dogfooding de su modelo V4-Pro. La empresa recopiló aproximadamente 200 tareas de ingeniería del mundo real de más de 50 ingenieros, que abarcan el desarrollo de funciones, correcciones de errores, refactorización y diagnósticos en pilas tecnológicas que incluyen PyTorch, CUDA, Rust y C++. Tras un riguroso filtrado, se conservaron 30 tareas para la evaluación del benchmark.
V4-Pro-Max logró una tasa de aprobación de codificación del 67%, superando significativamente a Sonnet 4.5 con un 47% y acercándose a Opus 4.5 con un 70%. Sin embargo, queda por detrás de Opus 4.5 Thinking (73%) y Opus 4.6 Thinking (80%), mientras que supera sustancialmente a Haiku 4.5 con un 13%.
En una encuesta interna con 85 encuestados, todos los participantes informaron usar V4-Pro para codificación orientada a agentes en flujos de trabajo diarios. El 52% respaldó V4-Pro como su modelo principal predeterminado de codificación, el 39% se inclinó por la aprobación y menos del 9% expresó desaprobación. Los problemas informados incluyeron errores de bajo nivel, la mala interpretación de indicaciones ambiguas y un comportamiento ocasional de sobrepensamiento.
Aviso legal: La información de esta página puede proceder de terceros y no representa los puntos de vista ni las opiniones de Gate. El contenido que aparece en esta página es solo para fines informativos y no constituye ningún tipo de asesoramiento financiero, de inversión o legal. Gate no garantiza la exactitud ni la integridad de la información y no se hace responsable de ninguna pérdida derivada del uso de esta información. Las inversiones en activos virtuales conllevan riesgos elevados y están sujetas a una volatilidad significativa de los precios. Podrías perder todo el capital invertido. Asegúrate de entender completamente los riesgos asociados y toma decisiones prudentes de acuerdo con tu situación financiera y tu tolerancia al riesgo. Para obtener más información, consulta el
Aviso legal.
Artículos relacionados
Tencent utilizó el código de Anthropic, Claude Code, en el último entrenamiento del modelo Hy3, informa The Information
Según The Information, citando memorandos internos de Tencent y fuentes, los empleados de Tencent usaron el Code de Anthropic, durante la fase de post-entrenamiento de Hy3, el modelo de lenguaje grande más reciente de la empresa, a pesar de la prohibición explícita de Anthropic sobre servicios comerciales a empresas chinas, citando nacional
GateNewsHace18m
Samsung Electro-Mechanics sube por la demanda de IA, KB Securities eleva el precio objetivo el 4 de mayo
Según KB Securities, el 4 de mayo, Samsung Electro-Mechanics mantuvo una calificación de compra y elevó su precio objetivo, citando una fuerte demanda de capacitores cerámicos multicapa y sustratos FC-BGA utilizados en servidores de IA. La empresa informó ingresos en el primer trimestre de 3,2 billones de won ($2,18 mil millones) y
GateNewsHace38m
Meta AI Impulsa la participación en Facebook e Instagram en el 1T del año fiscal 26; el tiempo dedicado a Reels sube 10%
De acuerdo con The Economic Times, los resultados del primer trimestre del año fiscal 2026 de Meta mostraron que las mejoras de IA impulsaron la participación en video en Facebook e Instagram. El tiempo de uso en Instagram Reels aumentó un 10%, mientras que el tiempo de visualización de videos de Facebook creció más de un 8% a nivel global. El precio promedio por anuncio subió un 12% interanual, y más de 8
GateNewsHace38m
Investigación más reciente de Harvard Medicine: la IA en las salas de urgencias toma mejores decisiones de diagnóstico que los médicos humanos
Un estudio publicado por la Escuela de Medicina de Harvard en 《Science》, que mediante pruebas doble ciego y evaluación de razonamiento clínico compara de forma objetiva las diferencias entre los sistemas de IA y los médicos humanos en la interpretación de historias clínicas. Los resultados muestran que la IA, en los puntos de decisión del inicio de la sala de urgencias, puede estar a la par o ser superior a los médicos tratantes, y solo con la información de historia clínica electrónica disponible en ese momento. El estudio también subraya que la IA aún no puede ejercer la medicina de forma autónoma, por lo que los médicos siguen siendo indispensables; si se aplica de manera generalizada, la IA puede reducir los errores de diagnóstico y los costos de atención médica.
ChainNewsAbmediaHace54m
Los 10 principales conglomerados de Corea del Sur ganan 65% hasta 2,6 billones de dólares mientras se disparan las acciones de chips de IA
Según The Korea Herald, los 10 principales conglomerados de Corea del Sur vieron aumentar su valor de mercado combinado un 65% hasta 3.832,7 billones de wones (US$2,6 billones), impulsado por una subida de las acciones de chips relacionadas con la IA. SK Group registró la mayor ganancia, con un aumento del 89,6% hasta 1.139,8 billones de wones (US$775 mil millones), liderado por un
GateNewsHace57m
Las inversiones en IA impulsaron el 75% del crecimiento del PIB de EE.UU. en el primer trimestre, afirma un asesor de la Casa Blanca
Según David Sacks, asesor de inteligencia artificial y criptomonedas de la Casa Blanca, al comentar datos de Morgan Stanley publicados a principios de mayo, las inversiones relacionadas con IA contribuyeron aproximadamente el 75% del crecimiento del PIB de EE. UU. en el primer trimestre de 2026. Sacks señaló que la inversión en IA impulsará alrededor del 2,5% del crecimiento del PIB este año y
GateNewshace1h