Anthropic identifica tres cambios a nivel de producto detrás de la caída de la calidad de Claude Code, no un problema del modelo

Mensaje de Gate News, 23 de abril — El equipo de ingeniería de Anthropic confirmó que la degradación de la calidad de Claude Code reportada por los usuarios durante el mes pasado se debió a tres cambios independientes a nivel de producto, no a problemas de la API ni del modelo subyacente. Los tres problemas se solucionaron el 7 de abril, el 10 de abril y el 20 de abril, respectivamente, con la versión final ahora en v2.1.116.

El primer cambio ocurrió el 4 de marzo, cuando el equipo redujo el nivel de esfuerzo de razonamiento predeterminado para Claude Code de “high” a “medium” para abordar picos ocasionales de latencia extrema en Opus 4.6 bajo alta intensidad de razonamiento. Después de quejas generalizadas de los usuarios sobre el rendimiento reducido, el equipo revirtió el cambio el 7 de abril. El valor predeterminado actual es ahora “xhigh” para Opus 4.7 y “high” para otros modelos.

El segundo problema fue un bug introducido el 26 de marzo. El sistema estaba diseñado para borrar registros antiguos de razonamiento después de que la inactividad de la conversación superara una hora para reducir los costos de recuperación de sesión. Sin embargo, una falla en la implementación hizo que el borrado se ejecutara repetidamente en cada turno posterior en lugar de una sola vez, lo que provocó que el modelo perdiera progresivamente el contexto de razonamiento previo. Esto se manifestó como un aumento de la falta de memoria, operaciones repetidas e invocaciones anómalas de herramientas. El bug también provocó fallos de caché en cada solicitud, acelerando el consumo de la cuota de los usuarios. Dos experimentos internos no relacionados enmascararon las condiciones de reproducción, extendiendo el proceso de depuración a más de una semana. Después de la corrección el 10 de abril, el equipo revisó el código problemático usando Opus 4.7 y descubrió que Opus 4.7 podía identificar el bug, mientras que Opus 4.6 no.

El tercer cambio se lanzó el 16 de abril junto con Opus 4.7. El equipo agregó instrucciones al mensaje del sistema para reducir la salida redundante. Las pruebas internas durante varias semanas no mostraron regresión, pero después del lanzamiento la interacción con otros prompts degradó la calidad de la codificación. La evaluación extendida reveló una caída del 3% en el rendimiento tanto en Opus 4.6 como en 4.7, lo que llevó a un rollback el 20 de abril.

Estos tres cambios afectaron a diferentes grupos de usuarios en distintos momentos, y su efecto combinado creó una caída generalizada e inconsistente de la calidad, complicando el diagnóstico. Anthropic afirmó que ahora requerirá a más empleados internos que usen la misma versión pública de compilación que los usuarios, que ejecuten suites completas de evaluación del modelo para cada modificación del prompt del sistema y que implementen periodos de despliegue por etapas. Como compensación, Anthropic ha restablecido las cuotas de uso para todos los usuarios con suscripción.

Aviso legal: La información de esta página puede proceder de terceros y no representa los puntos de vista ni las opiniones de Gate. El contenido que aparece en esta página es solo para fines informativos y no constituye ningún tipo de asesoramiento financiero, de inversión o legal. Gate no garantiza la exactitud ni la integridad de la información y no se hace responsable de ninguna pérdida derivada del uso de esta información. Las inversiones en activos virtuales conllevan riesgos elevados y están sujetas a una volatilidad significativa de los precios. Podrías perder todo el capital invertido. Asegúrate de entender completamente los riesgos asociados y toma decisiones prudentes de acuerdo con tu situación financiera y tu tolerancia al riesgo. Para obtener más información, consulta el Aviso legal.

Artículos relacionados

Seagate因强劲的AI数据中心需求超预期Q4指引,股价上涨10%

Gate News消息,4月28日——Seagate Technology,这家美国数据存储硬件制造商在4月28日上调了其财年第四季度的营收和利润指引,指引高于预期,原因是AI工作负载需求强劲。公司预计第四季度营收为$3.45 billion (加或减$100 million)且

GateNewsHace27m

OpenAI pronostica que millones de usuarios de ChatGPT Plus se cambiarán a un plan más barato con anuncios

Mensaje de Gate News, 28 de abril — OpenAI espera que su opción de suscripción más barata, con anuncios, no solo atraiga a nuevos usuarios, sino que también lleve a decenas de millones de suscriptores de pago existentes a degradar su plan. La empresa prevé que los usuarios de suscripciones para consumidores más que se dupliquen este año hasta 122 millones y

GateNewsHace28m

Apple agrega herramientas de fotos con IA a iOS 27, iPad, Mac este otoño

Apple planea introducir cuatro nuevas herramientas de edición de fotos con IA—Extend, Enhance, Reframe y Clean Up—en el software de iPhone, iPad y Mac que se lanzará este otoño, según Bloomberg. La medida busca cerrar una brecha competitiva con rivales de Android como Google y Samsung en la edición de fotos impulsada por IA

CryptoFrontierHace38m

NVIDIA Lanza Nemotron 3 Nano Omni, Modelo Multimodal de Código Abierto para Agentes de IA Empresariales

Mensaje de Gate News, 28 de abril — NVIDIA anunció el lanzamiento de Nemotron 3 Nano Omni, un modelo de inferencia multimodal de código abierto diseñado para proporcionar una base unificada para agentes de IA aptos para empresas. El modelo combina capacidades de visión, audio y lenguaje para permitir que los sistemas de IA logren hasta mejoras de eficiencia de 9x e

GateNewsHace48m

2026 SusHi Tech Tokyo se inaugura; el Pabellón de Taiwán lidera con 27 nuevas empresas emergentes que profundizan la cooperación entre Taiwán y Japón

La agencia de desarrollo nacional liderará la participación de 27 nuevas empresas en SusHi Tech Tokyo 2026, creando el pabellón de Taiwán como la mayor exposición nacional, mostrando la fortaleza en tecnología de IA y sostenibilidad, y promoviendo la estrategia de la Alianza de Startups de Asia con la marca Startup Island TAIWAN. Durante el período de la feria se firmará un memorando con el lado japonés para profundizar la cooperación en la cadena de suministro; además, se llevará a cabo Asia MirAI Day, fomentando la red de startups de Asia-Pacífico. Se espera atraer a más de 60.000 participantes, 700 nuevas empresas y más de 10.000 reuniones de negocios.

ChainNewsAbmediahace1h

OpenAI No Alcanzó Objetivos de Crecimiento; Las Acciones Tecnológicas Caen en Picado

Seis grandes acciones tecnológicas cayeron con fuerza después de informes de que OpenAI no ha alcanzado sus propios objetivos de crecimiento y ventas, lo que indica que los operadores están reevaluando la capacidad de la empresa para financiar compromisos masivos de infraestructura informática. Las caídas del martes afectaron a Coreweave (CRWV), SoftBank Group (9984.T),

CryptoFrontierhace2h
Comentar
0/400
Sin comentarios