Anthropic Claude supera el nuevo punto de referencia de resistencia a la propaganda para LLMs

Según el Instituto de la Lengua Estonia, una organización patrocinada por el gobierno publicó recientemente un nuevo ranking en el benchmark de «Resistencia a la propaganda», que evalúa docenas de modelos de lenguaje grandes en su capacidad para evitar tomar posiciones sobre narrativas estratégicas rusas. Los modelos Claude de Anthropic obtuvieron el mejor desempeño entre los modelos de frontera: Claude Opus 4.7 logró una puntuación de 94,9 sobre 100 y recibió una calificación de «Ejemplar» en el 77 por ciento de las preguntas de prueba. El benchmark evaluó las respuestas de los LLM en 14 categorías de operaciones de influencia rusas, con temas que van desde el estatus de Crimea hasta la historia de la OTAN.
Aviso legal: La información en esta página puede provenir de fuentes de terceros y es solo para referencia. No representa las opiniones ni puntos de vista de Gate y no constituye asesoramiento financiero, de inversión ni legal. El comercio de activos virtuales implica un alto riesgo. No te bases únicamente en la información presentada en esta página para tomar decisiones. Para más detalles, consulta el Aviso legal.
Comentar
0/400
Sin comentarios