DGrid AI publica un documento de investigación PoQ-Judge, reduciendo los costos de evaluación de la calidad de LLM en un 72%

Según ChainCatcher, DGrid AI lanzó hoy su último documento de investigación, «PoQ-Judge», introduciendo un marco de evaluación de calidad de múltiples arquitecturas que elimina la necesidad de respuestas de referencia. El marco logró una correlación de 0,747 con las puntuaciones de evaluación humana en conjuntos de prueba retenidos, mientras que redujo los costos de evaluación en más de 72% mediante evaluación en cascada y calibración de pesos en línea. PoQ (Proof of Quality) es el mecanismo de consenso propietario de DGrid diseñado para prevenir el despliegue de modelos de baja calidad y la manipulación de datos en la capa de protocolo.
Aviso legal: La información en esta página puede provenir de fuentes de terceros y es solo para referencia. No representa las opiniones ni puntos de vista de Gate y no constituye asesoramiento financiero, de inversión ni legal. El comercio de activos virtuales implica un alto riesgo. No te bases únicamente en la información presentada en esta página para tomar decisiones. Para más detalles, consulta el Aviso legal.
Comentar
0/400
Sin comentarios