esqueça AGI—Os Principais Modelos de IA Ainda Têm Dificuldades com Matemática
Em breve
MATHVISTA, construído com mais de 6.000 pontos de dados anotados pela Sahara AI, testa modelos de IA no raciocínio matemático multimodal. GPT-4V obteve 49,9%, o resultado mais elevado entre 12 modelos testados, mas ainda 10,4 pontos percentuais abaixo do desempenho humano. Os investigadores dizem que o progresso em direção à AGI continua.
Decrypt·03-18 12:10
