A Tencent Hunyuan e a SSV Digital Culture Lab, em colaboração com o Institute of Computing Technology da Chinese Academy of Sciences, lançaram Chronicles-OCR a 18 de maio, o primeiro benchmark de avaliação que cobre sete estilos de letras antigas, desde o script de ossos de oráculo até ao script cursivo. O benchmark inclui 2.800 imagens anotadas por especialistas.
Os testes a 28 modelos mainstream de grandes linguagens multimodais mostraram um desempenho fraco em caracteres antigos. O GPT-5 e o Gemini 2.5 Pro obtiveram pontuações quase nulas na deteção de caracteres entre épocas, enquanto o modelo com melhor desempenho atingiu apenas 16,5. Mesmo com caixas delimitadoras fornecidas para evitar a localização, a maior exatidão foi de 27,1%, com o Gemini 3.1 Pro a atingir apenas 14,0% no script de ossos de oráculo.
Notícias relacionadas
Samsung e a Intel atacam em conjunto, a TSMC põe em marcha o maior plano de expansão de sempre, com 18 fábricas! As acções de materiais para instalações industriais deverão beneficiar
Charms.ai conclui um financiamento de 1,5 milhões para lançar a economia de personagens de IA, enquanto a Pensilvânia acusa a Character.ai de praticar medicina
Avanço da IA na ponta: a TetraMem anuncia os resultados do MLX200, uma plataforma construída com chips de 22 nm da TSMC