A Tencent lança Chronicles-OCR, o primeiro benchmark de reconhecimento de caracteres antigos, GPT-5 e Gemini 2.5 pontuam perto de zero

A Tencent Hunyuan e a SSV Digital Culture Lab, em colaboração com o Institute of Computing Technology da Chinese Academy of Sciences, lançaram Chronicles-OCR a 18 de maio, o primeiro benchmark de avaliação que cobre sete estilos de letras antigas, desde o script de ossos de oráculo até ao script cursivo. O benchmark inclui 2.800 imagens anotadas por especialistas.

Os testes a 28 modelos mainstream de grandes linguagens multimodais mostraram um desempenho fraco em caracteres antigos. O GPT-5 e o Gemini 2.5 Pro obtiveram pontuações quase nulas na deteção de caracteres entre épocas, enquanto o modelo com melhor desempenho atingiu apenas 16,5. Mesmo com caixas delimitadoras fornecidas para evitar a localização, a maior exatidão foi de 27,1%, com o Gemini 3.1 Pro a atingir apenas 14,0% no script de ossos de oráculo.

Aviso legal: As informações contidas nesta página podem provir de fontes externas e têm caráter meramente informativo. Não refletem os pontos de vista nem as opiniões da Gate e não constituem qualquer tipo de aconselhamento financeiro, de investimento ou jurídico. A negociação de ativos virtuais envolve um risco elevado. Não se baseie exclusivamente nas informações contidas nesta página ao tomar decisões. Para mais detalhes, consulte o Aviso legal.
Comentar
0/400
Nenhum comentário