Tencent Meluncurkan Chronicles-OCR, Tolok Ukur Pengenalan Karakter Kuno Pertama, Skor GPT-5 dan Gemini 2,5 Hampir Nol

Tencent Hunyuan dan SSV Digital Culture Lab, bekerja sama dengan Institute of Computing Technology di bawah Akademi Ilmu Pengetahuan Tiongkok, merilis Chronicles-OCR pada 18 Mei, benchmark evaluasi pertama yang mencakup tujuh gaya font kuno dari tulisan tulang orakel hingga tulisan kursif. Benchmark ini berisi 2.800 gambar yang diberi anotasi ahli.

Pengujian terhadap 28 model besar bahasa multimodal arus utama menunjukkan performa buruk pada karakter kuno. GPT-5 dan Gemini 2.5 Pro meraih skor mendekati nol pada deteksi karakter lintas era, sementara model dengan performa terbaik hanya mencapai 16,5. Bahkan ketika diberikan bounding box untuk melewati lokalisasi, akurasi tertinggi hanya 27,1%, dengan Gemini 3.1 Pro mencatat 14,0% saja pada tulisan tulang orakel.

Penafian: Informasi di halaman ini mungkin berasal dari sumber pihak ketiga dan hanya untuk referensi. Ini tidak mewakili pandangan atau pendapat Gate dan bukan merupakan nasihat keuangan, investasi, atau hukum. Perdagangan aset virtual melibatkan risiko tinggi. Mohon jangan hanya mengandalkan informasi di halaman ini saat membuat keputusan. Untuk detailnya, lihat Penafian.
Komentar
0/400
Tidak ada komentar