Mercury 2 Inception Labs mencapai 90% pada AIME 2026, mengungguli DiffusionGemma milik Google

Pada Kamis (18 Juni), Inception Labs meluncurkan Mercury 2, mengklaimnya sebagai model bahasa penalaran tercepat di dunia, yang menghasilkan sekitar 1.000 token per detik. Menurut pengumuman perusahaan, Mercury 2 meraih skor 90% pada AIME 2026 (American Invitational Mathematics Examination), dibandingkan DiffusionGemma milik Google yang memperoleh 69,1% pada tolok ukur yang sama. Model ini juga mencapai 77% pada GPQA, sebuah tolok ukur sains level doktor. Augment Code, perusahaan agen pengkodean AI, melaporkan penurunan latensi sebesar 82% dan pemotongan biaya 90% setelah mengganti Mercury 2 dengan Anthropic Claude Opus 4.7, sambil tetap menjaga kualitas output.
Penafian: Informasi di halaman ini mungkin berasal dari sumber pihak ketiga dan hanya untuk referensi. Ini tidak mewakili pandangan atau pendapat Gate dan bukan merupakan nasihat keuangan, investasi, atau hukum. Perdagangan aset virtual melibatkan risiko tinggi. Mohon jangan hanya mengandalkan informasi di halaman ini saat membuat keputusan. Untuk detailnya, lihat Penafian.
Komentar
0/400
Tidak ada komentar