Berita Pintu Gerbang, 10 April, hari ini, platform evaluasi AI tepercaya global LMArena (platform penilaian model AI dengan pengujian buta yang diikuti oleh jutaan pengguna) memperbarui papan peringkat khusus Code Arena; GLM-5.1 menduduki peringkat pertama untuk model open source global, dan berada di peringkat ketiga untuk model global.
GLM-5.1 tidak hanya mewarisi kemampuan pengkodean open source SOTA dari generasi model sebelumnya, tetapi juga mencapai terobosan pada tugas jarak jauh (Long-Horizon Task), dengan mewujudkan: membangun desktop Linux dari nol dalam 8 jam; 655 iterasi mematahkan hambatan optimasi bottleneck pada basis data vektor; serta 1000 putaran optimasi pemanggilan alat untuk memuat beban model pembelajaran mesin dunia nyata.
Perlu disorot bahwa pada standar evaluasi yang setara di papan peringkat METR, GLM-5.1 adalah satu-satunya model open source yang mencapai kerja berkelanjutan level 8 jam, serta merupakan salah satu dari sedikit model di seluruh dunia selain Claude Opus 4.6 yang memiliki kemampuan tersebut.
Penafian: Informasi di halaman ini dapat berasal dari pihak ketiga dan tidak mewakili pandangan atau opini Gate. Konten yang ditampilkan hanya untuk tujuan referensi dan bukan merupakan nasihat keuangan, investasi, atau hukum. Gate tidak menjamin keakuratan maupun kelengkapan informasi dan tidak bertanggung jawab atas kerugian apa pun yang timbul akibat penggunaan informasi ini. Investasi aset virtual memiliki risiko tinggi dan rentan terhadap volatilitas harga yang signifikan. Anda dapat kehilangan seluruh modal yang diinvestasikan. Harap pahami sepenuhnya risiko yang terkait dan buat keputusan secara bijak berdasarkan kondisi keuangan serta toleransi risiko Anda sendiri. Untuk detail lebih lanjut, silakan merujuk ke
Penafian.
Artikel Terkait
ChatGPT Hadirkan Excel dan Google Sheets: GPT-5,5 Langsung Masuk ke Spreadsheet, Copilot dan Gemini Saling Bersaing
OpenAI meluncurkan ekstensi ChatGPT for Excel dan ChatGPT for Google Sheets, menggunakan GPT-5.5 sebagai penggerak, dengan inti berupa jelaskan sambil dikerjakan. Fungsinya mencakup analisis, menulis rumus secara otomatis, memperbarui spreadsheet, serta penjelasan penalaran langkah demi langkah, sehingga pengguna bisa langsung memproses dan memahami data di dalam lembar kerja. Ini membuka persaingan tiga arah dengan Copilot dan Gemini, menandai lanskap baru bagi produktivitas AI di tingkat perusahaan; pengguna Taiwan perlu menginstal melalui AppSource/Workspace Marketplace, serta memperhatikan privasi data dan apakah perlu ChatGPT Plus.
ChainNewsAbmedia24menit yang lalu
Google Chrome Secara Diam-diam Mengunduh Model AI 4GB pada 6 Mei Tanpa Persetujuan Pengguna
Menurut Tom's Hardware, peneliti keamanan Alexander Hanff mengungkapkan bahwa Google Chrome diam-diam mengunduh sekitar 4GB berkas model AI bernama "weights.bin" ke perangkat yang memenuhi syarat pada 6 Mei tanpa pemberitahuan atau persetujuan pengguna yang eksplisit. Berkas tersebut, yang didasarkan pada Gemini Nano, menggerakkan fitur AI lokal
GateNews29menit yang lalu
CEO Ripple Menolak Narasi Pemotongan Kerja oleh AI di Tengah PHK Coinbase
CEO Ripple Dorong Narasi AI sebagai Penggerak Pertumbuhan
CEO Ripple Brad Garlinghouse menolak anggapan bahwa kecerdasan buatan terutama adalah alat untuk memangkas pekerjaan, saat berbicara kepada CoinDesk di Consensus Miami 2026. “Menggambarkan AI sebagai sosok boogeyman adalah tindakan yang memalukan,” kata Garlinghouse, dengan memposisikan teknologi tersebut sebagai
CryptoFrontier36menit yang lalu
Stockcoin.ai Menyelesaikan Putaran Pendanaan Seed yang Dipimpin oleh Amber Group
Menurut pengumuman resmi, Stockcoin.ai, sebuah platform berbasis AI untuk perdagangan futures saham dan kripto, telah menyelesaikan putaran pendanaan seed yang dipimpin oleh Amber Group, dengan partisipasi dari investor angel di kripto dan keuangan tradisional. Platform ini berfokus pada upaya menjembatani data on-chain dengan ekuitas m
GateNews1jam yang lalu
Pengguna Aktif Bulanan Aplikasi Claude melonjak 658% menjadi 85,79 juta dalam setahun, unduhan naik 2321%
Berdasarkan data Similarweb yang dipantau oleh Beating, metrik tahun ke tahun aplikasi Claude App pada bulan April menunjukkan pertumbuhan yang signifikan: pengguna aktif bulanan (MAU) naik dari 11,31 juta setahun lalu menjadi 85,79 juta, naik 658%; unduhan dari app store melonjak dari 920 ribu menjadi 22,3 juta, naik 2321%.
GateNews1jam yang lalu
Presiden OpenAI Bersaksi bahwa Musk Mencari Kontrol Penuh dan $800B untuk Koloni Mars pada 5 Mei
Menurut kesaksian Presiden OpenAI Greg Brokeman pada 5 Mei selama minggu kedua persidangan di California, Elon Musk sebelumnya mendukung upaya mengubah OpenAI menjadi perusahaan berorientasi laba dan menuntut kendali penuh atas organisasi tersebut. Brokeman menyatakan bahwa Musk menyebut perlunya mengumpulkan dana 8 miliar dolar untuk
GateNews1jam yang lalu