Eksekutif Google DeepMind: Setiap Perusahaan Produk AI Harus Membangun Tolok Ukur Kustom

Berita Gate, 27 April — Logan Kilpatrick, manajer produk senior di Google DeepMind dan pemimpin produk untuk Google AI Studio, menyatakan di X bahwa setiap perusahaan yang membangun produk berbasis AI harus menetapkan tolok ukur kustomnya sendiri untuk mengukur performa model AI. Ia menyebutnya sebagai cara untuk membuat peningkatan model “memberi manfaat yang secara tidak proporsional bagi perusahaan Anda” dan mendesak para pendiri serta pemimpin bisnis untuk “mulai besok.”

Kebanyakan perusahaan saat ini mengandalkan papan peringkat publik untuk memilih model AI, tetapi papan peringkat ini mengukur kemampuan umum yang sering tidak selaras dengan skenario bisnis tertentu. Kilpatrick mencontohkan perusahaan peninjau kontrak yang paling peduli pada akurasi ekstraksi klausul—sebuah kemampuan yang tidak ada dalam tolok ukur publik, sehingga tidak mungkin menilai performa model pada tugas tersebut. Tolok ukur kustom menawarkan dua keunggulan utama: pertama, tolok ukur ini memungkinkan perusahaan mengevaluasi setiap pembaruan model terhadap tugas bisnis mereka sendiri dan memilih model yang berkinerja terbaik pada kasus penggunaan mereka yang sebenarnya, bukan model dengan peringkat tertinggi secara keseluruhan; kedua, tolok ukur ini memungkinkan perusahaan membagikan set pengujian tersebut kepada penyedia model, sehingga mendorong optimasi berkelanjutan di area yang penting bagi bisnis mereka.

Kilpatrick mencatat bahwa perusahaan seperti Zapier dan Sierra sudah menerapkan pendekatan ini, dengan mengatakan bahwa “ada banyak alpha yang bisa diciptakan di sini.”

Penafian: Informasi di halaman ini dapat berasal dari pihak ketiga dan tidak mewakili pandangan atau opini Gate. Konten yang ditampilkan hanya untuk tujuan referensi dan bukan merupakan nasihat keuangan, investasi, atau hukum. Gate tidak menjamin keakuratan maupun kelengkapan informasi dan tidak bertanggung jawab atas kerugian apa pun yang timbul akibat penggunaan informasi ini. Investasi aset virtual memiliki risiko tinggi dan rentan terhadap volatilitas harga yang signifikan. Anda dapat kehilangan seluruh modal yang diinvestasikan. Harap pahami sepenuhnya risiko yang terkait dan buat keputusan secara bijak berdasarkan kondisi keuangan serta toleransi risiko Anda sendiri. Untuk detail lebih lanjut, silakan merujuk ke Penafian.

Artikel Terkait

R0AR Melaju ke Babak Final Consensus 2026 PitchFest, Tersisih Tipis dari Top 20

Menurut MetaversePost, R0AR maju ke babak seleksi final CoinDesk Consensus 2026 PitchFest pada 4 Mei, hanya tersisih dari 20 startup teratas yang dipilih untuk presentasi langsung. Inovator Web3 dan AI itu dinilai bersama startup berpotensi tinggi di seluruh dunia pada salah satu m

GateNews2jam yang lalu

Musk Mengincar Penyelesaian Senilai $150 Miliar dari OpenAI Sebelum Sidang, Pembicaraan Penyelesaian Gagal

Menurut berkas pengadilan, Elon Musk menghubungi Presiden OpenAI Greg Brockman pada 26 April, dua hari sebelum sidang mereka dimulai di pengadilan federal Oakland, untuk membahas kemungkinan penyelesaian. Ketika Brockman menyarankan kedua pihak mencabut tuntutan mereka, Musk menanggapi dengan ancaman, mengatakan kepada Brockman: "Pada akhir

GateNews2jam yang lalu

Cursor Menerima Tawaran Akuisisi SpaceX senilai 60 miliar dolar AS tetapi Tidak Mau Berkolaborasi dengan xAI untuk Model Koding

Menurut The Information, Cursor telah menerima penawaran akuisisi bersyarat senilai 60 miliar dolar AS dari SpaceX, meskipun kesepakatan tersebut belum final. Saat ini, perusahaan tidak memiliki rencana untuk berkolaborasi dengan unit AI SpaceX, xAI, dalam mengembangkan model pengkodean. Sebagai gantinya, Cursor berfokus pada mengoptimalkannya

GateNews3jam yang lalu

Haun Ventures Menutup Dana senilai $1 miliar pada 4 Mei, Membagi Modal antara Investasi Kripto Tahap Awal dan Tahap Akhir

Menurut Bloomberg, Haun Ventures menyelesaikan putaran penggalangan dana senilai 1 miliar dolar AS pada 4 Mei, dengan 500 juta dolar AS dialokasikan untuk investasi tahap awal dan 500 juta dolar AS untuk investasi tahap lanjut. Dana tersebut akan menyalurkan modal selama dua hingga tiga tahun ke depan, menargetkan startup kripto dan blockchain sambil memperluas

GateNews3jam yang lalu

OpenAI Menggalang $4 Miliar untuk Usaha Patungan Penerapan, Senilai 10 Miliar Dolar AS

Menurut BlockBeats, pada 4 Mei, OpenAI menghimpun lebih dari $4 miliar untuk mendirikan perusahaan patungan baru yang berfokus membantu perusahaan mengadopsi perangkat lunak kecerdasan buatannya. Ventura tersebut, bernama The Deployment Company, didukung oleh 19 investor termasuk TPG Inc., Brookfield Asset Management,

GateNews4jam yang lalu

Mengapa sebagian orang merasa AI akan mengubah dunia, sementara yang lain menganggapnya biasa saja? Dua diagnosa dari Karpathy

Karpathy mengatakan, kesenjangan persepsi AI berasal dari dua diagnosis: 1) hanya pernah memakai model gratis/model versi lama, sehingga tidak bisa mencerminkan kemampuan model agentic yang paling mutakhir; 2) peningkatan kemampuan baru tampak signifikan di bidang yang sangat teknis, dan juga bersifat tidak simetris. Hal ini membuat pengguna yang membayar dan pembaca umum melihat fenomena yang berbeda, sehingga menimbulkan kesalahpahaman timbal balik dalam dunia paralel. Pelajaran bagi pembaca Taiwan adalah, hanya dengan benar-benar menggunakan model paling mutakhir untuk menyelesaikan tugas produksi, serta memverifikasi dasar penilaiannya, kita bisa menghindari terseret oleh mitos yang disebarkan media.

ChainNewsAbmedia4jam yang lalu
Komentar
0/400
Tidak ada komentar