Pesan Gate News, 20 April — Model AI teratas unggul dalam memecahkan masalah kompleks seperti matematika Olimpiade, tetapi kesulitan pada pekerjaan rutin perusahaan, menurut David Meyer dari Databricks. Beberapa model mungkin memperbaiki nomor faktur yang salah alih-alih menandainya sebagai kesalahan, sementara alat pemrograman seperti Claude juga bisa berkinerja di bawah standar pada tugas rekayasa data.
Kesenjangan ini berasal dari perbedaan mendasar antara data perusahaan dan teks web publik yang digunakan untuk melatih model besar. Data perusahaan sering menampilkan label kolom yang tidak jelas, banyak kolom kosong, dan kode yang disimpan sebagai teks biasa. Dalam satu studi akademis, skor F1 model AI, yang menyeimbangkan precision dan recall, turun dari 0.94 pada data publik menjadi 0.07 pada data perusahaan untuk tugas rekayasa data. Selain itu, model besar cenderung mengandalkan pola yang sudah familiar dari pelatihan; beberapa kembali ke Structured Query Language (SQL) bahkan setelah menerima instruksi dan dokumentasi untuk bahasa kueri proprietari milik sebuah perusahaan.
Model sumber terbuka yang lebih kecil yang disetel dengan reinforcement learning dapat menangani pekerjaan tertentu dengan lebih efisien dengan biaya pelatihan yang jauh lebih rendah dibandingkan model umum skala besar. Databricks sedang membangun agen AI yang lebih kecil untuk alur kerja spesifik, seperti KARL, yang menggunakan reinforcement learning untuk penalaran multi-langkah dengan dokumen perusahaan. Industri bergeser dari mengandalkan model raksasa ke arsitektur hibrida, di mana model kecil yang efisien menangani volume rutin, lalu hanya mengeskalasi kasus yang tidak jelas atau kompleks ke sistem yang lebih besar dan lebih mahal.
Databricks baru-baru ini mengakuisisi Quotient AI untuk membantu perusahaan besar menjalankan agen AI dengan lebih andal. Persaingan di bisnis AI kini berpusat pada menjalankan seluruh siklus hidup AI, termasuk sistem umpan balik untuk melacak kesalahan dan terus meningkatkan model dari waktu ke waktu, sehingga alat evaluasi dan penyetelan semakin bernilai setelah penerapan.
Penafian: Informasi di halaman ini dapat berasal dari pihak ketiga dan tidak mewakili pandangan atau opini Gate. Konten yang ditampilkan hanya untuk tujuan referensi dan bukan merupakan nasihat keuangan, investasi, atau hukum. Gate tidak menjamin keakuratan maupun kelengkapan informasi dan tidak bertanggung jawab atas kerugian apa pun yang timbul akibat penggunaan informasi ini. Investasi aset virtual memiliki risiko tinggi dan rentan terhadap volatilitas harga yang signifikan. Anda dapat kehilangan seluruh modal yang diinvestasikan. Harap pahami sepenuhnya risiko yang terkait dan buat keputusan secara bijak berdasarkan kondisi keuangan serta toleransi risiko Anda sendiri. Untuk detail lebih lanjut, silakan merujuk ke
Penafian.
Artikel Terkait
Pengguna ChatGPT Kini Bisa Mengakses Langganan di Platform OpenClaw, Sam Altman Mengumumkan
Menurut pengumuman Sam Altman hari ini, pengguna ChatGPT kini dapat masuk ke platform agen OpenClaw menggunakan akun ChatGPT mereka dan langsung mengakses langganan ChatGPT yang sudah ada di platform tersebut.
GateNews7menit yang lalu
AI Agent Manfred Membentuk Perusahaan, Berencana Mulai Trading Kripto pada Akhir Mei
Agen AI Manfred telah membentuk perusahaannya sendiri dan memperoleh dompet kripto beserta kredensial untuk merekrut staf, melakukan pembayaran, dan menjalankan bisnis, menurut laporan. Agen ini berencana mulai trading kripto pada akhir
GateNews30menit yang lalu
Agen AI mengelola perusahaan secara menyeluruh! Mesin penjual otomatis berbasis kecerdasan buatan di San Francisco membuka peluang bisnis baru yang menarik
Artikel ini melaporkan bahwa mesin penjual otomatis Valerie digerakkan oleh OpenClaw, memungkinkan agen AI benar-benar menjalankan operasi harian, termasuk penetapan harga, stok, aktivitas komunitas, bahkan mengelola rekening bank. Hasil pengujian menunjukkan bahwa AI dapat meniru keputusan manajer perusahaan, tetapi muncul “halusinasi penetapan harga”, seperti menaikkan harga batang protein menjadi 15 dolar AS. Hambatan hukum seperti KYC, pembukaan rekening bank, dan izin makanan belum teratasi. Meski ada mekanisme seperti trust yang memungkinkan agen AI memegang perusahaan, tantangan praktis masih banyak.
ChainNewsAbmedia3jam yang lalu
Agen AI Manfred Membentuk Perusahaan, Mendapatkan Dompet Kripto Menjelang Peluncuran Perdagangan Awal Mei Mendatang
Agen AI Manfred telah membentuk perusahaannya sendiri dan mendapatkan dompet kripto bersama kredensial untuk merekrut staf, melakukan pembayaran, dan menjalankan bisnis. Agen tersebut tidak dijadwalkan mulai melakukan trading kripto sampai akhir dari
GateNews6jam yang lalu
MoonPay Meluncurkan Kartu MoonAgents untuk Agen AI di Jaringan Mastercard
Menurut The Block, MoonPay meluncurkan MoonAgents Card pada Jumat, kartu debit virtual Mastercard yang mengonversi stablecoin menjadi mata uang fiat secara real time pada saat pembayaran. Kartu ini diterbitkan melalui Monavate, platform pembayaran teregulasi dan anggota utama Mastercard, dalam kemitraan dengan Exodus M
GateNews6jam yang lalu
AI Agent Manfred Membentuk Perusahaan, Mendapat Dompet Kripto Sebelum Peluncuran Perdagangan Mei
Agen AI Manfred telah membentuk perusahaannya sendiri dan memperoleh dompet kripto serta kredensial bisnis, meskipun belum akan mulai memperdagangkan cryptocurrency hingga akhir Mei. Kini agen tersebut sudah siap untuk merekrut staf, melakukan pembayaran, dan menjalankan bisnis
GateNews12jam yang lalu