Google Research Merilis ReasoningBank: Agen AI Belajar Strategi Penalaran dari Keberhasilan dan Kegagalan

Berita Gate, 22 April — Google Research merilis ReasoningBank, sebuah kerangka memori agen yang memungkinkan agen yang digerakkan oleh model bahasa besar untuk terus belajar setelah penerapan. Kerangka ini mengekstrak strategi penalaran universal dari pengalaman tugas yang berhasil maupun yang gagal, menyimpannya dalam bank memori untuk diambil dan dieksekusi pada tugas-tugas serupa di masa depan. Makalah terkait dipublikasikan di ICLR, dan kodenya telah dirilis sumber terbukanya di GitHub.

ReasoningBank ditingkatkan dibandingkan dua pendekatan yang sudah ada: Synapse, yang merekam lintasan aksi lengkap tetapi memiliki keterpindahan yang terbatas karena granularitas yang terlalu terperinci, dan Agent Workflow Memory, yang hanya belajar dari kasus yang berhasil. ReasoningBank membuat dua perubahan kunci: menyimpan “pola penalaran” alih-alih “urutan aksi,” dengan setiap memori berisi bidang terstruktur untuk judul, deskripsi, dan konten; serta memasukkan lintasan kegagalan ke dalam pembelajaran. Kerangka ini menggunakan sebuah model untuk menilai sendiri lintasan eksekusi, mengubah pengalaman kegagalan menjadi aturan anti-jebakan. Misalnya, aturan “klik tombol Muat Lebih saat terlihat” berevolusi menjadi “verifikasi terlebih dahulu pengidentifikasi halaman saat ini, hindari loop gulir tak berujung, lalu klik muat lebih.”

Makalah ini juga memperkenalkan Memory-aware Test-time Scaling (MaTTS), yang mengalokasikan komputasi tambahan selama inferensi untuk mengeksplorasi beberapa lintasan dan menyimpan temuan di bank memori. Ekspansi paralel menjalankan beberapa lintasan berbeda untuk tugas yang sama, menyempurnakan strategi yang lebih andal melalui perbandingan diri; ekspansi berurutan menyempurnakan satu lintasan secara iteratif, menyimpan penalaran antara di memori.

Pada tugas browser WebArena dan tugas pengkodean SWE-Bench-Verified menggunakan Gemini 2.5 Flash sebagai agen ReAct, ReasoningBank mencapai tingkat keberhasilan 8,3% lebih tinggi di WebArena dan 4,6% lebih tinggi di SWE-Bench-Verified dibandingkan baseline tanpa memori, dengan mengurangi rata-rata langkah per tugas sekitar 3. Menambahkan MaTTS dengan ekspansi paralel (k=5) selanjutnya meningkatkan tingkat keberhasilan WebArena sebesar 3 poin persentase dan mengurangi langkah sebesar tambahan 0,4.

Penafian: Informasi di halaman ini dapat berasal dari pihak ketiga dan tidak mewakili pandangan atau opini Gate. Konten yang ditampilkan hanya untuk tujuan referensi dan bukan merupakan nasihat keuangan, investasi, atau hukum. Gate tidak menjamin keakuratan maupun kelengkapan informasi dan tidak bertanggung jawab atas kerugian apa pun yang timbul akibat penggunaan informasi ini. Investasi aset virtual memiliki risiko tinggi dan rentan terhadap volatilitas harga yang signifikan. Anda dapat kehilangan seluruh modal yang diinvestasikan. Harap pahami sepenuhnya risiko yang terkait dan buat keputusan secara bijak berdasarkan kondisi keuangan serta toleransi risiko Anda sendiri. Untuk detail lebih lanjut, silakan merujuk ke Penafian.

Artikel Terkait

Reid Hoffman: NFT Bisa Kembali karena Agen AI Membutuhkan Kepercayaan Kripto

Reid Hoffman, partner Greylock dan pendiri LinkedIn, mengatakan bahwa agen otonom akan memerlukan sistem kepercayaan berbasis kripto untuk bertransaksi di internet terbuka, seraya menyiratkan bahwa NFT mungkin akan kembali, menurut pernyataannya. Agen AI dan Infrastruktur Kepercayaan Pernyataan Hoffman mengarah pada potensi

CryptoFrontier57menit yang lalu

IBM Memperluas Enterprise AI Suite dengan Alat Baru Berbasis Agen di Think 2026

Menurut IBM, perusahaan mengumumkan perluasan kemampuan AI perusahaan di konferensi Think 2026 di Boston, dengan meluncurkan alat-alat baru berbasis agen untuk membantu organisasi menyematkan kecerdasan buatan ke dalam operasi harian. Context Studio, yang kini tersedia secara umum, memungkinkan perusahaan untuk

GateNews2jam yang lalu

Mimpi Claude dari Anthropic: Agent menyusun ulang ingatan secara otomatis di sela-sela pekerjaan, menghapus duplikasi, dan meniadakan konflik

Anthropic mengumumkan Dreams di acara Code with Claude, memungkinkan Claude Managed Agents untuk secara otomatis mengatur memori di banyak sesi percakapan, menghapus duplikasi dan konflik, serta memperbarui entri yang sudah usang, lalu menghasilkan basis memori yang dapat diaudit; batas input 100 sesi dan 4.096 karakter, dieksekusi secara asinkron, selesai dalam hitungan menit hingga puluhan menit, dan mendukung pemantauan streaming. Pratinjau riset perlu diajukan, sementara hanya mendukung claude-opus-4-7 dan claude-sonnet-4-6, dengan waktu peluncuran resmi belum ditentukan.

ChainNewsAbmedia5jam yang lalu

Cloudflare berkolaborasi dengan Stripe untuk menghadirkan Agen otonom yang melakukan negosiasi: AI dapat membuat akun sendiri, membeli domain, dan mendeploy aplikasi

Cloudflare dan Stripe pada 30 April bersama-sama meluncurkan protokol baru yang memungkinkan AI Agent membuat akun Cloudflare sendiri tanpa campur tangan manusia, berlangganan paket berbayar, mendaftarkan domain, mendapatkan token API, dan langsung melakukan deployment aplikasi. Blog resmi Cloudflare menjelaskan bahwa seluruh alur proses dari awal hingga akhir tidak memerlukan manusia masuk ke dashboard, menyalin-tempel token, atau memasukkan data kartu kredit; pengguna hanya perlu terlebih dahulu memberikan izin, serta menerima syarat dan ketentuan penggunaan Cloudflare. Minggu ini, pengumuman tersebut mendapat 548 poin di Hacker News, menjadi salah satu berita infrastruktur yang menandai tonggak bagi AI Agent untuk menjalankan tugas secara mandiri. Arsitektur tiga lapis: penemuan layanan, otorisasi identitas, dan pemrosesan pembayaran menjadi token Cloudflare-Stripe

ChainNewsAbmedia5jam yang lalu

Insinyur Coinbase: Agen AI Bisa Mengganggu Model Iklan Web

Erik Reppel, seorang insinyur Coinbase, mengatakan bahwa agen-agen kecerdasan buatan dapat secara fundamental melemahkan model bisnis internet yang bergantung pada iklan. Menurut Reppel, ekonomi web sangat bergantung pada pendapatan iklan yang dihasilkan dari pengguna manusia, tetapi agen AI melewati sistem itu.

CryptoFrontier6jam yang lalu

Prophet Meluncurkan Pasar Prediksi Berbasis AI dengan Kupon Perdagangan Langsung $10.000 Hari Ini

Menurut MetaversePost, Prophet meluncurkan pasar prediksi bertenaga AI hari ini (6 Mei) dengan $10.000 dalam USDC yang dialokasikan untuk perdagangan langsung. Pengguna dapat berdagang langsung melawan pihak lawan AI yang menghasilkan harga berbasis probabilitas untuk setiap pasar, dengan beberapa kontrak yang akan diselesaikan dalam waktu 24

GateNews12jam yang lalu
Komentar
0/400
Tidak ada komentar