#Anthropic发布Fable5模型 Sebuah model, dua nama: Anthropic merilis Fable 5 dan Mythos 5, model paling kuat yang terbuka untuk umum untuk pertama kalinya


9 Juni, Anthropic secara bersamaan merilis dua model baru—Claude Fable 5 dan Claude Mythos 5. Menariknya, keduanya sebenarnya didasarkan pada model dasar yang sama, dengan satu-satunya perbedaan adalah ketatnya "pengaman keselamatan". Ini adalah pertama kalinya model paling canggih dari Anthropic tersedia secara publik, dan ini juga merupakan eksperimen "rilis berlapis" yang langka.
Artikel ini akan membantu Anda memahami: apa yang membuatnya kuat, mengapa memiliki dua nama, dan bagaimana menggunakannya sekarang.
1. Pertama, jelaskan: apa itu model "Mythos level"?
Sudah akrab dengan Claude? Pembaca tahu bahwa model Anthropic selalu dibagi menjadi tiga tingkat: Haiku (cepat), Sonnet (seimbang), Opus (paling kuat). Pada bulan April tahun ini, Anthropic diam-diam memperkenalkan tingkat baru di atas Opus—tingkat Mythos. Model tingkat Mythos pertama (Claude Mythos Preview) tidak dijual secara publik tetapi dirilis melalui sebuah proyek bernama Project Glasswing, bekerja sama dengan pemerintah AS, dan hanya tersedia untuk beberapa lembaga keamanan siber dan penyedia infrastruktur kritis.
Alasannya sederhana: tingkat model ini terlalu kuat, berpotensi disalahgunakan dalam bidang seperti serangan siber dan penelitian biologis, sehingga Anthropic percaya model ini sebaiknya tidak dirilis langsung.
Dua model yang dirilis kali ini adalah versi resmi tingkat Mythos:
◆ Claude Fable 5: versi terbuka untuk semua dengan seperangkat pengaman baru;
◆ Claude Mythos 5: versi dengan beberapa pengaman yang dilonggarkan, hanya tersedia untuk mitra terpercaya seperti Glasswing. Keduanya didasarkan pada model inti yang sama. Nama-namanya juga dipilih dengan hati-hati: Fable berasal dari Latin fabula ("cerita yang diceritakan"), dan berbagi akar dengan mythos Yunani—asal usul yang sama—hanya berbeda dalam "kemampuan berbicara secara bebas."
2. Seberapa kuat model ini?
Menurut Anthropic, Fable 5 melampaui model apa pun yang pernah dirilis secara publik oleh perusahaan, dan merupakan teknologi terbaru (SOTA) di hampir semua tolok ukur AI, terutama unggul dalam rekayasa perangkat lunak, pekerjaan pengetahuan, pemahaman visual, dan penelitian ilmiah. Semakin panjang dan kompleks tugasnya, semakin besar keunggulannya dibanding model-model lama.
Pengkodean: merangkum dua bulan menjadi satu hari. Perusahaan pembayaran Stripe melaporkan dalam pengujian awal bahwa Fable 5 menyelesaikan migrasi penuh dari basis kode Ruby sebanyak 50 juta baris dalam satu hari—sesuatu yang biasanya memakan waktu lebih dari dua bulan kerja manual oleh tim. Dalam evaluasi Cognition (Devin’s developer) FrontierCode, Fable 5 mendapatkan skor tertinggi di antara model-model mutakhir dan menggunakan lebih sedikit token.
Visual: mengalahkan Pokémon FireRed tanpa bantuan. Model Claude sebelumnya membutuhkan alat bantu kompleks (peta, navigasi, info status permainan) untuk sekadar maju dalam Pokémon, tetapi Fable 5 menyelesaikan permainan hanya dengan melihat layar permainan mentah. Ia juga dapat merekonstruksi kode sumber untuk aplikasi web langsung dari tangkapan layar.
Memori: mencatat saat bermain Slay the Spire. Dalam tugas dengan jutaan token, Fable 5 dapat mempertahankan fokus dan meningkatkan kinerja dengan menggunakan catatannya sendiri. Dalam pengujian dengan permainan kartu Slay the Spire, setelah diberikan memori permanen, kinerjanya meningkat tiga kali lipat dibanding Opus 4.8.
Penelitian ilmiah: mempercepat desain obat sekitar 10 kali lipat. Para ahli desain protein internal di Anthropic menggunakan Mythos 5 untuk mempercepat bagian dari proses pengembangan obat sekitar sepuluh kali lipat—model secara mandiri menyelesaikan tugas seperti memilih situs pengikatan, menjalankan alat desain protein, dan memulihkan dari kegagalan, semuanya tanpa bantuan manusia. Dari 14 target protein, 9 menghasilkan kandidat obat menjanjikan untuk pengembangan lebih lanjut. Ia juga mengusulkan hipotesis mekanistik baru tentang protein E. coli, yang kemudian dikonfirmasi oleh laboratorium riset independen.
3. Bagaimana pengaman keselamatan bekerja: memicu "penurunan tingkat" ke Opus 4.8
Ini adalah aspek paling menarik dari rilis ini. Fable 5 dilengkapi dengan seperangkat pengklasifikasi baru—sistem AI terpisah dari model utama—yang dirancang untuk mendeteksi potensi penyalahgunaan. Ketika pengklasifikasi mendeteksi bahwa permintaan Anda melibatkan salah satu dari tiga bidang sensitif berikut, respons tidak akan lagi berasal dari Fable 5 tetapi secara otomatis beralih ke model yang kurang kuat, Claude Opus 4.8 (dengan prompt yang memberi tahu pengguna):
1. Keamanan siber: model tingkat Mythos sangat mampu menemukan dan mengeksploitasi kerentanan perangkat lunak, dan dapat melakukan "peretasan otomatis"—pengintaian dan pergerakan lateral dalam satu paket. Kemampuan ini secara signifikan menurunkan biaya serangan siber, sehingga fokusnya adalah pada pertahanan.
2. Biologi dan kimia: model sekarang dapat melakukan tugas ilmiah dunia nyata (seperti memprediksi perakitan kapsid virus). Kemampuan dual-use ini berbahaya jika disalahgunakan, jadi sebagian besar permintaan di bidang bioteknologi diturunkan ke Opus.
3. Serangan distilasi: mencegah "ekstraksi" skala besar dari kemampuan Fable 5 untuk melatih model pesaing.
Angka kunci: pengaktifan pengaman ini terjadi pada kurang dari 5% sesi, artinya lebih dari 95% pengguna mengalami hampir seluruh kemampuan Mythos 5. Anthropic mengakui bahwa pengaman ini dikonfigurasi secara konservatif dan mungkin menghasilkan false positive, dan berencana untuk mengurangi alarm palsu segera. Mengenai jailbreak, lebih dari 1.000 jam pengujian bounty kerentanan eksternal tidak menemukan "jailbreak universal."
Perubahan penting lainnya: semua lalu lintas dari model tingkat Mythos akan disimpan selama 30 hari (termasuk klien perusahaan) untuk perlindungan terhadap metode serangan baru dan jailbreak—Anthropic berjanji data ini tidak akan digunakan untuk pelatihan dan memiliki perlindungan privasi seperti audit akses.
4. Mythos 5: versi "lingkaran terpercaya" tanpa pengaman
Mythos 5 pada dasarnya adalah Fable 5 dengan beberapa pengaman yang dihapus, mengklaim memiliki kemampuan keamanan siber terkuat di dunia. Saat ini, hanya tersedia melalui Project Glasswing untuk lembaga keamanan siber, sebagai peningkatan dari Mythos Preview. Anthropic berencana untuk secara bertahap memperluas: bernegosiasi dengan pemerintah AS untuk menambah mitra; meluncurkan program akses terpercaya yang lebih sistematis untuk organisasi keamanan siber; dan membuka rencana penelitian biologi terpercaya (menghapus pengaman bioteknologi tetapi mempertahankan pengaman keamanan siber) untuk mempercepat pengembangan terapi baru. Pendekatan "model yang sama, unlock berlapis berdasarkan identitas" ini adalah yang pertama dalam rilis AI frontier.
5. Harga dan akses: jendela API gratis hingga 22 Juni
Harga API selama jendela gratis: $10 per juta token untuk input, $50 per juta token untuk output—kurang dari setengah Mythos Preview. Identifikasi model adalah claude-fable-5, dan paket API serta rencana enterprise bayar sesuai penggunaan tersedia mulai hari ini. Pelanggan harus memperhatikan:
◆ Dari sekarang hingga 22 Juni: paket Pro, Max, Tim, dan enterprise menyertakan Fable 5 secara gratis;
◆ Mulai 23 Juni: akan dihapus dari paket, dan penggunaan lanjutan akan memerlukan pembelian kredit penggunaan; jika kapasitas memungkinkan, jendela gratis ini mungkin diperpanjang;
◆ Setelah itu: seiring peningkatan daya komputasi, Anthropic berencana mengintegrasikan kembali Fable 5 ke dalam paket langganan standar. Dengan kata lain, dua minggu ke depan adalah waktu terbaik untuk mencoba model paling kuat secara gratis, jadi pembaca yang berminat harus memanfaatkan kesempatan ini.
6. Pemikiran akhir: "pendekatan baru" terhadap kemampuan dan keamanan
Dalam beberapa tahun terakhir, laboratorium frontier hanya menghadapi dua opsi untuk "bagaimana jika model terlalu kuat": menunda rilis atau memotong kemampuan. Anthropic menawarkan solusi ketiga—rilis penuh dengan pengaman dinamis untuk versi publik, sementara versi lengkap disimpan untuk lembaga terpercaya.
Pendekatan ini tidak sempurna: false positive sebanyak 5% mungkin membuat frustrasi beberapa pengguna profesional (terutama peneliti keamanan dan biolog), dan retensi data selama 30 hari bisa menimbulkan kekhawatiran privasi. Tetapi ini memungkinkan "kemampuan paling kuat" tidak terkunci di balik proyek pemerintah, melainkan masuk ke dalam dialog semua orang secara terkendali. Ketika AI dapat menyelesaikan dua bulan kerja tim dalam satu hari, atau secara mandiri merancang kandidat obat protein, "cara merilis" menjadi sama pentingnya dengan "apa yang dibangun." Akar bersama Fable dan Mythos mungkin menetapkan preseden untuk strategi rilis model frontier di masa depan.
Lihat Asli
post-image
Halaman ini mungkin berisi konten pihak ketiga, yang disediakan untuk tujuan informasi saja (bukan pernyataan/jaminan) dan tidak boleh dianggap sebagai dukungan terhadap pandangannya oleh Gate, atau sebagai nasihat keuangan atau profesional. Lihat Penafian untuk detailnya.
  • Hadiah
  • Komentar
  • Posting ulang
  • Bagikan
Komentar
Tambahkan komentar
Tambahkan komentar
Tidak ada komentar
  • Disematkan