Developer Mia merilis Qwable 27B di Hugging Face, sebuah full fine-tune dari Qwen3.6-27B milik Alibaba yang dilatih pada dataset penalaran bergaya Fable 5, menyusul pengumuman pada 15 Juni 2026. Model ini meniru pendekatan penalaran terstruktur ala Anthropic's Fable 5 sambil berjalan sepenuhnya di perangkat keras lokal tanpa biaya API atau kebijakan retensi data yang wajib. Tak lama setelah itu, kontributor open-source Huihui-ai merilis versi yang diabliterasi yang menghapus perilaku penolakan bawaan dengan memodifikasi bobot model menggunakan llama.cpp's cvector-generator. Rilis tersebut mengikuti seminggu saat pemerintah AS memerintahkan Fable 5 ditarik untuk semua warga negara asing atas temuan jailbreak yang dipersengketakan. Kedua varian Qwable menyediakan alternatif lokal untuk layanan AI berbasis cloud, menghilangkan ketergantungan server dan kebutuhan pemrosesan data pihak ketiga.
Arsitektur Qwable 27B dan Metodologi Pelatihan
Qwable 27B adalah full fine-tune dari model dasar Qwen3.6-27B milik Alibaba yang dibangun oleh developer Mia pada dataset contoh penalaran bergaya Fable 5. Pendekatan pelatihannya adalah instruction fine-tuning pada contoh bertipe trace, di mana developer mengumpulkan contoh yang diformat seperti jawaban langkah demi langkah ala Fable 5 dan melatih Qwen untuk menghasilkan struktur output yang serupa. Model berparameter 27 miliar ini menargetkan struktur instruksi yang mengikuti gaya Fable 5, menghasilkan output penyelesaian tugas yang lebih terarah, lebih dapat dijelaskan, dan lebih bertahap dibanding model Qwen dasar.
Model berjalan dalam format GGUF, tipe berkas terkompresi yang kompatibel dengan LM Studio dan llama.cpp. Build kuantisasi Q4 membutuhkan sekitar 16,5 GB penyimpanan. Semua pemrosesan terjadi secara lokal tanpa mengirim data ke server eksternal, sehingga menghilangkan kewajiban retensi data 30 hari yang Fable 5 tetapkan untuk semua lalu lintas, termasuk pelanggan enterprise yang sebelumnya memiliki perjanjian nol-retensi.
Proses Abliterasi Menghapus Mekanisme Penolakan
Huihui-ai menerapkan abliterasi untuk menghasilkan Huihui-Qwable-3.6-27b-abliterated, sebuah varian yang menghilangkan perilaku penolakan model. Proses ini mengidentifikasi arah penolakan yang tertanam dalam bobot model dengan menjalankan model pada kumpulan besar prompt berbahaya dan tidak berbahaya, mengukur perbedaan aktivasi internal, lalu memodifikasi bobot untuk menghilangkan perbedaan tersebut. Setelah abliterasi, model tidak lagi memiliki sinyal matematis yang memicu respons penolakan.
Huihui-ai menerapkan teknik tersebut langsung ke Qwable GGUF menggunakan llama.cpp's cvector-generator, tanpa memerlukan lingkungan Python, pelatihan ulang bobot penuh, atau server sewaan. Proses ini berbeda dari jailbreaking karena memodifikasi arsitektur model secara permanen, bukan mengeksploitasi kerentanan prompt. Kartu model menyatakan versi yang diabliterasi hanya untuk riset dan lingkungan yang terkontrol, dengan tanggung jawab hukum dan etika sepenuhnya berada pada pengguna.
Build yang Tersedia dan Kebutuhan Perangkat Keras
Qwable yang diabliterasi tersedia di Hugging Face dalam tiga build. Versi rekomendasi Q4_K_M_Q8 berbobot sekitar 19 GB dan merupakan opsi terkecil yang paling ramah konsumen. Tersedia versi yang mendukung prediksi multi-token untuk sistem dengan sumber daya komputasi yang memadai, sehingga generasi respons lebih cepat. Baik Qwable standar maupun varian yang diabliterasi berjalan pada perangkat keras konsumen melalui runtime lokal seperti LM Studio.
Kasus Penggunaan untuk Versi Standar dan yang Diabliterasi
Qwable standar cocok untuk bantuan coding, debugging teknis, dan alur kerja yang membutuhkan model yang menampilkan proses penalaran ketimbang menghasilkan jawaban langsung. Model ini berjalan pada setup agen lokal dan kebanyakan runtime lokal. Versi yang diabliterasi ditujukan bagi peneliti keamanan yang membutuhkan perilaku model mentah tanpa penyaringan dari penyedia, pipeline data sintetis yang memerlukan output untuk topik sensitif, serta pekerjaan evaluasi untuk menguji kapabilitas model tanpa gangguan kebijakan konten. Kartu model memperingatkan bahwa penyaringan keselamatan yang berkurang berarti output dapat bersifat sensitif, kontroversial, atau tidak sesuai.
FAQ
Apa itu Qwable 27B dan kapan dirilis?
Qwable 27B adalah full fine-tune dari Qwen3.6-27B milik Alibaba yang dilatih pada dataset penalaran bergaya Fable 5, diumumkan oleh developer Mia pada 15 Juni 2026. Model ini berjalan secara lokal dalam format GGUF dan membutuhkan sekitar 16,5 GB pada build kuantisasi Q4-nya.
Bagaimana versi yang diabliterasi berbeda dari model Qwable standar?
Versi yang diabliterasi, yang dibuat oleh Huihui-ai, menghapus perilaku penolakan dengan memodifikasi bobot model menggunakan llama.cpp's cvector-generator. Proses ini menghilangkan sinyal matematis yang memicu respons penolakan, menghasilkan model yang memproses semua prompt tanpa penyaringan konten sambil tetap mempertahankan fungsionalitas penuh.
Apa saja kebutuhan perangkat keras untuk menjalankan model Qwable?
Build kuantisasi Q4 membutuhkan sekitar 16,5 GB penyimpanan, sementara versi Q4_K_M_Q8 yang diabliterasi direkomendasikan berbobot sekitar 19 GB. Kedua model berjalan pada perangkat keras konsumen melalui runtime lokal seperti LM Studio atau llama.cpp, dengan versi prediksi multi-token tersedia untuk sistem dengan kapasitas komputasi yang lebih tinggi.