Qwable 27B：ローカルAIモデルが一般向けハードウェア上で『Fable 5』の推論を再現

2026-06-23 22:12:28

開発者のMiaがHugging FaceでQwable 27Bをリリースした。これは、2026年6月15日の発表に続いて、Fable 5のような推論データセットで学習されたAlibabaのQwen3.6-27Bの完全なファインチューニングである。このモデルはAnthropicのFable 5の構造化された思考手法を再現しつつ、APIコストや強制的なデータ保存ポリシーなしで完全にローカルのハードウェア上で動作する。間もなく、オープンソース貢献者のHuihui-aiが、llama.cppのcvector-generatorでモデルの重みを変更することで組み込みの拒否挙動を取り除いた“abriliterated”（劣化・無力化）版を公開した。これらのリリースは、米国政府が、争点となっているジェイルブレイクの認定をめぐり、Fable 5をすべての外国籍の人に対して取り下げるよう命じた1週間の後に行われた。両方のQwableバリアントは、クラウド型AIサービスのローカル代替を提供し、サーバーへの依存やサードパーティによるデータ処理の要件をなくす。

Qwable 27B Architecture and Training Methodology

Qwable 27Bは、開発者MiaがFable 5スタイルの推論例のデータセットで構築した、AlibabaのQwen3.6-27Bベースモデルの完全ファインチューニングである。学習手法はトレース形式の例に対するインストラクション・ファインチューニングであり、開発者がFable 5のステップバイステップ回答のように整形された例を収集し、Qwenに同様の出力構造を生成させるよう学習させた。その結果得られる270億（27-billion）パラメータのモデルは、Fable 5の指示追従の構造を狙い、ベースのQwenモデルよりも導きがあり、説明的で、ステップごとのタスク完了出力を生成する。

このモデルは、LM Studioやllama.cppと互換性のある圧縮ファイル形式であるGGUF形式で動作する。Q4量子化ビルドでは、約16.5 GBのストレージが必要になる。すべての処理は外部サーバーへデータを送らずにローカルで行われ、Fable 5がFable 5の対象となる既存のゼロ保持契約がある企業顧客を含むすべての通信に対して課していた、強制的な30日間のデータ保存要件を排除する。

無力化プロセスが拒否メカニズムを除去する

Huihui-aiは無力化（abliteration）を適用して、Huihui-Qwable-3.6-27b-abliteratedという、モデルの拒否挙動をなくすバリアントを作成した。このプロセスは、危険／無害なプロンプトの大量セットでモデルを実行し、内部アクティベーションの差を測定することで、モデルの重みに埋め込まれた拒否の方向性を特定し、その差をなくすように重みを変更する。無力化の後は、モデルは拒否応答を引き起こす数理的なシグナルをもはや含まない。

Huihui-aiは、llama.cppのcvector-generatorを使ってQwableのGGUFに直接この手法を適用し、Python環境、完全な重み再学習、またはレンタルサーバーは不要だった。プロセスは、プロンプトの脆弱性を突くのではなくモデルのアーキテクチャを恒久的に変更する点で、ジェイルブレイクとは異なる。モデルカードでは、無力化版は研究および管理された環境のみに用いるものであり、法的・倫理的な責任はユーザー側に全面的にあると明記されている。

利用可能なビルドとハードウェア要件

無力化されたQwableはHugging Faceで3つのビルドとして提供されている。推奨のQ4_K_M_Q8版は約19 GBで、最小かつ最も一般消費者向けの選択肢を表す。十分な計算資源を持つシステム向けに、多トークン予測をサポートするバージョンも利用可能で、より高速な応答生成を提供する。標準のQwableと無力化バリアントの両方は、LM Studioのようなローカル実行環境を通じて一般的なハードウェアで動作する。

標準版と無力化版の用途

標準のQwableは、コーディング支援、技術的デバッグ、そして直接の答えではなく推論プロセスを示すモデルを必要とするワークフローに向いている。これはローカルのエージェント構成と、ほとんどのローカル実行環境で動作する。無力化版は、プロバイダー側のフィルタリングなしで生のモデル挙動を必要とするセキュリティ研究者、機密性の高いトピックに関する出力を必要とする合成データのパイプライン、コンテンツポリシーによる干渉なしにモデルの能力をテストする評価作業のために役立つ。モデルカードでは、安全性フィルタリングが低減されるため、出力が機微で、論争的であったり不適切であったりし得ると警告している。

よくある質問

Qwable 27Bとは何で、いつリリースされたのですか？

Qwable 27Bは、Fable 5スタイルの推論データセットで学習されたAlibabaのQwen3.6-27Bの完全なファインチューニングであり、開発者Miaが2026年6月15日に発表した。モデルはGGUF形式でローカルにて動作し、Q4量子化ビルドでは約16.5 GBが必要になる。

無力化版は標準のQwableモデルとどう違いますか？

無力化版はHuihui-aiによって作成され、llama.cppのcvector-generatorを用いてモデルの重みを変更することで拒否挙動を取り除く。プロセスは、拒否応答を引き起こす数理的なシグナルを排除し、その結果、コンテンツのフィルタリングを行わずにすべてのプロンプトを処理しつつ、完全な機能を維持するモデルになる。

Qwableモデルを動かすためのハードウェア要件は何ですか？

Q4量子化ビルドでは約16.5 GBのストレージが必要で、推奨のQ4_K_M_Q8無力化版は約19 GBの重さになる。両方のモデルは、LM Studioやllama.cppのようなローカル実行環境を通じて一般的なハードウェアで動作し、多トークン予測版が計算能力の高いシステムで利用可能である。

ソースを表示

免責事項：本ページの情報には第三者提供の内容が含まれる場合があり、参考目的のみで提供されています。これらはGateの見解や意見を示すものではなく、金融、投資、または法律上の助言を構成するものでもありません。暗号資産取引には高いリスクが伴います。意思決定を行う際には、本ページの情報のみに依存しないでください。詳細については、免責事項をご確認ください。