Google DeepMindは本日、オープンソースのマルチモーダルAIモデル「Gemma 4 12B」をリリースしました。 120億パラメータのモデルは、より大きい26BのMixture of Expertsモデルと同等の性能を提供しながら、必要なメモリは半分未満で、16GBのVRAMだけで、エントリーレベルのMacBook Air M5デバイスを含む一般向けノートPC上で動作できます。
Gemma 4 12Bは、Gemma 4シリーズでネイティブの音声入力に対応する最初のミドルサイズモデルです。 このモデルは、別個のビジョンおよびオーディオエンコーダを備えない軽量なアーキテクチャを特徴としており、低遅延とメモリ使用量の削減を可能にします。 マルチステップの推論、Agentのワークフロー、そして完全にオフラインでのローカル推論をサポートします。 このモデルはApache 2.0ライセンスのもとで公開され、学習済みの重みはHugging FaceおよびKaggleで利用可能で、Model Garden、Cloud Run、GKEを含むGoogle Cloudの各プラットフォームを介してデプロイできます。