Beating señala que Google ha lanzado Gemma 4 12B, un nuevo tamaño de modelo en la familia Gemma 4 diseñado para ejecutar agentes de IA multimodales de forma local en portátiles de consumo con 16GB de RAM. El modelo de 12B parámetros utiliza una arquitectura multimodal sin codificador que admite entradas de texto e imagen, cubriendo un vacío de rendimiento entre los modelos más pequeños y los más grandes de la gama.
Google, al mismo tiempo, actualizó su herramienta de inferencia local LiteRT-LM con compatibilidad con la API de OpenAI, lo que permite a los desarrolladores conectar herramientas como Continue, Aider y Open WebUI directamente a una instancia local de Gemma 4 12B sin depender de modelos basados en la nube.