A Google DeepMind lança a Gemma 4 12B, modelo multimodal de código aberto executando em memória de GPU de 16GB

A Google DeepMind lançou hoje a Gemma 4 12B, um modelo de IA multimodal de código aberto. O modelo com 12 bilhões de parâmetros oferece desempenho comparável ao seu modelo Mixture of Experts de 26B maior, ao mesmo tempo em que exige menos da metade da memória, e pode rodar em laptops de consumo com apenas 16GB de VRAM, incluindo dispositivos MacBook Air M5 de entrada.

A Gemma 4 12B é o primeiro modelo intermediário da série Gemma 4 a oferecer suporte nativo à entrada de áudio. O modelo traz uma arquitetura leve, sem encoders separados de visão e áudio, o que permite menor latência e redução no consumo de memória. Ele suporta raciocínio em múltiplas etapas, fluxos de trabalho de Agentes e inferência local totalmente offline. O modelo é lançado sob a licença Apache 2.0, com pesos pré-treinados disponíveis no Hugging Face e no Kaggle, e pode ser implantado via plataformas do Google Cloud, incluindo Model Garden, Cloud Run e GKE.

Isenção de responsabilidade: as informações nesta página podem ter origem em fontes terceiras e servem apenas como referência. Não representam as opiniões da Gate e não constituem orientação financeira, de investimentos ou jurídica. A negociação de ativos virtuais envolve alto risco. Não tome decisões baseando-se apenas nas informações desta página. Para mais detalhes, consulte a Isenção de responsabilidade.
Comentário
0/400
Sem comentários