Nova linhagem open source promete desempenho de ponta com custo menor
Google – A gigante de Mountain View acaba de disponibilizar globalmente o Gemma 4, família de modelos de IA aberta que alia raciocínio avançado, suporte multimodal e licença Apache 2.0, liberando uso comercial sem amarras.
- Em resumo: versão maior processa até 256 mil tokens e já é top-3 no ranking mundial de modelos abertos.
Desempenho de elite em quatro tamanhos estratégicos
São dois modelos enxutos – Effective 2B e Effective 4B – pensados para celulares e dispositivos edge, e dois robustos – 26B MoE e 31B Dense – destinados a cargas pesadas. O 26B, por exemplo, responde mais rápido ao acionar apenas 3,8 bilhões de parâmetros por interação, estratégia semelhante ao que o TechCrunch destaca nas discussões sobre eficiência de modelos abertos.
O modelo 31B aparece atualmente em 3º lugar no ranking global da Arena AI, enquanto o 26B ocupa a 6ª posição, superando arquiteturas até 20 vezes maiores.
Multimodalidade e janela de 256K: por que isso importa?
Toda a linha lê imagens e vídeos; as versões E2B e E4B também processam áudio, tornando-se candidatas naturais a transcrição de reuniões e recursos de acessibilidade. Com limite de 128K (edge) ou 256K (cloud), o Gemma 4 manuseia relatórios extensos, códigos ou contratos completos em um único prompt — capacidade rara fora de serviços fechados.
Licença Apache 2.0: liberdade que atrai o mercado
Ao adotar a licença permissiva, o Google facilita a integração com Vertex AI, GKE, Cloud Run e plataformas como Hugging Face, Kaggle e Ollama. Empresas que hesitavam em migrar para soluções open source – frente a rivais como GPT-4 o, Llama 3 e Claude 3 – agora ganham uma alternativa com suporte oficial, segurança corporativa e ecossistema Android preparado via Agent Mode, ML Kit GenAI e AICore.
O que você acha? O Gemma 4 consegue ameaçar a hegemonia dos modelos proprietários? Para acompanhar outras novidades em IA, acesse nossa editoria especializada.
Crédito da imagem: Divulgação / Google