Actualités de Gate News, le 3 avril, Google publie le modèle multimodal Gemma 4. Gemma 4 peut traiter des entrées textuelles et des images (les petits modèles prennent également en charge l’entrée audio) et générer des sorties textuelles. Cette version inclut des modèles de poids ouverts avec entraînement préalable et ajustement sur instructions. La fenêtre de contexte de Gemma 4 peut accueillir jusqu’à 256000 jetons et prend en charge plus de 140 langues. Gemma 4 adopte à la fois une architecture dense et une architecture de mélange d’experts (MoE), adaptée à des tâches telles que la génération de texte, le codage et le raisonnement. Ces modèles existent en quatre tailles différentes : E2B, E4B, 26B A4B et 31B, et peuvent être déployés dans divers environnements, allant des téléphones mobiles aux ordinateurs portables et aux serveurs.