WEB

Gemma 4 : Google lance ses modèles d’IA open source basés sur Gemini 3

Gemma 4 Logo.jpg

Google présent Gemma 4 est sa famille de modèles d’IA ouverte la plus intelligente à ce jour, basée sur les mêmes recherches que Gemini 3. La société met également en avant la dynamique déjà acquise avec plus de 400 millions de téléchargements depuis la première génération et plus de 100 000 variantes créées par la communauté.

Logo Gemma 4

Gemma 4 est disponible en quatre formats, avec les versions Effective 2B, Effective 4B, 26B Mixture of Experts et 31B Dense. Google affirme que les modèles plus grands atteignent une référence dans leur catégorie, le 31B étant classé troisième au monde dans le classement textuel d’Arena AI et le 26B à la sixième place. Le groupe affirme même que Gemma 4 surpasse dans ce domaine des modèles jusqu’à 20 fois plus grands.

Google cible d’abord l’IA locale avec Gemma 4

L’un des choix les plus remarquables de Gemma 4 est son positionnement. Google affirme qu’il fait évoluer ces modèles afin qu’ils puissent fonctionner et évoluer efficacement sur les appareils Android, les puces graphiques d’ordinateurs portables (GPU), les postes de travail des développeurs et des accélérateurs plus puissants.

Les deux petits modèles, E2B et E4B, concentrent cette stratégie. Google les présente comme des modèles multimodaux optimisés pour une faible latence et une efficacité de mémoire, avec une exécution entièrement hors ligne sur les téléphones, les Raspberry Pi, les machines Nvidia et les Jetson Orin Nanos. Android peut déjà servir de terrain d’essai pour ces usages via l’AICore Developer Preview, conçu pour préparer la compatibilité avec Gemini Nano 4.

Les modèles plus lourds ciblent un autre public. Le mélange d’experts 26B donne la priorité à la vitesse en activant uniquement 3,8 milliards de paramètres lors de l’inférence, tandis que le 31B Dense est présenté comme la base la plus solide pour le réglage fin et la qualité brute. Google précise également que les poids bfloat 16 non quantifiés tiennent sur un seul GPU Nvidia H100 de 80 Go.

Un modèle ouvert, mais pensé pour les agents

Google ne présente pas Gemma 4 comme un simple concurrent de chatbot IA. La société met l’accent sur le raisonnement avancé, la planification en plusieurs étapes, la génération de code hors ligne et les flux agents. La famille de modèles prend en charge de manière native les appels de fonctions, la sortie JSON structurée et les instructions système, trois éléments de base pour créer des agents capables d’interagir avec des outils et des API.

Références Gemma 4

Gemma 4 étend également sa portée multimodale. Tous les modèles traitent nativement les images et la vidéo, avec des performances mises en avant en termes d’OCR et de compréhension graphique, tandis que les versions E2B et E4B ajoutent une entrée audio native pour la reconnaissance et la compréhension vocales. Google ajoute une fenêtre contextuelle de 128 000 jetons pour les modèles Edge et jusqu’à 256 000 jetons pour les modèles plus grands.

De plus, Google publie Gemma 4 sous licence Apache 2.0, mettant l’accent sur la flexibilité commerciale, le contrôle total sur les données, l’infrastructure et les modèles, ainsi que le déploiement possible sur site ou dans le cloud. Cette ouverture s’accompagne d’une promesse de sécurité, le groupe affirmant appliquer les mêmes protocoles rigoureux à Gemma 4 que pour ses modèles propriétaires.

Enfin, Google verrouille l’écosystème dès le lancement. Gemma 4 est disponible dans Google AI Studio, Google AI Edge Gallery, Hugging Face, Kaggle ou Ollama, avec une compatibilité annoncée d’emblée avec des outils comme Transformers, vLLM, llama.cpp, MLX, Keras, Docker ou Nvidia NIM.

Shares:

Related Posts