Gemini 3.5 Live Translate : Google dévoile sa traduction améliorée en temps réel

Google fait un pas en avant à la traduction en temps réel avec Gemini 3.5 Live Translate, un modèle conçu pour parler pendant que l’échange se poursuit au lieu d’attendre la fin de chaque phrase. L’ambition est simple : réduire le sentiment d’interruption qui accompagne encore la plupart des outils de traduction vocale.

Google Traduction

Gemini 3.5 Live Translate fait ses débuts

Le plus gros changement est la cadence. Là où les systèmes au tour par tour laissent un écart entre le discours original et la réponse traduite, Gemini 3.5 Live Translate produit une voix continue qui ne reste que quelques secondes derrière l’orateur. Google cherche ainsi à entretenir le fil d’une conversation plutôt que de juxtaposer des blocs successifs de traduction.

Cette continuité ne repose pas uniquement sur la rapidité. Le modèle promet également de préserver l’intonation, le rythme et la hauteur, ce qui vise à rendre la traduction moins mécanique et plus proche de la parole réelle. La difficulté consiste à arbitrer entre deux exigences contraires : attendre suffisamment longtemps pour comprendre le contexte, mais pas au point de rompre la synchronisation avec celui qui parle.

Gemini 3.5 Live Translate arrive sur Google Translate sur Android et iOS, avec un accès direct via le bouton « Live Translate ». Google cible donc d’abord les situations très simples, celles où deux personnes souhaitent se comprendre sans passer par une séquence lourde et fragmentée.

Sur Android, le nouveau « Mode écoute » va dans le même sens. Il permet d’écouter la traduction dans l’écouteur du téléphone, comme lors d’un appel traditionnel, lorsqu’on n’a pas d’écouteurs sous la main. Ce détail est important car il réduit les frottements de matière qui limitent souvent ce type d’outil dans un usage quotidien.

Google étend également ce modèle à Google Meet. La traduction vocale de l’application d’appel vidéo était auparavant limitée à cinq langues. Avec Gemini 3.5 Live Translate, Google met en avant plus de 70 langues et plus de 2 000 combinaisons de langues possibles dans une même réunion, alors que l’opération précédente utilisait uniquement l’anglais.

L’arrivée dans Google Meet donne à cette annonce une portée plus large que la simple traduction mobile. Google ne cible plus uniquement les voyages, les échanges occasionnels ou les conversations impromptues. Le groupe apporte désormais la traduction vocale en visioconférence avec un bouton dédié sur le web pour lancer immédiatement la fonction.

Une traduction moins saccadée est bien plus précieuse dans une réunion que dans une seule phrase, car elle peut changer la façon dont les équipes multilingues communiquent en direct. La prise en charge de milliers de combinaisons éloigne également l’outil d’un modèle centré sur l’anglais, ce qui élargit considérablement les cas d’utilisation internationaux.

Déploiement progressif et audio traçable

Google maintient cependant un calendrier à plusieurs niveaux. Gemini 3.5 Live Translate commence à être déployé sur Google Translate sur mobile, puis arrive en avant-première privée ce mois-ci pour certains clients professionnels de Google Workspace avant un déploiement plus large plus tard cette année. Les développeurs peuvent également y accéder en préversion publique via l’API Gemini Live et Google AI Studio.

Google ajoute enfin une garantie sur la traçabilité du son produit. Tout l’audio généré par le modèle reçoit un marquage SynthID imperceptiblement intégré dans la sortie vocale. Google cherche ainsi à accompagner la montée des voix synthétiques en conservant un moyen de les identifier, en gardant à l’esprit les risques de manipulation et de désinformation.