Meta redéfinit la traduction instantanée
Meta a présenté SeamlessM4T, un modèle d’IA qui traduit la parole en 101 langues. Ce modèle représente une avancée vers une interprétation simultanée en temps réel, où les mots sont traduits dès qu'ils sont prononcés.
Contrairement aux systèmes traditionnels qui passent par plusieurs étapes (parole au texte, traduction du texte, puis texte à la parole), SeamlessM4T traduit directement la parole d’une langue en une parole dans une autre, limitant ainsi les erreurs et les pertes d’efficacité.
L'innovation repose sur une technique appelée exploration de données parallèles qui associe des fichiers audio à leurs sous-titres dans d’autres langues, permettant au modèle de s’entraîner sur une vaste gamme de données multilingues. Ainsi, SeamlessM4T est 23% plus précis que les modèles actuels les plus performants et prend en charge plus de langues pour les traductions directes que Google AudioPaLM, qui se limite aux traductions vers l’anglais.
En tant que modèle open-source, il invite à la collaboration et à l’amélioration continue. Toutefois, des experts notent que d’autres solutions, comme celles de Google, sont souvent plus rapides et réactives.
Par ailleurs, SeamlessM4T reste confronté à des défis pour les langues moins courantes en raison du manque de données disponibles. Pour pallier ce problème, il a été pré-entraîné sur des millions d’heures d’audio multilingue, ce qui améliore sa capacité à gérer ces langues sous-représentées.
SeamlessM4T représente un grand pas vers la traduction instantanée. Bien qu’il ne soit pas encore simultané, Meta assure travailler sur des versions plus rapides, comparables à la vitesse des interprètes humains, ouvrant la voie à un futur proche où les barrières linguistiques pourraient disparaître.
Quel avenir pour les interprètes ?
Bien que ces avancées technologiques promettent de faciliter la communication à l'échelle mondiale, l’expertise humaine reste indispensable dans des domaines complexes et sensibles, tels que la diplomatie, le droit ou la médecine, où les nuances culturelles et contextuelles sont cruciales. Cependant, dans d’autres secteurs, ces compétences pourraient progressivement céder la place à des solutions automatisées.
Cette évolution pourrait redéfinir profondément le métier d'interprète à l’ère de l’IA.
Source : MIT Technology Review