Hibiki par Kyutai : une innovation majeure dans le domaine de la traduction vocale instantanée

0
263

Kyutai, un laboratoire à but non lucratif spécialisé dans la recherche ouverte en intelligence artificielle, a récemment présenté Hibiki, une solution de traduction vocale innovante. Nommé d’après le mot japonais signifiant « écho », Hibiki permet une traduction simultanée tout en conservant la voix originale de l’interlocuteur et en ajustant intelligemment le rythme pour correspondre au sens du discours. Cette technologie génère en temps réel une traduction orale et écrite dans la langue souhaitée.

Actuellement entraîné pour traduire du français vers l’anglais, Hibiki surpasse les technologies existantes en termes de précision, de préservation des caractéristiques vocales et de fluidité. Grâce à son processus d’inférence simplifié, il peut être déployé efficacement dans le cloud pour des traductions groupées, mais aussi utilisé en temps réel sur des appareils mobiles.

Moins de six mois après le lancement de Moshi, son modèle d’IA conversationnelle full duplex (permettant des échanges fluides sans alternance imposée), Kyutai rend désormais Hibiki accessible à tous. Les codes d’inférence, les poids du modèle français-anglais et un rapport technique sont partagés publiquement, permettant aux chercheurs et à la communauté IA d’intégrer cette technologie dans leurs projets et de l’adapter à d’autres langues. Cette avancée marque une étape clé dans le domaine des technologies vocales, offrant de nouvelles perspectives en matière de communication et d’accessibilité.

Patrick Perez, Directeur général de Kyutai, a officiellement présenté Hibiki lors d’une conférence scientifique internationale organisée à l’Institut Polytechnique de Paris dans le cadre de la Semaine pour l’Action sur l’Intelligence Artificielle.

Avec Hibiki, tout comme avec Moshi précédemment, Kyutai continue de repousser les limites de l’IA multimodale, contribuant ainsi à des avancées bénéfiques pour la société.

Pour plus d’informations, consultez le communiqué de presse en PDF sur : https://kyutai.org/

À propos de Kyutai

Fondé en novembre 2023 par le Groupe iliad, CMA CGM et Schmidt Sciences, Kyutai est un laboratoire à but non lucratif dédié à la recherche ouverte en intelligence artificielle. Dirigé par des scientifiques de renommée mondiale, Kyutai explore les frontières de l’IA tout en partageant ses découvertes avec la communauté et en formant de jeunes talents. Spécialisé dans la multimodalité et l’efficacité, Kyutai s’est fait remarquer avec Moshi, une IA conversationnelle full duplex développée en seulement six mois par une équipe de huit personnes. Kyutai a également récemment lancé Helium-1, un modèle de traitement de texte multilingue performant, optimisé pour les appareils mobiles. Unique en son genre dans l’écosystème européen, Kyutai s’engage à développer une recherche de pointe en IA au service de l’intérêt général.