Ouvrir le menu principal

MacGeneration

Recherche

Translatotron : Google cherche à garder l'intonation et la voix du locuteur dans les traductions vocales

Stéphane Moussie

jeudi 16 mai 2019 à 11:24 • 7

Logiciels

Les ingénieurs de Google travaillent sur un tout nouveau système de traduction vocale pouvant notamment mieux conserver l’intonation du locuteur.

La traduction vocale fonctionne généralement en trois étapes, expliquent Ye Jia et Ron Weiss sur le blog Google AI. Premièrement, le système transcrit la parole en texte. Deuxièmement, ce texte est traduit dans la langue désirée. Et troisièmement, le texte traduit est prononcé par une synthèse vocale.

Ce système fragmenté, à l’œuvre dans Google Traduction par exemple, fonctionne globalement bien, mais il y a matière à faire mieux, estiment les ingénieurs qui expérimentent un nouveau mécanisme.

Architecture du Translatotron

Le Translatotron, le nom de leur nouveau système, fait l’impasse sur l’étape de conversion de la parole en texte. En traduisant plus directement les paroles, le Translatotron est censé offrir plusieurs avantages : plus de vitesse, pas d’erreur possible entre la reconnaissance et la traduction, une meilleure gestion des mots qui n’ont pas besoin d’être traduits (comme les noms propres) et la conservation de l’intonation.

Source (en espagnol)
Traduction avec le système traditionnel
Traduction avec le Translatotron

Pour l’heure, le Translatotron donne de moins bons résultats que la méthode traditionnelle en ce qui concerne la fidélité de la traduction. Mais il se démarque d’ores et déjà en matière de reproduction de l’intonation.

Google veut même aller plus loin en conservant la voix du locuteur. Imaginez un peu : c’est comme si c’était vous qui parliez chinois ou néerlandais. Des échantillons d’essais entre l’espagnol et l’anglais sont disponibles sur cette page. Les résultats ne sont pas très probants pour le moment pour la conservation de la voix, mais le Translatotron est toujours en plein développement.

Rejoignez le Club iGen

Soutenez le travail d'une rédaction indépendante.

Rejoignez la plus grande communauté Apple francophone !

S'abonner

Tim Cook envoie ses félicitations à Donald Trump pour son nouveau mandat

06/11/2024 à 22:00

• 17


Plus de 1 000 soutiens pour notre campagne de sociofinancement, et si on allait jusqu’à 100 000 € ?

06/11/2024 à 20:40

• 40


Sherlocking des apps : jusqu'où peut aller Apple avant d'aller trop loin ?

06/11/2024 à 20:30

• 10


macOS 15.2 Public beta disponible pour tous

06/11/2024 à 20:15

• 2


Apple devrait vraiment prendre en charge le MTP en USB, qui est (encore) cassé avec la Nintendo Switch

06/11/2024 à 18:50

• 6


Retroactive ne portera pas Aperture ni iTunes sur macOS Sequoia

06/11/2024 à 18:00

• 11


Magic Mouse ou Magic Trackpad assorti à l’iMac M4, il faut choisir

06/11/2024 à 15:45

• 34


iPhone 16 Pro : pour 568 $ de composants, 6 % de plus que pour l’iPhone 15 Pro

06/11/2024 à 14:08


IA : Apple voudrait l’expertise de Foxconn pour son infrastructure serveur

06/11/2024 à 11:45

• 42


Microsoft Office pour Mac est à prix cassé chez Godeal24 ! 📍

06/11/2024 à 09:33


L'écran des Raspberry Pi passe au 720p, c'est le futur

06/11/2024 à 09:00

• 11


Refurb : jusqu'à -370 € sur l'Apple Studio Display 5K avec pied ou VESA 🆕

06/11/2024 à 06:57

• 35


Nouvelle vague de licenciement chez Mozilla, qui remercie 30 % de son personnel

05/11/2024 à 22:00

• 44


Intel pourrait (encore) abandonner ses cartes graphiques

05/11/2024 à 21:30

• 17


Apple prévient les investisseurs que ses futurs produits pourraient ne pas être aussi rentables que l'iPhone

05/11/2024 à 21:00

• 52


Mais qu’est-ce qu’Apple va donc faire de Pixelmator ?

05/11/2024 à 20:30

• 9