France : une parole de synthèse, en temps réel, pour donner de la voix, aux personnes muettes

par | 11 Juin 2023

Lèvres

Non, nous ne vous invitons pas dans un film de science-fiction, dont Star Trek serait la meilleure illustration, concernant notre sujet, qui inaugure les balbutiements, d’un outil inédit, que l’on pourrait qualifier de « synthétiseur vocal ». Son objectif, principal et ambitieux, est de redonner enfin une voix, que l’on croyait à jamais perdue, à destination des muets, premier pas peut-être vers un traducteur universel, de surcroît.

Lèvres

Cet appareil est, nous devons le souligner, le fruit d’un travail scientifique et abouti, issu des cerveaux  géniaux de chercheurs du CNRS. Toute leur démarche est expliquée avec clarté, par un communiqué, qui émane de leur part, et qui mérite un regard, des plus attentifs.

Un système de décodeur-traducteur reposant sur des capteurs localisés à des endroits associés à l’usage de la parole perdue : le tout octroie une vraie parole de synthèse instantanée bienvenue

La démarche paraît, des plus simples, pour une parvenir à une véritable parole de synthèse. Tout commence par la pose, avec minutie, de capteurs, à des endroits appropriés : sur la langue, les lèvres et la mâchoire du sujet. Ses mouvements, d’un type articulatoire, inaudibles dans un premier temps, sont ensuite décodés et convertis, pour accoucher d’une véritable parole de synthèse. Tout repose sur un algorithme d’apprentissage, qui relève de l’intelligence artificielle (les anglophones évoquent spécifiquement le « deep learning »). Il lui permet de relever le principal défi, qui lui incombe : être le traducteur approprié, commis d’office, et encensé pour ses qualités ad hoc, dans ce champ très précis, de la recherche ou la reconstitution de ce trésor, qu’est la parole.

Un projet abouti, mais également une première étape vers un outil, permettant au cerveau d’agir directement sur la parole, en évitant une lecture des lèvres et l’usage des capteurs si contraignants

De précédents systèmes de conversion, reposant aussi sur un type d’articulation silencieuse, sont dépassés par ce nouveau synthétiseur, qui est pourvu d’avantages qui ne sont propres qu’en ce qui le concerne : il fonctionne « en temps réel, sans restriction sur le vocabulaire et sur n’importe quel locuteur, après une courte période de calibration », s’auto-congratulent l’ensemble des chercheurs. Mieux encore, il constituerait, la première étape, actuellement en gestation, d’une incroyable interface cerveau-machine, qui se passerait de tout cet attirail, quelque peu encombrant, et inesthétique au possible, d’outil spécifique de détecteur-traducteur labial. Il est possible, d’en savoir plus sur ce projet, dans la revue PLOS Computational Biology.

Lèvres, Pixabay
TAGs :

Rédigé par Jade Bernard

La rédaction, c'est la vie ! J'adore les mots, je partage mon avis avec passion !

Vous pourriez aimer ces contenus

0 commentaires

Soumettre un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *

Pin It on Pinterest

Share This