LipNet : il y a maintenant une application qui peut lire sur les lèvres

Des scientifiques de l’université d’Oxford en Grande-Bretagne, de DeepMind de Google, et de l’institut canadien de recherche avancée viennent de dévoiler une application qui peut lire sur les lèvres, LipNet. LipNet est basée sur l’intelligence artificielle (IA), ce qui implique que cette application peut apprendre de ses propres erreurs, en les corrigeant pour devenir plus efficace.Elle est capable de déchiffrer les mots qui ont été prononcés en analysant les caractéristiques visuelles spatio-temporelles d’une personne s’exprimant sur une vidéo avec une précision de 93,4 %, bien meilleure que la précision moyenne des personnes malentendantes capables de lire sur les lèvres, qui est de 52,3 %.

Encore du travail…

Mais il y a une limite : cette précision est celle qui ressort lorsque l’on teste la machine sur un nombre restreint de phrases, dotées d’une structure identique, et de mots issus de champs lexicaux communs, soit un stock total de 64.000 combinaisons de phrases différentes.Pour le moment, L’objectif est de parvenir à terme à développer une gamme d’applications, dont des outils d’aide pour les personnes malentendantes, de dictée silencieuse dans les espaces publics, et de reconnaissance vocale dans des environnements bruyants.Cependant, il n’est pas nécessaire de s’inquiéter pour le moment : il faudra en effet beaucoup d’entraînement à LipNet avant qu’elle se montre capable de suivre une réelle perce conversation entre 2 personnes. Pour cela, elle devra intégrer de grandes quantités de données pour déchiffrer les différents accents, et les particularités des différentes langues et cultures.En 1968, le film « 2001, l’odyssée de l’espace » du réalisateur américain Stanley Kubrick suggérait déjà comment l’intelligence artificielle pourrait suivre les conversations de deux interlocuteurs, en dépit du fait que leur micro était éteint.

Plus