mon espace personnel

tous les champs marqués d'un * sont obligatoires.


Entrez votre nom d'utilisateur et votre mot de passe pour vous identifier:

mot de passe oublié ?inscription

faire de la reconnaissance vocale un bien commun

mercredi 14 août 2019 à 09h31

La voix devient un outil de plus en plus central pour l’accès au numérique. Avec Common Voice, Mozilla veut rendre son utilisation ouverte à tous, et à toutes les langues.

  

Common Voice doit ainsi comporter des enregistrements les plus représentatifs possible, pour éviter les problèmes de discrimination trop courants dans le monde de l’intelligence artificielle (IA), développée en grande majorité par des hommes blancs. Résultat, toutes les IA de reconnaissance marchent mieux sur les hommes que sur les femmes, mieux sur les personnes blanches que sur les noires. Ce distributeur de savon automatique ne distingue pas les mains à la peau sombre, l’IA de reconnaissance faciale de Google classe la photo d’une personne afro-américaine dans la catégorie "gorille", un algorithme d’Amazon triait les C.V. et excluait quasi systématiquement les femmes… Les exemples sont nombreux. "Nous travaillons pour que personne ne soit exclu. Pour que nos données soient représentatives, il faut convaincre des individus de toutes les origines, de tous les âges et avec des accents de contribuer. Comme aux personnes en situation de handicap auxquelles on ne pense pas assez souvent", développe Alexandre Lissy. Le CHU de Rennes est par exemple intéressé par la technologie dans le cadre de la rééducation de patients victimes d’accidents graves, de la route ou des AVC, qui ont des difficultés à parler. Si elles contribuaient à Common Voice, cela permettrait d’entraîner l’intelligence artificielle à reconnaître ces voix, et donc de créer des commandes vocales adaptées aux personnes partiellement paralysées ou gravement blessées. 

 

un atout pour l’accessibilité à tous

 

Toutes ces heures d’enregistrement entraînent Deep Speech. Cette intelligence artificielle retranscrit à l’écrit ce qu’elle reconnaît. C’est une base, un support pour de nombreuses applications, d’autant que l’ensemble est libre de droits, mis à disposition de tous. Une entreprise française y contribue car elle veut l’intégrer dans un assistant personnel, respectueux des données de l’utilisateur. Elle pourrait permettre aussi à terme de piloter les navigateurs Internet à la voix, un atout pour l’accessibilité à tous, mais aussi pour les utilisateurs de casques de réalité virtuelle, qui rendent l’usage du clavier et de la souris laborieux. 

 

L’idée est de ne pas laisser les Amazon, Google et Apple, avec leurs Alexa, Assistant et Siri, les seuls maîtres à bord dans le domaine de la reconnaissance vocale. "Nous produisons une base de données de voix ouverte à tous, Common Voice, dans laquelle nous sommes sûrs qu’il n’y a aucun problème de vie privée ou de traçage possible. Mais aussi une intelligence artificielle, Deep Speech, qui fait de la reconnaissance vocale et qui est entraînée avec notre base de données", explique Alexandre Lissy, qui travaille sur le projet pour Mozilla. La voix est un outil de plus en plus central pour accéder à Internet. Pour lancer des recherches, pour communiquer avec des assistants vocaux… "Et si nous n’avons pas d’outil qui prend en charge la langue des utilisateurs, soit ils seront exclus, soit les dialectes vont peu à peu disparaître", assure l’ingénieur. Common Voice est ainsi libre et ouverte à contribution. Effet que Mozilla avait peu anticipé, d’importantes communautés très motivées se sont constituées autour de plusieurs langues locales menacées. Ainsi, la base de données contient plus d’heures de kabyle enregistrées que de français par exemple. D’autres communautés comme les Catalans, les Basques, les Bretons ou les Chinois de Taïwan viennent y sauver leur langue, pour en faire un bien commun, une mémoire en ligne. "Ils veulent que leur langue soit utilisable avec les outils du XXIe siècle, estime Alexandre Lissy. Qu’Internet soit ouvert à tous est au cœur de la mission Mozilla".  

 

mobiliser une communauté francophone

  

Il y a plusieurs moyens de contribuer à Common Voice (voice.mozilla.org/fr). Enregistrer sa voix en lisant les 5 phrases proposées et aussi valider les phrases des autres. Il faut constituer un corpus de texte, libre de droits, qui doit être le plus proche possible de ce qu’on utilise tous les jours. Mozilla a développé pour cela un petit outil qui s’appelle le collecteur de phrases. Phrases qui seront lues ensuite par les contributeurs. Pour les motivés au profil plus technique, Mozilla recherche aussi des gens aptes à aider Deep Speech à comprendre les abréviations françaises.

source : humanite.fr