Google lance officiellement Transcription instantanée son outil de retranscription textuelle en direct de conversations, qui se présente pour le moment sous la forme d’une app Android nommée Transcription instantanée. Avec celle-ci, il est possible d’obtenir, sur son smartphone, une retranscription textuelle immédiate de ce que dit un interlocuteur.

La technologie a mobilisé une équipe d’ingénieurs Google qui a du faire face à des impératifs contradictoires : améliorer la qualité de reconnaissance, tout en minimisant le volume de données « consommées » de et vers l’internet. D’un côté, l’envoi de données à des serveurs distants Google permet d’améliorer la reconnaissance, en utilisant la puissance de calcul de l’AI Google, de l’autre il faut éviter d’envoyer des Mo de données sur le réseau cellulaire.

Pour parvenir à un bon équilibre, Transcription instantanée s’appuie sur un réseau de neurones local (installé sur le smartphone) pour la détection de la parole, réseau qui fonctionne sur le principe d’un réseau image (pour détecter les longueurs d’onde de la parole), et sur l’envoi des données filtrées à un moteur ASR (Automatic Speech Recognition) distant de Google. Le tandem logiciel comprend 70 langues, couvrant, estime Google, 80 % de la population mondiale. La qualité de reconnaissance semble excellente.

Un dernier écueil peut venir troubler les choses : le niveau de bruit dans lequel se déroule la conversation, problème connu par Google comme le « problème des soirées cocktail ». Aucune solution miracle n’est de la partie, il faut toujours s’assurer que le niveau de la voix à reconnaitre soit suffisant pour bien couvrir le bruit environnant. Les ingénieurs de Google se sont contentés d’afficher un indicateur de volume de reconnaissance pour aider à contrôler ce paramètre.

AUCUN COMMENTAIRE

À vous la parole !

Fermer
*
*

Ce site utilise Akismet pour réduire les indésirables. En savoir plus sur comment les données de vos commentaires sont utilisées.