Une équipe de Microsoft Research spécialisée en intelligence artificielle annonce avoir accompli une avancée majeure en matière de reconnaissance vocale, en concevant un système capable de transcrire une conversation aussi bien qu'un professionnel humain. Les futurs assistants virtuels, mais aussi les robots, comprendront beaucoup mieux ce que nous leur disons.

© Metro-Goldwyn-Mayer/PolarisHAL 9000 (CARL 500 en version française) est un personnage de fiction, un supercalculateur doté d'intelligence artificielle qui apparaît pour la 1re fois dans 2001, l'Odyssée de l'espace de Stanley Kubrick (1968)
« Nous sommes en train de passer d'un monde où les gens doivent comprendre les ordinateurs à un monde dans lequel les ordinateurs doivent nous comprendre », explique Harry Shum, patron du groupe Microsoft Artificial Intelligence and Research. Cette inflexion, dont nous commençons à percevoir les prémices à travers les assistants virtuels de nos smartphones et les enceintes connectées type Amazon Echo, est en train de s'accomplir en partie sous l'effet de deux technologies intrinsèquement liées : l'intelligence artificielle (IA) et la reconnaissance vocale.
À ce propos, Microsoft affirme avoir réalisé une « performance historique » avec son système de reconnaissance vocale qui transcrit la parole conversationnelle aussi bien que des humains spécialisés dans cet exercice.Pour confirmer cette avancée, l'équipe d'Harry Shum a demandé à des transcripteurs professionnels de travailler à partir de la base de données Switchboard. Elle a été créée dans les années 1990 par le
National Institute of Standards and Technology (NIST) afin de servir de maître-étalon aux travaux sur la reconnaissance vocale. Switchboard contient des échantillons de conversations téléphoniques en anglais, espagnol et chinois mandarin qui ont l'avantage de recréer des conditions réelles où les gens peuvent parfois marmonner, bafouiller, tousser, s'éclaircir la voix...
Commentaire: Lire aussi :