Hey Google
Les technologies d'assistance vocale ont fait irruption dans nos vies depuis l'avènement de l'Internet des Objets (IdO) et se développent à une vitesse sans précédent. Mais, ce que beaucoup ignorent peut-être est que ce développement nécessite une atteinte à la politique de confidentialité des données que ces petits objets enregistrent. Google, Amazon, tout comme les autres entreprises qui développent des technologies d'assistance vocale estiment que pour assurer l'avancée de la technologie, les enregistrements audios des utilisateurs sont enregistrés et analysés par certains de leurs employés qu'ils appellent des experts en langue.

Cette semaine, un employé de Google, un employé parmi ceux que Google appelle des experts en langue, a permis au média belge VRT NWS d'avoir accès à plus d'un millier d'enregistrements vocaux enregistrés via l'assistant vocal Google Home des utilisateurs. Le média a ensuite réalisé une vidéo pour mettre en évidence la façon dont les données vocales et les transcriptions issues des enregistrements faits par l'assistant Google Home sont gérées. Mis à par ce fait, ce dernier a également laissé les journalistes de VRT NWS consulter le logiciel utilisé pour réviser ou analyser les enregistrements. Le rapport confirme ce que beaucoup de personnes savent déjà, mais n'y a-t-il pas de risque ?

VRT NWS a pu écouter plus de mille extraits enregistrés via Google Assistant. Dans ces enregistrements, le média estime avoir clairement pu entendre les adresses, ainsi que d'autres informations sensibles des utilisateurs. « Cela nous a facilité la tâche de trouver les personnes impliquées et de les confronter aux enregistrements audio », a déclaré le média. Bien sûr, Google, Amazon et Apple, avec son assistant vocal intelligent Siri, ont toujours insisté sur le fait « qu'ils ne sont pas intéressés par ce que vous dites, mais par la façon dont vous le dites ». Cependant, écouter les enregistrements est un rappel frappant du fait que tout ce que vous dites à un assistant vocal ou dans son voisinage est enregistré.

Selon les explications fournies à VRT NWS, Google sous-traite la tâche d'écoute à des professionnels externes. Ils se connectent à une partie sécurisée de l'outil contenant une liste des extraits audio à analyser. Environ trois sources auraient confirmé que c'est ainsi que Google fonctionne. La reconnaissance vocale génère automatiquement un script des enregistrements. Les employés doivent ensuite vérifier pour décrire l'extrait le plus fidèlement possible : s'agit-il d'une voix de femme, d'un homme ou d'un enfant ? Qu'est-ce qu'ils disent ? Ils écrivent et décrivent avec soin tout ce qu'ils entendent. Pour Google, ces descriptions améliorent constamment ses moteurs de recherche, ce qui entraîne de meilleures réactions aux commandes.

Savoir que des personnes travaillant pour Google écoutent indirectement de tels enregistrements soulève des questions sur la confidentialité. Le média belge a rapporté que pour éviter que des extraits soient automatiquement liés à un utilisateur, les employés qui sont chargés d'analyser les transcriptions sont déconnectés des informations de l'utilisateur. Ils suppriment le nom d'utilisateur et le remplacent par un numéro de série anonyme. Mais, d'après la vidéo qu'il a présentée, ce dernier estime qu'il n'est nul besoin d'être un spécialiste des fusées pour retrouver l'identité de quelqu'un. Il vous suffira d'écouter attentivement ce qui se dit, a-t-il expliqué.

De plus, rapporte-t-il, s'ils ne savent pas comment écrit, un mot, un extrait, un nom, etc., ces employés doivent rechercher chaque mot, adresse, nom personnel ou nom de société sur Google ou sur Facebook. De cette manière, ils découvrent souvent rapidement l'identité de la personne qui parle. Le média belge a indiqué qu'il a écouté « plus de mille extraits, dont 153 étaient des conversations qui n'auraient jamais dû être enregistrées et au cours desquelles la commande "OK Google" n'a clairement pas été donnée ». « Mais dès que quelqu'un dans le voisinage prononce un mot qui sonne un peu comme "OK Google", Google Home commence à enregistrer », a confirmé VRT NWS.

Cela signifie logiquement que de nombreuses conversations sont enregistrées de manière non intentionnelle. L'assistant a enregistré par exemple des conversations dans la chambre à coucher, des conversations entre parents et enfants, mais aussi des appels professionnels qui contiennent de nombreuses informations jugées confidentielles. Des enregistrements erronés peuvent également se produire lorsque quelqu'un appuie sur le mauvais bouton de son téléphone ou donne une commande par inadvertance. Ces informations sont enregistrées et stockées et risqueraient inévitablement d'être divulguées à des pirates informatiques, des gouvernements ou des organes de presse belges. Il arrive également des moments où les enregistrements concernent des agressions ou d'autres types de violence.

« L'une de nos trois sources indépendantes a déclaré qu'il avait dû décrire un enregistrement dans lequel il avait entendu une femme en détresse définitive », a indiqué VRT NWS. Que sont censés faire les employés avec ces informations ? Aucune directive claire n'a été spécifiée concernant de tels cas. C'est une question d'éthique importante. Selon le média, les employés reçoivent uniquement des instructions spécifiques concernant les numéros de compte et les mots de passe. Celles-ci sont marquées comme des informations sensibles. Google n'est cependant pas resté indifférent face à cette divulgation qu'il a qualifiée comme une faille de sécurité grave.

« Nous venons d'apprendre qu'un de ces réviseurs de langue a violé nos politiques de sécurité des données en divulguant des données audio néerlandaises confidentielles », a déclaré Google. Selon un porte-parole de l'entreprise, « ce travail est d'une importance cruciale pour développer des technologies permettant de maintenir des produits tels que Google Assistant ». D'après les indications de Google, seulement 0,2 % de tous les extraits audios sont examinés par ses experts en langue. Il a également ajouté que les extraits sonores ne sont pas associés aux comptes d'utilisateur dans le cadre du processus de révision. Les réviseurs ne doivent pas transcrire les conversations en arrière-plan ni d'autres bruits, mais uniquement les extraits qui sont dirigés vers Google.

Néanmoins, pour certaines personnes, ces objets, malgré leur utilité très précieuse, se révèlent de plus en plus comme étant le dispositif d'espionnage le plus sophistiqué jamais conçu. « Le gouvernement, le FBI, la NSA et les autres agences de renseignement dans les autres pays du monde ne se sont pas encore rendu compte du potentiel de surveillance énorme qu'offrent ces objets, ou ils le sont déjà et attendent de trouver la bonne stratégie pour l'exploiter. Ce qui est sûr, personne ne devra faire confiance à Google, Apple ou n'importe qui d'autre pour garantir sa sécurité et sa vie privée et la confidentialité de ses données si le gouvernement venait à réclamer les enregistrements vocaux de leurs assistants intelligents », ont-ils déclaré.

Sources : VRT NWS, Google