Deux informaticiens pensent être parvenus à identifier la langue du manuscrit de Voynich, un texte rédigé au XVe siècle et qui était jusqu'ici impénétrable. Pour cela, ils se sont aidés d'une série d'algorithmes et du service Google Traduction.

Depuis sa découverte au XXe siècle, de nombreux historiens et cryptographes se sont évertués, en vain, à déchiffrer le manuscrit de Voynich. C'est peut-être finalement une intelligence artificielle (IA) qui y est parvenue. Greg Kondrak et Bradley Hauer, deux chercheurs en informatique et spécialistes en traitement du langage naturel de l'université de l'Alberta (Canada), ont créé une série d'algorithmes grâce à laquelle ils ont pu analyser cet alphabet inconnu et identifier la langue utilisée.

Le manuscrit de Voynich est un codex du XVe siècle. Long de 240 pages manuscrites, il est accompagné de dessins de plantes, de nus et d'observations astronomiques. À ce jour, il est considéré comme le plus important cryptogramme non résolu. Toutes sortes d'hypothèses ont été émises quant à la langue d'origine du texte : latin, italien, arabe coranique, moldave, thaï, pinyin. Pour sa part, l'équipe de l'université de l'Alberta penchait au départ pour l'arabe.

Voynich manual
© DPPlusieurs analyses du manuscrit de Voynich ont penché pour un guide botanique. L’analyse pratiquée à l’aide de l’intelligence artificielle a amené les chercheurs à confirmer cette hypothèse.

80 % des mots figurent dans un dictionnaire hébreu

Pour vérifier leur théorie, les chercheurs ont entraîné leurs algorithmes en se servant d'échantillons du texte de la « Déclaration universelle des droits de l'Homme » dans 380 langues différentes. Et, contre toute attente, la machine a estimé que le manuscrit de Voynich avait été rédigé en hébreu. Les chercheurs se sont ensuite employés à tenter de traduire ce texte. Pour ce faire, ils sont partis de l'hypothèse de base que le cryptage reposait sur des alphagrammes, technique qui consiste à réorganiser les lettres d'un mot dans l'ordre alphabétique pour former des anagrammes. Ils ont alors conçu un algorithme capable de déchiffrer les mots.

« Il s'est avéré que plus de 80 % des mots existaient dans un dictionnaire hébreu, mais nous ne savions pas si, pris ensemble, ils avaient un sens. » Greg Kondrak et Bradley Hauer se sont tournés vers un confrère parlant hébreu pour savoir si la première phrase du texte traduite avec cet idiome était cohérente. Réponse négative. Les chercheurs ont alors tenté de convertir la phrase hébreu en anglais en se servant tout simplement du service Google Traduction. Et là, ils ont obtenu quelque chose...

Le manuscrit de Voynich serait un guide botanique

Dans la langue de Shakespeare, la première phrase du manuscrit dirait : « She made recommendations to the priest, man of the house and me and people ». Traduite en français, cela signifie : « Elle a fait des recommandations au prêtre, à l'homme de la maison, à moi et aux gens ». Une phrase d'introduction bien curieuse, a lui-même admis le professeur Kondrak. Ce dernier estime que seule la contribution d'historiens spécialisés en hébreu ancien pourrait aider à une interprétation plus cohérente de ces traductions étant donné la syntaxe atypique qui a été employée.

Bref, pour le moment, le manuscrit de Voynich garde encore son mystère. Cependant, les chercheurs concluent leur article scientifique paru dans Transactions of the Association for Computational Linguistics en soutenant que le texte est probablement de l'hébreu avec les lettres réarrangées pour suivre un ordre fixe. L'étude a révélé plusieurs mots pris individuellement signifiant « fermier », « air », « lumière », « feu ». Les auteurs estiment que cela conforte l'hypothèse déjà émise plusieurs fois que le manuscrit de Voynich serait en fait un guide botanique. Forts de cette première expérience, ils comptent continuer à affiner leur algorithme et l'appliquer à d'autres manuscrits anciens.

Voynich manual p68
© Beinecke Rare Book & Manuscript Library, Yale University, Wikimedia CommonsLa page 68 du manuscrit de Voynich.