Illustration
Reconnaissance faciale pour iPhone. YouTube

[UPMC - 27 avril 2016] Usages et mésusages de la reconnaissance faciale

La reconnaissance des visages, celles de terroristes, par exemple, serait une technologie mature. Vraiment ? Malgré les progrès de l’intelligence artificielle, il suffit de se grimer pour y échapper.

La faculté que nous avons de reconnaître les visages et les voix a quelque chose de magique : même après de nombreuses années d’absence, nous identifions spontanément une personne que nous croisons dans la rue ou qui nous appelle au téléphone. Bien sûr, si elle s’est laissée pousser la barbe ou les cheveux et qu’elle a décidé de changer la couleur de ses yeux, ou qu’elle nous appelle l’hiver avec une voix enrouée, nous aurons plus de difficultés… Et, à l’inverse, il nous est arrivé à tous de croire reconnaître une personne et de nous tromper. Mais ces situations apparaissent somme toute assez rares.

Aujourd’hui, avec des techniques d’intelligence artificielle, on parvient à construire des machines en mesure de reconnaître automatiquement les visages avec des performances quasiment équivalentes aux nôtres. Il n’en fallait pas plus pour que le maire de Nice décide d’installer des portails de reconnaissance faciale dans sa ville afin d’assurer la sécurité de ses concitoyens pendant la tenue de l’Euro2016, puis, si l’expérience s’avérait concluante, d’étendre en permanence cette surveillance à tout l’espace urbain.

La télévision et la radio en ont fait état tout dernièrement, information abondamment reprise dans tous les médias. Or, s’il existe déjà de nombreuses utilisations de la reconnaissance faciale, par exemple dans les aéroports ou sur les réseaux sociaux, un certain nombre d’obstacles, d’ordre à la fois technique et juridique, s’opposent à ce que l’on identifie automatiquement dans une foule des personnes reconnues comme étant des terroristes, surtout lors d’un événement festif.

Performance des algorithmes

Les algorithmes de reconnaissance des visages reposent sur un traitement automatique des images qui détecte des zones de discontinuité (bouches, yeux, cheveux, etc.), puis qui repère des points d’intérêt (commissures des lèvres, narines, extrémités des yeux et des sourcils, etc.). Ensuite, partant de ces points d’intérêt, des logiciels d’apprentissage machine entraînés sur un grand nombre d’images de visages identifient des individus répertoriés. Plus il existe de points d’intérêt, et plus on utilise d’images pour entraîner le système, plus la reconnaissance est fiable.

Logiciel de reconnaissance visuelle sur visage. Mbroemme5783/Wikimédia, CC BY-SA

Or, aujourd’hui, les techniques d’apprentissage utilisant des réseaux de neurones formels (ce que l’on appelle leDeep Learning – l’apprentissage profond) permettent de traiter des centaines de millions d’images contenant chacune de très nombreux points d’intérêt par image (plus de mille). Cela explique les performances époustouflantes qu’obtiennent des sociétés spécialisées comme DeepFace (Facebook), FaceNet (Google), FaceFirst, Face-Six, etc. Ainsi, DeepFace annonçait, il y a plus de six mois, un taux de reconnaissance correct de 97,25 %, presque équivalent au nôtre, et FaceNet prétendait même obtenir 99,63 % !

Dès à présent, nombre d’applications recourent à ces techniques : déblocage des téléphones, vérification de l’identité au passage à la douane dans les aéroports ou sur les comptes Internet, annotation des photographies, contrôle à l’entrée des casinos, etc.

Limites juridiques

Cependant, pour reconnaître une personne, il faut qu’une ou plusieurs images de son visage aient été préalablement enregistrées. Les réseaux sociaux comme Facebook et les sites de gestion de photographies comme iPhoto pour Apple, ou Flickr, possèdent ces images en quantité ; ils se trouvent donc en situation stratégique privilégiée pour mettre en œuvre les applications susmentionnées de la reconnaissance faciale, dont en particulier les applications policières, ce qui ne manque pas de susciter un certain malaise.

Qui plus est, les législations sur l’image en vigueur dans les différents pays s’opposent, plus ou moins, à la mise en œuvre d’applications de surveillance et de lutte contre le terrorisme. Ainsi, en Europe, certains pays comme la Norvège interdisent toute prise de vue qui ne reçoit pas le consentement explicite de la personne photographiée. Et, pour l’instant, en France, l’administration n’a pas le droit de transmettre les fichiers d’images de personnes fichées. Bref, si un terroriste n’a pas eu l’idée saugrenue de mettre sa photo sur Facebook, il est impossible de l’utiliser pour la sécurité publique… Quant aux États-Unis, s’il n’existe pas de loi fédérale qui mentionne explicitement l’utilisation de la reconnaissance faciale, il y a des lois dans certains États, comme l’Illinois et le Texas, qui s’opposent à ce que l’on utilise des technologies pour identifier les individus sans avoir préalablement reçu leur consentement éclairé.

Limites techniques

Indépendamment de ces obstacles d’ordre juridique, il existe des limitations techniques qui rendent inefficace l’utilisation massive des techniques de reconnaissance faciale pour assurer la sécurité à l’échelle d’une ville. En effet, si l’on reconnaît bien un visage de face, avec de bonnes conditions d’éclairage, il apparaît beaucoup plus difficile de l’identifier de trois quarts ou de profil avec un mauvais éclairage. En conséquence, l’identification d’individus sur des clichés de foules, par exemple sur la voie publique, demeure très délicate. D’ailleurs, les travaux du FBI, sur des clichés de qualité bien inférieure à celle des images des réseaux sociaux, font état de performance beaucoup moins bonne (environ 85 % de reconnaissance correcte).

Un logiciel sera-t-il capable de reconnaître cette reine des fleurs au Carnaval de Nice ? Zil/Wikimédia, CC BY-SA

Qui plus est, si une personne porte une perruque, une fausse barbe, des lunettes foncées et qu’elle se grime, il devient quasiment impossible de la reconnaître. Aux États unis, un mouvement appelé CV Dazzle explique comment dérouter les logiciels de reconnaissance faciale avec un peu de maquillage. À cet égard, comment imaginer que dans un événement festif comme l’Euro 2016, la mairie de Nice empêche les supporters de se peinturlurer le visage aux couleurs de leur équipe favorite et de faire ainsi échec à l’identification automatique ? Rappelons que, très récemment, aucun logiciel ne permit de faire automatiquement le rapprochement entre l’homme au chapeau filmé à l’aéroport de Bruxelles le 22 mars 2016 et les images de Mohamed Abrini prises en novembre 2015, juste avant les attentats de Paris.

En résumé, les logiciels de reconnaissance de visage qui étaient supposés assurer la sécurité de la population permettront de suivre tous ceux dont les images sont répertoriées sur les réseaux sociaux, mais pas les individus fichés, pour des raisons légales. De plus, ceux qui veulent vraiment passer inaperçus feront échouer les systèmes de reconnaissance en se grimant, tandis que les autres seront suivis à la trace…

The Conversation

Jean-Gabriel Ganascia, Professeur, Intelligence Artificielle, Sciences Cognitives, Université Pierre et Marie Curie (UPMC) – Sorbonne Universités

La version originale de cet article a été publiée sur The Conversation.