Les spams font progresser l’Intelligence Artificielle

octobre 17, 2008

Depuis l’apparition des messages importuns, couramment dénommés "spams", on a assisté au développement d’outils automatiques de protection contre les réponses, tout aussi automatiques, aux inscriptions en ligne. Ces outils, dénommés "puzzles anti-spam" doivent devenir de plus en plus sophistiqués, ce qui incite les chercheurs à développer de nouveaux algorithmes.

Les maudits puzzles visuels que l’on doit remplir à chaque inscription sur un site ou lors de la mise en ligne d’un commentaire sur un blog sont la cible de diverses attaques. Les spammers et autres hackers ne sont pas les seuls à s’acharner à les corrompre, les chercheurs aussi, dans le but de développer des algorithmes plus intelligents et plus proches de la pensée humaine.

Le type de puzzles le plus courant est constitué d’une série de chiffres et de lettres déformés mais ne résiste plus aux derniers logiciels d’Intelligence Artificielle. Même les puzzles les plus récents s’appuyant sur des photographies viennent d’être défaits. Dénommés CAPTCHAs (Completely Automated Public Turing test to tell Computers and Humans Apart), ces puzzles ont été développés vers la fin des années 90 afin de distinguer les vrais utilisateurs des machines tentant de créer des comptes de courrier électronique pour envoyer des spams ou poster des liens commerciaux sur des forums. Le "test de Turing", proposé par le mathématicien Alan Turing en 1950, mesure la capacité d’un ordinateur à imiter la réflexion humaine.

Les CAPTCHAs textuels sont un bon moyen de différenciation entre humains et robots spammeurs car les lettres et chiffres déformés sont, la plupart du temps, facilement lus par les humains tandis que les ordinateurs peuvent avoir du mal à les déchiffrer. Les informaticiens voient cependant depuis quelques temps ces CAPTCHAs comme des défis d’Inteligence Artificielle intéressants et les concepteurs de CAPTCHAs textuels doivent introduire progressivement de plus en plus de distorsions pour berner les machines tout en préservant un équilibre entre sécurité et utilisabilité.

En début d’année a été présenté un programme capable de déchiffrer avec un taux de succès de 60% les CAPTCHAs utilisés pour sécuriser les services de courrier électronique d’Hotmail, MSN et Windows Live. Ce taux peut sembler faible mais un ordinateur peut opérer plusieurs milliers d’attaques par minute.

D’autres alternatives voient donc le jour régulièrement pour contrecarrer les robots décrypteurs. La combinaison de puzzles ou la reconnaissance d’objets sont ainsi apparus, mais rapidement les chercheurs en Intelligence Artificielle sont en mesure de mettre au point des programmes passant outre ces derniers obstacles. Philippe Golle, du centre de recherche de Palo Alto, vient ainsi de présenter un programme capable de réussir le test de reconnaissance d’image Asirra développé par Microsoft. Asirra demande à l’utilisateur de classer des images selon qu’elles contiennent des chiens ou des chats en utilisant une base de données de 3 millions d’images. Cette tâche devrait être plus compliquée pour un ordinateur que de reconnaitre des lettres mais le programme de M Golle identifie correctement les chats ou les chiens avec un taux de succès de 83%.

Malgré tous ces progrès, il n’est pas évident que les spammeurs utilisent des méthodes d’Intelligence Artificielle contre les CAPTCHAs. Les laboratoires de Websense Security rapportent en effet que nombre de spammeurs recourent à de la main d’oeuvre humaine bon marché pour résoudre les CAPTCHAs manuellement.

Source :

– Researchers Teach Computers To Recognize Objects In Images, 9 Octobre 2008 – https://www.informationweek.com/news/personal_tech/cameras/showArticle.jhtml?articleID=210800744
– Spammers Crack Microsoft’s CAPTCHA to Push Spam, 13 octobre 2008-10-15 – https://www.spamfighter.com/News-11090-Spammers-Crack-Microsofts-CAPTCHA-to-Push-Spam.htm
– How Spam is Improving AI, 14 octobre 2008 – https://www.technologyreview.com/web/21519/page2/

Rédacteur :

Franz Delpont [email protected]