Pourquoi ne pas tirer profit des mécanismes anti-spam de type CAPTCHA largement utilisés sur les blogs et sur de nombreux sites Internet pour faire effectuer à des humains des tâches jugées complexes pour des machines ? Cette simple constatation est à l’origine du projet "Soylent Grid" développé à l’University of California, San Diego (UCSD) par une équipe franco-américaine et financé par Calit2 (California Institute for Telecommunications and Information Technology). Ces travaux ont été présentés lors d’ICCV 2007 (International Conference on Computer Vision) de l’IEEE à Rio de Janeiro ce mois-ci.
A l’instar du mécanisme de reconnaissance de caractères reCAPTCHA (voir "Quand les filtres anti-spam améliorent les logiciels d’OCR", BE Etats-Unis 81), Soylent Grid s’appuie sur une double validation d’un jeu de données graphiques par des utilisateurs dans le but d’enrichir une base de connaissances. L’originalité du système d’UCSD réside dans la variété des puzzles qui sont proposés aux internautes : déchiffrage d’un texte, identification des occurrences d’un même type d’objet dans une image, définition de contours et appréciation de la qualité esthétique d’un sujet présenté. Le résultat de la première partie à déchiffrer est connu et sert à vérifier qu’un robot n’essaie pas de casser le système, alors que la réponse donnée dans la deuxième partie va venir enrichir une base de données. Dès qu’un certain nombre d’utilisateurs convergent vers la même solution, l’information peut être considérée comme valide.
Soylent Grid a trouvé sa première application dans le projet Grozi de Columbia University : un outil d’assistance à l’achat en supermarché pour les personnes malvoyantes. Actuellement, les articles qui ne sont pas reconnus automatiquement par Grozi doivent être traités manuellement par l’équipe de recherche. La participation de milliers d’internautes doit permettre d’accélérer significativement le temps de traitement des images actuellement illisibles par un ordinateur. Les chercheurs envisagent également de tirer partie de l’association Grozi-Soylent Grid pour traiter en quasi temps-réel les informations en provenance de personnes appareillées.
Cependant, comme pour tout système réparti de ce type, la qualité des résultats est étroitement liée à l’adoption massive ou non par les plates-formes de blog ou de sites Internet de réseaux sociaux. L’équipe d’UCSD a estimé qu’il faudrait 25 fois le nombre de CAPTCHA résolus sur le site https://www.digg.com (en moyenne un toutes les 17 secondes) pour s’approcher d’une analyse en temps réel dans un flux vidéo dans le cadre de Grozi. Mais d’après l’équipe de recherche, l’intérêt de Solyent Grid réside surtout dans son ouverture à des systèmes tiers pour enrichir sa base d’images à décrypter. La variété de la nature des informations à traiter complique d’autant plus la tâche des programmes conçus pour déchiffrer les CAPTCHAs traditionnels, renforçant ainsi la sécurité des sites qui utiliseront ce système.
Source :
– "In Human Grid, We are the Cogs", 17/10/2007 – https://www.calit2.net/newsroom/article.php?id=1178
– "CAPTCHAs For Social Good?", 22/10/2007 – https://www.internetnews.com/bus-news/article.php/3706396
Pour en savoir plus, contacts :
– "Soylent Grid: it’s Made of People!", Stephan Steinbach, Vincent Rabaud et Serge Belongie, University of California, San Diego: https://www.cs.ucsd.edu/~sjb/icv2007.pdf
– GroZi, A Grocery Shopping Assistant for the Visually Impaired: https://grozi.calit2.net/
– Site Internet de l’"Eleventh IEEE International Conference on Computer Vision" (ICCV 2007): https://iccv2007.rutgers.edu/
– "Quand les filtres anti-spam améliorent les logiciels d’OCR", BE Etats-Unis 81, 06/2007: https://www.bulletins-electroniques.com/actualites/43050.htm
Code brève
ADIT : 51599
Rédacteur :
Vincent Reboul [email protected]