Des chercheurs de l’université Cornell ont reçu de la NSF une bourse de 2 millions de dollars, s’étalant jusqu’en 2007, pour un projet combinant sciences sociales et informatique et utilisant notamment l’archive du Web du projet Internet Archive. L’équipe rassemble des chercheurs en informatique et des chercheurs en sciences sociales, avec pour propos technique de développer des outils pour extraire et analyser l’information issue de très grandes quantités de données. L’Internet Archive fournit une copie de ce qui était disponible sur le Web entre 1996 et il y a quelques mois (soit plus de 40 milliards de pages), ce qui permet aussi d’appréhender son évolution au cours des années. 30% de ces données, soit 200 téraoctets seront copiées sur un serveur de Cornell pour que l’équipe de recherche travaille dessus. Cette recherche étudiera la diffusion de nouvelles technologies, de pratiques sociales et commerciales, de marchés, d’habitudes et modes, de normes, d’opinions et légendes urbaines. Elle conduira aussi à développer des outils "intelligents", un besoin identifié de longue date par Internet Archive.
Pour en savoir plus, contacts :
– https://www.news.cornell.edu/stories/Sept05/NSFcybertools.dea.html
– https://www.linuxelectrons.com/article.php/20050928172605434
Code brève
ADIT : 29925
Rédacteur :
Sébastien Morbieu, [email protected]