Intelligence artificielle et lutte contre le covid19

arton10414

La Maison Blanche lance un appel à la communauté IA

Le 16 mars 2020, la Maison Blanche par son Bureau de la politique scientifique et technologique (Office of Science and Technology Policy ou OSTP) publiait une base de données accessible librement (Covid-19 Open Research Dataset ou CORD-19) et contenant la littérature scientifique existante sur le coronavirus. [1] Cette base de données est construite en collaboration avec plusieurs institutions telles que le Allen Institute for AI, la Chan Zuckerberg Initiative (CZI, entreprise philanthropique créée en 2015 par Priscilla Chan et Mark Zuckerberg), le Center for Security and Emerging Technology (CSET) de l’université de Georgetown, Microsoft et la Bibliothèque Nationale de Médecine (NLM) du NIH. Elle est mise à jour très régulièrement avec les dernières publications / prépublications disponibles.

Suite à cette publication, l’OSTP a également lancé un appel à la communauté des chercheurs en intelligence artificielle (IA) afin qu’ils se saisissent de ces données et les exploitent pour lutter contre la pandémie actuelle. Dix grandes questions ont été identifiées auxquelles les chercheurs tentent de répondre à l’aide d’algorithmes permettant d’explorer ou miner les données. L’ensemble des informations sur cet appel est accessible via la plateforme de compétition en science des données Kaggle sur laquelle diverses propositions d’algorithmes ont déjà été faites pour répondre à des questions telles que : que savons-nous de la transmission, l’incubation et la stabilité dans l’environnement du virus ? Que savons-nous des facteurs de risque du covid-19 ? Que savons-nous de la génétique du virus, son origine et son évolution ?

Diverses utilisations de l’IA et des données pour lutter contre la crise actuelle

Au-delà de l’initiative de la Maison Blanche, on voit un intérêt important porté à l’IA par les chercheurs américains dans le contexte actuel qui pourrait ouvrir la voie à diverses opportunités de coopération internationale.

1. Suivi et visualisation de l’épidémie

Dans le domaine du suivi de la propagation du virus, l’université Carnegie Mellon basée à Pittsburgh (PA, Pennsylvanie) a travaillé avec les Centres pour le contrôle et la prévention des maladies (CDC, la principale agence américaine de protection de la santé publique) pour modifier les modèles existants utilisés chaque année pour le traitement saisonnier de la grippe.

Les équipes du professeur Roni Rosenfeld, chef du département d’apprentissage machine et du groupe de recherche Delphi, développent notamment trois méthodologies. La première dite nowcast utilise les relevés historiques du CDC et d’autres organisations pour prédire le nombre de personnes infectés en temps réel. D’autres données telles que l’activité sur Twitter, le nombre de recherche sur Google et l’accès à des sites médicaux ou à des articles Wikipédia sont également prises en compte. Une seconde méthode permet d’effectuer des prévisions de tendance jusqu’à quatre semaines pour déterminer le pic d’infection et le nombre maximum de cas prévu en s’appuyant sur des modèles d’apprentissage statistique. La troisième méthode dite de la “sagesse des foules” (wisdom of the crowds en anglais) est également un modèle de prévision. Dans ce cas, un groupe de volontaires composé d’experts et non-experts est consulté chaque semaine par le biais d’une plateforme en ligne. Cette dernière méthode donne des résultats proches de l’apprentissage machine.

Des travaux similaires sur les données crowdsourcées auprès de volontaires sont également en cours à l’université d’Harvard. Le site COVID Near You permet à chacun de signaler ses symptômes en temps réel dès leur apparition avec une indication géographique. Cet outil est développé par l’équipe du professeur John Brownstein, qui dirige HealthMap, en collaboration avec le Boston Children’s Hospital et l’école de médecine d’Harvard.

Outre le suivi en lui-même, un travail important est effectué pour la visualisation de ces données. On pense notamment à l’université Johns Hopkins, basée à Baltimore près de Washington, qui s’est distinguée en mettant en place un tableau de suivi du nombre de cas, de décès, par pays avec cartographie et courbes.

Enfin, les modèles épidémiologiques reposent en grande partie sur des outils mathématiques. 
Il existe déjà des collaborations entre chercheurs français et américains dans le domaine. Simon Cauchemez, récemment nommé au conseil scientifique pour assister le gouvernement, étudie les modèles mathématiques liés aux maladies infectieuses à l’institut Pasteur et collabore notamment avec Justin Lessler du centre d’épidémiologie de l’université Johns Hopkins.

2. Recherche de traitement médicamenteux

Un autre champ d’application de l’IA est l’identification de composés médicamenteux et l’élaboration de traitement.

On pense notamment à la la collaboration franco-américaine entre Iktos et SRI International, annoncée début mars 2020. La startup française Iktos, qui a bénéficié d’un accompagnement NETVA en 2018, utilise des algorithmes génératifs pour concevoir des molécules ayant les caractéristiques recherchés pour des traitements antiviraux. Couplé aux technologies en chimie synthétique du centre de recherche californien SRI, cela pourrait permettre d’accélérer la découverte de médicaments candidats pour le traitement de divers virus comme la grippe ou l’actuel coronavirus.

Ce type de collaboration est très intéressant et pourrait servir de modèle car selon, Insilico Medicine, startup spin-off de Johns Hopkins, l’un des goulots d’étranglement dans la recherche de médicaments assistée par IA est la capacité à synthétiser les molécules et à les tester rapidement. Le 6 février 2020, cette société avait notamment publié les structures moléculaires de protéines associés au virus et déclaré la synthèse et la réalisation d’essais sur 100 de ces molécules en invitant d’autres acteurs à réutiliser les données partagées. [3]

3. Des initiatives incitatives…

L’’Institut de la Transformation Digitale du C3.ai (C3.ai DTI) a lancé dès le 26 mars un appel à projet pour l’utilisation de l’IA pour endiguer la pandémie. Ce nouvel institut-consortium de recherche composé d’universités prestigieuses (université d’Illinois à Urbana-Champaign, université de Chicago, Berkeley, Princeton, MIT et Carnegie) et de Microsoft financera, à hauteur de $100,000 à $500,000 pour une enveloppe totale de $5.8 millions, des projets utilisant l’IA pour la conception et le repositionnement de médicaments ou pour la conception et le partage des données d’essais cliniques [4]. De manière générale, l’appel tend à soutenir la recherche appliquée de l’IA à la pandémie.

Du côté de la DARPA, on peut noter deux programmes d’intérêt dans le contexte actuel. Le programme Pandemic Prevention Platform (P3) développe des méthodes pour fortement accélérer toutes les étapes de réponse aux épidémies avec comme objectif d’avoir un traitement disponible en 60 jours pour contenir un nouvel agent infectieux. Ce dispositif a été activé pour le covid19 avec l’espoir de trouver un traitement firebreak dans les temps impartis. [5] Ce travail repose sur des technologies développées par l’Autonomous Diagnostics to Enable Prevention and Therapeutics (ADEPT) qui a quatre piliers : le diagnostic rapide et le suivi précis de menace infectieuse, de nouvelles méthodes pour la fabrication rapide de vaccins, de nouveaux outils pour concevoir des cellulaires mammaires pour l’administration de médicaments et le diagnostic in vivo, et de nouvelles méthodes pour conférer une immunité quasi-immédiate à un individu grâce aux anticorps.

4. … mais des difficultés demeurent pour l’échange des données

Afin de tirer la pleine puissance de l’IA, l’accès aux données et leur échange entre différentes juridictions est important. Dans cette optique, il est important de noter les discussions hebdomadaires entre gouvernements de différents pays avec l’OSTP et la présence de National Focal Points ou points de contacts nationaux permettant le partage d’information épidémiologique.

[1] https://www.whitehouse.gov/briefings-statements/call-action-tech-community-new-machine-readable-covid-19-dataset/ 
[2] https://www.kaggle.com/allen-institute-for-ai/CORD-19-research-challenge/data#
[3] https://insilico.com/ncov-sprint/
[4] https://c3dti.ai/research/applying-ai-to-mitigate-the-covid-19-pandemic/
[5] https://spectrum.ieee.org/the-human-os/biomedical/bionics/darpas-firebreak-treatment-for-the-coronavirus

Partager

Derniers articles dans la thématique
,