Diffusion de la science ouverte : approche ascendante ou descendante? Focus sur plusieurs tendances aux Etats-Unis

Diffusion de la science ouverte : approche ascendante ou descendante? Focus sur plusieurs tendances aux Etats-Unis

Que ce soit au sein de la communauté scientifique ou au sein des gouvernements, la science ouverte semble constituer un ensemble de pratiques vers lesquelles il est souhaitable de converger. Même si la pandémie a mis davantage encore ce sujet sur le devant de la scène, il est important d’observer -malgré un ensemble de points communs- une différence importante dans la structuration de ces débats aux Etats-Unis et en France, avec des approches respectivement ascendante et descendante. Un dialogue bilatéral sur la dissémination des bonnes pratiques de l’open science serait ainsi particulièrement fructueux.

Diffusion de la science ouverte : approche ascendante ou descendante? Focus sur plusieurs tendances aux Etats-Unis

En période de pandémie, la science ouverte s’est révélée décisive. Au cours de la pandémie, la communauté scientifique travaillant sur la COVID-19 a été contrainte de fortement faire évoluer ses pratiques. Nous avons observé en effet :

  • Une amélioration des procédures de publication : depuis le tout début de la crise de la COVID-19, les éditeurs ont rendu les recherches sur les SARS-CoV 2 librement accessibles. Des efforts ont également été déployés pour accélérer le processus d’évaluation par les pairs des recherches sur les coronavirus. Quelques journaux ont même créé des groupes de scientifiques dédiés pour une relecture plus rapide des articles.  
  • Une utilisation accrue des serveurs de prépublication : malgré les efforts déployés pour accélérer le processus, l’évaluation par les pairs peut encore être un processus long et potentiellement biaisé. C’est pourquoi les chercheurs travaillant sur la COVID-19 se sont largement appuyés sur les archives ouvertes (serveurs de prépublication).
  • Une meilleure organisation des données : des bases de données gratuites et ouvertes ont vu le jour, notamment des initiatives émanant de l’OMS, des NIH ou de CORD-19. Il est intéressant de noter que CORD-19 est issu d’un consortium très diversifié comprenant : l’Office of Science and Technology Policy (OSTP) de la Maison Blanche, les NIH, Kaggle et l’AI Allen Institute,  rejoints par Semantic Scholar, Chan Zuckerberg Initiative, CSET, bioRxiv, medRxiv, Microsoft, AWS, NLM et IBM (1). Notons que CORD-19 est associé à des défis informatiques ouverts coordonnés par plusieurs de ces partenaires afin de prioriser les questions pertinentes et d’avancer ainsi très concrètement sur les nombreux problèmes posés par la pandémie (2).

Après la pandémie, il est probable que certains de ces modes de fonctionnement subsistent au moins en partie, notamment l’utilisation des serveurs de prépublication. Ils ont été mis en place en urgence et sont donc imparfaits. En effet, un certain nombre d’articles en prépublication se sont avérés de mauvaise qualité, ce qui a suscité des inquiétudes du fait d’une couverture médiatique importante et prématurée. Cependant, en bousculant au moins temporairement le système actuel de publication pour introduire plus de fluidité et de transparence, elles ont amené des questions légitimes et montré que des changements étaient possibles. 

Une de ces questions essentielles est la confiscation du débat scientifique par les journaux à comité de relecture (« peer review »), qui réduisent le grand débat horizontal que les scientifiques doivent avoir, à un processus confidentiel où un éditeur décide ou non de publier un article sur la base d’échanges par courriel avec des relecteurs anonymes pour le chercheur. Les défauts d’un tel système sont nombreux et bien connus : la publication est lente, perméable au conflit d’intérêt, a un coût peu justifiable et a tendance à exclure les chercheurs de certains pays en voie de développement. De plus, les chercheurs sont amenés à travailler en silo pour garder l’exclusivité de leurs résultats jusqu’à la publication, et seul l’exclusif et le fort impact est publié.

Il serait très important d’être en mesure de pouvoir publier des résultats qui ne seraient pas nouveaux mais au contraire répliqués dans un autre laboratoire, selon un protocole préalablement détaillé et disponible. Il serait également utile de pouvoir publier une étude montrant qu’une méthode s’avère inefficace dans un contexte donné, afin d’éviter la duplication d’efforts inutiles. 

Le système actuel crée également une rareté artificielle qui met les chercheurs en compétition pour un certain nombre de places libres dans des journaux, et ils sont ainsi tentés de s’éloigner de l’éthique scientifique pour publier dans les journaux les plus prestigieux. Notons que les éditeurs ont ainsi un effet de levier pour faire s’aligner les chercheurs sur leurs intérêts ou leurs préjugés. Enfin, il est estimé actuellement, même si des différences existent entre disciplines, qu’au moins la moitié des résultats expérimentaux publiés dans des journaux à comités de lecture ne sont pas reproductibles, donc sans réelle valeur scientifique (3).

Ceci est catastrophique pour la communauté scientifique qui s’appuie sur la littérature scientifique pour bâtir ses hypothèses et plus largement l’écosystème de la recherche et de l’innovation (dont par exemple les startups dans le domaine biomédical, largement affecté lui aussi par ces mauvaises pratiques). 

Les conséquences vont au-delà. Par exemple, lorsque de petites communautés très visibles doutent de vérités scientifiques (théorie de la Terre plate). Aussi, cette discussion ne doit pas simplement être réduite au sujet de l’open access, comme nous y poussent les grandes maisons d’édition scientifiques dominantes, sous peine de limiter l’adoption de la science ouverte à un simple problème de basculement d’un système d’abonnement pour lire les articles à un système de paiement pour pouvoir les publier. La science ouverte doit au contraire être vue comme le rétablissement d’une discussion scientifique libre, horizontale et constructive, basée sur les principes de transparence et d’inclusivité, et menée par la communauté scientifique.

Différences d’approche entre les Etats-Unis et la France

L’open science se met en place différemment aux Etats-Unis et en France. Tandis qu’en France l’approche est descendante, avec des directives émanant du Ministère de l’Enseignement Supérieur, de la Recherche et de l’Innovation (MESRI) qui sont ensuite déclinées organisme par organisme, l’absence de l’équivalent d’un MESRI au niveau fédéral rend une approche coordonnée plus difficile aux Etats-Unis. De fait, ce sont essentiellement les chercheurs qui se structurent au niveau de leur département, de leur institut et de leur université. Les paragraphes suivants décrivent un bref état des lieux des actions entreprises dans trois grandes universités de la côte ouest. 

A UC Berkeley (UCB), un groupe de travail « Reproducibility and open science » a été créé en collaboration avec University of Washington (UoW) et New York University (NYU) (4). Le Berkeley Institute of Data Science (BIDS) est un acteur important de ce groupe de travail dont l’objectif est d’encourager l’open science dans ces trois grandes universités américaines à travers des conférences et ateliers, ainsi que d’échanger sur les bonnes pratiques et de promouvoir des outils adéquats. 

Des membres des comités de titularisation et des comités d’avancement du BIDS ont participé à des réunions de ce groupe de travail. Suite à cela, les directives pour les comités de titularisation et d’avancement du BIDS ont été modifiées afin de valoriser des pratiques caractéristiques de l’open science. A titre d’exemple, au BIDS, les données ouvertes et le code open source considérés comme ayant un « impact significatif » sont ainsi pris en compte par ces comités, et non pas uniquement les publications et le facteur d’impact des journaux dans lesquelles elles sont publiées. Notons cependant que la direction du campus a un droit de veto sur une titularisation ou une promotion, qu’elle se réserve le droit d’appliquer si les critères traditionnels en termes de nombre et d’impact des publications ne sont pas remplis, mais ce droit est en pratique appliqué extrêmement rarement.

Le BIDS est également moteur pour organiser des workshops et des sessions de sensibilisation à l’open science et de bonnes pratiques en matière de reproductibilité à UCB. Sa très forte interaction avec beaucoup de départements de UCB, et son expertise en matière de traitement des données de toutes sortes, en fait un véritable « nexus » pour cette dissémination. Plusieurs chercheurs du BIDS publient dans le Journal of Open Science Software (JOSS), journal en open access nécessitant la soumission d’un code open source, et sans frais de publication ni abonnement (JOSS est financé par des dons de la communauté) (5).  

Une autre initiative notable de UCB a consisté à ouvrir un nouveau poste de « open science librarian », l’année dernière, pour aider et conseiller les scientifiques du campus de UC Berkeley qui souhaitent adopter l’open science en matière de bonnes pratiques et d’outils à utiliser. Notons enfin que de plus en plus d’appels à candidatures pour la titularisation dans l’UCB incluent des critères de sélection relatifs à la science ouverte, tels qu’apporter la preuve d’un investissement significatif sur un projet de code open source.

UCB semble à la pointe en matière de science ouverte. Elle est très active dans la contestation entre UC et Springer ainsi que Elsevier, qui a mené à un arrêt des négociations concernant l’abonnement du groupe UC. Notons que Michael Eisen, affilié à UCB et au Lawrence National Berkeley Lab, est un cofondateur de la Public Library of Science (PLOS), un journal open access fondé en 2001 suite à une initiative menée par H. Varmus, prix Nobel et ancien directeur des NIH, Patrick Brown et lui. Michael Eisen reste très engagé en faveur de l’open science et ses opinions sont très écoutées à UCB sur ce sujet.

PLOS: la Public Library of Science, évolution de son logo depuis sa création.

A Stanford, le Stanford Data Science Institute’s Center for Open and REproducible Science (DSI-CORES) a été fondé le 16 septembre 2020 (6). L’équipe du DSI-CORES rassemble des chercheurs venant d’une palette très diverse des départements de Stanford. Le DSI-CORES vise à développer des outils et des recommandations pour faciliter l’adoption de l’open science sur le campus, et à les diffuser à travers des formations, des séminaires, des hackatons, etc. Certains départements publient dans leurs offres de postes des critères relatifs à l’open science. Cependant, aucun élément ne semble avoir été directement inclus concernant les directives sur les titularisations et la promotion dans les départements de Stanford à ce jour.  

Les bibliothèques de l’University of Washington (UoW) ont lancé très récemment une initiative, appelée Open Scholarship Commons, en faveur de la science ouverte. Cette initiative réunit des chercheurs, des enseignants et des étudiants pour effectuer des formations et lancer des ateliers de discussion sur la science ouverte, inviter des conférenciers actifs dans ce domaine. De plus en plus de départements incluent dans leurs offres de postes (de chercheurs comme ingénieurs de recherche) des critères relatifs à l’open science

Facteurs limitant la diffusion de l’open science en France et aux Etats-Unis

Trois axes semblent émerger comme étant à la fois importants mais aussi limitants. Il serait donc particulièrement intéressant d’avancer sur :

  • L’accès aux données : il existe une contradiction entre garder un avantage compétitif et offrir ses méthodes et données en vue d’augmenter globalement la reproductibilité. En effet, la reproductibilité impose la mise à disposition des méthodes, protocoles et algorithmes et des données pour la communauté. Cependant, bien souvent, les données ont nécessité de grands efforts humains et financiers. Ce sont le fruit d’années d’efforts acharnés. Ces données constituent une mine en termes de recherches à venir et potentiellement aussi un atout pour l’émergence de startups issues du milieu académique.
  • L’évaluation de la recherche : les journaux scientifiques sont d’une certaine façon des distributeurs de facteurs d’impact (impact factor), une métrique associée au prestige d’un journal scientifique, que les scientifiques doivent systématiquement faire maintenant apparaître dans leurs demandes de fonds et évaluations. Sans changement de cette pratique, toute adoption de l’open science est vaine, car les scientifiques ne seront pas incités à fonctionner de façon plus transparente. Pourtant, les outils du Web 2.0 permettent un fonctionnement plus collaboratif, comme d’évaluer aussi à quel point chaque scientifique contribue à l’effort collectif de création de connaissances. 
  • Le financement public de la recherche : celui-ci ne devrait pas faire de l’originalité un impératif absolu. En pratique, la recherche de solutions originales n’est pas synonyme de solutions à court terme voire efficientes. La recherche de l’originalité comme critère clef peut pousser à préférer des méthodes ou savoir-faire préférentiellement développés au laboratoire et qui ne sont -par définition- pas validés au-delà (rappelons qu’il n’y a pas d’incitation pour cela). Le plan de recherche proposé par le chercheur dans sa demande de fonds peut se trouver donc intrinsèquement peu reproductible, avec une incitation à garder les résultats pour lui-même ou son équipe, plutôt que pour la communauté. 

Pour conclure, la différence profonde entre l’approche descendante et l’approche ascendante rend un éventuel dialogue bilatéral franco-américain sur le sujet potentiellement très intéressant. Il sera important d’évaluer les avantages respectifs de chacune des approches et d’essayer de dégager une approche optimale. Au-delà des différences de forme, ne perdons pas de vue nos nombreux points communs. En particulier, nous devrons être vigilants à avancer vers plus d’open science en identifiant les prochains caps respectifs à franchir tout en analysant comment nos pratiques peuvent être complémentaires. Promouvoir et surtout parvenir à implémenter plus d’open science, c’est placer les fruits de la recherche et de l’innovation comme prioritaire pour la communauté scientifique et la société, et ceci, devant la carrière individuelle du chercheur.

 

Rédaction :

Renaud Seigneuric [1,2], Jean-Baptiste Bordes [1,3,*]

Affiliations :

[1] Ambassade de France aux Etats-Unis, 4101 Reservoir Road, NW – Washington, D.C. – 20007

[2] Consulat Général de France à Houston, 777 Post Oak Blvd #600, Houston, TX 77056

[3] Consulat Général de France à San Francisco, 88 Kearny St #600, San Francisco, CA 94108

[*] Correspondance: attache-stic.sf at ambascience-usa.org

Sources : 

(1) https://www.semanticscholar.org/cord19

(2) https://www.kaggle.com/allen-institute-for-ai/CORD-19-research-challenge 

(3) https://www.nature.com/articles/533452a

(4) https://bids.berkeley.edu/working-groups/reproducibility-and-open-science

(5) https://joss.theoj.org/

(6) https://datascience.stanford.edu/cores/about

image_pdfimage_print