Coronavirus : Le coronavirus est un terrain d'essai pour la transparence scientifique – Quartz

22

De notre obsession

L'IA bouleverse les entreprises, les industries et l'humanité.

Alors que le nombre de personnes qui ont contracté un coronavirus augmente, plusieurs groupes d'universités aux États-Unis et en Europe ont publié des prévisions au cours des derniers jours sur où et comment la maladie, que les épidémiologistes ont désormais surnommée nCoV19, se propageront ensuite.

Certaines prévisions se concentrent sur le classement des pays et des provinces chinoises les plus à risque de voir de nouveaux cas (une analyse menée par le groupe Northeastern University place les États-Unis au cinquième rang). D'autres ont tenté d'estimer le décompte final – une estimation de la Lancaster Medical School du Royaume-Uni indique que le nombre de cas à Wuhan pourrait atteindre plus de 190 000 personnes en deux semaines.

La cartographie de l'avenir d'une épidémie est inestimable pour les fonctionnaires qui s'efforcent de mettre en œuvre des restrictions de voyage et d'allouer des ressources de soins de santé. Mais cela nécessite une montagne de données. Vous devez connaître les modèles de trafic des compagnies aériennes et suivre les interdictions de voyager changeantes. Vous devez rester au fait des connaissances des virologues en évolution rapide sur la transmission des maladies. Et vous devez savoir où surgissent de nouveaux cas, ce qui n'est pas une mince affaire pour une épidémie de cette ampleur.

Avec tout cela en main, vous pouvez concevoir un modèle informatique pour calculer la probabilité que le virus se propage dans un temps donné le long d'un certain nombre d'itinéraires possibles.

Alessandro Vespignani, qui dirige le laboratoire de modélisation des systèmes biologiques et socio-techniques qui a produit l'analyse de classement, a déclaré que son équipe était déjà bien équipée avec les données sur les voyages en avion de son travail sur les épidémies précédentes. Mais ils avaient besoin de plus de données sur le nombre de cas existants pour se connecter. Il s'est donc tourné vers un référentiel public en ligne de données sur le nombre de cas téléchargés par des chercheurs de diverses universités sur la plate-forme open-source Github. Cela, ainsi que d'autres sources universitaires et gouvernementales, l'aident à compléter le puzzle.

Dans les épidémies passées, certains chercheurs en santé publique se sont rendus coupables d'avoir thésaurisé des ensembles de données haut de gamme pour une étude minutieuse – et, espérons-le, un article de revue éclaboussant – jusqu'à longtemps après la fin de la crise de santé publique.

Mais les scientifiques mondiaux de la santé qui travaillent pour suivre le coronavirus disent que l'épidémie a déclenché un niveau d'ouverture et de collaboration sans précédent entre des équipes de recherche normalement compétitives. Le résultat, disent-ils, est que les modèles informatiques exploitables pour prédire où la maladie pourrait se propager ensuite – et les données génétiques nécessaires pour développer des traitements – sont mis en ligne plus rapidement et avec une qualité supérieure à celle de toute épidémie précédente.

"La communication entre les équipes de mannequins a été la meilleure que j'aie jamais vue de ma vie", a déclaré Vespignani.

Le référentiel Github comprend certaines sources de données dérivées de l'intelligence artificielle, comme HealthMap de la Harvard Medical School, qui utilise l'IA pour parcourir les articles de presse et autres médias numériques pour détecter les nouveaux cas. L'Université Johns Hopkins a également ouvert les données derrière sa carte de suivi des cas, qui regroupe les données provenant de diverses sources officielles chinoises, américaines et de l'OMS.

Le domaine actuel des modèles prédictifs ne serait pas possible de faire si rapidement – dans une semaine ou deux après la confirmation de la propagation de la maladie entre les personnes – sans ces ensembles de données ouverts, a déclaré Vespignani.

«Lors d'épidémies précédentes, vous pouviez attendre des semaines ou des mois pour voir un document contenant la seule information dont vous aviez besoin dans votre travail», a-t-il déclaré. «Cela a vraiment entravé le processus. Cette fois, c'est différent. »

David Pigott, un scientifique de l'Institut de métrologie et d'évaluation de la santé de l'Université de Washington qui a contribué au référentiel Github, affirme que les chercheurs en santé mondiale récoltent désormais les avantages des réseaux de partage de données qui ont évolué au cours des dernières épidémies, en particulier Ebola et Zika.

"Avec chaque événement, il y a une boule de neige d'individus partageant les mêmes idées qui sont de plus en plus conscients les uns des autres", a-t-il déclaré. "Donc, lorsque le coronavirus a été détecté, nous savions à qui nous adresser."

Pendant ce temps, un certain nombre d'articles sur les caractéristiques virales et la constitution génétique de la maladie ont accéléré l'examen par les pairs au Lancet ces derniers jours. Et au moins une société privée de surveillance des épidémies basée sur l'IA se joint également à la mêlée: Metabiota, un service basé à San Francisco pour les agences gouvernementales et les compagnies d'assurance, prévoit de rendre les données provinciales derrière sa carte de suivi nCoV19 disponibles gratuitement au début de la semaine prochaine , A déclaré la PDG Nita Madhav à Quartz.

Ce sera la première fois que la société partagera ses données, a déclaré Madhav, une décision qui, selon elle, a été influencée par la déclaration d'urgence de l'OMS. "Avec une épidémie aussi importante, nous recevons beaucoup de demandes de données", a-t-elle déclaré. "Nous constatons une tendance vers les données ouvertes et nous voulons y contribuer."

Dirk Brockmann, biologiste à l'Université Humboldt de Berlin qui maintient sa propre projection du risque de transmission mondial nCoV19, attribue toute cette ouverture nouvelle à l'afflux croissant d'informaticiens dans les domaines de la santé publique, qui apportent avec eux une éthique plus libérale vers la transparence que a traditionnellement été trouvé parmi les épidémiologistes.

"Il y a un changement culturel qui se produit dans la prochaine génération de scientifiques, ce qui est très prometteur", a-t-il déclaré. "Cela change vraiment le domaine."

Cela est particulièrement important dans le contexte du nCoV19, en raison des antécédents de la Chine en matière de transparence pendant les épidémies. Lorsque le pays a été frappé par le SRAS en 2003, il a fallu des mois aux fonctionnaires pour admettre l'ampleur réelle de la charge de travail et pour partager les données génomiques recueillies auprès des patients avec des scientifiques extérieurs.

Ainsi, lorsque le nCoV19 a commencé à décoller début janvier, il y avait de bonnes raisons de s'inquiéter de ce que la Chine serait prête à partager. Le résultat a été mitigé: l’Organisation mondiale de la santé et certains scientifiques ont salué l’ouverture relative du pays avec des données épidémiologiques et génétiques. Mais le 28 janvier, deux hauts responsables américains de la santé ont fait pression sur le pays pour obtenir davantage de données sur le potentiel de transmission interhumaine de la maladie et sur les efforts pour développer un vaccin.

Le besoin de plus de données a également été renforcé jeudi par l'OMS dans sa désignation officielle de l'épidémie comme urgence sanitaire mondiale. Jusqu'à présent, les scientifiques chinois, sinon leurs bureaucrates, semblent avoir une longueur d'avance: le document sur la génomique du Lancet publié le même jour répertorie plus de 30 auteurs du Centre chinois de contrôle et de prévention des maladies.