Mais les modèles ont donné des prévisions très divergentes. L’Imperial College a averti que les États-Unis pourraient voir jusqu’à 2 millions de décès dus au Covid-19 d’ici l’été, alors que les prévisions de l’IHME étaient beaucoup plus prudentes, prévoyant environ 60 000 décès d’ici le mois d’août.
Il s’est avéré qu’aucune des deux prévisions n’était très proche. Les États-Unis ont finalement atteint environ 160 000 décès au début du mois d’août. L’énorme écart entre les prévisions du printemps a attiré l’attention d’un spécialiste des données âgé de 26 ans, Youyang Gu.
À la mi-avril, alors qu’il vivait avec ses parents à Santa Clara, en Californie, Gu a passé une semaine à construire son propre prédicteur de décès Covid et un site web pour afficher les informations morbides.
En peu de temps, son modèle a commencé à produire des résultats plus précis que ceux élaborés par des institutions disposant de centaines de millions de dollars de financement et de dizaines d’années d’expérience.
« Son modèle était le seul qui semblait sain », explique Jeremy Howard, expert en données et chercheur de renom à l’université de San Francisco. « Les autres modèles se sont révélés être des absurdités à maintes reprises, et pourtant il n’y a pas eu d’introspection de la part des personnes qui publient les prévisions ou des journalistes qui les rapportent.
Il avait d’abord envisagé d’examiner la relation entre les tests Covid, les hospitalisations et d’autres facteurs, mais il a constaté que ces données étaient rapportées de manière incohérente par les États et le gouvernement fédéral.
Les chiffres les plus fiables semblaient être les comptes quotidiens de décès. « D’autres modèles utilisaient davantage de sources de données, mais j’ai décidé de me baser sur les décès passés pour prédire les décès futurs », explique Gu. « Le fait d’avoir cela comme seule entrée a permis de filtrer le signal du bruit. »
La nouvelle version sophistiquée du modèle de Gu provient de son utilisation d’algorithmes d’apprentissage automatique pour affiner ses chiffres. Après le MIT, Gu a travaillé quelques années dans l’industrie financière à la rédaction d’algorithmes pour les systèmes d’échange à haute fréquence dans lesquels ses prévisions devaient être précises s’il voulait conserver son emploi.
En ce qui concerne Covid, Gu a continué à comparer ses prévisions aux totaux de décès déclarés et a constamment réglé son logiciel d’apprentissage automatique pour qu’il aboutisse à des pronostics toujours plus précis. Même si le travail exigeait les mêmes heures qu’un emploi exigeant à plein temps, Gu a donné de son temps et a vécu de ses économies.
Il voulait que ses données soient considérées comme exemptes de tout conflit d’intérêt ou de tout préjugé politique. Bien qu’il ne soit pas parfait, le modèle de Gu a donné de bons résultats dès le départ. Fin avril, il a prédit que les États-Unis verraient 80 000 morts d’ici le 9 mai. Le nombre réel de morts s’est élevé à 79 926.
Une prévision similaire de l’IHME à la fin avril prévoyait que les États-Unis ne dépasseraient pas les 80 000 décès pendant toute l’année 2020. Gu a également prédit 90.000 morts le 18 mai et 100.000 morts le 27 mai, et une fois de plus, a obtenu les bons chiffres.
Là où l’IHME s’attendait à ce que le virus s’éteigne en raison de la distanciation sociale et d’autres politiques, Gu a prédit qu’il y aurait une deuxième grande vague d’infections et de décès, car de nombreux États ont rouvert leurs portes. se rapporte à The 27-Year-Old Who Became a Covid-19 Data Superstar « D’autres modèles ont utilisé plus de sources de données, mais j’ai décidé de me baser sur les décès passés pour prédire les décès futurs », dit Gu. « Le fait d’avoir ça comme seule entrée a aidé à filtrer le signal du bruit. »
PHOTOGRAPHE : JUSTIN WEE FOR BLOOMBERG BUSINESSWEEK L’IHME a fait l’objet de critiques en mars et avril, lorsque ses chiffres ne correspondaient pas à ce qui se passait.
Pourtant, le prestigieux centre, basé à l’Université de Washington et soutenu par un financement de plus de 500 millions de dollars de la Fondation Bill & Melinda Gates, a été cité presque quotidiennement lors des briefings des membres de l’administration du Président Donald Trump.
En avril, le responsable américain des maladies infectieuses, Anthony Fauci, a déclaré lors d’un entretien que le nombre de décès de Covid « semble plus élevé que les 100 000 à 200 000 » auxquels on s’attendait autrefois – une prédiction qui reflétait les prévisions de l’IHME.
Et le 19 avril, le même jour où Gu a mis en garde contre une deuxième vague, Trump a indiqué que les 60 000 morts prévues par l’IHME indiquaient que la lutte contre le virus serait bientôt terminée. Les responsables de l’IHME ont également fait une promotion active de leurs chiffres.
« L’IHME était présent dans toutes ces émissions d’information pour essayer de dire aux gens que le nombre de morts serait nul d’ici juillet », explique Gu. « Toute personne ayant du bon sens pouvait voir que nous serions à 1 000 à 1 500 morts par jour pendant un certain temps. Je pensais que c’était très peu sincère de leur part de faire cela ». Christopher Murray, le directeur de l’IHME, dit qu’une fois que l’organisation a mieux maîtrisé le virus après avril, ses prévisions se sont radicalement améliorées. Mais ce printemps-là, semaine après semaine, de plus en plus de gens ont commencé à prêter attention au travail de Gu.
Il a signalé son modèle aux journalistes sur Twitter et a envoyé des courriers électroniques aux épidémiologistes, leur demandant de vérifier ses chiffres.
Vers la fin avril, l’éminent biologiste de l’Université de Washington Carl Bergstrom a tweeté sur le modèle de Gu, et peu de temps après, les Centres américains de contrôle et de prévention des maladies ont inclus les chiffres de Gu sur leur site web de prévisions Covid.
Avec un tel intérêt pour ces prévisions, d’autres modèles ont commencé à apparaître au cours du printemps et de l’été 2020. Nicholas Reich, professeur associé au département de biostatistique et d’épidémiologie de l’université du Massachusetts à Amherst, a rassemblé la cinquantaine de modèles et a mesuré leur précision pendant de nombreux mois au centre de prévisions Covid-19.
« Le modèle de Youyang a toujours été parmi les meilleurs », déclare M. Reich. En novembre, Gu a décidé de mettre un terme à son opération de prévision de décès. Reich avait mélangé les différentes prévisions et a constaté que les prévisions les plus précises provenaient de ce « modèle d’ensemble », ou de données combinées.
« Youyang a pris du recul avec un remarquable sens de l’humilité », dit Reich. « Il a vu que les autres modèles marchaient bien et que son travail ici était terminé. » Un mois avant d’arrêter le projet, Gu avait prédit que les États-Unis enregistreraient 231 000 décès le 1er novembre. Lorsque le 1er novembre est arrivé, les États-Unis ont enregistré 230 995 décès.
Le Murray de l’IHME a son propre point de vue sur la sortie de Gu. Il affirme que le modèle de Gu n’aurait pas pris en compte la nature saisonnière du coronavirus et aurait manqué la vague hivernale de cas et de décès.
« Il a fait disparaître l’épidémie en hiver, et nous avions compris qu’il y avait une saisonnalité dès le mois de mai », dit Murray. Les méthodes d’apprentissage par machine utilisées par Gu fonctionnent bien pour les prévisions à court terme, dit Murray, mais « ne sont pas très bonnes pour comprendre ce qui se passe » dans le tableau d’ensemble.
Les algorithmes, basés sur le passé, ne peuvent pas tenir compte des variantes du virus et de la façon dont les vaccins peuvent ou non fonctionner contre elles, selon Murray.
Pour sa part, l’IHME a correctement appelé le pic précoce du virus, puis s’est trompé lorsqu’il s’est agi de prédire une forte diminution des décès, jusqu’à ce qu’il ajuste son modèle pour mieux refléter la réalité.
« Nous nous sommes trompés le 1er avril », dit M. Murray. « Depuis lors, nous sommes le seul groupe à avoir réussi à corriger la situation de manière cohérente. Reich, qui compile la liste des principaux modèles, a déclaré que les prédictions de l’organisation plus tard dans la pandémie étaient passables.
« Au début, le modèle de l’IHME n’a pas fait ce qu’il annonçait », dit Reich. « Plus récemment, il s’est avéré être un modèle raisonnable. Je ne dirais pas que c’est l’un des meilleurs, mais il est raisonnable ». Gu a refusé de répondre aux remarques de Murray sur son modèle.
Au lieu de cela, il offre la version d’un scientifique des données d’un compliment détourné. « Je suis très reconnaissant au Dr. Chris Murray et à son équipe pour le travail qu’ils ont accompli », dit Gu. « Sans eux, je ne serais pas dans la position où je suis aujourd’hui. »
Dans la mesure où nous pouvons tirer des enseignements de cette histoire de données, le Reich demande que les gens ne se précipitent pas pour accorder trop de foi aux premiers modèles individuels la prochaine fois qu’une pandémie se déclare. Il se demande également si les prévisions au-delà de six à huit semaines ne seront jamais très précises.
Dans l’idéal, le CDC et d’autres organismes seront plus rapides à combiner les modèles et à distribuer les données combinées à l’avenir. « J’espère que nous investirons le temps, l’énergie et l’argent nécessaires à la mise en place d’un système plus prêt à réagir avec un plus large éventail de modèles plus proches du départ », déclare M. Reich.
« Nous devons avoir des gens prêts, au lieu de faire le tour et de frapper à la porte des gens ». Après avoir fait une petite pause, Gu, qui a maintenant 27 ans et vit dans un appartement à New York, s’est remis au jeu de la modélisation.
Cette fois, il crée des chiffres concernant le nombre de personnes aux États-Unis qui ont été infectées par Covid-19, la rapidité avec laquelle les vaccins sont déployés et le moment où, si jamais, le pays pourrait atteindre l’immunité collective.
Ses prévisions suggèrent qu’environ 61% de la population devrait avoir une forme d’immunité – soit par le vaccin, soit par une infection antérieure – d’ici juin.
Avant la pandémie, Gu espérait lancer une nouvelle entreprise, peut-être dans le domaine de l’analyse sportive. Aujourd’hui, il envisage de se concentrer sur la santé publique.
Il veut trouver un emploi où il pourra avoir un grand impact tout en évitant la politique, les préjugés et le bagage qui accompagne parfois les grandes institutions.
« Il y a beaucoup de lacunes dans le domaine qui pourraient être améliorées par des personnes ayant mon expérience », dit-il. « Mais je ne sais pas encore comment je m’intégrerais ».
Bloomberg
Laisser un commentaire