Le débat sur les origines du Covid reprend de plus belle. Le gouvernement américain a ouvert une enquête lorsque des voix se sont élevées, affirmant que le virus ne s'était pas transmis à l'homme par les chauves-souris, mais provenait d'un laboratoire de Wuhan.
Une nouvelle étude du virologue américain Jesse Bloom ne confirme aucune de ces deux thèses. Elle remet toutefois en question le fait que le Covid ait été transmis à l'homme sur le marché d’animaux sauvages de Wuhan. L'étude n'a toutefois pas encore été évaluée par des pairs, ni publiée dans une revue scientifique.
La cause des doutes sur l'origine du Covid? Il y a environ un an à Wuhan, rapporte le New York Times, le séquençage génétique de plus de 200 échantillons du virus provenant de cas précoces du virus a mystérieusement disparu d’une base de données scientifiques.
Le scientifique Jesse Bloom l’a découvert en tombant sur une étude de mars 2020 sur Internet. Celle-ci présentait un tableau de plus de 241 lectures de séquençage génétique recueillies par des scientifiques de l'Université de Wuhan. Le tableau indiquait que les scientifiques avaient téléchargé le séquençage dans une base de données en ligne appelée Sequence read archive (SRA), gérée par la National Library of Medicine (NLM) du gouvernement américain.
Ces séquences génétiques sont importantes, car elles fournissent des indices sur la façon dont le SARS-CoV-2 est passé de l’animal à notre espèce. De plus, ces dernières ont été récoltées lors des premiers stades de la pandémie et sont donc considérées comme particulièrement précieuses, car elles rapprochent les chercheurs de «l’effet de débordement».
Pour cette raison, le chercheur Jesse Bloom s’est particulièrement intéressé à ces séquences – mais lorsqu'il les a recherchées dans la base de données, elles sont restées introuvables. Alors, il a consulté le tableau pour savoir qui avait effectué la récolte des séquences désormais disparues. Il est tombé sur le dr. Aisi Fu, co-fondateur d’un laboratoire clinique de Wuhan, qui s’occupe de la technologie de séquençage génétique.
Déterminé à trouver les séquences manquantes, Jesse Bloom a poursuivi ses recherches et est tombé sur une autre étude que le dr. Fu avait publiée en mars 2020. Les scientifiques y avaient examiné 45 écouvillons nasaux prélevés au début de la pandémie afin de rechercher le matériel génétique du SARS-CoV-2. Toutefois, dans cette étude, les scientifiques n'ont pas publié les séquences réelles, mais seulement certaines mutations virales. Néanmoins, le chercheur américain a découvert des preuves que les écouvillons nasaux devaient être la source des 241 séquences manquantes.
Après des recherches plus poussées, il a découvert treize des séquences sous forme de fichiers individuels dans le Google Cloud. Cette découverte est importante, car elle pourrait fournir de nouvelles pistes pour retracer l'origine du virus. De plus, comme il n'existe qu'un nombre limité d'échantillons de la phase initiale de la pandémie, chacun d'entre eux est particulièrement précieux. Certains des échantillons les plus anciens proviennent du marché d’animaux sauvages Huanan à Wuhan, où un foyer de Covid-19 s’était déclaré en décembre 2019.
Cependant, le virus du marché d’animaux présente trois mutations supplémentaires qui sont absentes des échantillons de SARS-CoV-2 collectés quelques semaines plus tard. Seulement ceux prélevés plus tard présentent des similitudes avec le virus du Covid détecté chez les chauves-souris. Pour cette raison, il est possible qu'une lignée précoce du virus ne soit pas passée par les animaux.
Les séquences génétiques récupérées dans le Google Cloud ressemblaient également de plus près aux virus du Covid chez les chauves-souris. Cela suggère que le SARS-CoV-2 circulait à Wuhan depuis un certain temps avant d’atteindre le marché d’animaux sauvages, a déclaré le scientifique américain Jesse Bloom. Ainsi le virus détecté au marché ne représenterait pas l'ensemble des virus du Covid qui circulaient déjà fin 2019.
La raison pour laquelle ces séquences ont été supprimées de la base de données pose des interrogations, même si le processus semble avoir été mené dans le respect des règles. En effet, les scientifiques peuvent demander la suppression de données en contactant les gestionnaires de la base de données Sequence read archive (SRA). La National Library of Medicine (NLM), qui gère les archives, a confirmé qu'elle avait retiré treize séquençages l'été dernier.
Les séquences génétiques du SARS-CoV-2 ont été soumises pour publications dans le Sequence read archive en mars 2020, puis retirées par la même personne en juin 2020, selon une porte-parole de la National Library of Medicine. La raison invoquée pour ce retrait? Les séquences étaient mises à jour et intégrées dans une autre base de données.
Malgré ses recherches assidues, le chercheur Jesse Bloom n'a pas réussi à retrouver ces données. On ignore pour l'instant si les séquences sont effectivement stockées dans une autre base de données ou si leur disparition a des origines douteuses. Le New York Times n'a pu joindre aucun des chercheurs impliqués dans l'étude. (saw/dfr)