Une équipe composée de mathématiciens, de statisticiens et d'épidémiologistes (Sorbonne Université, CNRS, Collège de France, Oxford University) a lancé ce lundi 27 avril une enquête à destination des foyers français ayant expérimenté la présence du nouveau coronavirus pendant la période de confinement. Ce projet a été baptisé "Alcov2" - un hybride d'alcôve et de SARS-Cov2.

Accès direct à l'enquête : https://alcov2.math.cnrs.fr/index.php/876874?lang=fr

L'idée de cette équipe est la suivante : les histoires des foyers où au moins une personne a ressenti des symptômes liés à Covid-19 (fièvre, toux, maux de tête ou de gorge, fatigue, diarrhée, courbatures, frissons, nausées, perte de goût ou d’odorat, gêne respiratoire, douleur ou oppression thoracique...) sont autant de répétitions indépendantes d'un même processus micro-épidémique de transmission interne au foyer.

Ce processus stochastique, c'est-à-dire de nature probabiliste, sera modélisé finement à l'aide de paramètres tels que le taux d'infection journalier par personne du foyer, la décroissance de ce taux d'infection en fonction du temps écoulé depuis l'infection, la dépendance de ce taux d'infection à la sévérité des symptômes et la probabilité d'être asymptomatique.

En interrogeant les foyers français sur le nombre de personnes du foyer ayant ou n'ayant pas ressenti de symptômes potentiellement liés à Covid-19, leurs facteurs de risque, le tableau clinique précis de chaque cas et surtout pour chacun de ces cas, la date d'apparition des premiers symptômes, cette équipe pourra reconstruire les paramètres de ce processus micro-épidémique.

La première étape de cette reconstruction passe par l'élaboration d'un algorithme de classification non supervisée permettant de classer les cas en fonction de leur tableau clinique et de leurs facteurs de risque et de leur associer un score quantifiant la probabilité qu'ils soient effectivement infectés. La deuxième étape consiste à inférer les paramètres du modèle épidémique en intégrant l'incertitude sur la présence du virus grâce à l'étape précédente (par une approche dite bayésienne) et l'incertitude sur la présence d'individus infectés asymptomatiques ou pauci-symptomatiques (par l'utilisation de chaînes de Markov cachées).

Ce travail à l'interface entre mathématiques de la modélisation, statistique et médecine met en commun des compétences complémentaires, y compris celles de data scientists venus d'horizons très variés (Sorbonne Université, Ekimetrics) et fédérés au sein du Club datacraft. Ce travail collaboratif mettra deux nouveaux outils à la disposition de la communauté scientifique : _ 1) un algorithme capable de calculer la probabilité d'avoir été malade du Covid-19 en fonction des symptômes ressentis et des facteurs de risque; _ 2) une estimation fine des paramètres cruciaux de la transmission du virus, en particulier les variations du taux d'infection au cours du temps écoulé depuis l'infection et la fréquence des asymptomatiques.

Pour le grand public, ce travail pourrait à terme permettre la diffusion d’un questionnaire-diagnostic permettant à chacun de calculer le risque pour son foyer d’avoir été exposé ou non au coronavirus en fonction des symptômes ressentis et de leur chronologie.

Le questionnaire est disponible publiquement et est diffusé en parallèle à un panel national représentatif de 10 000 foyers grâce à la coopération gracieuse du groupe Bilendi et de l’institut d’études BVA. L’enquête a également vocation à être répliquée dans plusieurs autres pays.