Par Mathieu Moslonka-Lefebvre, PhD en épidémiologie mathématique et président de DataCovid, s’expriment ici à titre personnel

Avant-propos

Ce billet, à visée scientifique et didactique, illustre un cas d’usage des données du Baromètre Covid 19 relatif à une évaluation prospective d’impact du projet d’application de tracking dans le cadre de la lutte contre l’épidémie de coronavirus.

Les analyses mises en oeuvre n’engagent que leurs auteurs et n’ont pas fait l’objet d’une relecture par les pairs. Les éléments rapportés sont susceptibles d’évoluer en fonction des éventuels commentaires qui seront effectués par la communauté scientifique. 

Ce billet a vocation à être enrichi par des analyses plus élaborées, notamment dans le cadre de travaux scientifiques spécifiques ultérieurs qui seront résumés sur le blog. 

En matière de santé publique, il est recommandé de suivre et consulter les instructions officielles disponibles sur https://www.gouvernement.fr/info-coronavirus.

Une application de tracking en principe efficace en supposant une utilisation suffisante

Une application qui informe sans délai les personnes ayant été en contact avec une personne diagnostiquée positive au coronavirus pourrait permettre de contrôler l’épidémie si elle est adoptée très largement. En effet, l’efficacité du suivi des contacts par tracking est notamment gouverné par carré de la proportion de la population utilisant l’application1. Ainsi, pour une adoption de 50 %, l’efficacité ne pourra excéder 25 %. La raison en est simple : pour que le traçage d’un lien infectieux soit effectif, il faut que le couple “infecteur / infecté” utilisent conjointement l’application.

L’intérêt pour une application de tracking en forte baisse

Début avril, 56% des Français déclaraient qu’ils accepteraient d’utiliser une application mobile qui de façon anonyme fournirait des informations sur leurs déplacements et leurs contacts, pour prévenir, tester et traiter les personnes potentiellement exposées (33% refuseraient  et 11% ne savent pas).

A la fin mai, seulement 40% des Français accepteraient d’utiliser une telle application installée sur leur téléphone portable (48 % refuseraient et 12 % ne savent pas). Le taux d’acceptation chute de 16 points en deux mois. Même dans le cas où les personnes alertées par l’application auraient le droit de réaliser gratuitement un test de dépistage, le taux d’acceptation resterait inchangé (40 % accepteraient, 48 % refuseraient et 12 % ne savent pas). Pour la suite, étant donné les profils de réponses identiques à ces deux variantes de la question, les résultats de ces deux questions sont combinés afin d’accroître la puissance statique des analyses réalisées2.

Les déterminants de l’impact du tracking

Dans le présent billet, nous apportons des éléments de réponse relatifs à deux questions principales :

L’efficacité de l’application dépend de trois paramètres centraux3: le pourcentage de personnes infectées par le Covid 19 détectées par les services de santé, notée δ ; l’efficacité de la mise en quarantaine des cas contacts des personnes infectées notée ε, qui regroupe un ensemble de composantes dont la plus déterminante sera probablement le taux d’utilisation effectif de l’application de tracking ; le R0, c’est à dire le nombre moyen de personnes contaminées par une personne infectée4.

En effet, pour pouvoir être “activée”, l’application de tracking repose, comme tout processus de “contact tracing”, sur une détection de personnes infectées appelées “cas index” qui vont ensuite permettre de retracer les chaînes de contacts infectieuses. Dans le cas du covid 19, le taux de détection δ va être limité par deux facteurs principaux : la mise à disposition de tests diagnostics ainsi que la fraction des cas pas ou pas symptomatiques qui pourrait être importante dans le cas de la pandémie5. Dans la suite nous prendrons comme hypothèse que δ sera d’au plus 80 % en raison de la présence probable de nombreux cas asymptomatiques ainsi que des symptômes souvent peu spécifiques par rapport à d’autres maladies6.

Dans le cadre du processus de notification des contacts par tracking, l’efficacité de la mise en quarantaine ε repose sur la conjonction d’un grand nombre de facteurs : le taux d’usage des smartphones équipés des technologies compatibles avec la solution de tracking (noté ε1), le taux d’installation effective de l’application de tracking par les personnes équipées de ces smartphones (noté ε2), l’efficacité de l’application au sens d’un risque de “faux négatifs” réduit (notée ε3), le respect de la quarantaine par les usagers notifiés (notée ε4). ε est donné par le produit :

ε = (ε1 x ε2)2 x ε3 x ε4

.

Dans la suite, nous ferons l’hypothèse que le taux d’équipement ε1 et le taux d’utilisation effective de l’application de tracking ε2 constituent les principaux facteurs déterminant l’efficacité de la mise en quarantaine ε. Il a été estimé que le taux d’équipement ε1 serait de l’ordre de 75 %7. Quant au taux d’utilisation effective de l’application de tracking ε2 il peut-être estimé et suivi dans le temps avec les données des vagues de sondage 1 et 7 du baromètre Covid 19. Entre début avril et la fin mai, ε2 a chuté de 56 à 40 % en raison d’une perception moindre du risque épidémique. En supposant que ε3 et ε4 sont proches de 100 %, on en déduit que l’efficacité d’ensemble ε est de l’ordre de 10 à 20 % sur la base des données historiques dont nous disposons à ce jour. L’efficacité pourrait par exemple augmenter si le taux d’adoption tend à s’accroître à l’avenir.

Enfin, la valeur du R0 va jouer sur les valeurs minimales du taux de détection δ et du taux d’efficacité de la mise en quarantaine ε qui vont permettre de maintenir l’épidémie sous contrôle. Plus le R0 sera élevé, plus les valeurs de δ et ε devront être élevées pour maîtriser le risque épidémique.

L’articulation du tracking avec le seuil épidémique gouverné par le R0

Pour la France, la R0 avant le déconfinement a été estimé à une valeur de 3 environ8. Pour une valeur aussi élevée, seul un taux d’installation effective de l’application de tracking de plus de 80 % pourrait permettre de contrôler l’épidémie9. On note qu’une courte majorité d’utilisateurs potentiels de l’application ne permettait pas à elle seule de contrôle l’épidémie.

Lors du déconfinement, le R0  est passé à 0,710 et tend à remonter à l’occasion du déconfinement en restant pour l’heure inférieur à la valeur seuil de 1 d’après les données de la dernière vague en date du baromètre Covid 1911. Ces faibles valeurs du R0 par rapport à la valeur initiale de 3 s’explique par la forte adhésion aux gestes barrières et notamment la réduction par les Français de leurs contacts rapprochés.

Pour la suite nous ferons l’hypothèse que le R0 en l’absence de tracking va continuer à remonter avec le retour à une vie sociale et économique “normale” jusqu’à atteindre un plateau qui sera selon toutes vraisemblance inférieur à la valeur initiale de 3 en raison des pratiques de protection acquises avec la crise.

Ce contexte étant posé, les valeurs de δ et ε permettant de maintenir l’épidémie sous contrôle par tracking pour différents scenarii d’évolution du R0 sont ici présentées dans le tableau suivant12:

Tableau 1. Pour différents scenarii d’évolution du R0, risque de rebond épidémique pour différentes combinaisons de pourcentage de personnes infectées par le Covid 19 détectées par les services de santé (δ) et d’efficacité de la mise en quarantaine des cas contacts des personnes infectées dont taux d’utilisation effectif de l’application de tracking (ε). Les valeurs sont reprises de Feretti et al. (2020)12 et réinterprétées dans une optique d’évaluer le risque de rebond.

Efficacité du tracking
ε = 20 %
Efficacité du tracking
ε = 50 %
Efficacité du tracking
ε = 80 %
Pourcentage de détection des infectés par les services de santé
δ = 50 % 
Si R0 = 1,7 : rebond

Si R0 = 2,0 : rebond

Si R0 = 2,5 : rebond

Si R0 = 3,0 : rebond

Si R0 = 1,7 : pas de rebond

Si R0 = 2,0 : rebond

Si R0 = 2,5 : rebond

Si R0 = 3,0 : rebond

Si R0 = 1,7 : pas de rebond

Si R0 = 2,0 : pas de rebond

Si R0 = 2,5 : rebond

Si R0 = 3,0 : rebond

Pourcentage de détection des infectés par les services de santé
δ = 80 % 
Si R0 = 1,7 : pas de rebond

Si R0 = 2,0 : rebond

Si R0 = 2,5 : rebond

Si R0 = 3,0 : rebond

Si R0 = 1,7 : pas de rebond

Si R0 = 2,0 : pas de rebond

Si R0 = 2,5 : pas de rebond

Si R0 = 3,0 : rebond

Si R0 = 1,7 : pas de rebond

Si R0 = 2,0 : pas de rebond

Si R0 = 2,5 : pas de rebond

Si R0 = 3,0 : pas de rebond

D’après ce tableau, un taux d’usage effectif de l’application de l’ordre de 60 %, conduisant à une efficacité d’ensemble de l’ordre de 20 % sous les hypothèses du présent billet, pourrait probablement suffire si le R0 post-déconfinement se stabilise à une valeur inférieure 1,7 et sous la condition que le taux de détection soit très élevé. Si toutefois le R0 post-déconfinement se stabilise à une valeur de 2, ce taux devra être renforcé pour maîtriser le risque épidémique en raison des autres facteurs qui viennent grever l’efficacité de la mise en quarantaine par tracking (taux de faux négatifs et compliance des cas contact alertés par exemple) et la détection des cas index (cas asymptomatiques en particulier).

Les leviers pour renforcer l’efficacité de l’application

L’intérêt pour une application de tracking est en forte baisse, avec une chute de 16 points entre début avril et la fin mai. Un des facteurs qui pourrait expliquer cette chute est la plus faible préoccupation des Français vis-à-vis de l’épidémie de coronavirus13 ainsi que la plus faible évaluation de la gravité de l’épidémie14. L’épidémie étant jugée moins préoccupante (préoccupation moyenne de 63 % début avril avec 65 % pour les “oui” et 59 % pour les “non” ; contre 45 % fin mai avec 51 % pour les “oui” et 41 % pour les “non”) et moins grave (gravité moyenne de 8,5/10 début avril avec 8,6/10 pour les “oui” et 8,4/10 pour les “non” ; contre 7,1/10 fin mai avec 7,5/10 pour les “oui” et 6,9/10 pour les “non” ) qu’il y a deux mois, les Français semblent alors moins enclins à utiliser l’application.

Ainsi, dans l’hypothèse où une deuxième vague de l’épidémie viendrait à toucher la France à l’automne, le taux d’usage pourrait augmenter, ce qui viendrait accroître l’efficacité de l’application.

En outre, une analyse géographique apporte des éclairages intéressants. C’est en Ile-de-France ainsi que dans les grands centres urbains15 que les taux d’utilisateurs potentiels de l’application sont significativement plus élevés16 par rapport au niveau national (61 % et 59 % respectivement début avril ; 44 % et 43 % respectivement fin mai). A l’opposé, le taux d’adoption en zones rurales est le plus faible constaté (53 % en avril ; 37 % seulement fin mai).

Comme le risque épidémique est plus élevé dans les zones denses où les contacts sont plus fréquents, l’application pourrait apporter un surcroît de protection intéressant précisément dans les zones les plus à risque.

Pour aller plus loin dans les esquisses d’analyses ici présentées, deux autres billets sont en cours de rédaction par des experts aux profils complémentaires :

  1. Cf. Feretti et al. (2020) Quantifying SARS-CoV-2 transmission suggests epidemic control with digital contact tracing. Science.[]
  2. Fusion des variables D70 et D71.[]
  3. Cf. Feretti et al. (2020) précité.[]
  4. Une définition plus complète est proposée dans le billet suivant : https://datacovid.org/suivre-levolution-hebdomadaire-du-risque-epidemique-avec-le-barometre-covid-19/[]
  5. Pour un cluster français particulier [pas nécessairement représentatif de la population générale], la “proportion de personnes infectées sans symptômes pendant la période d’étude est d’au moins 17%”. Cf. https://www.pasteur.fr/fr/espace-presse/documents-presse/covid-19-premiere-etude-serologique-france-deja-beaucoup-enseignements[]
  6. Cf. https://datacovid.org/suivre-les-symptomes-des-francais-et-la-demande-potentielle-de-soins-en-contexte-epidemique-avec-les-donnees-de-datacovid/[]
  7. Cf. https://www.data.gouv.fr/fr/datasets/barometre-du-numerique/ et https://www.economie.gouv.fr/files/files/2019/PDF/barometre_numerique_2019.pdf[]
  8. Cf. Salje et al. (2020) Estimating the burden of SARS-CoV-2 in France. Science.[]
  9. Cf. Supplementary Figure 18 de Feretti et al. (2020) précité.[]
  10. Cf. Salje et al. (2020) précité.[]
  11. Cf. https://datacovid.org/suivre-levolution-hebdomadaire-du-risque-epidemique-avec-le-barometre-covid-19/[]
  12. Cf. Feretti et al. (2020) précité.[][]
  13. A partir de la variable A0 du baromètre (correspondant à la question : “Parmi les sujets suivants, quelles sont les trois qui vous semblent les plus préoccupants aujourd’hui, pour vous personnellement ?”), nous opérons une conversion en échelle numérique sur [0,1] où une valeur de 0 signifie que l’épidémie de coronavirus n’est pas dans les trois premières préoccupations, ⅓ correspond à la troisième préoccupation, ⅔ à la deuxième, et 1 à la première préoccupation. Cette nouvelle variable, notée A0’, quantifie la préoccupation vis-à-vis du covid. Les personnes qui accepteraient d’utiliser l’application sont significativement plus préoccupées par le coronavirus que les personnes qui refuseraient de l’utiliser (au sens d’un test de Wilcoxon, au seuil usuel de 5 % ; la différence est hautement significative tant en avril qu’en mai).[]
  14. Nous  employons la même méthode que précédemment mais utilisons cette fois la variable B1 (correspondant à la question : “Sur une échelle de 0 à 10, comment évaluez-vous la gravité de l’épidémie de coronavirus aujourd’hui ? Valeurs possibles : 0 (Pas grave du tout) à 10 (Extrêmement grave).[]
  15. Ici ; les catégories d’agglomération de 100.000 habitants et plus, y compris l’agglomération de Paris.[]
  16. Au sens d’un test statistique robuste car non-paramétrique (test de Wilcoxon), au seuil usuel de 5 %.[]
  17. Cf. Callaway, Duncan S.; Newman, M. E. J.; Strogatz, S. H.; Watts, D. J. (2000). Network Robustness and Fragility: Percolation on Random Graphs. Physical Review Letters.[]