Que vaut le site hcqtrial.com, qui annonce que HCQ fonctionne sur la base d'un "country-randomized controlled trial" avec 1/3 de la pop mondiale
J'explique dans ce thread pourquoi la méthodologie est absurde, en l'utilisant pour la France (HCQ : +12% de morts)
Contexte : Ce site nous vient du compte @CovidAnalysis, qui est aussi à l'origine du site c19study.com, site très partisan pour lequel j'ai déjà expliqué en quoi ce site s'apparente à de la désinformation
Partie 1 : La méthodologie
Ne vous faites pas avoir par la longueur et la présentation du texte, la méthodologie de ce site est extrêmement simple, et il ne s'agit en rien d'un essai randomisé (soit les auteurs n'ont pas compris cette notion, soit ils sont malhonnêtes)
Pour chaque pays, ils regardent le nombre de morts du COVID sur ourworldindata.org, et le divisent par la population du pays, pour obtenir le ratio suivant : nombre de morts rapporté à la population
Par exemple :
- Inde : ~40 000 morts pour 1,4 milliards d'habitants --> ratio = 29 morts par million d'habitants
- France : ~30 000 morts pour ~67 millions d'habitants --> ratio = 478 morts par million d'habitants
Comment obtiennent-ils le "79,1%" de morts en moins ? Ils font simplement la moyenne de ces ratios ajustés pour les 8 pays du groupe "contrôle" et les 11 pays du groupe "traitement", et comparent ces deux moyennes
Il est à noter que faire une telle moyenne (non pondérée) de ratios comme ici n'a aucun sens (et est considérée comme une erreur de base dans beaucoup de domaines)
Ici par exemple, les 11 millions de cubains comptent autant que les 1,4 milliards d'Indiens
Partie 2 : Pourquoi cette méthodologie est absurde ? L'exemple des départements français.
L'énorme problème de cette comparaison (qui la rend complètement caduque) est de considérer que la différence de morts / habitants entre deux pays est dû à un traitement
En France par exemple, Paris est l'un des départements les plus touchés en morts / habitants, alors que la Lozère est l'un des moins touchés
Qu'en concluez-vous sur le traitement ?
Rappel utile : Corrélation n'est pas causalité (très bon site avec beaucoup d'exemples tylervigen.com/spurious-corre…)
Une chose qui parait beaucoup plus logique pour expliquer ces chiffres, c'est que l'épidémie s'est beaucoup plus propagée à Paris qu'en Lozère
Que se passe-t-il si on applique la même métholodogie aux départements français ?
Pour simplifier (beaucoup de temps pour pas grand-chose), on ne va faire aucun ajustement (l'hypothèse sous-jacente est que les départements français sont comparables)
Où l'HCQ a-t-elle été donnée de façon généralisée et tôt ? Dans les Bouches-du-Rhône (13) : C'est notre groupe "traitement"
Où la prescription d'HCQ a-t-elle été limitée ? Dans tous les autres départements : C'est notre groupe "contrôle"
Pour chaque département, j'ai utilisé les données hospitalières de Santé Publique (geodes.santepubliquefrance.fr) pour le nombre de morts, et les chiffres de l'INSEE pour la population
J'ai ensuite fait le ratio morts / habitants
Enfin, en suivant la métholodogie du site, j'ai fait la moyenne des ratios de chaque groupe :
- Groupe "traitement" (HCQ) : 279 morts par million d'habitants
- Groupe "contrôle" (Pas HCQ) : 249 morts par million d'habitants
Conclusion quant au traitement ?
Aux ajustement près (différences moindres entre départements), j'ai utilisé la même méthodologie que ce site
J'espère que les explications sont claires, et que l'exemple français vous montre à quel point on ne peut rien en tirer
Je me suis limité au problème principal de cette méthodologie : on ne peut pas déduire l'efficacité d'un traitement avec le nombre de morts de chaque pays (rapporté à la population)
Et bien sûr corrélation != causalité : tylervigen.com/spurious-corre…
Exemple :
En explorant + précisément on voit d'autres gros problèmes
- Les critères d'exclusion pour exclure 169 pays (sur 188) semblent très arbitraires, et cela ressemble à du cherry picking
- Le classement entre groupe "traitement" et groupe "contrôle" semble loin d'être parfait
Pour conclure : Même si ce site semble compliqué au premier abord, la méthodologie est très simple (et ne prouve rien) : Comparaison du nombre de morts par pays, rapporté à la population (et ajusté de façon naïve avec quelques facteurs)
Je suis bien évidemment ouvert à toute discussion constructive et sans insultes
Pour plus d'analyses de manipulations des chiffres et des études pendant la pandémie, ça se passe par ici ⬇️