#THREAD#COVID19france
Interrogations sur:
A. Incohérences internes dans données hospitalières par classe âge GEODES
B. Incohérences entre ces données dans GEODES vs data.gouv.fr/fr/datasets/r/…
Je vais commencer par A.
1/
pour résumer:
pourquoi y a t il une différence entre le présumé total des réas au 31/10 (tous âges) et la somme des pers. en réa au 31/10 si on additionne les chiffres par classe 0...90+ ?
des gens dont âge inconnu, indéterminé, non disponible ?
ce n'est pas une différence considérable mais elle existe
en fonction du "vrai" (?) total: 28/3443 ou 28/3415 ce n'est pas rien
s'il s'agit d'un problème avec la détermination de l'âge alors il suffit d'insérer une ligne "âge non disponible" par ex.
vous pouvez vérifier cela par vous même et cela est valable pour d'autres jours (sic) et pour d'autres indicateurs (sic encore), comme les hospi ou les décès...
pourquoi ???
voire ce #thread
passons maintenant aux incohérences entre GEODES et data.gouv.fr
prenons encore les réas actuels par âge du 31/10
pour mémoire voici ce que nous donne GEODES
(voir tweet précédents si besoin)
les données sur data.gouv sur cet item se trouvent ici data.gouv.fr/fr/datasets/r/…
elles sont organisées par date et région et se présentent ainsi (il s'agit de "stock" et non de "flux" i.e. nouvelles hospi, rea, etc.)
filtrons pour garder que le 31/10/2020 et faisons les sommes des reas à cette date (donc "à travers" les codes région)
on trouve 3443... ce nombre correspond au total tous âges des réas actuels au 31/10/2020 sur GEODES (cf.
on constate que la somme des pers. en rea actu. au 31/10 selon base data.gouv (3441) = somme tous âges pers. en rea. actu au 31/10 selon GEODES (3441) !!!
plus fort encore, si on fait la somme de toutes les classes data.gouv on obtient un total de 6858 !!! #WTF !
en résumé
A. déjà GEODES est incohérent en interne car chiffre tous âges actu. réa. n'est pas égal à somme des réa. actu. par classe âge 0 à 90+(
)
B. GEODES et data.gouv sont incohérents entre eux
le total data.gouv en rea du jour = 2 x celui GEODES
si on croit GEODES (3443 ou 3415 au total des réa du jour)
la somme des classes (hors 0) dans data.gouv donne 3415
donc déjà quel est le bon total 3443 ou 3415 ???
la somme des classes age 0 à 90+ GEODES = 3415
somme classes sans classe 0 data.gouv = 3415
pourquoi 3443, le total tous ages GEODES des rea actu au 31/10 est aussi dans la base data.gouv.fr/fr/datasets/r/… dans la classe 0 ???
est ce une erreur de manipulation ?
car si on garde cette ligne on obtient un total data.gouv des rea actu = double celui de GEODES !!!
c'est donc très grave ce qui se passe puisque des données fiables sont fondamentales pour prise de décision éclairée et pour informer le public en toute transparence et honnêteté !
et ceci vaut pour d'autres indicateurs (hospi, décès) et autres dates !!!
je met en lien le dernier fichier excel de comparaison geodes vs data.gouv ici file.io/hIF3VnnEOzQq
merci d'avoir lu ce #thread jusqu'au bout
merci de diffuser et partager au maximum
merci de faire un max d'analyse stat aussi #COVID19france#confinement#PCRtest