#Thread Comment des données en open data peuvent être le point de départ d’enquêtes journalistiques de terrain. Démonstration avec la base ARIA des accidents industriels gérée par le Bureau d’analyse des risques et pollutions industriels (Barpi) #DDJ#RStats 1/18 📊📈📉
La base ARIA est un inventaire des accidents industriels en France (pour la plupart) qui ont pu porter atteinte à la santé, la sécurité publique ou l’environnement. Elle n’est pas exhaustive. Mais elle peut être utilisée pour déceler des tendances et des similitudes 2/18
Cette base est en fait une vraie mine d’or. Pour chaque accident, elle donne la localisation, une description de l’évènement, et beaucoup de détails : l’environnement impacté, les matières impliquées, les causes de l’accident, le secteur d’activité, etc. 3/18
Elle contient en réalité tellement d’informations qu’il est très facile de s’y perdre. Concentrons nous donc sur les accidents survenus entre 2008 et 2019, dans des installations classées pour la protection de l’environnement 4/18
Nous voilà avec un échantillon de 12 555 accidents survenus en France. La première chose que l’on regarde, c’est leur distribution par année. Il ressort que plus d’accidents sont référencés depuis 2017, dont un nombre plus important ayant des conséquences environnementales 5/18
Voyons ensuite distribution des accidents par secteur d’activité. Histoire de savoir si quelques secteurs sont plus représentés que d’autres. Bingo, quatre secteurs d’activité totalisent plus de 85% des accidents 6/18
Dans la base ARIA, les accidents environnementaux sont notés de 1 (les moins graves) à 6 (les plus graves). Lorsqu’on regarde la proportion de ces niveaux de gravité, il ressort que les accidents ont tendance à être plus graves dans l’agriculture, la sylviculture et la pêche 7/18
Regardons donc de plus près cette catégorie. Au sein de cet ensemble « agriculture, sylviculture et pêche », l’essentiel des accidents environnementaux se concentre dans une sous-catégorie : « Culture et production animale » 8/18
On a donc beaucoup d’accidents dans l’agriculture. C’est large! Voyons si nous pouvons resserrer notre recherche. La visualisation en tree-map est pour cela très pratique. Nous découvrons ainsi qu’au sein de l’agriculture, c’est dans l’élevage qu’il y a le plus d’accidents 9/18
Trois sous-catégories comptent plus de 10 accidents survenus entre 2008 et 2019. Et parmi ces sous-catégories, c’est dans les élevages porcins que l’on trouve les accidents environnementaux les plus graves 10/18
Concentrons nous donc sur les élevages porcins. Leur répartition par région montre clairement que la plupart sont survenus en Bretagne 11/18
Mais ce sujet est-il actuel ? Le nombre d’accidents dans les élevages porcins de Bretagne, référencés dans la base ARIA, a-t-il augmenté ces dernières années ? La réponse est oui 12/18
C’est dans le Finistère qu’ont eu lieu les accidents les plus graves 13/18
L’eau est le principal milieu naturel atteint par les accidents dans les élevages porcins bretons. Et c’est l’unique milieu pollué par les accidents les plus graves 14/18
Ces accidents sont de deux principaux types : rejets de matières dangereuses et incendies. Mais c’est la première catégorie qui concentre les accidents les plus graves 15/18
Et le lisier est la principale matière impliquée 16/18
Nous savons donc qu’il y a une hausse des accidents dans les porcheries bretonnes (répertoriées dans la base ARIA), que ces accidents impactent le milieu aquatique, et que les répercussions environnementales sont plus graves lorsqu’il y a des rejets de lisier 17/18
Après avoir croisé ces informations avec une recherche dans les médias locaux, il ne restait plus qu’à lancer une enquête de terrain. Ce que nous avons fait avec @ThomasBaietto. Le résultat a été publié la semaine dernière ici => francetvinfo.fr/economie/emplo…. 18/18
• • •
Missing some Tweet in this thread? You can try to
force a refresh
[#THREAD] Chutes des ventes, recettes publicitaires en berne, éditeurs déficitaires, stratégies numériques balbutiantes, le passage au scanner des chiffres de la presse dépeint un tableau noir, alors que l’année 2020 s’annonce déjà comme l’une des pires de son histoire (1/60)
La baisse des ventes des journaux ne date pas d’hier. C’est un mouvement qui prend racine au début des années 2000. La démocratisation d’Internet, et son flot d’informations gratuites, donne le coup d’envoi d’une chute qui ne semble plus vouloir s’arrêter (2/60)
Un nouveau cap est franchi après la crise financière de 2008. La chute des ventes de la presse payante grand public s’accélère à vitesse grand V jusqu’en 2016, date des derniers chiffres publiés par le ministère de la Culture (3/60)
[#THREAD] Le camembert. Certains l’aiment coulant. D’autres plâtreux. En data visualisation, on l’aime coloré. Mais le camembert est en fait périmé depuis 1984, et la publication des résultats de l’expérience scientifique de William Cleveland et Robert McGill (1/29)
Avant de raconter l’expérience de Cleveland et McGill, un peu de contexte historique : en 1984, faire des expériences scientifiques sur les graphiques c’est quelque chose de plutôt nouveau (2/29)
Dans les années 1960-1970, on ne parlait pas encore de data visualisation mais de « sémiologie graphique ». L’analyse des graphiques était surtout pratiquée par les adeptes de la sémiotique, l’étude des signes et de la signalisation (3/29)