Gro-Tsen Profile picture
Jan 31, 2023 44 tweets 11 min read Read on X
Voici maintenant une tentative d'analyse de ces données 🔽 de températures. Je vais chercher à comprendre un peu les anomalies de température, c'est-à-dire les écarts à la température «attendue» pour le jour donné, et leur distribution statistique, notamment les extrêmes. •1/?
[Méta: de façon inhabituelle pour moi, je vais rédiger et poster mon fil au fur et à mesure, à un rythme sans doute inégal. C'est pour ça la numérotation de ce tweet dit «2/?», je ne sais pas encore combien il y en aura.] •2/?
La première question qu'on se pose, c'est «quelle est la température “typique” pour un jour donné de l'année?». L'idée évidente c'est de moyenner sur le jeu de données. Le problème c'est que c'est hyper bruité: ⬇️. Ces petites fluctuations ne veulent évidemment RIEN dire. •3/? Graphe de la température mo...
Évidemment qu'il ne fait pas «vraiment» plus froid le 24 avril que le 23 avril, c'est juste un hasard que les choses sont tombées comme ça. En fait, le problème est que le signal est extrêmement bruité: voilà quoi ressemblent l'ensemble des points. ⬇️ •4/? Température quotidienne moy...
Alors comment on débruite un tel truc? On pourrait penser faire une moyenne par fenêtre glissante (par exemple, 15 jours centrés), mais ça ça revient à faire une convolée avec un signal carré — autant convoler avec une gaussienne, ce sera plus régulier. •5/?
Convoler avec une gaussienne, ça revient à multiplier les coefficients de Fourier par une gaussienne, donc en fait c'est ça que j'ai fait pour le calcul. Reste à choisir la largeur de cette gaussienne. Voici quelques moyennes possibles: ⬇️ •6/? Température moyenne en Fran...
Dans le graphe du tweet précédent, la courbe en gris est la moyenne non lissée, les trois courbes bleues sont des versions lissées par convolution avec une gaussienne. Celle en pointillés moyenne «trop», celle en tiretés ne moyenne «pas assez». •7/?
Je dis ça au jugé, je ne connais pas de critère précis pour savoir sur quelle largeur faire la convolution. J'ai finalement choisi de multiplier le coefficient de Fourier d'ordre k/an par exp(−(k/6)²). Ça convole par une gaussienne d'écart-type 1an/(6π√2) ~ 13.7j. •8/?
Bref, voici⬇️ le résultat de ce moyennage, donc la température «attendue» en fonction du jour de l'année: contre la moyenne naïve, d'une part, et contre le nuage de points de l'autre (pas à la même échelle: mon moyennage est la — même — courbe bleue dans les deux). •9/? Température moyenne en Fran...Température quotidienne moy...
Ce qui reste quand on soustrait la température d'un jour donnée à la température «attendue» que je viens de décrire, c'est ce qu'on peut appeler des «anomalies» de températures, représenté ici⬇️ par un nuage de point gris (un point par jour). •10/? Graphe des différences entr...
Donc, pour être bien clair, dans le graphe du tweet précédent, un point élevé/bas signifie que le jour est anormalement chaud/froid par rapport à ce jour de l'année, et 0 signifie «comme attendu». La droite rouge est la régression linéaire de l'ensemble. •11/?
Cette droite rouge a une pente de 2.53 degrés par siècle, c'est le réchauffement climatique observé sur mon intervalle de données, cohérent avec ce que j'avais trouvé précédemment🔽. Évidemment ma droite passe par 0 au milieu de l'intervalle. •12/?
Maintenant ce qui m'intéresse c'est de considérer les jours anormaux ✳︎même✳︎ après soustraction de ce réchauffement climatique. Donc je vais appeler «anomalie corrigée» la différence à la droite de régression. Voici à quoi ça ressemble: ⬇️ •13/?? Graphe des anomalies corrig...
Pour être bien clair, dans ce graphe, un point représente l'écart entre la température du jour (moyennée-lissée) et la température prédite d'après le jour de l'année ET le modèle linéaire de réchauffement climatique. C'est ça que j'appelle «anomalie corrigée». •14/?
La raison pour laquelle je fais cette double correction (jour dans l'année ET changement climatique), c'est parce que je veux connaître les jours exceptionnellement chauds/froids même pour leur saison et même pour le réchauffement moyen observé (en France). •15/?
Évidemment si on ne corrige pas pour le changement climatique il y a plus de jours «anormalement chauds» maintenant qu'il y a 70 ans. Ce qui m'intéresse c'est la fréquence après correction de la tendance linéaire de base. D'où la double correction. •16/?
Ceci étant dit, quels sont les jours les plus anormalement chauds de mes données? Ce sont:
1989-12-16: +9.5
1952-07-01: +9.2
1961-12-11: +9.1
1958-02-14: +8.8
2022-06-18: +8.7
2003-08-05: +8.7
1961-12-04: +8.6
1953-12-04: +8.5
2019-06-27: +8.4
2019-07-25: +8.4
•17/?
Le 16 décembre 1989 a été le jour le plus ✸anormalement✸ chaud en France depuis 1950, selon moi, donc. (Je répète que c'est après correction du réchauffement climatique linéaire, sinon c'est le 18 juin 2022 qui gagne.) •18/?
Et les jours les plus anormalement froids?
1985-01-08: −15.4
1985-01-16: −15.1
1987-01-12: −14.7
1985-01-15: −14.2
1956-02-02: −14.1
1956-02-10: −13.5
1985-01-14: −13.2
1985-01-06: −13.1
1956-02-11: −13.0
1954-02-01: −12.3
(Valeurs d'écarts à la valeur attendue!)
•19/?
Tous ces jours sont en hiver, parce que les hivers 1985 et 1956 ont été vraiment très froids. On peut bien sûr trouver des jours anormalement froids d'autres saisons. Le plus fort que j'ai d'avril à octobre est le 1986-04-12 avec −8.7 d'écart, puis le 2003-10-24 à −8.1. •20/?
(Visiblement les jours anormalement froids ont tendance à se produire plutôt en hiver, mais même les jours anormalement chauds se produisent souvent en hiver: il y a juste plus de variabilité tes températures en hiver qu'en été.) •21/?
Bon, mais ce qui m'intéresse, ce n'est pas de produire des anecdotes météorologiques, c'est d'étudier la distribution de cette anomalie corrigée. Voici sa fonction de répartition ⬇️ (abscisse: anomalie A, ordonnée: proportion des jours à <A d'anomalie corrigée). •22/? Fonction de répartition de ...
Les deux barres verticales pointillées représentent un écart-type de part et d'autre de la moyenne (par construction, elle vaut 0). La médiane est à 0.03, donc c'est raisonnablement symétrique. •23/?
Bon, je reprends ce fil là où je l'avais laissé. J'ai défini l'«anomalie corrigée de température d'un jour» comme la différence entre la température observée et celle attendue pour le jour dans l'année compte tenu d'un réchauffement climatique linéaire (à 2.52K/siècle). •24/?
Cette anomalie corrigée a (moyenne 0 par construction et) un écart-type de σ = 2.89K. Sur mes données, 68% des jours ont une anomalie corrigée dans l'intervalle ±σ, et environ 96% dans l'intervalle ±2σ. J'ai mis les 4% restants en gras sur ce graphe ⬇️ (=tweet 13). •25/? Graphe des anomalies corrig...
Première question qu'on peut se poser: ces 4% de jours où l'anomalie (corrigée) sort de l'intervalle ±2σ, donc qui sont anormalement chauds ou froids au niveau 2σ (en gras sur le graphique du tweet précédent) deviennent-ils de plus en plus fréquents avec le temps? •26/?
À vue de nez on ne dirait pas. Pour être un peu plus précis que ce «vue de nez», j'ai calculé le barycentre dans l'intervalle de temps des jours «anormalement chauds à 2σ» et «anormalement froids à 2σ», et ils valent 0.497 et 0.500 respectivement … •27/?
… (où 0 = le 1er janvier 1950 et 1 = le 31 décembre 2022, points extrêmes de mon jeu de données), bref ces jours anormaux n'ont pas tendance à devenir plus fréquents (ça décalerait le barycentre vers 1), ils me semblent au contraire étonnamment bien répartis. •28/?
⚠️ Je répète que ceci est APRÈS correction par un changement climatique linéaire. Autrement dit, ce que je dis est que les événement extrêmes ne semblent pas devenir plus fréquents / extrêmes que prédit par ce modèle linéaire (ici estimé à 2.53 degré par siècle), … •29/?
… je ne suis PAS en train de dire que les extrêmes de canicule ne deviennent pas plus fréquents, juste qu'ils ne deviennent pas PLUS fréquents que ce qu'on attend par un modèle linéaire de changement climatique. •30/?
D'ailleurs, pour illustrer le point précédent, si je refais le calcul du tweet 27 avec l'anomalie brute (non corrigée), je trouve un barycentre de 0.677 pour les jours chauds à >2σ et 0.415 pour les froids à <−2σ. Donc sans correction, on voit très bien le réchauffement! •31/?
OK, donc si je résume, the story so far:

‣ Je modélise la température par:

(température «attendue» pour le jour de l'année [tweet 9])

+ (changement climatique linéaire [tweet 12])

+ «anomalie corrigée»

Je cherche à comprendre la distribution de cette dernière.

•32/?
‣ L'anomalie corrigée a un écart-type de σ = 2.89K (degrés). Sa distribution observée est tracée tweet 22. Ses écarts à ±σ et ±2σ suivent largement la forme d'une gaussienne. Ils ne semblent pas devenir plus fréquents avec le temps. •33/??
❧ Je peux calculer d'autres quantités sur mes anomalies corrigées, notamment l'asymétrie en.wikipedia.org/wiki/Skewness et l'excès d'aplatissement en.wikipedia.org/wiki/Kurtosis qui sont en gros le 3e et 4e moments de la variable, correctement normalisés (cf. Wikipédia): … •34/?
… ces quantités mesurent en gros combien la loi de la distribution n'est pas gaussienne au niveau des 3e et 4e moments. Je trouve:

⁃ asymétrie = −0.22, donc décalée vers les anomalies négatives,

⁃ kurtosis normalisé = 0.21, donc plus aplatie qu'une gaussienne.

•35/?
Bon alors honnêtement ces valeurs d'asymétrie et de kurtosis ne me parlent pas trop (peut-être qu'elles parleront à d'autres), mais ce que je peux faire c'est tracer la distribution en échelle log pour comparer à une gaussienne: ⬇️ (en bleu: ℙ(X<a), en rouge ℙ(X>a)). •36/? Fonction de répartition de ...
Donc, le graphe du tweet précédent montre la proportion des jours ayant une anomalie corrigée <a (en bleu) ou >a (en rouge), avec, en pointillés gris, la distribution gaussienne de même écart-type σ = 2.89K (i.e., essentiellement la fonction d'erreur). •37/?
Ce que je vois là-dessus, c'est que jusque vers 2% de probabilité de part ou d'autre dans l'intervalle ±2σ les anomalies corrigées sont bien modélisées par une gaussienne, mais après il y a des différences significatives, et asymétriques: … •38/?
… les anomalies de FROID sont PLUS probables que ce que le suggère un modèle gaussien avec l'écart-type observé («la queue froide est plus épaisse» 🙊), les anomalies de CHAUD sont au contraire MOINS probables. •39/?
Bon, pour nuancer cette affirmation, quand je dis «plus probables» ça peut aussi dire «plus durables», parce que tout ce que mes calculs voient c'est des nombres de jours d'anomalie, sans tenir compte de leur groupement. •40/?
Par ailleurs, il serait peut-être intéressant de comparer la distribution observée avec une distribution standard ayant non seulement cette moyenne (0) et cet écart-type (σ) mais aussi l'asymétrie et le kurtosis mesurés. Mais je ne sais connais pas ces trucs. •41/?
Bon, je veux clore ce fil (avant que Twitter ne ferme son API publique), donc je mets juste un dernier graphique, montrant l'autocorrélation (r de Pearson) des anomalies corrigées à n jours d'intervalle. La régression de log(r) a une pente de −0.22/j. •42/44 Graphe de l'autocorrélation...
J'avais déjà fait 🔽 un calcul d'autocorrélation des températures, mais cette fois je corrige l'effet saisonnier, donc l'autocorrélation tend bien vers 0 avec pente logarithmique 1/(4.5j): c'est le temps typique de dissipation des anomalies. •43/44
Bon, je finis ce fil par le code Sage que j'ai utilisé pour ces graphiques et analyses: gist.github.com/Gro-Tsen/92774… (c'est un peu le bordel, mais si on l'évalue ligne à ligne ça doit reproduire les graphes qui précèdent dans ce fil). La source des données est rappelée. •44/44

• • •

Missing some Tweet in this thread? You can try to force a refresh
 

Keep Current with Gro-Tsen

Gro-Tsen Profile picture

Stay in touch and get notified when new unrolls are available from this author!

Read all threads

This Thread may be Removed Anytime!

PDF

Twitter may remove this content at anytime! Save it as PDF for later use!

Try unrolling a thread yourself!

how to unroll video
  1. Follow @ThreadReaderApp to mention us!

  2. From a Twitter thread mention us with a keyword "unroll"
@threadreaderapp unroll

Practice here first or read more on our help page!

More from @gro_tsen

Jul 20
OK, this 🔽 blew up (and I'll need to mute the thread). I can't respond to every reply individually, but there are a few common ones that deserve specific attention. So here are a few followup points. 🧵⤵️ •1/15
First, there are number of things that I forgot to mention. Like how many homeless people were forcibly removed from Paris ahead of the games, or students being told to vacate their residence because they would be used as lodging for the games. •2/15
Or how the price of metro tickets has been suddenly doubled(!) for the games. Admittedly this is more of a tourist tax, because locals typically have monthly cards or could buy their tickets well in advance, but this is still crazy from a supposed public service. •3/15
Read 15 tweets
Jul 19
I think non-French and non-French-speaking readers should be told about how utterly insane things are now in and around Paris because of the Olympics are. The opening ceremony is one week away and they've already barred any access to the Seine! 🧵⤵️ •1/19
The different levels of security perimeters are incomprehensible, but basically all areas within ~100m of the Seine are now completely off-limits. You can only go there, even by foot, if you live there or work there, and you need to get a special permit in advance. •2/19
Getting the permit is no sure thing: apparently some people have had their application denied (no explanations given), so they're not allowed to go where they work, or even where they live. Nobody knows what's supposed to happen to them. •3/19
Read 28 tweets
Jun 24
En tant que Français et Canadien, je pense qu'il est nécessaire que je dise un mot au sujet du fait que les binationaux sont soudainement considérés comme suspects en France, presque des ennemis de l'intérieur. 🧵⤵️ •1/22
Je suis né en France d'une mère française, et j'ai vécu quasi toute ma vie en France, je parle français depuis que je sais parler, j'ai fait mes études en France, mes amis vivent en France, je m'intéresse à l'histoire de France, au droit français, à la langue française… •2/22
Bref, je suis non seulement légalement français, mais, que ça me plaise ou non, je suis aussi culturellement français, et, je n'ai aucune honte à le dire, j'aime profondément ce pays, au moins autant que Monsieur Bardella. Même si en ce moment j'ai du mal à en être fier. •3/22
Read 22 tweets
Jun 13
Une chose fascinante avec le regard que la droite et le centre portent sur la gauche française, c'est que la gauche du passé leur semble toujours plus acceptable que celle du présent: Gambetta, Briand, Blum, Mendès-France, on conteste très rarement leur héritage, … •1/11
… souvent même la droite reconnaît explicitement que c'étaient de grands hommes et affirme que la gauche les aurait ensuite trahis (Sarkozy en 2007 par exemple: «la gauche d'aujourd'hui [n'a] plus grand-chose à voir avec la gauche de Jaurès»). •2/11vie-publique.fr/discours/16640…
La gauche du présent, en revanche, ou du passé proche, paraît toujours détestable: la victoire du Front populaire de 1936, et l'alliance des socialistes et radicaux avec les communistes, n'a pas été accueillie avec enthousiasme par le centre-droit d'alors, … •3/11 Image
Read 11 tweets
Jun 11
J'ai calculé les coefficients de corrélation des résultats entre toutes les listes des dernières européennes, et je trouve ça très intéressant pour se faire une idée de la proximité idéologique entre elles (notamment, de qui se rapprochent les «petites» listes). 🧵⤵️ •1/14


Image
Image
Image
Image
(Désolé pour ce dump sous forme d'images: si vous voulez le résultat sous format texte, il est là: — la même page comporte le script Perl abominable que j'ai utilisé pour le calculer.) •2/14gist.github.com/Gro-Tsen/e54a8…
La source des données est là: (il faut fournir ce fichier csv en entrée à mon script Perl pour produire le résultat). •3/14 data.gouv.fr/fr/datasets/re…
Read 14 tweets
Nov 26, 2023
Let me say a few things about “random” versus “generic” sequences (binary sequences, say). A random sequence of 0's and 1's everyone has some idea of what that looks like: take a fair coin and flip it repeatedly. But what in the world is a “generic” sequence? 🤔🧵⤵️ •1/21
There are many flavors of randomness and correspondingly many flavors of genericity, but the overall theme seems to be that a random object is one that doesn't belong to any “easily explicitly described” set of measure zero, … •2/21
… whereas a generic object is one that doesn't belong to any “easily explicitly described” meager set. What does all of this mean? Well, “easily explicitly described” depends on the flavor we're talking about: but clearly we need some kind of restriction, … •3/21
Read 21 tweets

Did Thread Reader help you today?

Support us! We are indie developers!


This site is made by just two indie developers on a laptop doing marketing, support and development! Read more about the story.

Become a Premium Member ($3/month or $30/year) and get exclusive features!

Become Premium

Don't want to be a Premium member but still want to support us?

Make a small donation by buying us coffee ($5) or help with server cost ($10)

Donate via Paypal

Or Donate anonymously using crypto!

Ethereum

0xfe58350B80634f60Fa6Dc149a72b4DFbc17D341E copy

Bitcoin

3ATGMxNzCUFzxpMCHL5sWSt4DVtS8UqXpi copy

Thank you for your support!

Follow Us!

:(