Gro-Tsen Profile picture
Jan 31 44 tweets 11 min read Twitter logo Read on Twitter
Voici maintenant une tentative d'analyse de ces données 🔽 de températures. Je vais chercher à comprendre un peu les anomalies de température, c'est-à-dire les écarts à la température «attendue» pour le jour donné, et leur distribution statistique, notamment les extrêmes. •1/?
[Méta: de façon inhabituelle pour moi, je vais rédiger et poster mon fil au fur et à mesure, à un rythme sans doute inégal. C'est pour ça la numérotation de ce tweet dit «2/?», je ne sais pas encore combien il y en aura.] •2/?
La première question qu'on se pose, c'est «quelle est la température “typique” pour un jour donné de l'année?». L'idée évidente c'est de moyenner sur le jeu de données. Le problème c'est que c'est hyper bruité: ⬇️. Ces petites fluctuations ne veulent évidemment RIEN dire. •3/? Graphe de la température mo...
Évidemment qu'il ne fait pas «vraiment» plus froid le 24 avril que le 23 avril, c'est juste un hasard que les choses sont tombées comme ça. En fait, le problème est que le signal est extrêmement bruité: voilà quoi ressemblent l'ensemble des points. ⬇️ •4/? Température quotidienne moy...
Alors comment on débruite un tel truc? On pourrait penser faire une moyenne par fenêtre glissante (par exemple, 15 jours centrés), mais ça ça revient à faire une convolée avec un signal carré — autant convoler avec une gaussienne, ce sera plus régulier. •5/?
Convoler avec une gaussienne, ça revient à multiplier les coefficients de Fourier par une gaussienne, donc en fait c'est ça que j'ai fait pour le calcul. Reste à choisir la largeur de cette gaussienne. Voici quelques moyennes possibles: ⬇️ •6/? Température moyenne en Fran...
Dans le graphe du tweet précédent, la courbe en gris est la moyenne non lissée, les trois courbes bleues sont des versions lissées par convolution avec une gaussienne. Celle en pointillés moyenne «trop», celle en tiretés ne moyenne «pas assez». •7/?
Je dis ça au jugé, je ne connais pas de critère précis pour savoir sur quelle largeur faire la convolution. J'ai finalement choisi de multiplier le coefficient de Fourier d'ordre k/an par exp(−(k/6)²). Ça convole par une gaussienne d'écart-type 1an/(6π√2) ~ 13.7j. •8/?
Bref, voici⬇️ le résultat de ce moyennage, donc la température «attendue» en fonction du jour de l'année: contre la moyenne naïve, d'une part, et contre le nuage de points de l'autre (pas à la même échelle: mon moyennage est la — même — courbe bleue dans les deux). •9/? Température moyenne en Fran...Température quotidienne moy...
Ce qui reste quand on soustrait la température d'un jour donnée à la température «attendue» que je viens de décrire, c'est ce qu'on peut appeler des «anomalies» de températures, représenté ici⬇️ par un nuage de point gris (un point par jour). •10/? Graphe des différences entr...
Donc, pour être bien clair, dans le graphe du tweet précédent, un point élevé/bas signifie que le jour est anormalement chaud/froid par rapport à ce jour de l'année, et 0 signifie «comme attendu». La droite rouge est la régression linéaire de l'ensemble. •11/?
Cette droite rouge a une pente de 2.53 degrés par siècle, c'est le réchauffement climatique observé sur mon intervalle de données, cohérent avec ce que j'avais trouvé précédemment🔽. Évidemment ma droite passe par 0 au milieu de l'intervalle. •12/?
Maintenant ce qui m'intéresse c'est de considérer les jours anormaux ✳︎même✳︎ après soustraction de ce réchauffement climatique. Donc je vais appeler «anomalie corrigée» la différence à la droite de régression. Voici à quoi ça ressemble: ⬇️ •13/?? Graphe des anomalies corrig...
Pour être bien clair, dans ce graphe, un point représente l'écart entre la température du jour (moyennée-lissée) et la température prédite d'après le jour de l'année ET le modèle linéaire de réchauffement climatique. C'est ça que j'appelle «anomalie corrigée». •14/?
La raison pour laquelle je fais cette double correction (jour dans l'année ET changement climatique), c'est parce que je veux connaître les jours exceptionnellement chauds/froids même pour leur saison et même pour le réchauffement moyen observé (en France). •15/?
Évidemment si on ne corrige pas pour le changement climatique il y a plus de jours «anormalement chauds» maintenant qu'il y a 70 ans. Ce qui m'intéresse c'est la fréquence après correction de la tendance linéaire de base. D'où la double correction. •16/?
Ceci étant dit, quels sont les jours les plus anormalement chauds de mes données? Ce sont:
1989-12-16: +9.5
1952-07-01: +9.2
1961-12-11: +9.1
1958-02-14: +8.8
2022-06-18: +8.7
2003-08-05: +8.7
1961-12-04: +8.6
1953-12-04: +8.5
2019-06-27: +8.4
2019-07-25: +8.4
•17/?
Le 16 décembre 1989 a été le jour le plus ✸anormalement✸ chaud en France depuis 1950, selon moi, donc. (Je répète que c'est après correction du réchauffement climatique linéaire, sinon c'est le 18 juin 2022 qui gagne.) •18/?
Et les jours les plus anormalement froids?
1985-01-08: −15.4
1985-01-16: −15.1
1987-01-12: −14.7
1985-01-15: −14.2
1956-02-02: −14.1
1956-02-10: −13.5
1985-01-14: −13.2
1985-01-06: −13.1
1956-02-11: −13.0
1954-02-01: −12.3
(Valeurs d'écarts à la valeur attendue!)
•19/?
Tous ces jours sont en hiver, parce que les hivers 1985 et 1956 ont été vraiment très froids. On peut bien sûr trouver des jours anormalement froids d'autres saisons. Le plus fort que j'ai d'avril à octobre est le 1986-04-12 avec −8.7 d'écart, puis le 2003-10-24 à −8.1. •20/?
(Visiblement les jours anormalement froids ont tendance à se produire plutôt en hiver, mais même les jours anormalement chauds se produisent souvent en hiver: il y a juste plus de variabilité tes températures en hiver qu'en été.) •21/?
Bon, mais ce qui m'intéresse, ce n'est pas de produire des anecdotes météorologiques, c'est d'étudier la distribution de cette anomalie corrigée. Voici sa fonction de répartition ⬇️ (abscisse: anomalie A, ordonnée: proportion des jours à <A d'anomalie corrigée). •22/? Fonction de répartition de ...
Les deux barres verticales pointillées représentent un écart-type de part et d'autre de la moyenne (par construction, elle vaut 0). La médiane est à 0.03, donc c'est raisonnablement symétrique. •23/?
Bon, je reprends ce fil là où je l'avais laissé. J'ai défini l'«anomalie corrigée de température d'un jour» comme la différence entre la température observée et celle attendue pour le jour dans l'année compte tenu d'un réchauffement climatique linéaire (à 2.52K/siècle). •24/?
Cette anomalie corrigée a (moyenne 0 par construction et) un écart-type de σ = 2.89K. Sur mes données, 68% des jours ont une anomalie corrigée dans l'intervalle ±σ, et environ 96% dans l'intervalle ±2σ. J'ai mis les 4% restants en gras sur ce graphe ⬇️ (=tweet 13). •25/? Graphe des anomalies corrig...
Première question qu'on peut se poser: ces 4% de jours où l'anomalie (corrigée) sort de l'intervalle ±2σ, donc qui sont anormalement chauds ou froids au niveau 2σ (en gras sur le graphique du tweet précédent) deviennent-ils de plus en plus fréquents avec le temps? •26/?
À vue de nez on ne dirait pas. Pour être un peu plus précis que ce «vue de nez», j'ai calculé le barycentre dans l'intervalle de temps des jours «anormalement chauds à 2σ» et «anormalement froids à 2σ», et ils valent 0.497 et 0.500 respectivement … •27/?
… (où 0 = le 1er janvier 1950 et 1 = le 31 décembre 2022, points extrêmes de mon jeu de données), bref ces jours anormaux n'ont pas tendance à devenir plus fréquents (ça décalerait le barycentre vers 1), ils me semblent au contraire étonnamment bien répartis. •28/?
⚠️ Je répète que ceci est APRÈS correction par un changement climatique linéaire. Autrement dit, ce que je dis est que les événement extrêmes ne semblent pas devenir plus fréquents / extrêmes que prédit par ce modèle linéaire (ici estimé à 2.53 degré par siècle), … •29/?
… je ne suis PAS en train de dire que les extrêmes de canicule ne deviennent pas plus fréquents, juste qu'ils ne deviennent pas PLUS fréquents que ce qu'on attend par un modèle linéaire de changement climatique. •30/?
D'ailleurs, pour illustrer le point précédent, si je refais le calcul du tweet 27 avec l'anomalie brute (non corrigée), je trouve un barycentre de 0.677 pour les jours chauds à >2σ et 0.415 pour les froids à <−2σ. Donc sans correction, on voit très bien le réchauffement! •31/?
OK, donc si je résume, the story so far:

‣ Je modélise la température par:

(température «attendue» pour le jour de l'année [tweet 9])

+ (changement climatique linéaire [tweet 12])

+ «anomalie corrigée»

Je cherche à comprendre la distribution de cette dernière.

•32/?
‣ L'anomalie corrigée a un écart-type de σ = 2.89K (degrés). Sa distribution observée est tracée tweet 22. Ses écarts à ±σ et ±2σ suivent largement la forme d'une gaussienne. Ils ne semblent pas devenir plus fréquents avec le temps. •33/??
❧ Je peux calculer d'autres quantités sur mes anomalies corrigées, notamment l'asymétrie en.wikipedia.org/wiki/Skewness et l'excès d'aplatissement en.wikipedia.org/wiki/Kurtosis qui sont en gros le 3e et 4e moments de la variable, correctement normalisés (cf. Wikipédia): … •34/?
… ces quantités mesurent en gros combien la loi de la distribution n'est pas gaussienne au niveau des 3e et 4e moments. Je trouve:

⁃ asymétrie = −0.22, donc décalée vers les anomalies négatives,

⁃ kurtosis normalisé = 0.21, donc plus aplatie qu'une gaussienne.

•35/?
Bon alors honnêtement ces valeurs d'asymétrie et de kurtosis ne me parlent pas trop (peut-être qu'elles parleront à d'autres), mais ce que je peux faire c'est tracer la distribution en échelle log pour comparer à une gaussienne: ⬇️ (en bleu: ℙ(X<a), en rouge ℙ(X>a)). •36/? Fonction de répartition de ...
Donc, le graphe du tweet précédent montre la proportion des jours ayant une anomalie corrigée <a (en bleu) ou >a (en rouge), avec, en pointillés gris, la distribution gaussienne de même écart-type σ = 2.89K (i.e., essentiellement la fonction d'erreur). •37/?
Ce que je vois là-dessus, c'est que jusque vers 2% de probabilité de part ou d'autre dans l'intervalle ±2σ les anomalies corrigées sont bien modélisées par une gaussienne, mais après il y a des différences significatives, et asymétriques: … •38/?
… les anomalies de FROID sont PLUS probables que ce que le suggère un modèle gaussien avec l'écart-type observé («la queue froide est plus épaisse» 🙊), les anomalies de CHAUD sont au contraire MOINS probables. •39/?
Bon, pour nuancer cette affirmation, quand je dis «plus probables» ça peut aussi dire «plus durables», parce que tout ce que mes calculs voient c'est des nombres de jours d'anomalie, sans tenir compte de leur groupement. •40/?
Par ailleurs, il serait peut-être intéressant de comparer la distribution observée avec une distribution standard ayant non seulement cette moyenne (0) et cet écart-type (σ) mais aussi l'asymétrie et le kurtosis mesurés. Mais je ne sais connais pas ces trucs. •41/?
Bon, je veux clore ce fil (avant que Twitter ne ferme son API publique), donc je mets juste un dernier graphique, montrant l'autocorrélation (r de Pearson) des anomalies corrigées à n jours d'intervalle. La régression de log(r) a une pente de −0.22/j. •42/44 Graphe de l'autocorrélation...
J'avais déjà fait 🔽 un calcul d'autocorrélation des températures, mais cette fois je corrige l'effet saisonnier, donc l'autocorrélation tend bien vers 0 avec pente logarithmique 1/(4.5j): c'est le temps typique de dissipation des anomalies. •43/44
Bon, je finis ce fil par le code Sage que j'ai utilisé pour ces graphiques et analyses: gist.github.com/Gro-Tsen/92774… (c'est un peu le bordel, mais si on l'évalue ligne à ligne ça doit reproduire les graphes qui précèdent dans ce fil). La source des données est rappelée. •44/44

• • •

Missing some Tweet in this thread? You can try to force a refresh
 

Keep Current with Gro-Tsen

Gro-Tsen Profile picture

Stay in touch and get notified when new unrolls are available from this author!

Read all threads

This Thread may be Removed Anytime!

PDF

Twitter may remove this content at anytime! Save it as PDF for later use!

Try unrolling a thread yourself!

how to unroll video
  1. Follow @ThreadReaderApp to mention us!

  2. From a Twitter thread mention us with a keyword "unroll"
@threadreaderapp unroll

Practice here first or read more on our help page!

More from @gro_tsen

May 24
This 🔽 is perhaps what baffles me most about flat earth conspiracy theories: never mind that they can't explain something as basic as sunrise and sunset, what makes even less sense is whyever anyone would want to keep the shape of the Earth a secret.
Some seem to believe (or claim to believe…) that it's because there's something hidden behind the Great Ice Wall that takes the place of the south pole in their theories. But why not just claim there's nothing behind that wall but the edge of the world, or something?
Still not sure whether most flat earthers really believe in what they claim to believe, or whether they're just trying to get attention: you have to admit that “globe conspiracy” is an attention-grabber (as: “they can't possibly be that stupid can they?”).
Read 4 tweets
May 24
Quelques remarques sur la rédaction d'une demande d'accès aux documents administratifs: le problème est que chaque tournure peut être problématique dans certaines conditions.
Si on demande «tous les documents relatifs à X», on risque de faire face à une interprétation minimaliste, donc incomplète, de X. Mais si on précise «notamment X1, X2, X3…», il y a un risque que X1, X2, X3 n'existent pas, …
… mais si on cherche une formulation pour dire «absolument tout ce qui concerne X de près ou de loin», il y a un risque que la demande soit jugée abusive. Bref, il faut jongler avec ces différentes possibilités, faire un pari sur ce qui marchera le mieux.
Read 6 tweets
May 23
Supposons que je veuille demander à la Mairie de Paris (au titre de l'accès aux documents administratifs) le détail de la programmation des feux de circulation tricolores qu'elle contrôle. Quel terme pensez-vous que je doive utiliser dans la demande?
Je veux dire, quel est le terme administratif pour «programmation des feux de circulation tricolore»?

Je veux le détail du cadencement des couleurs, les feux synchronisés entre eux et leurs délais, les heures des différents régimes de cadencement, etc. Comment on dit tout ça?
Bon, j'ai préparé le courrier suivant. Quelqu'un peut le relire avant que je l'envoie? Lettre adressée à la Mairie...
Read 5 tweets
Mar 30
Petit fil à l'attention des gens qui, comme moi, aiment télécharger avec `yt-dlp` (le fork/successeur de `youtube-dl`) des documentaires du site Web d'Arte arte.tv/fr/ pour les regarder plus tard: le problème des sous-titres. 🧵⤵️ •1/14
Donc, `yt-dlp` — qu'on trouve sur github.com/yt-dlp/yt-dlp — est capable de télécharger les vidéos du replay d'Arte, ce qui permet de les sauvegarder pour les regarder plus tard, ou sur une machine non connectée, ou qqch du genre. Ceci est vrai depuis longtemps. •2/14
Mais il y a un an environ, Arte a changé le format de ses vidéos, probablement pour ne pas avoir à dupliquer entièrement la vidéo entre la version allemande et la version française (pour n'avoir que le son qui change). •3/14
Read 14 tweets
Mar 26
I'm not saying one should add more lanes to highways, but the oft-repeated “argument” that adding them leads to more traffic and that this is bad (i.e., burning the “one more lane will fix traffic” strawman) is moronic. Do I really need to explain why? 🧵⤵️ •1/9
People who need to get from A to B arbitrate between their different options, taking into account things like travel time, comfort, safety, etc. In the case of cars, travel time (i.e., traffic congestion) is a major negative, and probably acts as buffer: … •2/9
… meaning that, regardless of the number of lanes, more and more people will take the car until traffic reaches a level so bad that other transport systems become competitive. In clear: CAR TRAFFIC IS A MEASURE OF HOW BAD OTHER MEANS OF TRANSPORT ARE. •3/9
Read 9 tweets
Mar 24
Je suis toujours fasciné par la manière dont certains ont du mal à faire une séparation mentale entre:
⁃ l'opportunité de faire une réforme X,
⁃ la légalité d'appliquer une certaine procédure P pour y arriver,
⁃ l'opportunité d'appliquer P,

⁃ l'opportunité de manifester contre X si on est en désaccord avec X,
⁃ le droit de manifester ainsi,
⁃ le droit de ne pas subir de violences policières si on manifeste (ou si on ne manifeste pas),
⁃ le caractère significatif ou non de violences policières signalées,

⁃ le droit de brûler des poubelles,
⁃ le caractère significatif ou non d'incendies de poubelles signalés,
⁃ le droit de grève,
⁃ l'opportunité de faire grève,
etc.

Ce sont 11 questions totalement différentes (et la liste est bien plus longue, évidemment).
Read 4 tweets

Did Thread Reader help you today?

Support us! We are indie developers!


This site is made by just two indie developers on a laptop doing marketing, support and development! Read more about the story.

Become a Premium Member ($3/month or $30/year) and get exclusive features!

Become Premium

Don't want to be a Premium member but still want to support us?

Make a small donation by buying us coffee ($5) or help with server cost ($10)

Donate via Paypal

Or Donate anonymously using crypto!

Ethereum

0xfe58350B80634f60Fa6Dc149a72b4DFbc17D341E copy

Bitcoin

3ATGMxNzCUFzxpMCHL5sWSt4DVtS8UqXpi copy

Thank you for your support!

Follow Us on Twitter!

:(