Marcel Ribeiro-Dantas, PhD🔎📊🌿 Profile picture
@nextflowio @nf_core Dev Advocate @SeqeraLabs. ScientificComm @PortalDeviante. Former @Institut_Curie @Sorbonne_Univ_ @laishuol @bioinfo_UFRN

Jul 13, 2020, 19 tweets

Sempre bom lembrar a diferença entre correlação e #causalidade :-). Se a diferença não está clara para você, segue o fio 🧶 #stats #ia 1/19

2/19 Por que o sol nasce de manhã? Por que o céu é azul? Por que ficamos com fome? Por que nos arrepiamos? Por que choramos? Por que a criminalidade aumentou? Por que os preços caíram? Por que esse remédio não funciona?

3/19 O porquê é aquele amiguinho que nos acompanha dos primeiros momentos de nossas vidas até o final, para quem fazemos perguntas sobre a causa dos fenômenos que observamos. Vamos escolher uma pergunta e trabalhar em torno dela, ok? Vamos imaginar que você é o prefeito de uma

4/19 linda cidade na costa leste dos Estados Unidos. Durante seu mandato, você observou que em alguns períodos do ano morria muito mais pessoas afogadas do que em outros períodos. Não só isso, também morria mais pessoas por ataques de tubarão e mais pessoas por homicídio na

5/19 região de praias da cidade. Buscando solucionar isso, você contratou alguém p/ tentar explicar o q estava acontecendo. Como você acha q qualquer um consegue explicar essas coisas, vc contratou o mais barato e rápido do mercado e essa pessoa identificou que existia uma

6/19 correlação entre todas essas coisas e uma outra: venda de sorvetes na sua cidade. Sempre que as vendas de sorvete aumentavam, TODAS ESSAS MORTES TAMBÉM AUMENTAVAM! Vendas de sorvete caíam? O número de mortes também caía. Legenda do GIF abaixo: MUAHAHAHA

7/19 Bem, desse modo, você e seu analista concluíram que o melhor a se fazer era proibir a venda de sorvete ou definir um teto de vendas. Desse modo, com as vendas lá embaixo (ou zeradas), menos pessoas morreriam afogadas, por ataque de tubarão e homicídio naquela região. Certo?

8/19 Felizmente, um analista treinado em causalidade soube da análise que vocês estavam fazendo e foi dar uma olhada. Consegui permissão para compartilhar aqui no Twitter a reação dele ao ler o relatório e os próximos passos (proibir sorvete p/ resolver o problema).

9/19 Você deve estar se perguntando: "Mas Marcel, olha o gráfico abaixo. Há uma correlação razoável entre o consumo de sorvete e mortes por afogamento. Isso ñ significa que um está causando o outro?" Esse raciocínio é uma falácia chamada cum hoc que ocorre quando você diz que pq

10/19 A e B ocorrem juntos, um causa o outro. Sabendo disso, você retruca: "Beleza, entendi.. Mas se A não causa B (nem vice-versa), como é q eles tem essa correlação? Como que eu consigo predizer um sabendo do outro?" Te peguei, Marcel!

11/19 Uma possível explicação para esse exemplo é a do princípio da causa em comum (Reichenbach's Common Cause Principle). Existe um terceiro evento que tanto causa A quanto causa B, de modo que P(A,B|C) = P(A)P(B), isto é, os dois eventos são independentes quando você leva em

12/19 consideração essa terceira variável. Voltemos para o sorvete. O cidadão com treinamento em causalidade entra em contato com vocês e explica que existe uma terceira variável que vocês não consideraram: temperatura. Ela está atuando como variável de confusão pois ao causar as

13/19 outras duas, ela confunde a sua análise fazendo parecer que há uma associação direta entre venda de sorvete e morte por afogamento quando na real elas são independentes, dada a temperatura. Em períodos muito quentes, as pessoas ficam inclinadas a tomar banho de piscina/mar

14/19 e tomar sorvete. Em períodos muito frios, as pessoas ficam inclinadas a tomar menos banho de piscina/mar e menos sorvete. É óbvio que vai ter o sem noção indo para o mar com temperatura negativa ou tomando sorvete, mas a nível de população a diferença é gritante.

15/19 Infelizmente nesse caso não é plausível intervir no clima (manter uma temperatura agradável constante para sempre), mas conhecendo o diagrama causal, e portanto compreendendo o fenômeno, podemos entender o que está acontecendo. Aumentar o contingente de salva vidas no verão

16/19 pode ser uma solução, ou sistemas de monitoramento. Em alguns casos, é possível intervir na causa: cigarro e câncer de pulmão, por exemplo. Sabemos que não fumar diminui bastante suas chances de desenvolver câncer de pulmão. Já intervir em uma variável que é fruto de apenas

17/19 uma correlação, não irá surtir o efeito esperado. No caso do sorvete, imagine que tanto o sorvete como o banho de piscina ocorrem, em parte, por um desejo de se refrescar por causa da temperatura. Na hora que você proíbe o consumo de sorvete, quem está querendo se refrescar

18/19 ficará inclinado a fazê-lo com base nas opções restantes. Você poderia acabar induzindo mais pessoas a tomarem banho de piscina/mar e como há uma chance X de se afogar ao ir para o mar, se o número de pessoas indo para o mar aumenta, é esperado que mais pessoas morram.

19/19 O tiro saiu pela culatra, né? 😥

Share this Scrolly Tale with your friends.

A Scrolly Tale is a new way to read Twitter threads with a more visually immersive experience.
Discover more beautiful Scrolly Tales like this.

Keep scrolling