Marcel Ribeiro-Dantas, PhD🔎📊🌿 Profile picture
@nextflowio @nf_core Dev Advocate @SeqeraLabs. ScientificComm @PortalDeviante. Former @Institut_Curie @Sorbonne_Univ_ @laishuol @bioinfo_UFRN

May 10, 2020, 10 tweets

1/10 Ao ver o fio abaixo, sobre alta probabilidade de vieses na coleta/interpretação de dados durante a pandemia de #COVID19, retweetado pelo @yudapearl, q recebeu o TuringAward (conhecido como Nobel da computação) pelo seu trabalho em causalidade, caiu a

2/10 ficha que comentei sobre um fenômeno estatístico interessante em uma aula que dei na @uofl, à convite do @DibsonG, e acabei esquecendo de comentar sobre isso em outros lugares. Até cogitei escrever um post sobre isso no meu blog, mas acabou passando batido.

3/10 Como quem me acompanha deve imaginar, parte da introdução da aula se deu em torno da dificuldade q costumamos ter em aceitar q correlação não implica em causalidade, e do perigo de condicionar por todas as variáveis do estudo p/ tentar obter essa implicação. No começo da

4/10 pandemia, eu fiz uma análise exploratória nos dados compartilhados pelo hospital Albert Einstein e dados liberados pela secretaria de saúde de Pernambuco, e fiquei surpreso em ñ encontrar pacientes com Influenza A e COVID-19 ao mesmo tempo. Em ambas as bases, ocorriam os

5/10 outros três casos: Ñ Inf A e COVID-19, Ñ COVID-19 e Inf A, e Ñ Inf A e Ñ COVID-19. Alguns sairiam correndo e gritando aos quatro tempos que Influenza A CAUSA imunidade cruzada ou alguma hipótese do tipo, sem tomar o devido cuidado. Outros diriam que o resultado é sólido pois

6/10 se trata de milhares de pacientes em dois estados diferentes. P/ mim, estava na cara que era um paradoxo verídico, como o explain away effect. Criei algumas hipóteses, como no Grafo Acíclico Direcionado abaixo, através do qual observamos que ao olharmos apenas para dados de

7/10 pacientes hospitalizados, nós estamos condicionando em um colisor, viés de seleção nesse caso, o que cria uma correlação espúria entre as duas doenças. Ainda assim, segui acompanhando mais dados da secretaria de saúde de Pernambuco, até que alguns poucos dias antes da aula,

8/10 surgiram casos onde pacientes foram testados positivo para ambas. Essa thread é sobre não pularmos para conclusões de forma precipitada. Tive uma certa dificuldade em entender os dados da secretaria de saúde de PE na época, e portanto posso ter cometido algum erro, mas a

9/10 mensagem principal se mantém. Comentei c/ pouquíssimas pessoas na época, justamente pelo impacto q uma informação como essa poderia ter tido se propagada em massa. Outras supostas hipóteses enviesadas ainda estão por aí, como o @lmonasterio retweetou

10/10 Comentei nesse retweet dele de um outro pseudo paradoxo parecido, onde diziam q bebês de mães fumantes nascidos com baixo peso tinham mais chances de sobreviver do q bebês de mães ñ fumantes. Viés de seleção, + uma vez, criando correlação espúria. #bookofwhy

Share this Scrolly Tale with your friends.

A Scrolly Tale is a new way to read Twitter threads with a more visually immersive experience.
Discover more beautiful Scrolly Tales like this.

Keep scrolling