1/8 Carl Sagan disse que "Não quero acreditar, quero saber", e estou junto a ele nesse desejo. No entanto, é fácil perceber como esse raciocínio pode passar uma ideia bem diferente para quem ñ tem treinamento científico. A ciência é um exercício de acreditar, seja nos resultados
2/8 dos estudos de outros autores, em pressupostos não verificáveis, ou mesmo na ausência de vieses de nossa parte. Não é uma crença cega, sem fundamento ou movida por emoções, isso sem chance de dúvidas não é (ou ao menos a ciência bem feita não é), mas depende de crença. Quem
3/8 é cientista sabe do que estou falando, mas com certeza para alguns pareceu nebuloso o que disse acima. Portanto, vamos a um exemplo. Imagine que você coletou alguns dados e fez algumas análises de estatística descritiva para checar algumas coisas. Você percebe que esses dados
4/8 tem uma determinada distribuição estatística, além de outras propriedades, e existem técnicas para inferir resultados a partir de dados exatamente com essas propriedades. Maravilhoso! No entanto... E se sua coleta foi enviesada (a população daquela região é jovem mas, sem
5/8 saber você coletou dados principalmente de pessoas mais velhas), e a distribuição estatística da população é diferente da sua amostra? Isso implica que as técnicas que você utilizou... Não funcionam para aqueles dados. Seus resultados provavelmente estarão errados. Ou imagine
6/8 que sua amostra é representativa, mas essa técnica que tanto se utiliza, na verdade... Não funciona, ou produz resultados ruins, mas por N razões acabou se difundindo na literatura científica. Um exemplo disso é o costume de ajustar por todas as variáveis para se evitar viés
7/8 de confusão, algo bastante comum e... Errado! Uma variável pode ser um confundidor, mas ela também pode ser mediador, colisor, e ao ajustar por elas você ADICIONA (em vez do intuito original de remover) VIÉS à sua análise. A ciência oferece um ecossistema onde idealmente
8/8 estamos sempre revisitando técnicas, pressupostos, teorias, resultados, dados e, isso tudo, ao longo do tempo, vai adicionando mais evidências e menos incerteza de que aquilo está certo ou funciona. No entanto, em muitos casos *jamais* teremos 100% de certeza. Compreende?
• • •
Missing some Tweet in this thread? You can try to
force a refresh
1/11 Após escrever esse tweet, peguei-me pensando sobre muitas pessoas de fora da academia ñ saberem o q significa crença dentro da ciência. Isso me lembrou inclusive de um episódio do #SciCast (@PortalDeviante) que gravei há alguns meses onde brincávamos q iríamos falar sobre
2/11 crença, e o uso de um teorema matemático q usa crença para validar a hipótese de Jesus ter ressuscitado. Estou falando do Teorema de Bayes. Se quiser saber mais, recomendo ouvir o episódio! Ficou super legal. Se acha q estou brincando sobre a palavra deviante.com.br/podcasts/scica…
3/11 crença, trago aqui um print da página da Wikipédia. E digo mais, vai além disso! Em várias metodologias científicas nós utilizamos de pressupostos. Alguns pressupostos podem ser checados, de modo a identificar violações. Outros, NÃO. Ou seja, vai na base da fé. Por exemplo,
1/4 O cidadão liga para a assistência técnica de seu carro e conta a seguinte história pitoresca: Sempre que vou tomar sorvete de creme na sorveteria, meu carro tem dificuldade de ligar quando vou embora. O curioso é que se eu escolho qualquer outro sabor, o carro funciona normal
2/4 Já tentei vários sabores e o carro funciona normal, mas se eu escolho o bendito creme... Tenho dificuldade em fazer o carro ligar. O carro não gosta de sorvete de creme? 🤣 Quem me segue já está cansado da velha máxima, né? "Correlação não implica em causalidade". Após
3/4 investigação, os técnicos descobriram que havia uma peça superaquecendo. O sorvete de creme é o que mais saía, tinha um fluxo diferente. Imediatamente se recebia o sorvete após pagar, e a peça ainda estava quente. Os outros sabores demoravam mais para sair e era o tempo
É possível que tenhamos hoje o anúncio de uma das maiores evidências já obtidas por cientistas sobre vida em outro planeta. O curioso é que, se de fato for comprovado, esteve pertinho de nós o tempo inteiro. É no planeta que passa mais pertinho de nós, inclusive.
Existem várias razões de ser difícil compreender os fenômenos que observamos, muita razões para nem sempre as coisas serem o que parecem. Hoje vou falar de TRÊS coisas relacionadas a essa dificuldade. Pronto para mais um fio 🧶de #DataScience#Statistics#Science? 😃🥳 1/20
2/20 Talvez o mais óbvio sejam variáveis latentes ou ñ observadas/medidas. Em muitos casos, independente da quantidade de dados q vc observar sobre 2 eventos, você seguirá vendo uma correlação q fará você achar que um evento está causando o outro. Em uma determinada região, por
3/20 exemplo, foi observado q quando o consumo de sorvete aumentava, mais pessoas morriam por ataques de tubarão e acidentes em piscinas. Quando o consumo de sorvete caía, menos pessoas morriam por ataques de tubarão e acidentes em piscina. Nenhuma quantidade de dados sobre
1/18 Eu costumo assistir o @sharktankbrasil e, em um episódio que assisti hoje, topei mais uma vez com um termo que tá na boca do povo mais do que nunca, principalmente por causa da #COVID19: Crescimento exponencial.
Vamos lá bater um papo em um fio🧶sobre curva exponencial? 😁
2/18 A primeira informação que talvez surpreenda algumas pessoas é a seguinte: NÃO, a curva de casos de COVID19 *NÃO TEM CRESCIMENTO EXPONENCIAL*. E não tem porque é impossível que tivesse. Isso torna menos assustador? *NÃO, NÃO TORNA*. Com essas duas informações postas, sigamos.
3/18 Vc deve estar se perguntando: “Mas Marcel, por que em todo canto dizia q o crescimento era exponencial se não era?” Bem, existem algumas explicações para isso. A primeira razão é que a palavra exponencial já é um termo popularizado, até por ter significado fora da matemática
1/4 Ñ, + quase lá. Imagina o seguinte cenário. Relendo os meus tweets, de fato ñ ficou claro.
Vc quer testar se o medicamento X tem um efeito Y em pacientes recém transplantados, pq você é levado a crer que talvez não. Daí vc está lá no hospital q vc trabalha e manda um e-mail
2/4 p/ PARTE dos recém transplantados naquele mês. Daí um mês depois, eles vem, e você dá o tratamento. Após um certo período, você considera a diferença de Y entre quem recebeu o tratamento e quem ñ recebeu. O problema aqui é q os pacientes q n receberam tratamento e morreram
3/4 desde o início estão sendo contabilizados. Enquanto que o grupo dos tratados é composto apenas de quem ainda estava vivo 1 mês após o transplante. É como se você tivesse começado a analisar os dois grupos no primeiro dia, mas existissem indivíduos IMORTAIS no grupo dos