Rosana Ferrero🕊☮️🏳 Profile picture
Oct 31, 2022 12 tweets 13 min read Read on X
🤯Tercer y última parte de ERRORES QUE DAN MIEDO en #DataScience 🎃

☠️ERRORES mortales que incluso los expertos cometen⚰️
rosanaferrero.blogspot.com/2016/09/los-7-…

Continúa leyendo, si te atreves...👻
#HorrorStats #HappyHalloween #DataAnalytics #Halloween #FelizLunes #dataviz #RStats #Python #ML
🚫No realizar una investigación reproducible💀

“Every analysis you do on a dataset will have to be redone 10-15 times before publication. Plan accordingly” Trevor A.Branch

No crear un informe replicable, reproducible y reutilizable sí que DA MIEDO

#HorrorStats #HappyHalloween
🚫No seleccionar la prueba de hipótesis o el modelo de regresión correcto para tu objetivo🎃

¿Cuáles son las hipótesis? ¿Cómo son las muestras? ¿Qué tipo de prueba/modelo elegir? ¿Una cola o dos colas? ¿Qué hacer si mis datos no cumplen los supuestos? BOOO!! 👻

#HorrorStats #ML
🚫No distinguir la significación estadística de la significación práctica🤦🏻‍♀️p-valor nos dice la dirección y tamaño del efecto la magnitud

Que exista una diferencia no significa que sea grande

Muestras muy grandes detectan diferencias muy pequeñas. Big Data da MIEDO!
#HorrorStats
🚫Decir "se comprueba la hipótesis nula H0" o "H0 es cierta"

👉Así como la falta de evidencia no demuestra que el acusado es inocente, un resultado no estadísticamente significativo (e.g. p>.05) no demuestra que H0 sea verdadera. Solo “no hay suficiente evidencia"💀
#HorrorStats
🚫Decir "el p-valor es la probabilidad de que H0 sea cierta"

😱Las hipótesis son o no son. p-valor mide la fuerza de la evidencia contra H0. A menor p-valor, mayor evidencia contra H0 a largo plazo🧙

Sientes ESCALOFRÍOS?
#HorrorStats #DataScience #Halloween2022 #RStats #Python
🚫Considerar que el nivel de significación alfa=5% es un mandamiento⛪️

😉El valor 5% es simplemente una convención conveniente, podría ser el 10% o el 1%, no existe un umbral real.

🎃#HorrorStats #DataScience #RStats #Python #Analytics #dataviz #analisisdedatos 👻
Lee más👇
🚫No informar el p-valor exacto ni los resultados completos de la prueba de hipótesis.

😱p-valor depende de:
📌tamaño de efecto (ES), ES grandes son más fáciles de detectar.
📌tamaño de muestra (N). muestras grandes dan pruebas más sensibles
📌Diseño de estudio...

#HorrorStats
🚫No considerar el Error tipo III: resolver el problema incorrecto.

☠️¿Las hipótesis son las correctas? ¿Cuán plausible es H0? ¿Cuáles son las consecuencias de rechazar H0? El contexto es crucial

👻#HorrorStats #Halloween #Halloween2022 #DataScience #dataviz #RStats #Python 🎃
🚫Desconocer la potencia estadística

¿Alguna vez te lo has preguntado?
👉¿Puedo confiar en el resultado?
👉¿Cuántas muestras necesito?

Conocer la potencia estadística nos permite ahorrar tiempo y dinero en nuestras investigaciones, ¡¿cómo no te lo contaron antes?!

#HorrorStats
Interpretar correctamente los resultados de un análisis puede ser muy difícil😱

😎Para volverte un PRO en #DataScience no cometas los errores que te he mostrado en este hilo y usa esta guía para planificar y diseñar investigaciones rigurosas👇
#Halloween
maximaformacion.es/recursos/disen…
Recuerda👇

• • •

Missing some Tweet in this thread? You can try to force a refresh
 

Keep Current with Rosana Ferrero🕊☮️🏳

Rosana Ferrero🕊☮️🏳 Profile picture

Stay in touch and get notified when new unrolls are available from this author!

Read all threads

This Thread may be Removed Anytime!

PDF

Twitter may remove this content at anytime! Save it as PDF for later use!

Try unrolling a thread yourself!

how to unroll video
  1. Follow @ThreadReaderApp to mention us!

  2. From a Twitter thread mention us with a keyword "unroll"
@threadreaderapp unroll

Practice here first or read more on our help page!

More from @RosanaFerrero

Jan 26
📚 Libros imperdibles para crear #dataviz impresionantes con #RStats 📊🌟
😉 (Y puedes consultarlos online de forma gratuita)

🚀🧵↓

#datavisualization #datascience #analytics #stats #data #book #gratis
📉Visualización de datos: introducción práctica by @kjhealy
"Una guía de visualización de datos a la vez práctica y elegante. Healy combina la belleza y el conocimiento de Tufte con la utilidad concreta de Stack Exchange.”— Elizabeth Bruch

#dataviz #book buff.ly/2K7Zyuv
Image
@kjhealy 🎨 Fundamentos de visualización de datos by @ClausWilke
Ideal para los que deseen crear #dataviz convincentes.
Desarrolla el ojo crítico para visualizaciones efectivas.
Principios generales y aplicación práctica con ggplot2 en R.

buff.ly/3cSsc3t
Image
Read 8 tweets
Jan 20
💡Seguro conoces la frase "basura entra, basura sale", pero la calidad de los resultados no solo depende de la calidad de los datos, sino también de la validez del diseño de estudio que les dio forma; un buen diseño es la base para una buena inferencia.
🧵Cómo evaluar la validez? Image
1️⃣ Validez externa -> generalizar los resultados -> Representatividad de la muestra
👉 Precisión: tamaño de muestra (unidad experimental vs unidad de observación, tratamiento, réplica y pseudo-réplica)
👉 Exactitud: tipo de muestreo (aleatorio y representativo -evitar sesgos-) Image
2️⃣ Validez externa ecológica/practica -> generalizar a entornos de la vida real. Su practicidad.
👉 Si los métodos, los materiales y el contexto del estudio se aproximan a la situación real que se estudia o no. Image
Read 5 tweets
Oct 12, 2023
🎯 12 TOP 📦 #RStats para ahorrar horas de trabajo en tus análisis de datos 👀

1. Crea gráficos #ggplot de forma interactiva
📦 esquisse, recupera el código para reproducir el gráfico

2. Elige los colores para tus gráficos de forma interactiva
📦 colourpicker

#dataviz #stats Image
3. Visualiza series temporales
📦 tsviz

4. Prepara variables categóricas rápidamente
📦 questionr reordena, recodifica, discretiza

5. Explora tus datos y crea un informe automático
📦 DataExplorer buff.ly/3ekxlSL
buff.ly/46K6A3h
buff.ly/3sGXMt9
Image
6. Crea informes, presentaciones y tableros reproducibles y de alta calidad
📦 R Markdown (o Quarto) texto, código y resultados en un único documento; ¡Adiós copy & paste!

7. Crea tableros interactivos en Rmd
📦 flexdashboard buff.ly/2x97p6z
buff.ly/3HGnhBJ
Image
Read 5 tweets
Apr 4, 2023
🤖📚 Descubre las mejores herramientas impulsadas por #AI para la investigación académica y ahorra tiempo para hacer lo que más te gusta
📚 Accede a más información en menos tiempo!
🚀 Dale un impulso a tu investigación académica!
#GPT #DataScience #science #chatGPT #research #ML
✅Scispace
Espacio de trabajo para automatizar tareas
Obtén una explicación simple de texto, matemáticas y tablas confusas
Haz preguntas de seguimiento y obtén respuestas instantáneas
Busca papers relevantes
Mejora la colaboración
buff.ly/3gz7LhQ
#Researchtools #science
✅Elicit
Automatiza flujos de trabajo
Encuentra papers relevantes sin palabras clave exactas
Resume conclusiones del documento específicas para tu pregunta
Extrae información clave de los documentos
Lluvia de ideas, resumen y clasificación de textos
buff.ly/30DwBok
#GPT4
Read 7 tweets
Jan 26, 2023
🤯¡Los datos ausentes están por todas partes!😜
👉Pueden invalidar los resultados de tu estudio
👉Muchas funciones utilizan métodos automáticos que pueden no ser óptimos
👉El impacto de la falta de datos es un tema que la mayoría quiere evitar, pero hoy no
¿Qué hacer con los NA?:
🎯Necesitas identificar los datos ausentes, averiguar por qué y cómo faltan:
- errores humanos
- interrupciones del flujo de datos (e.g. meses)
- problemas de privacidad
- sesgo (e.g. tipos de participantes del estudio que tienen >NA)

¡Es info clave para intentar solucionarlo!
Explora los datos con los paquetes:
✅ visdat github.com/ropensci/visdat
✅ naniar naniar.njtierney.com
✅ VIM github.com/statistikat/VIM

Un ejemplo con los 3: mtor.sci.yorku.ca/MATH4330/files… ImageImageImageImage
Read 9 tweets
Jan 25, 2023
💥14 herramientas secretas impulsadas por #RStats para ahorrar tiempo y esfuerzo en tus proyectos de datos (¡No te lo pierdas!):👀
1️⃣ ¡Edita tus datos de forma interactiva (y guarda el código)! 👀
📦 'editData' es un complemento de RStudio para editar un data.frame o un tibble de forma interactiva
🔗 buff.ly/3U5Tgjy

#DataScience #DataVisualization #dataviz #stats #analytics #RStats #Analytics
2️⃣ ¡Crea gráficos #ggplot de forma interactiva!🚀
📦esquisse es otro de mis addins favoritos de #rstudio
✅ exporta el gráfico o recupera el código para reproducir el gráfico
🔗 buff.ly/3mxLHSo
#DataScience #DataVisualization #dataviz #stats #analytics #RStats #Analytics
Read 17 tweets

Did Thread Reader help you today?

Support us! We are indie developers!


This site is made by just two indie developers on a laptop doing marketing, support and development! Read more about the story.

Become a Premium Member ($3/month or $30/year) and get exclusive features!

Become Premium

Don't want to be a Premium member but still want to support us?

Make a small donation by buying us coffee ($5) or help with server cost ($10)

Donate via Paypal

Or Donate anonymously using crypto!

Ethereum

0xfe58350B80634f60Fa6Dc149a72b4DFbc17D341E copy

Bitcoin

3ATGMxNzCUFzxpMCHL5sWSt4DVtS8UqXpi copy

Thank you for your support!

Follow Us!

:(