Rosana Ferrero 📈📊🙌 Profile picture
Oct 30, 2022 7 tweets 11 min read Read on X
ERRORES QUE DAN MIEDO👻en #DataScience🎃
📊"Una imagen vale más que mil palabras", o que mil datos. Los gráficos cuentan la historia de los datos, nos ayudan a guiar, interpretar y comunicar😉
Cuidado con estos #HorrorStats
#HappyHalloween #Halloween #FelizDomingo #HalloweenEnds
🚫1. Elegir el gráfico incorrecto💀

Cada gráfico tiene sus propios casos de uso. ¿Tiene sentido representar el crédito € de una tarjeta con un gráfico de sectores? 🤌

#HorrorStats #HappyHalloween~ #trickortreat #DataScience #dataviz #DataScience #data
¿Qué gráfico utilizar?👇
🚫2. Manipular los ejes del gráfico💀

👉Distorsionar la escala, truncarla u omitir líneas de base es un error, intencionado o no.🤦🏻‍♀️

¿Quieres más ejemplos?👇

#HorrorStats #HappyHalloween~ #trickortreat #DataScience #dataviz #RStats #Python #DataVisualization #Stats #Analytics
🚫3. Eliminar datos atípicos del gráfico.😱

👨‍💻Si un gráfico parece que recorta algunos de los datos, no es confiable. Los valores atípicos (outliers) también deben representarse.👻

¿Qué son los "outliers"? 👇maximaformacion.es/blog-dat/como-…

#HorrorStats #HappyHalloween #DataScience #ML
🚫4. No evaluar los supuestos del modelo y su ajuste mediante gráficos.🎃

El Cuarteto de Anscombe: 4 conjuntos de datos con misma media, var, correlación, línea de regresión, etc. pero ¿En cuál tiene sentido ajustar una regresión lineal?😱👇
maximaformacion.es/blog-dat/error…

#HorrorStats
🚫5. Utilizar datos incorrectos🤦🏻‍♀️

🗑"Basura entra, basura sale". En el contexto de los gráficos esto significa que los datos incorrectos darán lugar a visualizaciones incorrectas.💀

#HorrorStats #HappyHalloween~ #dataviz #FelizDomingoParaTodos #DataScience #HalloweenEnds #ML
¿Conoces algún ejemplo famoso con errores en sus gráficos? Te leo😉

🚀Si te quedaste con ganas de más descarga nuestro recurso gratuito ¡IMPRESIONA CON TUS GRÁFICOS! maximaformacion.es/wp-content/upl…
Mañana otra serie ESCALOFRIANTE QUE DA MIEDO en #DataScience #HorrorStats #HappyHalloween

• • •

Missing some Tweet in this thread? You can try to force a refresh
 

Keep Current with Rosana Ferrero 📈📊🙌

Rosana Ferrero 📈📊🙌 Profile picture

Stay in touch and get notified when new unrolls are available from this author!

Read all threads

This Thread may be Removed Anytime!

PDF

Twitter may remove this content at anytime! Save it as PDF for later use!

Try unrolling a thread yourself!

how to unroll video
  1. Follow @ThreadReaderApp to mention us!

  2. From a Twitter thread mention us with a keyword "unroll"
@threadreaderapp unroll

Practice here first or read more on our help page!

More from @RosanaFerrero

May 21
📊 ¿Cómo evalúas y diagnosticas tu modelo de regresión?
💡 Comprender cómo se comportan los residuos es clave para interpretar si el modelo se ajusta correctamente a los datos.👇🧵

#stats #analytics #RStats #ModelDiagnostics #Estadística #DataScience #easystats #performance Image
Y aquí es donde entra el paquete 📦 {performance} de #RStats, que te permite realizar un diagnóstico completo, visual y eficiente en cuestión de segundos. 👇

🧪 Diagnóstico gráfico: lo que todo analista debería revisar: Image
🔍1️⃣ Residuos vs. valores ajustados
✔️ Ideal: dispersión aleatoria alrededor de 0 → indica linealidad y homocedasticidad
❌ Problemas:
Curvas = fallo en la linealidad
Forma de embudo = heterocedasticidad
🛠Solución: agrega términos no lineales o usa modelos con varianza flexible
Read 9 tweets
May 15
🎯 ¿CUÁNTO ES SUFICIENTE? El tamaño de muestra ideal explicado fácil y rápido 🚀
Cuando diseñas un experimento o estudio, surge la GRAN PREGUNTA: ¿Cuántos sujetos o muestras necesito? 🤔

🔍En este post veremos por qué y cómo calcular el tamaño de muestra👇🧵

#DataScience #stats Image
📉 Demasiado pequeño: Podrías pasar por alto un efecto importante. Resultados poco confiables o "ruido".
💸 Demasiado grande: Desperdicias recursos y esfuerzo
🏆 El tamaño justo (como Ricitos de oro): Para detectar efectos relevantes sin malgastar recursos. Image
✨ La RESPUESTA está en el CÁLCULO del tamaño de muestra.
Objetivo: Tener suficientes muestras para detectar un efecto real sin exagerar con muestras innecesarias.

🔑 Factores clave en el cálculo del tamaño de muestra: Image
Read 11 tweets
May 14
👀 ¿Te has preguntado qué estadísticos y gráficos usar para cada tipo de variable y estudio?
✨ Tanto la variación como la covariación son esenciales en el análisis de datos.
Aquí te lo resumo de forma sencilla 👇🧵

#stats #dataviz #statistics #analytics #datascience Image
La VARIACIÓN se ocupa de la dispersión dentro de una variable
La COVARIACIÓN se centra en las relaciones entre múltiples variables
Utilizar correctamente estas herramientas estadísticas puede enriquecer cualquier análisis de datos y ayudar a obtener conclusiones más robustas.📈🔍
✅ Estudios de variación: 1 variable

👉 Variables Categóricas (Nominales y Ordinales)
Gráfico recomendado: ¡Gráficos de barras!
Estadístico clave: Frecuencias y porcentajes.
Ejemplo: ¿Qué color prefieres? ¿A quién votarás? ¿Eres fumador? 🌈🚭
Read 7 tweets
May 13
🔥 Las pruebas estadísticas más comunes son TODAS modelos lineales. 🔥

🧠 Por lo tanto, en lugar de utilizar cientos de pruebas diferentes, ¿por qué no usar un modelo que realiza todas tus pruebas en una sola estructura flexible y robusta?

Te lo resumo en este post:👇🧵 Image
🤔 Cuando piensas en ANOVA, t-tests, test de Mann-Whitney o test Chi-cuadrado, crees que estás aplicando métodos diferentes, pero la realidad es que todos son casos especiales del Modelo Lineal.
🌟 3 razones por las que los modelos de regresión lineal deben ser tu primera opción:
1️⃣ Las Pruebas Clásicas requieren demasiados Supuestos
Modelos como GLM, GEE o regresión cuantil pueden manejar distribuciones sesgadas, correlaciones y dependencias sin esfuerzo.
Read 6 tweets
May 11
🚨Los datos ausentes están por todas partes🚨
👉Los NA pueden invalidar los resultados de tu estudio
👉Muchas funciones automáticas pueden no ser las más óptimas para manejarlos
👉El tratamiento incorrecto de los NA puede llevar a conclusiones erróneas o sesgadas
¿Qué hacer?👇🧵 Image
👀 ¿Qué hacer con los NA? 🤔
1️⃣ Identifica los datos ausentes y comprende por qué faltan:
👉 Errores humanos
👉 Interrupciones en el flujo de datos (como meses sin registro)
👉 Problemas de privacidad
👉 Sesgo: Como cuando ciertos participantes del estudio tienen más NA que otros Image
¡El patrón de NAs es información clave para intentar solucionarlo! 🔑

Para explorar los NA, te recomiendo estos paquetes de hashtag#RStats:
✅ visdat buff.ly/491P3p0
✅ naniar buff.ly/4hMOYKB
✅ VIM buff.ly/3wcVTcz
✅ mice buff.ly/3O97orm pic.x.com/bm3Ig6S5LpImage
Read 9 tweets
May 9
🌟👀 ¿Qué hacer cuando un resultado NO es estadísticamente significativo?
¡No entres en pánico! 🧘‍♀️🧠 Un p > 0.05 no es el fin del análisis, sino el inicio de una buena reflexión.

Hoja de ruta🧵👇🏻

#stats #datascience #analytics #inference #pvalue #rstats #research #thesis Image
🔥 1. Evita conclusiones simplistas
No estadísticamente significativo (discernible o detectable) ≠ No hay efecto
👉 El p-valor NO te dice si la hipótesis nula es verdadera. Solo indica la compatibilidad de los datos con esa hipótesis, asumiendo que sea cierta.
📏 2. Revisa el tamaño muestral

🔍 ¿Muestra pequeña? → Tal vez no hubo potencia suficiente para detectar el efecto.
💡 TIP: Usa análisis de sensibilidad para ver qué efecto podrías haber detectado.
Read 14 tweets

Did Thread Reader help you today?

Support us! We are indie developers!


This site is made by just two indie developers on a laptop doing marketing, support and development! Read more about the story.

Become a Premium Member ($3/month or $30/year) and get exclusive features!

Become Premium

Don't want to be a Premium member but still want to support us?

Make a small donation by buying us coffee ($5) or help with server cost ($10)

Donate via Paypal

Or Donate anonymously using crypto!

Ethereum

0xfe58350B80634f60Fa6Dc149a72b4DFbc17D341E copy

Bitcoin

3ATGMxNzCUFzxpMCHL5sWSt4DVtS8UqXpi copy

Thank you for your support!

Follow Us!

:(