Rosana Ferrero 📈📊🙌 Profile picture
Oct 30, 2022 7 tweets 11 min read Read on X
ERRORES QUE DAN MIEDO👻en #DataScience🎃
📊"Una imagen vale más que mil palabras", o que mil datos. Los gráficos cuentan la historia de los datos, nos ayudan a guiar, interpretar y comunicar😉
Cuidado con estos #HorrorStats
#HappyHalloween #Halloween #FelizDomingo #HalloweenEnds
🚫1. Elegir el gráfico incorrecto💀

Cada gráfico tiene sus propios casos de uso. ¿Tiene sentido representar el crédito € de una tarjeta con un gráfico de sectores? 🤌

#HorrorStats #HappyHalloween~ #trickortreat #DataScience #dataviz #DataScience #data
¿Qué gráfico utilizar?👇
🚫2. Manipular los ejes del gráfico💀

👉Distorsionar la escala, truncarla u omitir líneas de base es un error, intencionado o no.🤦🏻‍♀️

¿Quieres más ejemplos?👇

#HorrorStats #HappyHalloween~ #trickortreat #DataScience #dataviz #RStats #Python #DataVisualization #Stats #Analytics
🚫3. Eliminar datos atípicos del gráfico.😱

👨‍💻Si un gráfico parece que recorta algunos de los datos, no es confiable. Los valores atípicos (outliers) también deben representarse.👻

¿Qué son los "outliers"? 👇maximaformacion.es/blog-dat/como-…

#HorrorStats #HappyHalloween #DataScience #ML
🚫4. No evaluar los supuestos del modelo y su ajuste mediante gráficos.🎃

El Cuarteto de Anscombe: 4 conjuntos de datos con misma media, var, correlación, línea de regresión, etc. pero ¿En cuál tiene sentido ajustar una regresión lineal?😱👇
maximaformacion.es/blog-dat/error…

#HorrorStats
🚫5. Utilizar datos incorrectos🤦🏻‍♀️

🗑"Basura entra, basura sale". En el contexto de los gráficos esto significa que los datos incorrectos darán lugar a visualizaciones incorrectas.💀

#HorrorStats #HappyHalloween~ #dataviz #FelizDomingoParaTodos #DataScience #HalloweenEnds #ML
¿Conoces algún ejemplo famoso con errores en sus gráficos? Te leo😉

🚀Si te quedaste con ganas de más descarga nuestro recurso gratuito ¡IMPRESIONA CON TUS GRÁFICOS! maximaformacion.es/wp-content/upl…
Mañana otra serie ESCALOFRIANTE QUE DA MIEDO en #DataScience #HorrorStats #HappyHalloween

• • •

Missing some Tweet in this thread? You can try to force a refresh
 

Keep Current with Rosana Ferrero 📈📊🙌

Rosana Ferrero 📈📊🙌 Profile picture

Stay in touch and get notified when new unrolls are available from this author!

Read all threads

This Thread may be Removed Anytime!

PDF

Twitter may remove this content at anytime! Save it as PDF for later use!

Try unrolling a thread yourself!

how to unroll video
  1. Follow @ThreadReaderApp to mention us!

  2. From a Twitter thread mention us with a keyword "unroll"
@threadreaderapp unroll

Practice here first or read more on our help page!

More from @RosanaFerrero

Mar 2
🤯 Por piensas que con solo mirar coeficientes y R² tienes todo bajo control en tu modelo de regresión... 🤨

🔥 El Cuarteto de Anscombe: Cuatro datasets, un mismo modelo… pero con realidades completamente distintas. 🔥

🧵Soluciones...👇

#stats #analytics #datascience #DataViz Image
Estos cuatro conjuntos de datos tienen:
✅ Misma media en X e Y
✅ Misma varianza
✅ Misma correlación
✅ Mismos coeficientes de regresión
✅ Mismo R²

📉 Pero cuando los graficas… descubres el desastre 🤯

💡 Errores clave en un modelo de regresión:
❌ 1. Asumir linealidad sin verificarla
No todas las relaciones son lineales. Ajustar una línea recta a un patrón curvo es un error clásico.
Solución: Graficar y evaluar modelos más flexibles como regresión con splines o GAM.
Read 7 tweets
Feb 26
🔥 ¿QUÉ MODELO DE REGRESIÓN DEBERÍAS ELEGIR? (UNA GUÍA SENCILLA) 🔥

¿No sabes qué modelo de regresión usar? ¿Te confunden los términos LM, GLM, GAMM y demás siglas raras? 🌀 LO INTENTARÉ EXPLICAR RÁPIDAMENTE ⏳💥👇🧵

#stats #analytics #datascience Image
📢 PASO 1: ¿Tu variable respuesta es continua?
✅ Sí → Modelo Lineal (LM) (SI SE CUMPLEN SUS SUPUESTOS).
🚫 No → ¡Sigue leyendo! 👇
📢 PASO 2: ¿Tu variable respuesta es binaria, de conteo o de proporciones?
✅ Sí → Modelo Lineal Generalizado (GLM) (elige la familia adecuada: binomial, Poisson, gamma, etc.)
🚫 No → Vamos más profundo. 👇
Read 8 tweets
Feb 25
🚨📊 ¿Por qué deberías dejar de usar barplots? 🌧️🌈

Si sigues usando gráficos de barras con error para representar datos cuantitativos, estás perdiendo información valiosa. Aquí te explico por qué:👇🧵

#DataViz #RaincloudPlots #Analytics #RStats #DataScience #stats Image
1️⃣🔥 Ocultan la variabilidad → ¡Pueden hacer que datos diferentes se vean iguales!😵
👉📊 Los barplots NO te muestran la forma real de los datos, solo la media y el error o la incertidumbre.
🚨Datos con distribuciones totalmente diferentes pueden parecer idénticos en un barplot. Image
2️⃣ 🤯 Malas comparaciones → ¡Pueden hacerte creer diferencias que no existen! 📉
👉📊 Si los tamaños de muestra son diferentes, los IC en los barplots pueden ser engañosos.
❌ Dos grupos =medias y !=N pueden generar IC que te hagan pensar que hay +o- incertidumbre de la real. Image
Read 9 tweets
Feb 22
🔥 Crear gráficos con pruebas estadísticas suele requerir varios pasos, pero {ggstatsplot} lo hace todo en una sola línea de código. 👇🧵

✅ No necesitas copiar/pegar números en un informe: los gráficos ya contienen toda la información.

#rstats #stats #dataviz #datascience Image
🎯 #stats + #dataviz en 1 solo paso
✅ Gráficos con pruebas paramétricas, no paramétricas y robustas
✅ Formato APA listo para publicar 📑
✅ Muestra automáticamente N 📊
✅ Mezcla caja + violín para mejor visualización 🎻
✅ Incluye tamaños de efecto, IC y pruebas bayesianas Image
Image
Image
Image
📌 Funciones:
📊 ggbetweenstats → Compara entre grupos (violín + caja)
📊 ggwithinstats → Compara dentro de grupos
📊 gghistostats → Histogramas
📊 ggscatterstats y ggcorrmat → Correlaciones
📊 ggbarstats y ggpiestats → Barras y pie
📊 ggcoefstats → Regresión y metaanálisis Image
Read 5 tweets
Feb 18
🧐 Si quieres gráficos rápidos, elegantes y sin sufrir, prueba {tinyplot}🔥
✅ Gráficos en base R sin complicaciones
✅ Agrupaciones y leyendas automáticas en un solo paso
✅ Facetas sin sudar la gota gorda (olvídate de par(mfrow=...))
✅ Temas personalizables con un solo comando Image
📌 ¿Por qué deberías probar tinyplot?
1️⃣ Usa solo base R → sin dependencias, sin bloat.
2️⃣ Ultra ligero → instalación mínima, ideal para paquetes o scripts portables.
3️⃣ Drop-in replacement → si ya usas plot(), cambiar a tinyplot() es pan comido. Image
Image
🎯 ¡Prueba esto AHORA MISMO en tu R! 🎯
install.packages("tinyplot")
library(tinyplot)

plt(Sepal.Length ~ Petal.Length | Species, data = iris,
palette = "dark", pch = 16, grid = TRUE, frame = FALSE)

🌈 Y obtén un scatterplot agrupado con leyenda automática en una línea. Image
Read 4 tweets
Feb 13
🚀🔮✨ATENCIÓN, DETECTIVES DE DATOS ✨🔮🚀
😉 Porque aprender programación también puede hacerse de forma práctica y entretenida, hoy te traigo un desafío que pondrá a prueba tus conocimientos de R y tidyverse: la adaptación del SQL Murder Mystery. 🔎

👉 buff.ly/4hNGjGXImage
🕵🏻‍♂️ Este ejercicio interactivo te convertirá en un detective de datos que debe resolver un crimen analizando bases de datos policiales. Originalmente fue diseñado para SQL por pero aquí lo abordaremos utilizando R y tidyverse.
♻️ Adaptación de Naidoo (2019) y Goyal (2024).
✨ LO QUE VAS A HACER
🧐 Dominar el manejo de datos en R mientras resuelves un caso policíaco 😎
🔮 Explorar bases de datos
🛡️ Rastrear pistas clave para acercarte al culpable
💪 Usar R y tidyverse para realizar consultas, filtrar datos y descubrir patrones ocultos.
Read 5 tweets

Did Thread Reader help you today?

Support us! We are indie developers!


This site is made by just two indie developers on a laptop doing marketing, support and development! Read more about the story.

Become a Premium Member ($3/month or $30/year) and get exclusive features!

Become Premium

Don't want to be a Premium member but still want to support us?

Make a small donation by buying us coffee ($5) or help with server cost ($10)

Donate via Paypal

Or Donate anonymously using crypto!

Ethereum

0xfe58350B80634f60Fa6Dc149a72b4DFbc17D341E copy

Bitcoin

3ATGMxNzCUFzxpMCHL5sWSt4DVtS8UqXpi copy

Thank you for your support!

Follow Us!

:(