Rosana Ferrero 📈📊🙌 Profile picture
Oct 30, 2022 7 tweets 11 min read Read on X
ERRORES QUE DAN MIEDO👻en #DataScience🎃
📊"Una imagen vale más que mil palabras", o que mil datos. Los gráficos cuentan la historia de los datos, nos ayudan a guiar, interpretar y comunicar😉
Cuidado con estos #HorrorStats
#HappyHalloween #Halloween #FelizDomingo #HalloweenEnds
🚫1. Elegir el gráfico incorrecto💀

Cada gráfico tiene sus propios casos de uso. ¿Tiene sentido representar el crédito € de una tarjeta con un gráfico de sectores? 🤌

#HorrorStats #HappyHalloween~ #trickortreat #DataScience #dataviz #DataScience #data
¿Qué gráfico utilizar?👇
🚫2. Manipular los ejes del gráfico💀

👉Distorsionar la escala, truncarla u omitir líneas de base es un error, intencionado o no.🤦🏻‍♀️

¿Quieres más ejemplos?👇

#HorrorStats #HappyHalloween~ #trickortreat #DataScience #dataviz #RStats #Python #DataVisualization #Stats #Analytics
🚫3. Eliminar datos atípicos del gráfico.😱

👨‍💻Si un gráfico parece que recorta algunos de los datos, no es confiable. Los valores atípicos (outliers) también deben representarse.👻

¿Qué son los "outliers"? 👇maximaformacion.es/blog-dat/como-…

#HorrorStats #HappyHalloween #DataScience #ML
🚫4. No evaluar los supuestos del modelo y su ajuste mediante gráficos.🎃

El Cuarteto de Anscombe: 4 conjuntos de datos con misma media, var, correlación, línea de regresión, etc. pero ¿En cuál tiene sentido ajustar una regresión lineal?😱👇
maximaformacion.es/blog-dat/error…

#HorrorStats
🚫5. Utilizar datos incorrectos🤦🏻‍♀️

🗑"Basura entra, basura sale". En el contexto de los gráficos esto significa que los datos incorrectos darán lugar a visualizaciones incorrectas.💀

#HorrorStats #HappyHalloween~ #dataviz #FelizDomingoParaTodos #DataScience #HalloweenEnds #ML
¿Conoces algún ejemplo famoso con errores en sus gráficos? Te leo😉

🚀Si te quedaste con ganas de más descarga nuestro recurso gratuito ¡IMPRESIONA CON TUS GRÁFICOS! maximaformacion.es/wp-content/upl…
Mañana otra serie ESCALOFRIANTE QUE DA MIEDO en #DataScience #HorrorStats #HappyHalloween

• • •

Missing some Tweet in this thread? You can try to force a refresh
 

Keep Current with Rosana Ferrero 📈📊🙌

Rosana Ferrero 📈📊🙌 Profile picture

Stay in touch and get notified when new unrolls are available from this author!

Read all threads

This Thread may be Removed Anytime!

PDF

Twitter may remove this content at anytime! Save it as PDF for later use!

Try unrolling a thread yourself!

how to unroll video
  1. Follow @ThreadReaderApp to mention us!

  2. From a Twitter thread mention us with a keyword "unroll"
@threadreaderapp unroll

Practice here first or read more on our help page!

More from @RosanaFerrero

Jan 22
💡 A menudo le advierto a mis alumnos: No todos los valores atípicos (outliers) son villanos en tu análisis de datos. A veces, ¡son los héroes! 🤔
🚨 NO elimines los valores atípicos de forma predeterminada. ¡Podrías estar destruyendo tu análisis!

Antes evalúa lo siguiente:👇 Image
1️⃣ ¿Qué es un valor atípico?
👉 “un valor atípico es una observación que se desvía tanto de las otras observaciones que despierta sospechas de que ha sido generada por un mecanismo diferente” (Hawkins 1980).

👀 ¿Qué constituye una desviación “suficiente”?

#stats #outliers Image
2️⃣ ¿Por qué están ahí?
Los outliers tienen su origen en tres causas (ver imagen).

🔍 Ve a la fuente, utiliza tu conocimiento del área y el contexto del estudio para evaluarlo. Image
Read 6 tweets
Jan 19
🔄 "Basura entra, basura sale" es un principio clave cuando hablamos de datos, pero si pensaste en "limpiar" tus datos y nada más, ¡te falta la mitad del cuadro!

🧠 Reflexionemos por qué... 👀

#stats #analytics #datascience #research #phd #thesis #science #experiment #design Image
🤯 La VERDADERA lección es que los resultados no solo dependen de cómo preparas los datos para el análisis, sino de cómo tomaste esos datos desde el principio. Y eso, mi amigo, está directamente relacionado con el diseño de estudio. 📊 Image
💥¿Por qué es tan importante el diseño? Porque garantiza que los datos que recojas sean de calidad desde el comienzo. Si tu diseño no es válido, ni los datos más limpios podrán salvarte.😬
🎯 Decide cómo, cuándo, de quién o qué recolectas, ¡o estarás condenado desde el principio! Image
Read 5 tweets
Jan 14
🚨 ¡No dejes que la selección de predictores te confunda! 🚨

👉 Especifica tu modelo con lo que sabes (no solo por significación estadística).🔥
🧠 Crea un modelo que tenga sentido desde el conocimiento teórico o práctico del tema.

👇 Ejemplo Sencillo: Mortalidad de Ranas 🐸 Image
1️⃣ Especifica lo que ya sabes primero 🧠
👉 No elijas variables al azar.
Usa lo que sabes: la temperatura y la comida afecta a las ranas.🥵🍴
¿Y si lo importante es la interacción? (calor extremo + poca comida = 🚨 muerte).
✔️ Incluye efectos principales y la interacción. Image
2️⃣ La Significación estadística importa pero No mires solo el p-valor 🚫
Ejemplo: Si la interacción entre calor y comida es significativa, pero el efecto es pequeño, ¿vale la pena? 🤔
🎯 Examina los tamaños de efecto y su relevancia real en la vida de las ranas. 🐸 Image
Read 8 tweets
Jan 5
🌟📦 abess: Selección rápida del mejor subconjunto de predictores en Python y #RStats. 📊

😬 En un mundo lleno de datos, encontrar las variables más importantes puede ser como buscar una aguja en un pajar. ABESS (Adaptive BEst Subset Selection) llega para cambiar el juego.🧵👇 Image
Una solución rápida, precisa y adaptativa que selecciona las mejores variables para tus modelos predictivos. ABESS se centra en seleccionar un pequeño subconjunto de predictores clave, asegurando que el modelo final sea preciso y eficiente. Image
🧠 ABESS abarca un amplio espectro de análisis:
✅ Regresión lineal y penalizada
✅ Clasificación binaria o multiclase
✅ Modelos de respuesta censurada y de conteo
✅ Aprendizaje de tareas múltiples
✅ Selección del mejor subconjunto de grupo
Es increíblemente eficiente. Image
Read 5 tweets
Dec 31, 2024
✨✨ Mis post más populares de 2024 sobre #RStats ✨✨

Aquí tienes los favoritos de la comunidad, cargados de tips, herramientas y mejores prácticas. ¡No te los pierdas! 👇

#code #programming #stats #analytics #datascience #data #AI #IA #ML
🔥 IA y R: ¡Lo mejor del año!
✅ Asistente de IA para Shiny buff.ly/408Mmjp
✅ LLM en R y Python (paquete mall): buff.ly/3ZKFPKc
✅ Paquete “ask” en R para analytics con IA buff.ly/40aRFz1
✅ Integra IA en R: Guía paso a paso: buff.ly/4iQ7RwO Image
Image
📊 Visualización y análisis simplificados
✅ Las mejores tablas de resumen con R: buff.ly/409firq
✅ Tablas de resumen (semi) automáticas con R: buff.ly/3PgT0O8 y buff.ly/41JUubo
✅ PCA (semi) automático en R: buff.ly/3VVs3TU Image
Image
Image
Image
Read 6 tweets
Dec 29, 2024
🔥🔥 Mis post más populares sobre #stats #datascience y #analytics en 2024 🔥🔥

✨Este año ha estado lleno de aprendizajes, reflexiones y debates apasionantes. Aquí tienes los artículos sobre estadística y análisis de datos que más resonaron en la comunidad. ¿Te los perdiste?👇🏻
🎯 Conceptos que DESPEJAN dudas:
✅ ¿Por qué APRENDER estadística si el SOFTWARE/IA lo puede hacer todo por ti? buff.ly/41RK8WW
✅ ¿Cómo definir preguntas de investigación adecuadas? buff.ly/3Pdddof
✅ Valores atípicos e incluyentes: buff.ly/3PdlRDe
✅ El R2 no es lo que crees: buff.ly/3PdxppU y buff.ly/3Drg36k
✅ Calidad de los datos: buff.ly/3Dv06MJ

📉 Errores y sesgos que NO puedes ignorar:
✅ Sesgo de supervivencia (datos ausentes y diseños de estudio): buff.ly/3ZTQ8M3
Read 10 tweets

Did Thread Reader help you today?

Support us! We are indie developers!


This site is made by just two indie developers on a laptop doing marketing, support and development! Read more about the story.

Become a Premium Member ($3/month or $30/year) and get exclusive features!

Become Premium

Don't want to be a Premium member but still want to support us?

Make a small donation by buying us coffee ($5) or help with server cost ($10)

Donate via Paypal

Or Donate anonymously using crypto!

Ethereum

0xfe58350B80634f60Fa6Dc149a72b4DFbc17D341E copy

Bitcoin

3ATGMxNzCUFzxpMCHL5sWSt4DVtS8UqXpi copy

Thank you for your support!

Follow Us!

:(