Rosana Ferrero 📈📊🙌 Profile picture
Oct 30, 2022 7 tweets 11 min read Read on X
ERRORES QUE DAN MIEDO👻en #DataScience🎃
📊"Una imagen vale más que mil palabras", o que mil datos. Los gráficos cuentan la historia de los datos, nos ayudan a guiar, interpretar y comunicar😉
Cuidado con estos #HorrorStats
#HappyHalloween #Halloween #FelizDomingo #HalloweenEnds
🚫1. Elegir el gráfico incorrecto💀

Cada gráfico tiene sus propios casos de uso. ¿Tiene sentido representar el crédito € de una tarjeta con un gráfico de sectores? 🤌

#HorrorStats #HappyHalloween~ #trickortreat #DataScience #dataviz #DataScience #data
¿Qué gráfico utilizar?👇
🚫2. Manipular los ejes del gráfico💀

👉Distorsionar la escala, truncarla u omitir líneas de base es un error, intencionado o no.🤦🏻‍♀️

¿Quieres más ejemplos?👇

#HorrorStats #HappyHalloween~ #trickortreat #DataScience #dataviz #RStats #Python #DataVisualization #Stats #Analytics
🚫3. Eliminar datos atípicos del gráfico.😱

👨‍💻Si un gráfico parece que recorta algunos de los datos, no es confiable. Los valores atípicos (outliers) también deben representarse.👻

¿Qué son los "outliers"? 👇maximaformacion.es/blog-dat/como-…

#HorrorStats #HappyHalloween #DataScience #ML
🚫4. No evaluar los supuestos del modelo y su ajuste mediante gráficos.🎃

El Cuarteto de Anscombe: 4 conjuntos de datos con misma media, var, correlación, línea de regresión, etc. pero ¿En cuál tiene sentido ajustar una regresión lineal?😱👇
maximaformacion.es/blog-dat/error…

#HorrorStats
🚫5. Utilizar datos incorrectos🤦🏻‍♀️

🗑"Basura entra, basura sale". En el contexto de los gráficos esto significa que los datos incorrectos darán lugar a visualizaciones incorrectas.💀

#HorrorStats #HappyHalloween~ #dataviz #FelizDomingoParaTodos #DataScience #HalloweenEnds #ML
¿Conoces algún ejemplo famoso con errores en sus gráficos? Te leo😉

🚀Si te quedaste con ganas de más descarga nuestro recurso gratuito ¡IMPRESIONA CON TUS GRÁFICOS! maximaformacion.es/wp-content/upl…
Mañana otra serie ESCALOFRIANTE QUE DA MIEDO en #DataScience #HorrorStats #HappyHalloween

• • •

Missing some Tweet in this thread? You can try to force a refresh
 

Keep Current with Rosana Ferrero 📈📊🙌

Rosana Ferrero 📈📊🙌 Profile picture

Stay in touch and get notified when new unrolls are available from this author!

Read all threads

This Thread may be Removed Anytime!

PDF

Twitter may remove this content at anytime! Save it as PDF for later use!

Try unrolling a thread yourself!

how to unroll video
  1. Follow @ThreadReaderApp to mention us!

  2. From a Twitter thread mention us with a keyword "unroll"
@threadreaderapp unroll

Practice here first or read more on our help page!

More from @RosanaFerrero

Jul 1
🔍 ¿Tu análisis de clustering es fiable? Aprende a validarlo 🧠

El clustering no termina cuando el algoritmo te devuelve unos grupos. ¡Eso es solo el principio! 😉 Antes de sacar conclusiones, asegúrate de que tu agrupación es buena, estable y coherente.👇🧵
3 dimensiones clave de la validación del clustering (los tres mosqueteros🗡️):

🎯 1. CALIDAD del agrupamiento
Evalúa si los grupos formados tienen sentido:
👉 ¿Las observaciones de un mismo grupo son realmente similares?
👉 ¿Los grupos están bien separados entre sí? Image
🔄 2. ESTABILIDAD del agrupamiento
Realiza el clustering varias veces con diferentes subconjuntos.
Evalúa la CONSISTENCIA en los resultados.
👉 ¿Tu agrupación resiste los cambios en la muestra? Image
Read 8 tweets
Jun 26
⚽📊 ¿Qué hace un data scientist del fútbol?

El fútbol ya no se juega solo con los pies... también se juega con datos.
Cada pase, cada sprint, cada decisión táctica deja una huella digital que puede ser analizada, modelizada… y transformada en ventaja competitiva.

#datascience Image
En esta entrada del blog exploramos el trabajo de quienes analizan el juego más allá de lo que capta el ojo humano:
👉Datos de eventing (eventos con balón)
👉Datos de tracking (posición y orientación de jugadores y balón en cada instante)
👉Métricas avanzadas como xG/xT/VAEP/OBV Image
Image
👉 Modelos predictivos para prevenir lesiones
👉 Grafos para visualizar redes de pase
👉 Análisis de estilo de juego y búsqueda de fichajes similares

🔗 Enlace al post completo: maximaformacion.es/blog-ciencia-d…Image
Image
Read 4 tweets
Jun 22
✨ Elegir la prueba de hipótesis correcta (o el modelo correcto) para una repuesta continua no es solo un "ANOVA vs. Kruskal-Wallis" o "t-test vs Mann-Whitney".

👇 Hay 6 aspectos clave que debes considerar antes de tomar una decisión:🚀

#stats #datascience #analytics #research Image
1️⃣ ¿Qué quieres comparar?

📉 Igualdad de medias
📈 igualdad de medianas (según la distribución de los datos).
💨 Equivalencia estocástica (los grupos son similares en distribución) vs Superioridad estocástica (un grupo tiende a valores mayores que otro).

linkedin.com/posts/rosanafe…
⚠️ Advertencias clave
👉 El método debe elegirse según H0 y la pregunta de investigación, no según la distribución de los datos.
👉 "No paramétrico" no significa "sin supuestos" ni "sin problemas".
👉 Métodos como Mann-Whitney o pruebas de rangos modifican la hipótesis original. Image
Read 11 tweets
Jun 16
📢 ¡Ya puedes descargar GRATIS nuestras guías rápidas de RStudio y R Software en español!
👀 ¿Estás empezando en Data Science con R y no sabes por dónde comenzar?
👉 Tenemos justo lo que necesitas: cheat sheets validadas por RStudio con lo esencial para arrancar con buen pie.👇 Image
✨ Visuales, prácticas y fáciles de imprimir o tener a mano mientras trabajas.
🔹 ¿Qué encontrarás?
✔️ Guía rápida del IDE de RStudio
✔️ Guía rápida de Estadística Descriptiva con R y ggplot2
✔️ Guía rápida del lenguaje R: operadores, funciones básicas, estructuras de datos y más Image
📌 Son recursos diseñados para ayudarte a organizar el conocimiento por tareas y ganar fluidez sin memorizarlo todo.

💬 Como dice Garret Grolemund (RStudio):
“Las cheat sheets son ayudas visuales para acercarte rápidamente a las funciones que necesitas.” Image
Read 5 tweets
Jun 11
🚨 ¿Sabías que puedes utilizar R de forma interactiva sin escribir código? 🚨

¡SÍ! Los Addins de RStudio son como tener un ayudante en tu IDE. 💥 Imagina ejecutar órdenes en R con solo un par de clics, ¡sin siquiera escribir una línea de código! 🎯

#stats #rstats #DataScience Image
💻 Solo abre el menú Addins y BOOM 💣, puedes hacer un montón de cosas sin complicarte. Aquí te dejo mi lista top de 10 addins imprescindibles que te animarán a comenzar con R sin agobios. 😎👇

#Addins #RStudio #Estadística #Programación #analytics
1️⃣ CRANsearcher: 🔍 Encuentra paquetes de CRAN por títulos y descripciones en un abrir y cerrar de ojos. ¡Ya no más búsquedas interminables!
Read 13 tweets
Jun 10
😱📊 ¿Sigues usando gráficos de barras (o puntos+líneas) para representar datos continuos?
Es hora de soltar el barbarplot

📸 Mira la imagen: 5 conjuntos de datos muy diferentes dan lugar al mismo gráfico de barras. ¿Cómo puede ser? Te lo cuento en este post 👇🧵

#stats Image
❌ 8 razones para dejar de usar barplots para datos continuos

1️⃣ Ocultan la distribución de los datos
Diferentes distribuciones pueden dar lugar al mismo gráfico de barras.
Se pierde información clave como la simetría, la presencia de outliers o patrones multimodales. Image
2️⃣ Dan una falsa sensación de certeza
Representar solo la media ± error estándar (SE) o desviación típica (SD) induce a interpretaciones erróneas, especialmente con muestras pequeñas.
El SE puede exagerar visualmente las diferencias entre grupos. Image
Read 13 tweets

Did Thread Reader help you today?

Support us! We are indie developers!


This site is made by just two indie developers on a laptop doing marketing, support and development! Read more about the story.

Become a Premium Member ($3/month or $30/year) and get exclusive features!

Become Premium

Don't want to be a Premium member but still want to support us?

Make a small donation by buying us coffee ($5) or help with server cost ($10)

Donate via Paypal

Or Donate anonymously using crypto!

Ethereum

0xfe58350B80634f60Fa6Dc149a72b4DFbc17D341E copy

Bitcoin

3ATGMxNzCUFzxpMCHL5sWSt4DVtS8UqXpi copy

Thank you for your support!

Follow Us!

:(