🌎 ¡Acabo de encontrar una serie de mapas increíbles realizados con #RStats! Desde mapas interactivos hasta diseños 3D, hay algo para todos los amantes de los datos espaciales
👇 ¡8 cuentas a las que definitivamente vale la pena darle un vistazo!🧵 #dataviz#maps#geospatial#gis
💡 A menudo le advierto a mis alumnos: No todos los valores atípicos (outliers) son villanos en tu análisis de datos. A veces, ¡son los héroes! 🤔
🚨 NO elimines los valores atípicos de forma predeterminada. ¡Podrías estar destruyendo tu análisis!
Antes evalúa lo siguiente:👇
1️⃣ ¿Qué es un valor atípico?
👉 “un valor atípico es una observación que se desvía tanto de las otras observaciones que despierta sospechas de que ha sido generada por un mecanismo diferente” (Hawkins 1980).
👀 ¿Qué constituye una desviación “suficiente”?
#stats #outliers
2️⃣ ¿Por qué están ahí?
Los outliers tienen su origen en tres causas (ver imagen).
🔍 Ve a la fuente, utiliza tu conocimiento del área y el contexto del estudio para evaluarlo.
🔄 "Basura entra, basura sale" es un principio clave cuando hablamos de datos, pero si pensaste en "limpiar" tus datos y nada más, ¡te falta la mitad del cuadro!
🤯 La VERDADERA lección es que los resultados no solo dependen de cómo preparas los datos para el análisis, sino de cómo tomaste esos datos desde el principio. Y eso, mi amigo, está directamente relacionado con el diseño de estudio. 📊
💥¿Por qué es tan importante el diseño? Porque garantiza que los datos que recojas sean de calidad desde el comienzo. Si tu diseño no es válido, ni los datos más limpios podrán salvarte.😬
🎯 Decide cómo, cuándo, de quién o qué recolectas, ¡o estarás condenado desde el principio!
🚨 ¡No dejes que la selección de predictores te confunda! 🚨
👉 Especifica tu modelo con lo que sabes (no solo por significación estadística).🔥
🧠 Crea un modelo que tenga sentido desde el conocimiento teórico o práctico del tema.
👇 Ejemplo Sencillo: Mortalidad de Ranas 🐸
1️⃣ Especifica lo que ya sabes primero 🧠
👉 No elijas variables al azar.
Usa lo que sabes: la temperatura y la comida afecta a las ranas.🥵🍴
¿Y si lo importante es la interacción? (calor extremo + poca comida = 🚨 muerte).
✔️ Incluye efectos principales y la interacción.
2️⃣ La Significación estadística importa pero No mires solo el p-valor 🚫
Ejemplo: Si la interacción entre calor y comida es significativa, pero el efecto es pequeño, ¿vale la pena? 🤔
🎯 Examina los tamaños de efecto y su relevancia real en la vida de las ranas. 🐸
🌟📦 abess: Selección rápida del mejor subconjunto de predictores en Python y #RStats. 📊
😬 En un mundo lleno de datos, encontrar las variables más importantes puede ser como buscar una aguja en un pajar. ABESS (Adaptive BEst Subset Selection) llega para cambiar el juego.🧵👇
Una solución rápida, precisa y adaptativa que selecciona las mejores variables para tus modelos predictivos. ABESS se centra en seleccionar un pequeño subconjunto de predictores clave, asegurando que el modelo final sea preciso y eficiente.
🧠 ABESS abarca un amplio espectro de análisis:
✅ Regresión lineal y penalizada
✅ Clasificación binaria o multiclase
✅ Modelos de respuesta censurada y de conteo
✅ Aprendizaje de tareas múltiples
✅ Selección del mejor subconjunto de grupo
Es increíblemente eficiente.
🔥🔥 Mis post más populares sobre #stats #datascience y #analytics en 2024 🔥🔥
✨Este año ha estado lleno de aprendizajes, reflexiones y debates apasionantes. Aquí tienes los artículos sobre estadística y análisis de datos que más resonaron en la comunidad. ¿Te los perdiste?👇🏻
🎯 Conceptos que DESPEJAN dudas:
✅ ¿Por qué APRENDER estadística si el SOFTWARE/IA lo puede hacer todo por ti? buff.ly/41RK8WW
✅ ¿Cómo definir preguntas de investigación adecuadas? buff.ly/3Pdddof
✅ Valores atípicos e incluyentes: buff.ly/3PdlRDe