Rosana Ferrero 📈📊🙌 Profile picture
📊 PhD, Statistics + Data Science + Machine Learning + Biology/Ecol 😉 Stats is the grammar of science 🎓 Directora académica y Docente 🏢 Consultora 💙 #RStats
Jan 19 5 tweets 2 min read
🔄 "Basura entra, basura sale" es un principio clave cuando hablamos de datos, pero si pensaste en "limpiar" tus datos y nada más, ¡te falta la mitad del cuadro!

🧠 Reflexionemos por qué... 👀

#stats #analytics #datascience #research #phd #thesis #science #experiment #design Image 🤯 La VERDADERA lección es que los resultados no solo dependen de cómo preparas los datos para el análisis, sino de cómo tomaste esos datos desde el principio. Y eso, mi amigo, está directamente relacionado con el diseño de estudio. 📊 Image
Jan 14 8 tweets 3 min read
🚨 ¡No dejes que la selección de predictores te confunda! 🚨

👉 Especifica tu modelo con lo que sabes (no solo por significación estadística).🔥
🧠 Crea un modelo que tenga sentido desde el conocimiento teórico o práctico del tema.

👇 Ejemplo Sencillo: Mortalidad de Ranas 🐸 Image 1️⃣ Especifica lo que ya sabes primero 🧠
👉 No elijas variables al azar.
Usa lo que sabes: la temperatura y la comida afecta a las ranas.🥵🍴
¿Y si lo importante es la interacción? (calor extremo + poca comida = 🚨 muerte).
✔️ Incluye efectos principales y la interacción. Image
Jan 5 5 tweets 3 min read
🌟📦 abess: Selección rápida del mejor subconjunto de predictores en Python y #RStats. 📊

😬 En un mundo lleno de datos, encontrar las variables más importantes puede ser como buscar una aguja en un pajar. ABESS (Adaptive BEst Subset Selection) llega para cambiar el juego.🧵👇 Image Una solución rápida, precisa y adaptativa que selecciona las mejores variables para tus modelos predictivos. ABESS se centra en seleccionar un pequeño subconjunto de predictores clave, asegurando que el modelo final sea preciso y eficiente. Image
Dec 31, 2024 6 tweets 7 min read
✨✨ Mis post más populares de 2024 sobre #RStats ✨✨

Aquí tienes los favoritos de la comunidad, cargados de tips, herramientas y mejores prácticas. ¡No te los pierdas! 👇

#code #programming #stats #analytics #datascience #data #AI #IA #ML 🔥 IA y R: ¡Lo mejor del año!
✅ Asistente de IA para Shiny buff.ly/408Mmjp
✅ LLM en R y Python (paquete mall): buff.ly/3ZKFPKc
✅ Paquete “ask” en R para analytics con IA buff.ly/40aRFz1
✅ Integra IA en R: Guía paso a paso: buff.ly/4iQ7RwO Image
Image
Dec 29, 2024 10 tweets 7 min read
🔥🔥 Mis post más populares sobre #stats #datascience y #analytics en 2024 🔥🔥

✨Este año ha estado lleno de aprendizajes, reflexiones y debates apasionantes. Aquí tienes los artículos sobre estadística y análisis de datos que más resonaron en la comunidad. ¿Te los perdiste?👇🏻 🎯 Conceptos que DESPEJAN dudas:
✅ ¿Por qué APRENDER estadística si el SOFTWARE/IA lo puede hacer todo por ti? buff.ly/41RK8WW
✅ ¿Cómo definir preguntas de investigación adecuadas? buff.ly/3Pdddof
✅ Valores atípicos e incluyentes: buff.ly/3PdlRDe
Dec 16, 2024 4 tweets 2 min read
🌟👀 ¿Qué hacer cuando un resultado NO es estadísticamente significativo? 🧠

No te preocupes, ¡No es el fin del mundo! 🌎 Aquí te dejo una guía para reflexionar y tomar el próximo paso como un profesional de los datos: 🧵👇

#stats #analytics #datascience #research #science #phd Image 🔑 La ausencia de evidencia NO es evidencia de ausencia.
📚 No es el p-valor lo que define tu éxito, sino lo que haces con lo que aprendes del análisis. 🧠 Reflexiona, ajusta y avanza con estrategias más sólidas. 💪

+Info:

#Statistics #DataScientist buff.ly/3BHyx1TImage
Dec 13, 2024 7 tweets 2 min read
🚨 Mitos acerca de los intervalos de confianza 🚨

💡 Los IC, tan populares en investigación, a menudo se malinterpretan y se utilizan para obtener conclusiones equivocadas. 🧠

🔍 Lo que crees vs. Lo que realmente son los IC: 👇🧵🔥

#stats #rstats #analytics #datascience #data Image Mito 1️⃣
❌ Un IC del 95% contiene el valor verdadero del parámetro con una probabilidad del 95%.
✅ Realidad: No. El IC solo garantiza que, si repites el muestreo, el 95% de los IC incluirán el valor verdadero. Es sobre los procedimientos repetidos, ¡no sobre un IC específico!😬
Dec 11, 2024 6 tweets 3 min read
😱 El error más frecuente de un análisis de datos... ¡SÍ, ESTÁ AQUÍ! 🔥

¿Crees que los valores atípicos y valores ausentes son el peor enemigo en tu análisis? Pfff, amateur. El verdadero peligro acecha en un rincón mucho más oscuro: ¡la falta de contexto! 💣

#stats #datascience 🧐 El verdadero reto en un análisis de datos no es la preparación de datos ni la elección de algoritmos, sino el diseño de estudio y la pregunta de investigación. Sin una base sólida, todo tu análisis será como un castillo de naipes. 🏰🌪️

#analytics #research #Investigación
Dec 6, 2024 4 tweets 3 min read
👀 ¿Qué pasaría si el PCA hiciera su propio informe? 🤖

🔥 Con FactoInvestigate, el análisis de componentes principales (PCA) no solo examina tus datos, ¡también genera un informe completo automáticamente! 📝 Pero aquí está lo importante: el control siempre es tuyo.💪🧵

#rstats Image 😱 Con el FactoInvestigate en R puedes generar un informe completo en solo una línea de código.🚀

💡¿Qué es el PCA y por qué usarlo?
✅ Reducir la dimensión de tus datos sin perder información clave
✅ Identificar componentes más informativos
✅ Visualizar relaciones y patrones
Nov 30, 2024 6 tweets 3 min read
🎯 ¿MÚLTIPLES PRUEBAS? ¡CUIDADO CON LOS FALSOS POSITIVOS! 🚨

¿Sabías que al realizar muchas pruebas estadísticas, la probabilidad de obtener resultados falsos “significativos” se dispara? 😱

👀 El mejor artículo sobre el tema: 📚

Y te lo explico 💪🧵👇 buff.ly/3ZcR0emImage 🔥 ¿Cuál es el problema?
Cada prueba estadística tiene una probabilidad de error tipo I (rechazar una hipótesis nula verdadera).

⏩ Realizas 1 prueba → Error esperado: 5% (si 𝛼=0.05).
⏩ Realizas 100 pruebas → Probabilidad de al menos 1 error: ¡casi el 100%! 😬 Image
Nov 22, 2024 4 tweets 2 min read
🚨 ¡Atención usuarios de Excel! 🚨
📊 Aproximadamente 1 de cada 8 personas en el planeta usa Excel 🤯 Este software es tan popular que muchas veces da la falsa sensación de que todo lo que se hace allí está libre de errores. Pero... ¡cuidado con los siguientes casos! 😱👇🧵 Image 🔥 Desventajas de Excel vs herramientas avanzadas como R:

1️⃣ Errores manuales más frecuentes.
2️⃣ No es ideal para tareas complejas.
3️⃣ Menor automatización.
4️⃣ Difícil trazar/reproducir.
5️⃣ Visualización básica no interactiva.
6️⃣ Volumen.
7️⃣ Conversión de datos automática. 😳 Image
Nov 15, 2024 7 tweets 3 min read
🤔 ¿Alguna vez te has preguntado qué significa realmente que falten datos y cómo afecta a tu análisis? Vamos a destapar lo que a menudo SE IGNORA sobre este tema👇

#rstats #stats #datascience #ML #dataviz Image 🔴 ¿Qué son los datos faltantes?
"datos que no tienes -quizás datos que desearías tener, o esperabas tener, o pensabas que tenías, pero que, de todos modos, no tienes. [...] los datos faltantes son al menos tan importantes como los datos que tienes". (David Hand) Image
Nov 7, 2024 8 tweets 4 min read
🔥 ¿Cómo integrar la Inteligencia Artificial Generativa (GenAI) en R?

💡 Aquí te dejo algunas herramientas interesantes que permiten integrar la GenAI en tu flujo de trabajo en R. 🧵👇

🚨 También algunas advertencias y consejos.
#RStats #GenAI #DataScience #AI #ChatGPT #RStats 1️⃣ {chattr} by @theotheredgar. Conecta tu código con LLMs como GitHub Copilot Chat y GPT 3.5 o 4 de OpenAI; también con LLaMa o GitHub Copilot. Usa una aplicación Shiny que se ejecuta dentro del IDE RStudio.

👉buff.ly/3UL7aJP
buff.ly/4dI8EgB
Nov 4, 2024 6 tweets 3 min read
🚨 ¡El R² no es lo que parece! 🚨 A menudo me preguntan cuál debe ser el valor deseable del R² o a partir de qué cifra podemos decir que nuestro modelo es adecuado. Pero esto no es tan sencillo como parece.🤯

💡 Aquí van algunas consideraciones importantes:

#Stats #datascience Image 🔥 El R² NO indica si el modelo es adecuado. Un R² alto no garantiza que el modelo se ajuste a los datos correctamente. Realiza un gráfico de dispersión para evaluar la relación entre las variables, gráficos de diagnóstico para evaluar si se cumplen los supuestos, etc..

#dataviz Image
Oct 29, 2024 5 tweets 2 min read
💡 ¡Atención! 🚀 No todos los valores atípicos/influyentes son problemáticos. A veces, son clave para entender la variabilidad en nuestros datos.🤔 Si los eliminamos sin pensarlo, ¡podríamos sesgar nuestro modelo!😱
🔍 Antes de eliminar cualquier punto: ¡Evalúa!🧵
#stats #rstats Image Pregúntate:
1️⃣ ¿Son errores de medición? Si son observaciones genuinas de la muestra, ¿Son atípicas o influyentes?
2️⃣ ¿Por qué? ¿Cómo impactan en el modelo?

Puedes comparar el modelo con y sin esos valores para evaluar cómo cambian los coeficientes o las predicciones 🧐 Image
Oct 10, 2024 9 tweets 5 min read
😈 Los 7 Pecados Estadísticos que Incluso algunos Expertos Cometen
🚨 ¿Te consideras un experto en estadística? Entonces, ¡presta atención! Incluso los profesionales más experimentados caen en estos 7 pecados estadísticos que pueden arruinar cualquier análisis de datos. 🧵👇 🚫 ERROR 1: No realizar una investigación reproducible 😱
😤 ¿Cuántas veces has tenido que rehacer un análisis completo por un simple error o cambio en los datos?
💡Usa R, RMarkdown/Quarto para asegurar que tu trabajo sea 100% reproducible, y actualiza automáticamente tu trabajo. Image
Oct 6, 2024 12 tweets 7 min read
🌍10 Casos Emblemáticos de Análisis de Datos en la Vida Real
🔍¿Sabías que el análisis de datos ha salvado vidas y revolucionado industrias?Si alguna vez te has preguntado cómo los datos pueden marcar la diferencia, aquí te presento algunos casos emblemáticos que te sorprenderán. Image 1️⃣ John Snow y el cólera (1854): Identificó con datos la fuente de un brote de cólera en Londres, creando un mapa que reveló la relación entre las muertes y una bomba de agua contaminada, sentando las bases de la epidemiología moderna.

#Epidemiology buff.ly/2WaBa4sImage
Aug 9, 2024 10 tweets 4 min read
👀 La correlación puede no significar lo que crees que significa.

💥 La interpretación de la correlación y su relevancia práctica debe considerar tanto el contexto específico como las limitaciones estadísticas.

👇 20 Precauciones clave 🧵

#stats #analytics #datascience #data 1️⃣ Las asociaciones observadas deben ser confirmadas en otros datos.
2️⃣ No se deben inferir correlaciones indirectas sin justificación.
3️⃣ Utilizar la regresión en lugar de la correlación puede ser más adecuado.
4️⃣ Correlación nula (o pequeña) ≠ Ausencia de relación. Image
Jan 26, 2024 8 tweets 4 min read
📚 Libros imperdibles para crear #dataviz impresionantes con #RStats 📊🌟
😉 (Y puedes consultarlos online de forma gratuita)

🚀🧵↓

#datavisualization #datascience #analytics #stats #data #book #gratis 📉Visualización de datos: introducción práctica by @kjhealy
"Una guía de visualización de datos a la vez práctica y elegante. Healy combina la belleza y el conocimiento de Tufte con la utilidad concreta de Stack Exchange.”— Elizabeth Bruch

#dataviz #book buff.ly/2K7Zyuv
Image
Jan 20, 2024 5 tweets 2 min read
💡Seguro conoces la frase "basura entra, basura sale", pero la calidad de los resultados no solo depende de la calidad de los datos, sino también de la validez del diseño de estudio que les dio forma; un buen diseño es la base para una buena inferencia.
🧵Cómo evaluar la validez? Image 1️⃣ Validez externa -> generalizar los resultados -> Representatividad de la muestra
👉 Precisión: tamaño de muestra (unidad experimental vs unidad de observación, tratamiento, réplica y pseudo-réplica)
👉 Exactitud: tipo de muestreo (aleatorio y representativo -evitar sesgos-) Image
Oct 12, 2023 5 tweets 4 min read
🎯 12 TOP 📦 #RStats para ahorrar horas de trabajo en tus análisis de datos 👀

1. Crea gráficos #ggplot de forma interactiva
📦 esquisse, recupera el código para reproducir el gráfico

2. Elige los colores para tus gráficos de forma interactiva
📦 colourpicker

#dataviz #stats Image 3. Visualiza series temporales
📦 tsviz

4. Prepara variables categóricas rápidamente
📦 questionr reordena, recodifica, discretiza

5. Explora tus datos y crea un informe automático
📦 DataExplorer buff.ly/3ekxlSL
buff.ly/46K6A3h
buff.ly/3sGXMt9
Image