Rosana Ferrero 📈📊🙌 Profile picture
📊 PhD, Statistics + Data Science + Machine Learning + Biology/Ecol 😉 Stats is the grammar of science 🎓 Directora académica y Docente 🏢 Consultora 💙 #RStats
Feb 18 4 tweets 2 min read
🧐 Si quieres gráficos rápidos, elegantes y sin sufrir, prueba {tinyplot}🔥
✅ Gráficos en base R sin complicaciones
✅ Agrupaciones y leyendas automáticas en un solo paso
✅ Facetas sin sudar la gota gorda (olvídate de par(mfrow=...))
✅ Temas personalizables con un solo comando Image 📌 ¿Por qué deberías probar tinyplot?
1️⃣ Usa solo base R → sin dependencias, sin bloat.
2️⃣ Ultra ligero → instalación mínima, ideal para paquetes o scripts portables.
3️⃣ Drop-in replacement → si ya usas plot(), cambiar a tinyplot() es pan comido. Image
Image
Feb 13 5 tweets 2 min read
🚀🔮✨ATENCIÓN, DETECTIVES DE DATOS ✨🔮🚀
😉 Porque aprender programación también puede hacerse de forma práctica y entretenida, hoy te traigo un desafío que pondrá a prueba tus conocimientos de R y tidyverse: la adaptación del SQL Murder Mystery. 🔎

👉 buff.ly/4hNGjGXImage 🕵🏻‍♂️ Este ejercicio interactivo te convertirá en un detective de datos que debe resolver un crimen analizando bases de datos policiales. Originalmente fue diseñado para SQL por pero aquí lo abordaremos utilizando R y tidyverse.
♻️ Adaptación de Naidoo (2019) y Goyal (2024).
Feb 8 4 tweets 2 min read
🔥¿10 CASOS POR VARIABLE?🔥
Si has escuchado que necesitas 10 eventos por variable (EPV) para hacer una regresión logística, te tengo noticias... ¡Ese criterio es una trampa!🚨 Hoy te explico por qué confiar en esta regla puede arruinar tus análisis y qué puedes hacer en su lugar Image 🤔 ¿Por qué se usa el criterio de 10 EPV?
👉 Es fácil de recordar y aplicar.
👉 Se ha usado en miles de estudios.
👉 Parece "una buena regla general".

💀 Pero en realidad tiene GRANDES problemas... Image
Feb 7 5 tweets 2 min read
🔥 EDA Automático con R y Python 🔥
👀 El EDA es clave al trabajar con datos, ayuda a comprender y preparar los datos antes de modelar. R y Python ofrecen herramientas automáticas, pero ¡usa siempre con responsabilidad y ética! 🚨

#DataScience #RStats #Python #stats #dataviz Image 🚀 ¿Por qué realizar un EDA automático? Image
Feb 2 7 tweets 2 min read
📢 Guía práctica para la inferencia estadística 📊
La inferencia estadística es fundamental para analizar datos y tomar decisiones informadas. Sin embargo, elegir el método correcto puede ser un desafío. Aquí tienes algunas estrategias clave para 5 problemas comunes:🧵👇

#stats Image 🔍 1. Comparación de medias en datos no Normales pero población simétrica y unimodal:
❌ No confíes en n > 30
❌ No uses Wilcoxon, ya que cambia la hipótesis nula
✅ Usa pruebas t de Welch por permutación o con bootstrap
✅ Con valores atípicos, prueba Yuen-Welch por permutación
Jan 31 8 tweets 5 min read
🔥🤖 IA en #RStats: Opciones y Precauciones🧠📊
Desde hace un tiempo, vengo explorando cómo utilizar la IA para programar en R: ¿Podría ser un cambio interesante? ¿Qué hay que tener en cuenta? ¿Qué opciones hay? Dejo algunas de mis reflexiones para que compartamos experiencias.🧵 Image La IA puede ser útil, pero también puede generar código incorrecto, reforzar sesgos y fomentar la dependencia. Usarla con responsabilidad implica verificar, interpretar y contextualizar, no aceptar ciegamente sus sugerencias. 🚦

#IA #CódigoSeguro #stats #RStats Image
Jan 27 9 tweets 5 min read
😈 Los 7 Pecados Estadísticos Más Comunes y Graves 🚨
¡Atención! Estos errores pueden destruir cualquier análisis de datos, ¡y son más comunes de lo que crees! 😱
Pero no te preocupes, te diré cómo resolverlos. Sigue leyendo... 👇

#stats #datascience #analytics #HorrorStats Image 🚫 ERROR 1: No hacer tu investigación reproducible 😱
😤 ¿Te ha pasado tener que rehacer todo por un pequeño error?
💡 Usa R, RMarkdown o Quarto para que tu trabajo sea 100% reproducible y se actualice automáticamente.
+Info: buff.ly/2x97p6zImage
Jan 26 5 tweets 2 min read
🔥 Una muy buena opción para aprender visualización de datos online 🔥

🌟 ¿Quieres aprender visualización de datos con ejercicios interactivos y acceso a todo el código fuente? 🌟 Te voy a contar cómo funciona esta web alucinante que ha montado Claus Wilke.

#dataviz #stats Image 🧠 Un sitio web diseñado para aprender de forma activa:
Este curso online utiliza Quarto Live, lo que significa que puedes practicar en vivo directamente desde la página. 🎯 ¡No más excusas para no probar lo que estás aprendiendo al instante! Image
Jan 22 6 tweets 3 min read
💡 A menudo le advierto a mis alumnos: No todos los valores atípicos (outliers) son villanos en tu análisis de datos. A veces, ¡son los héroes! 🤔
🚨 NO elimines los valores atípicos de forma predeterminada. ¡Podrías estar destruyendo tu análisis!

Antes evalúa lo siguiente:👇 Image 1️⃣ ¿Qué es un valor atípico?
👉 “un valor atípico es una observación que se desvía tanto de las otras observaciones que despierta sospechas de que ha sido generada por un mecanismo diferente” (Hawkins 1980).

👀 ¿Qué constituye una desviación “suficiente”?

#stats #outliers Image
Jan 19 5 tweets 2 min read
🔄 "Basura entra, basura sale" es un principio clave cuando hablamos de datos, pero si pensaste en "limpiar" tus datos y nada más, ¡te falta la mitad del cuadro!

🧠 Reflexionemos por qué... 👀

#stats #analytics #datascience #research #phd #thesis #science #experiment #design Image 🤯 La VERDADERA lección es que los resultados no solo dependen de cómo preparas los datos para el análisis, sino de cómo tomaste esos datos desde el principio. Y eso, mi amigo, está directamente relacionado con el diseño de estudio. 📊 Image
Jan 14 8 tweets 3 min read
🚨 ¡No dejes que la selección de predictores te confunda! 🚨

👉 Especifica tu modelo con lo que sabes (no solo por significación estadística).🔥
🧠 Crea un modelo que tenga sentido desde el conocimiento teórico o práctico del tema.

👇 Ejemplo Sencillo: Mortalidad de Ranas 🐸 Image 1️⃣ Especifica lo que ya sabes primero 🧠
👉 No elijas variables al azar.
Usa lo que sabes: la temperatura y la comida afecta a las ranas.🥵🍴
¿Y si lo importante es la interacción? (calor extremo + poca comida = 🚨 muerte).
✔️ Incluye efectos principales y la interacción. Image
Jan 5 5 tweets 3 min read
🌟📦 abess: Selección rápida del mejor subconjunto de predictores en Python y #RStats. 📊

😬 En un mundo lleno de datos, encontrar las variables más importantes puede ser como buscar una aguja en un pajar. ABESS (Adaptive BEst Subset Selection) llega para cambiar el juego.🧵👇 Image Una solución rápida, precisa y adaptativa que selecciona las mejores variables para tus modelos predictivos. ABESS se centra en seleccionar un pequeño subconjunto de predictores clave, asegurando que el modelo final sea preciso y eficiente. Image
Dec 31, 2024 6 tweets 7 min read
✨✨ Mis post más populares de 2024 sobre #RStats ✨✨

Aquí tienes los favoritos de la comunidad, cargados de tips, herramientas y mejores prácticas. ¡No te los pierdas! 👇

#code #programming #stats #analytics #datascience #data #AI #IA #ML 🔥 IA y R: ¡Lo mejor del año!
✅ Asistente de IA para Shiny buff.ly/408Mmjp
✅ LLM en R y Python (paquete mall): buff.ly/3ZKFPKc
✅ Paquete “ask” en R para analytics con IA buff.ly/40aRFz1
✅ Integra IA en R: Guía paso a paso: buff.ly/4iQ7RwO Image
Image
Dec 29, 2024 10 tweets 7 min read
🔥🔥 Mis post más populares sobre #stats #datascience y #analytics en 2024 🔥🔥

✨Este año ha estado lleno de aprendizajes, reflexiones y debates apasionantes. Aquí tienes los artículos sobre estadística y análisis de datos que más resonaron en la comunidad. ¿Te los perdiste?👇🏻 🎯 Conceptos que DESPEJAN dudas:
✅ ¿Por qué APRENDER estadística si el SOFTWARE/IA lo puede hacer todo por ti? buff.ly/41RK8WW
✅ ¿Cómo definir preguntas de investigación adecuadas? buff.ly/3Pdddof
✅ Valores atípicos e incluyentes: buff.ly/3PdlRDe
Dec 16, 2024 4 tweets 2 min read
🌟👀 ¿Qué hacer cuando un resultado NO es estadísticamente significativo? 🧠

No te preocupes, ¡No es el fin del mundo! 🌎 Aquí te dejo una guía para reflexionar y tomar el próximo paso como un profesional de los datos: 🧵👇

#stats #analytics #datascience #research #science #phd Image 🔑 La ausencia de evidencia NO es evidencia de ausencia.
📚 No es el p-valor lo que define tu éxito, sino lo que haces con lo que aprendes del análisis. 🧠 Reflexiona, ajusta y avanza con estrategias más sólidas. 💪

+Info:

#Statistics #DataScientist buff.ly/3BHyx1TImage
Dec 13, 2024 7 tweets 2 min read
🚨 Mitos acerca de los intervalos de confianza 🚨

💡 Los IC, tan populares en investigación, a menudo se malinterpretan y se utilizan para obtener conclusiones equivocadas. 🧠

🔍 Lo que crees vs. Lo que realmente son los IC: 👇🧵🔥

#stats #rstats #analytics #datascience #data Image Mito 1️⃣
❌ Un IC del 95% contiene el valor verdadero del parámetro con una probabilidad del 95%.
✅ Realidad: No. El IC solo garantiza que, si repites el muestreo, el 95% de los IC incluirán el valor verdadero. Es sobre los procedimientos repetidos, ¡no sobre un IC específico!😬
Dec 11, 2024 6 tweets 3 min read
😱 El error más frecuente de un análisis de datos... ¡SÍ, ESTÁ AQUÍ! 🔥

¿Crees que los valores atípicos y valores ausentes son el peor enemigo en tu análisis? Pfff, amateur. El verdadero peligro acecha en un rincón mucho más oscuro: ¡la falta de contexto! 💣

#stats #datascience 🧐 El verdadero reto en un análisis de datos no es la preparación de datos ni la elección de algoritmos, sino el diseño de estudio y la pregunta de investigación. Sin una base sólida, todo tu análisis será como un castillo de naipes. 🏰🌪️

#analytics #research #Investigación
Dec 6, 2024 4 tweets 3 min read
👀 ¿Qué pasaría si el PCA hiciera su propio informe? 🤖

🔥 Con FactoInvestigate, el análisis de componentes principales (PCA) no solo examina tus datos, ¡también genera un informe completo automáticamente! 📝 Pero aquí está lo importante: el control siempre es tuyo.💪🧵

#rstats Image 😱 Con el FactoInvestigate en R puedes generar un informe completo en solo una línea de código.🚀

💡¿Qué es el PCA y por qué usarlo?
✅ Reducir la dimensión de tus datos sin perder información clave
✅ Identificar componentes más informativos
✅ Visualizar relaciones y patrones
Nov 30, 2024 6 tweets 3 min read
🎯 ¿MÚLTIPLES PRUEBAS? ¡CUIDADO CON LOS FALSOS POSITIVOS! 🚨

¿Sabías que al realizar muchas pruebas estadísticas, la probabilidad de obtener resultados falsos “significativos” se dispara? 😱

👀 El mejor artículo sobre el tema: 📚

Y te lo explico 💪🧵👇 buff.ly/3ZcR0emImage 🔥 ¿Cuál es el problema?
Cada prueba estadística tiene una probabilidad de error tipo I (rechazar una hipótesis nula verdadera).

⏩ Realizas 1 prueba → Error esperado: 5% (si 𝛼=0.05).
⏩ Realizas 100 pruebas → Probabilidad de al menos 1 error: ¡casi el 100%! 😬 Image
Nov 22, 2024 4 tweets 2 min read
🚨 ¡Atención usuarios de Excel! 🚨
📊 Aproximadamente 1 de cada 8 personas en el planeta usa Excel 🤯 Este software es tan popular que muchas veces da la falsa sensación de que todo lo que se hace allí está libre de errores. Pero... ¡cuidado con los siguientes casos! 😱👇🧵 Image 🔥 Desventajas de Excel vs herramientas avanzadas como R:

1️⃣ Errores manuales más frecuentes.
2️⃣ No es ideal para tareas complejas.
3️⃣ Menor automatización.
4️⃣ Difícil trazar/reproducir.
5️⃣ Visualización básica no interactiva.
6️⃣ Volumen.
7️⃣ Conversión de datos automática. 😳 Image
Nov 15, 2024 7 tweets 3 min read
🤔 ¿Alguna vez te has preguntado qué significa realmente que falten datos y cómo afecta a tu análisis? Vamos a destapar lo que a menudo SE IGNORA sobre este tema👇

#rstats #stats #datascience #ML #dataviz Image 🔴 ¿Qué son los datos faltantes?
"datos que no tienes -quizás datos que desearías tener, o esperabas tener, o pensabas que tenías, pero que, de todos modos, no tienes. [...] los datos faltantes son al menos tan importantes como los datos que tienes". (David Hand) Image