Rosana Ferrero 📈📊🙌 Profile picture
📊 PhD, Statistics + Data Science + Machine Learning + Biology/Ecol 😉 Stats is the grammar of science 🎓 Directora académica y Docente 🏢 Consultora 💙 #RStats
Dec 13 7 tweets 2 min read
🚨 Mitos acerca de los intervalos de confianza 🚨

💡 Los IC, tan populares en investigación, a menudo se malinterpretan y se utilizan para obtener conclusiones equivocadas. 🧠

🔍 Lo que crees vs. Lo que realmente son los IC: 👇🧵🔥

#stats #rstats #analytics #datascience #data Image Mito 1️⃣
❌ Un IC del 95% contiene el valor verdadero del parámetro con una probabilidad del 95%.
✅ Realidad: No. El IC solo garantiza que, si repites el muestreo, el 95% de los IC incluirán el valor verdadero. Es sobre los procedimientos repetidos, ¡no sobre un IC específico!😬
Dec 11 6 tweets 3 min read
😱 El error más frecuente de un análisis de datos... ¡SÍ, ESTÁ AQUÍ! 🔥

¿Crees que los valores atípicos y valores ausentes son el peor enemigo en tu análisis? Pfff, amateur. El verdadero peligro acecha en un rincón mucho más oscuro: ¡la falta de contexto! 💣

#stats #datascience 🧐 El verdadero reto en un análisis de datos no es la preparación de datos ni la elección de algoritmos, sino el diseño de estudio y la pregunta de investigación. Sin una base sólida, todo tu análisis será como un castillo de naipes. 🏰🌪️

#analytics #research #Investigación
Dec 6 4 tweets 3 min read
👀 ¿Qué pasaría si el PCA hiciera su propio informe? 🤖

🔥 Con FactoInvestigate, el análisis de componentes principales (PCA) no solo examina tus datos, ¡también genera un informe completo automáticamente! 📝 Pero aquí está lo importante: el control siempre es tuyo.💪🧵

#rstats Image 😱 Con el FactoInvestigate en R puedes generar un informe completo en solo una línea de código.🚀

💡¿Qué es el PCA y por qué usarlo?
✅ Reducir la dimensión de tus datos sin perder información clave
✅ Identificar componentes más informativos
✅ Visualizar relaciones y patrones
Nov 30 6 tweets 3 min read
🎯 ¿MÚLTIPLES PRUEBAS? ¡CUIDADO CON LOS FALSOS POSITIVOS! 🚨

¿Sabías que al realizar muchas pruebas estadísticas, la probabilidad de obtener resultados falsos “significativos” se dispara? 😱

👀 El mejor artículo sobre el tema: 📚

Y te lo explico 💪🧵👇 buff.ly/3ZcR0emImage 🔥 ¿Cuál es el problema?
Cada prueba estadística tiene una probabilidad de error tipo I (rechazar una hipótesis nula verdadera).

⏩ Realizas 1 prueba → Error esperado: 5% (si 𝛼=0.05).
⏩ Realizas 100 pruebas → Probabilidad de al menos 1 error: ¡casi el 100%! 😬 Image
Nov 22 4 tweets 2 min read
🚨 ¡Atención usuarios de Excel! 🚨
📊 Aproximadamente 1 de cada 8 personas en el planeta usa Excel 🤯 Este software es tan popular que muchas veces da la falsa sensación de que todo lo que se hace allí está libre de errores. Pero... ¡cuidado con los siguientes casos! 😱👇🧵 Image 🔥 Desventajas de Excel vs herramientas avanzadas como R:

1️⃣ Errores manuales más frecuentes.
2️⃣ No es ideal para tareas complejas.
3️⃣ Menor automatización.
4️⃣ Difícil trazar/reproducir.
5️⃣ Visualización básica no interactiva.
6️⃣ Volumen.
7️⃣ Conversión de datos automática. 😳 Image
Nov 15 7 tweets 3 min read
🤔 ¿Alguna vez te has preguntado qué significa realmente que falten datos y cómo afecta a tu análisis? Vamos a destapar lo que a menudo SE IGNORA sobre este tema👇

#rstats #stats #datascience #ML #dataviz Image 🔴 ¿Qué son los datos faltantes?
"datos que no tienes -quizás datos que desearías tener, o esperabas tener, o pensabas que tenías, pero que, de todos modos, no tienes. [...] los datos faltantes son al menos tan importantes como los datos que tienes". (David Hand) Image
Nov 7 8 tweets 4 min read
🔥 ¿Cómo integrar la Inteligencia Artificial Generativa (GenAI) en R?

💡 Aquí te dejo algunas herramientas interesantes que permiten integrar la GenAI en tu flujo de trabajo en R. 🧵👇

🚨 También algunas advertencias y consejos.
#RStats #GenAI #DataScience #AI #ChatGPT #RStats 1️⃣ {chattr} by @theotheredgar. Conecta tu código con LLMs como GitHub Copilot Chat y GPT 3.5 o 4 de OpenAI; también con LLaMa o GitHub Copilot. Usa una aplicación Shiny que se ejecuta dentro del IDE RStudio.

👉buff.ly/3UL7aJP
buff.ly/4dI8EgB
Nov 4 6 tweets 3 min read
🚨 ¡El R² no es lo que parece! 🚨 A menudo me preguntan cuál debe ser el valor deseable del R² o a partir de qué cifra podemos decir que nuestro modelo es adecuado. Pero esto no es tan sencillo como parece.🤯

💡 Aquí van algunas consideraciones importantes:

#Stats #datascience Image 🔥 El R² NO indica si el modelo es adecuado. Un R² alto no garantiza que el modelo se ajuste a los datos correctamente. Realiza un gráfico de dispersión para evaluar la relación entre las variables, gráficos de diagnóstico para evaluar si se cumplen los supuestos, etc..

#dataviz Image
Oct 29 5 tweets 2 min read
💡 ¡Atención! 🚀 No todos los valores atípicos/influyentes son problemáticos. A veces, son clave para entender la variabilidad en nuestros datos.🤔 Si los eliminamos sin pensarlo, ¡podríamos sesgar nuestro modelo!😱
🔍 Antes de eliminar cualquier punto: ¡Evalúa!🧵
#stats #rstats Image Pregúntate:
1️⃣ ¿Son errores de medición? Si son observaciones genuinas de la muestra, ¿Son atípicas o influyentes?
2️⃣ ¿Por qué? ¿Cómo impactan en el modelo?

Puedes comparar el modelo con y sin esos valores para evaluar cómo cambian los coeficientes o las predicciones 🧐 Image
Oct 10 9 tweets 5 min read
😈 Los 7 Pecados Estadísticos que Incluso algunos Expertos Cometen
🚨 ¿Te consideras un experto en estadística? Entonces, ¡presta atención! Incluso los profesionales más experimentados caen en estos 7 pecados estadísticos que pueden arruinar cualquier análisis de datos. 🧵👇 🚫 ERROR 1: No realizar una investigación reproducible 😱
😤 ¿Cuántas veces has tenido que rehacer un análisis completo por un simple error o cambio en los datos?
💡Usa R, RMarkdown/Quarto para asegurar que tu trabajo sea 100% reproducible, y actualiza automáticamente tu trabajo. Image
Oct 6 12 tweets 7 min read
🌍10 Casos Emblemáticos de Análisis de Datos en la Vida Real
🔍¿Sabías que el análisis de datos ha salvado vidas y revolucionado industrias?Si alguna vez te has preguntado cómo los datos pueden marcar la diferencia, aquí te presento algunos casos emblemáticos que te sorprenderán. Image 1️⃣ John Snow y el cólera (1854): Identificó con datos la fuente de un brote de cólera en Londres, creando un mapa que reveló la relación entre las muertes y una bomba de agua contaminada, sentando las bases de la epidemiología moderna.

#Epidemiology buff.ly/2WaBa4sImage
Aug 9 10 tweets 4 min read
👀 La correlación puede no significar lo que crees que significa.

💥 La interpretación de la correlación y su relevancia práctica debe considerar tanto el contexto específico como las limitaciones estadísticas.

👇 20 Precauciones clave 🧵

#stats #analytics #datascience #data 1️⃣ Las asociaciones observadas deben ser confirmadas en otros datos.
2️⃣ No se deben inferir correlaciones indirectas sin justificación.
3️⃣ Utilizar la regresión en lugar de la correlación puede ser más adecuado.
4️⃣ Correlación nula (o pequeña) ≠ Ausencia de relación. Image
Jan 26 8 tweets 4 min read
📚 Libros imperdibles para crear #dataviz impresionantes con #RStats 📊🌟
😉 (Y puedes consultarlos online de forma gratuita)

🚀🧵↓

#datavisualization #datascience #analytics #stats #data #book #gratis 📉Visualización de datos: introducción práctica by @kjhealy
"Una guía de visualización de datos a la vez práctica y elegante. Healy combina la belleza y el conocimiento de Tufte con la utilidad concreta de Stack Exchange.”— Elizabeth Bruch

#dataviz #book buff.ly/2K7Zyuv
Image
Jan 20 5 tweets 2 min read
💡Seguro conoces la frase "basura entra, basura sale", pero la calidad de los resultados no solo depende de la calidad de los datos, sino también de la validez del diseño de estudio que les dio forma; un buen diseño es la base para una buena inferencia.
🧵Cómo evaluar la validez? Image 1️⃣ Validez externa -> generalizar los resultados -> Representatividad de la muestra
👉 Precisión: tamaño de muestra (unidad experimental vs unidad de observación, tratamiento, réplica y pseudo-réplica)
👉 Exactitud: tipo de muestreo (aleatorio y representativo -evitar sesgos-) Image
Oct 12, 2023 5 tweets 4 min read
🎯 12 TOP 📦 #RStats para ahorrar horas de trabajo en tus análisis de datos 👀

1. Crea gráficos #ggplot de forma interactiva
📦 esquisse, recupera el código para reproducir el gráfico

2. Elige los colores para tus gráficos de forma interactiva
📦 colourpicker

#dataviz #stats Image 3. Visualiza series temporales
📦 tsviz

4. Prepara variables categóricas rápidamente
📦 questionr reordena, recodifica, discretiza

5. Explora tus datos y crea un informe automático
📦 DataExplorer buff.ly/3ekxlSL
buff.ly/46K6A3h
buff.ly/3sGXMt9
Image
Apr 4, 2023 7 tweets 7 min read
🤖📚 Descubre las mejores herramientas impulsadas por #AI para la investigación académica y ahorra tiempo para hacer lo que más te gusta
📚 Accede a más información en menos tiempo!
🚀 Dale un impulso a tu investigación académica!
#GPT #DataScience #science #chatGPT #research #ML ✅Scispace
Espacio de trabajo para automatizar tareas
Obtén una explicación simple de texto, matemáticas y tablas confusas
Haz preguntas de seguimiento y obtén respuestas instantáneas
Busca papers relevantes
Mejora la colaboración
buff.ly/3gz7LhQ
#Researchtools #science
Jan 26, 2023 9 tweets 6 min read
🤯¡Los datos ausentes están por todas partes!😜
👉Pueden invalidar los resultados de tu estudio
👉Muchas funciones utilizan métodos automáticos que pueden no ser óptimos
👉El impacto de la falta de datos es un tema que la mayoría quiere evitar, pero hoy no
¿Qué hacer con los NA?: 🎯Necesitas identificar los datos ausentes, averiguar por qué y cómo faltan:
- errores humanos
- interrupciones del flujo de datos (e.g. meses)
- problemas de privacidad
- sesgo (e.g. tipos de participantes del estudio que tienen >NA)

¡Es info clave para intentar solucionarlo!
Jan 25, 2023 17 tweets 28 min read
💥14 herramientas secretas impulsadas por #RStats para ahorrar tiempo y esfuerzo en tus proyectos de datos (¡No te lo pierdas!):👀 1️⃣ ¡Edita tus datos de forma interactiva (y guarda el código)! 👀
📦 'editData' es un complemento de RStudio para editar un data.frame o un tibble de forma interactiva
🔗 buff.ly/3U5Tgjy

#DataScience #DataVisualization #dataviz #stats #analytics #RStats #Analytics
Jan 14, 2023 9 tweets 29 min read
🌎 ¡Acabo de encontrar una serie de mapas increíbles realizados con #RStats! Desde mapas interactivos hasta diseños 3D, hay algo para todos los amantes de los datos espaciales
👇 ¡8 cuentas a las que definitivamente vale la pena darle un vistazo!🧵
#dataviz #maps #geospatial #gis ✅ Tyler Morgan-Wall @tylermorganwall

🔗 buff.ly/3ZBWNKe
Mapa 3D giratorio con puntos de luz (mapa anterior)

🔗 buff.ly/3QDfXLx
La red de cable submarino de fibra óptica de la Tierra.

Utiliza #rayshader #rayrender #rayverse
#dataviz #maps #geospatial #gis
Jan 14, 2023 5 tweets 11 min read
💥 ¡Hey #RStudio users! ¿Quieres integrar #ChatGPT en tu código?
😱 ¡Descarga 📦 gpttools! (amplía gptstudio)
👉 4 complementos (hilo 🧵)

#chatgpt3 #GPTwitter #gptchat #RStats #datascience #stats #analytics #machinelearning #ML #IA #ArtificialIntelligence #dataviz @posit_pbc #AI @posit_pbc Código de comentario: utiliza el modelo code-davinci-edit-001 de OpenAI para agregar comentarios a tu código con el mensaje: "agregue comentarios a cada línea de código, explicando lo que hace el código"
#ChatGPTenRStudio #RStats #DataScience #IA #ML #data #dataviz #analytics #AI
Dec 28, 2022 5 tweets 6 min read
😜¡No seas un inocente del #DataScience !
⚠️Aunque el #MachineLearning puede ser una herramienta poderosa, siempre es importante evaluar y validar tus modelos antes de confiar demasiado en ellos.
😱¿Cómo evaluar y validar modelos de #ML? 👉(Hilo 🧵)

#RStats #analytics #stats #IA ✅ Dividir los datos disponibles en dos (o más) conjuntos. Se entrena el modelo con un conjunto de entrenamiento y luego se mide su rendimiento en un conjunto de prueba. Así obtienes una estimación del rendimiento del modelo en datos que no ha visto antes
#ML #IA #DataScience