Rosana Ferrero 📈📊🙌 Profile picture
📊 PhD. Bioestadística | Data Science + Machine Learning | 🎓 Directora académica y Docente 💙 #RStats 😉 Stats is the grammar of science
Dec 9 9 tweets 2 min read
🚨El R² engaña. Más de lo que muchos admiten.🙈
Se repite como un mantra: “R² alto = modelo bueno”. La simplificación es cómoda, pero intelectualmente pobre.
Esto es lo que le enseño a mis alumnos en clase: 👇🧵

#stats #datacience #analytics #master #formacion #cienciadedatos Image El R² no evalúa adecuación, no valida supuestos y no tiene capacidad para anticipar precisión predictiva. La obsesión con encontrar un “valor mínimo aceptable” revela un malentendido estadístico arraigado.

Cuatro enseñanzas clave sobre lo que NO indica el R2: 👇
Dec 8 8 tweets 2 min read
⚠️Una tentación peligrosa: forzar los datos para que se ajusten a los supuestos de un modelo estadístico.
La limpieza y la transformación de datos son prácticas esenciales, pero cruzar la línea con una manipulación excesiva puede llevarnos a conclusiones y decisiones erróneas.🧵 Image 🧐 ¿Qué son los Supuestos del Modelo?
Los modelos estadísticos, como la Regresión Lineal Simple o el ANOVA, se construyen sobre ciertas condiciones que, si se cumplen, garantizan que los estimadores (los coeficientes o efectos que calculamos) sean insesgados y eficientes.
Dec 6 5 tweets 2 min read
🚨𝐃𝐞𝐣𝐚 𝐝𝐞 𝐜𝐨𝐩𝐢𝐚𝐫 𝐲 𝐩𝐞𝐠𝐚𝐫 para generar informes.🚨
Si trabajas con datos, ya sabes lo que supone cambiar una fecha, ejecutar todo el script y cruzar los dedos.
La alternativa profesional es otra: parametrizar.👇🧵

#stats #datascience #analytics #dataviz #rstats Herramientas como R Markdown/Quarto permiten definir 𝐩𝐚𝐫á𝐦𝐞𝐭𝐫𝐨𝐬 𝐝𝐞 𝐞𝐧𝐭𝐫𝐚𝐝𝐚, convirtiendo tu informe en una 𝐩𝐥𝐚𝐧𝐭𝐢𝐥𝐥𝐚 𝐝𝐢𝐧á𝐦𝐢𝐜𝐚.
👉 Un único script; cientos de resultados distintos.
Cambio la sucursal o la especie, y genero el informe específico. Image
Nov 30 5 tweets 2 min read
😱 ¿𝗦𝗶𝗴𝘂𝗲𝘀 𝘂𝘀𝗮𝗻𝗱𝗼 𝗴𝗿á𝗳𝗶𝗰𝗼𝘀 𝗱𝗲 𝗯𝗮𝗿𝗿𝗮𝘀 (𝗼 𝗽𝘂𝗻𝘁𝗼𝘀+𝗹í𝗻𝗲𝗮𝘀) 𝗽𝗮𝗿𝗮 𝗿𝗲𝗽𝗿𝗲𝘀𝗲𝗻𝘁𝗮𝗿 𝗱𝗮𝘁𝗼𝘀 𝗰𝗼𝗻𝘁𝗶𝗻𝘂𝗼𝘀?
Es hora de soltar el famoso barbarplot. Es el gráfico que miente con la mejor de las intenciones.👇🧵

#stats #dataviz Image 📸𝐋𝐚 𝐏𝐚𝐫𝐚𝐝𝐨𝐣𝐚
Mira la imagen: 𝐜𝐨𝐧𝐣𝐮𝐧𝐭𝐨𝐬 𝐝𝐞 𝐝𝐚𝐭𝐨𝐬 𝐦𝐮𝐲 𝐝𝐢𝐟𝐞𝐫𝐞𝐧𝐭𝐞𝐬 pueden dar lugar al 𝐦𝐢𝐬𝐦𝐨 𝐠𝐫á𝐟𝐢𝐜𝐨 𝐝𝐞 𝐛𝐚𝐫𝐫𝐚𝐬.¿Cómo? El barbarplot solo muestra 𝐦𝐞𝐝𝐢𝐚𝐬 𝐲 𝐞𝐫𝐫𝐨𝐫𝐞𝐬, ocultando la 𝐝𝐢𝐬𝐭𝐫𝐢𝐛𝐮𝐜𝐢ó𝐧 𝐫𝐞𝐚𝐥. Image
Image
Nov 25 10 tweets 5 min read
🔍 𝐘 𝐬𝐢 𝐥𝐚 𝐦𝐚𝐲𝐨𝐫𝐢́𝐚 𝐝𝐞 𝐥𝐨𝐬 𝐡𝐚𝐥𝐥𝐚𝐳𝐠𝐨𝐬 𝐜𝐢𝐞𝐧𝐭𝐢́𝐟𝐢𝐜𝐨𝐬 𝐪𝐮𝐞 𝐥𝐞𝐞𝐦𝐨𝐬… 𝐟𝐮𝐞𝐫𝐚𝐧 𝐟𝐚𝐥𝐬𝐨𝐬?
Aprendizajes clave del podcast de Lakens y Mehta que repasa uno de los ensayos más influyentes (y polémicos) de la ciencia moderna:👇🧵
#stats Image "Why Most Published Research Findings Are False", de John Ioannidis.
Lejos de ser un ataque a la ciencia, reflexionemos sobre 𝐜𝐨́𝐦𝐨 𝐩𝐫𝐨𝐝𝐮𝐜𝐢𝐦𝐨𝐬 𝐜𝐨𝐧𝐨𝐜𝐢𝐦𝐢𝐞𝐧𝐭𝐨.

🚩El problema: 𝐅𝐚𝐜𝐭𝐨𝐫𝐞𝐬 𝐪𝐮𝐞 𝐀𝐮𝐦𝐞𝐧𝐭𝐚𝐧 𝐞𝐥 𝐑𝐢𝐞𝐬𝐠𝐨 𝐝𝐞 𝐅𝐚𝐥𝐬𝐞𝐝𝐚𝐝 Image
Nov 18 7 tweets 2 min read
💡Cuando los datos mienten… y los LLMs creen 🤯
¿Pueden los LLMs realmente "ver" lo que los datos muestran? Un experimento manipuló datasets clásicos de R como mtcars para invertir relaciones entre variables y evaluar cómo interpretan los gráficos.👇🧵

#stats #analytics #RStats Image El resultado fue revelador: los LLMs siguieron interpretando los gráficos según lo que esperaban ver, no lo que los datos mostraban realmente.
Incluso con anomalías sutiles (horas de estudio vs. rendimiento académico), su detección era parcial y dependía de expectativas previas. Image
Nov 14 6 tweets 4 min read
🎉 Top Libros de Análisis Espacial con R (con acceso online gratuito) 🗺️
Si trabajas con SIG y quieres potenciar tus habilidades de análisis de datos geoespaciales, R es una excelente opción.

#rstats #datascience #rspatial #analytics #AnalisisEspacial #GIS #SIG #Geoespacial Image 1️⃣ 📙 Applied Spatial Data Analysis with R
By Roger S. Bivand, Edzer J. Pebesma, Virgilio Gómez-Rubio
Ttal vez algo antiguo (usa sp) pero referencia obligada por su teoría y práctica de modelos geoestadísticos y datos de área.
Nivel: medio-alto
Código: asdar-book.orgImage
Nov 11 4 tweets 2 min read
🗺️Mapas Sincronizados en R para un Análisis Comparativo de Impacto
¿Necesitas visualizar rápidamente el cambio o la diferencia entre dos variables geográficas (tipo 'Antes' y 'Después')? Deja de alternar entre mapas estáticos, utiliza las librerías mapview y leaflet.extras2 de R. Les comparto este código que genera dos mapas interactivos sincronizados. La magia está en el operador | que nos permite tener un límite central que puedes deslizar para revelar una variable o la otra. Es una forma increíblemente efectiva de comunicar resultados o impactos. Image
Nov 1 6 tweets 2 min read
📢 ¡𝗗𝗲𝘀𝗰𝗮𝗿𝗴𝗮 𝗚𝗥𝗔𝗧𝗜𝗦 nuestras guías rápidas de RStudio y R Software en español! 🎉

Si estás empezando en Data Science o Machine Learning con R, este hilo es para ti 🧵👇 Image 👀 💬 Como dice Garret Grolemund (RStudio):

“Las cheat sheets son ayudas visuales para acercarte rápidamente a las funciones que necesitas.”

✨ Visuales y prácticas
✨ Fáciles de imprimir o tener a mano
✨ Te ayudan a arrancar con buen pie sin memorizarlo todo Image
Oct 31 8 tweets 3 min read
🔎 𝗘𝗹 𝗞𝗶𝘁 𝗱𝗲 𝗛𝗲𝗿𝗿𝗮𝗺𝗶𝗲𝗻𝘁𝗮𝘀 𝗘𝘀𝗲𝗻𝗰𝗶𝗮𝗹 𝗽𝗮𝗿𝗮 𝗹𝗮 𝗘𝗗𝗔 𝗲𝗻 #RStats 📊
En R, ya no necesitas escribir cientos de líneas de código para resumir y visualizar tus datos. Existen paquetes dedicados que automatizan esta tarea.

Mis favoritos y enlaces👇🧵 Image El EDA es una fase crítica de cualquier proyecto de #DataScience.
Es donde detectamos anomalías, visualizamos distribuciones y, descubrimos patrones ocultos.
5 Paquetes para:
✅ Acelerar tu proceso
✅ Garantizar un análisis exhaustivo
✅ Obtener #dataviz potentes y comunicables
Oct 30 4 tweets 2 min read
📚¿𝗤𝘂𝗶𝗲𝗿𝗲s 𝗮𝗽𝗿𝗲𝗻𝗱𝗲𝗿 𝗲𝘀𝘁𝗮𝗱𝗶́𝘀𝘁𝗶𝗰𝗮 𝗰𝗼𝗻 R y no sabes por dónde empezar (o continuar)?
Mi biblioteca esencial de recursos organizada por nivel de dificultad.🧵👇

🔗Lista completa de libros recomendados:

#Rstats #stats #datascience lnkd.in/d_KDGcSHImage Con los recursos adecuados puedes avanzar desde fundamentos hasta modelos avanzados.

🎯 Principiantes:
Libros que enseñan a pensar en datos con R.
Ejemplo clave: R for Data Science de Hadley Wickham.
Aprende la base de la manipulación de datos y visualización.

#analytics Image
Oct 29 8 tweets 3 min read
🚨 ¿𝗦𝗮𝗯𝗶́𝗮𝘀 𝗾𝘂𝗲 𝗽𝘂𝗲𝗱𝗲𝘀 𝘂𝘁𝗶𝗹𝗶𝘇𝗮𝗿 𝗥 𝗱𝗲 𝗳𝗼𝗿𝗺𝗮 𝗶𝗻𝘁𝗲𝗿𝗮𝗰𝘁𝗶𝘃𝗮 𝗽𝗮𝗿𝗮 𝗮𝗰𝗲𝗹𝗲𝗿𝗮𝗿 𝘁𝘂 𝗳𝗹𝘂𝗷𝗼 𝗱𝗲 𝘁𝗿𝗮𝗯𝗮𝗷𝗼? 🚨
Los Addins de RStudio no reemplazan tu código, lo potencian ⚡
Ejecuta tareas repetitivas o complejas en un clic.🧵👇 Image 💻 Automatiza, visualiza y acelera tu flujo de trabajo.
El código sigue siendo el corazón de tu trabajo, los Addins son los turbo.🚀

Aquí mi Top 10 de Addins imprescindibles 😎👇

Descarga tus favoritos, abre el menú "Addins" en RStudio y ¡𝗕𝗢𝗢𝗠 💣!

#RStats #datascience Image
Oct 28 6 tweets 3 min read
🎨📊 𝗔𝗴𝗿𝗲𝗴𝗮 𝗶𝗻𝘁𝗲𝗿𝗮𝗰𝘁𝗶𝘃𝗶𝗱𝗮𝗱 𝗮 𝗹𝗮 𝗲𝗹𝗲𝗴𝗮𝗻𝗰𝗶𝗮 𝗱𝗲 {𝗴𝗴𝗽𝗹𝗼𝘁𝟮} 𝗰𝗼𝗻 {𝗴𝗴𝗶𝗿𝗮𝗽𝗵}
¿Y si tus gráficos en R pudieran reaccionar al usuario?
Con {ggiraph}, eso ya es una realidad

👇Permite que cada persona descubra su propia historia de datos🧵 🧩 ¿𝗤𝘂𝗲́ 𝗮𝗽𝗼𝗿𝘁𝗮 {𝗴𝗴𝗶𝗿𝗮𝗽𝗵}?
Mantiene la simplicidad de {ggplot2} pero añade dinamismo total.

➡️ Tus gráficos dejan de ser estáticos. ¡Ahora reaccionan!

Incluye:
• Tooltips (info al pasar el ratón)
• Hover (estilos dinámicos)
• Selección directa de elementos
Oct 27 8 tweets 5 min read
🧠💡 El truco del héroe del dato que solo quienes usamos R Markdown o Quarto conocemos.
La verdadera razón por la que son vitales no es “reproducibilidad” o “transparencia”.
Es una palabra mucho mejor: AUTOMATIZACIÓN. ⚙️✨

🧵👇#stats #rstats #python #datascience #analytics #code Image Todos hemos pasado por esto:
Pasas días haciendo el informe perfecto.

A la mañana siguiente:
“El cliente acaba de mandar los datos actualizados.” 😩

Y ahí, mientras todos sufren... tú presionas Render y te vas por un café. ☕
Oct 19 11 tweets 11 min read
👇 Recursos clave para dominar R para visualización y análisis de datos 👇
Desde preparación de datos hasta modelado avanzado y automatización con IA, estos enlaces ofrecen métodos, paquetes y guías prácticas para trabajar de manera más eficiente y obtener resultados confiables. Image 📚 Recursos y aprendizaje en R
✅ Positron: la nueva generación de IDE linkedin.com/feed/update/ur…
✅ Dataset linkedin.com/feed/update/ur…
✅ Recursos gratuitos en español linkedin.com/feed/update/ur…
✅ Bigbook of R: todos los libros gratuitos y online de R linkedin.com/feed/update/ur…
Oct 17 8 tweets 10 min read
💡Lo que TODO analista de datos debería saber: conceptos, errores y modelos explicados.🤯
No basta con software o IA: comprender la estadística marca la diferencia entre resultados fiables y engañosos.

Recopilatorio de post importantes👇🧵

#DataScience #Stats #RStats #analytics Image 💎 Recursos para:
- Formular preguntas de investigación claras y relevantes
- Evitar sesgos y errores que pueden arruinar tus análisis
- Entender y evaluar correctamente modelos estadísticos y predictivos
- Evaluar tamaños de efecto, significación estadística y falsos positivos
Oct 16 7 tweets 8 min read
📊 Mejora tus #DataViz y cuenta historias claras que realmente impacten.
Recursos clave para gráficos claros, interactivos y bien diseñados: desde ggplot2 hasta dashboards en R y Python. 🚀

💡 Te dejo mi lista con el top 16👇

#RStats #Python #VisualizaciónDeDatos #Storytelling Image Estos post:
👉 Te enseñan a crear gráficos efectivos, elegantes y claros
👉 Combinan herramientas y técnicas (R, Python, ggplot2, dashboards interactivos) con buenas prácticas de diseño y storytelling
👉 Te ayudan a interpretar y comunicar resultados de forma impactante.
Oct 12 6 tweets 3 min read
👀 ¿Por qué muchos abandonan la estadística y cómo tú puedes evitarlo?

📚 La estadística suele tener mala fama: la asociamos a fórmulas complejas, memorizar definiciones imposibles y un montón de matemáticas que parecen un jeroglífico. Pero no tiene por qué ser así.👇🧵

#stats Image 💡 Después de años ayudando a estudiantes a superar esa barrera, he descubierto que el problema no está en la estadística en sí, sino en la forma en que se enseña y se aprende.

👇 Aquí te dejo tres claves para que tú no caigas en esos mismos errores: Image
Oct 11 5 tweets 2 min read
🔁 Recordatorio periódico sobre la importancia de mejorar nuestras inferencias estadísticas...
Porque, al final, 𝐦𝐞𝐣𝐨𝐫𝐞𝐬 𝐢𝐧𝐟𝐞𝐫𝐞𝐧𝐜𝐢𝐚𝐬 𝐬𝐢𝐠𝐧𝐢𝐟𝐢𝐜𝐚𝐧 𝐦𝐞𝐣𝐨𝐫𝐞𝐬 𝐝𝐞𝐜𝐢𝐬𝐢𝐨𝐧𝐞𝐬.
[Y CURSO ONLINE GRATUITO] 👇🧵

#stats #inference #datascience #phD Image Uno de los cursos que más me han gustado en los últimos tiempos es:
🎓 “𝐈𝐦𝐩𝐫𝐨𝐯𝐢𝐧𝐠 𝐘𝐨𝐮𝐫 𝐒𝐭𝐚𝐭𝐢𝐬𝐭𝐢𝐜𝐚𝐥 𝐈𝐧𝐟𝐞𝐫𝐞𝐧𝐜𝐞𝐬”
📍 Impartido por 𝐃𝐚𝐧𝐢𝐞𝐥 𝐋𝐚𝐤𝐞𝐧𝐬 (Universidad Técnica de Eindhoven)
coursera.org/learn/statisti…Image
Oct 8 5 tweets 1 min read
🤯 ¿Alguna vez quisiste mover una imagen o redimensionar un bloque de texto en tus diapositivas 𝗦𝗜𝗡 volver al código?
🎉Nuevo complemento para presentaciones interactivas en Quarto + Revealjs: 𝐞𝐝𝐢𝐭𝐚𝐛𝐥𝐞 👇🧵

#Quarto #Revealjs #RStats #DataScience #Presentaciones #stats Con 𝐞𝐝𝐢𝐭𝐚𝐛𝐥𝐞, ahora puedes:👇🧵
🔹 𝗥𝗲𝗽𝗼𝘀𝗶𝗰𝗶𝗼𝗻𝗮𝗿 imágenes y cajas de texto

🔹 𝗥𝗲𝗱𝗶𝗺𝗲𝗻𝘀𝗶𝗼𝗻𝗮𝗿𝗹𝗮𝘀 directamente en la vista previa

🔹 𝗖𝗮𝗺𝗯𝗶𝗮𝗿 𝘁𝗮𝗺𝗮ñ𝗼 𝗱𝗲 𝗳𝘂𝗲𝗻𝘁𝗲 y 𝗮𝗹𝗶𝗻𝗲𝗮𝗰𝗶ó𝗻 del texto
Oct 6 6 tweets 2 min read
🧠 Cómo aprovechar los LLMs para el análisis de datos
Por Joe Cheng (CTO de Posit)

Los LLMs han cambiado la forma en que desarrollamos, pero en análisis de datos su verdadero valor no está en analizar datos directamente, sino en generar el código que lo hace posible.👇🧵

#stats Image 👉 Para ello, Posit desarrolló dos paquetes que simplifican la interacción con APIs de LLM:
- Elmer (R)
- Chatless (Python)
Ambos permiten gestionar llamadas HTTP a LLMs de manera sencilla y confiable.