Rosana Ferrero 📈📊🙌 Profile picture
📊 PhD, Statistics + Data Science + Machine Learning + Biology/Ecol 😉 Stats is the grammar of science 🎓 Directora académica y Docente 🏢 Consultora 💙 #RStats
Oct 19 11 tweets 11 min read
👇 Recursos clave para dominar R para visualización y análisis de datos 👇
Desde preparación de datos hasta modelado avanzado y automatización con IA, estos enlaces ofrecen métodos, paquetes y guías prácticas para trabajar de manera más eficiente y obtener resultados confiables. Image 📚 Recursos y aprendizaje en R
✅ Positron: la nueva generación de IDE linkedin.com/feed/update/ur…
✅ Dataset linkedin.com/feed/update/ur…
✅ Recursos gratuitos en español linkedin.com/feed/update/ur…
✅ Bigbook of R: todos los libros gratuitos y online de R linkedin.com/feed/update/ur…
Oct 17 8 tweets 10 min read
💡Lo que TODO analista de datos debería saber: conceptos, errores y modelos explicados.🤯
No basta con software o IA: comprender la estadística marca la diferencia entre resultados fiables y engañosos.

Recopilatorio de post importantes👇🧵

#DataScience #Stats #RStats #analytics Image 💎 Recursos para:
- Formular preguntas de investigación claras y relevantes
- Evitar sesgos y errores que pueden arruinar tus análisis
- Entender y evaluar correctamente modelos estadísticos y predictivos
- Evaluar tamaños de efecto, significación estadística y falsos positivos
Oct 16 7 tweets 8 min read
📊 Mejora tus #DataViz y cuenta historias claras que realmente impacten.
Recursos clave para gráficos claros, interactivos y bien diseñados: desde ggplot2 hasta dashboards en R y Python. 🚀

💡 Te dejo mi lista con el top 16👇

#RStats #Python #VisualizaciónDeDatos #Storytelling Image Estos post:
👉 Te enseñan a crear gráficos efectivos, elegantes y claros
👉 Combinan herramientas y técnicas (R, Python, ggplot2, dashboards interactivos) con buenas prácticas de diseño y storytelling
👉 Te ayudan a interpretar y comunicar resultados de forma impactante.
Oct 12 6 tweets 3 min read
👀 ¿Por qué muchos abandonan la estadística y cómo tú puedes evitarlo?

📚 La estadística suele tener mala fama: la asociamos a fórmulas complejas, memorizar definiciones imposibles y un montón de matemáticas que parecen un jeroglífico. Pero no tiene por qué ser así.👇🧵

#stats Image 💡 Después de años ayudando a estudiantes a superar esa barrera, he descubierto que el problema no está en la estadística en sí, sino en la forma en que se enseña y se aprende.

👇 Aquí te dejo tres claves para que tú no caigas en esos mismos errores: Image
Oct 11 5 tweets 2 min read
🔁 Recordatorio periódico sobre la importancia de mejorar nuestras inferencias estadísticas...
Porque, al final, 𝐦𝐞𝐣𝐨𝐫𝐞𝐬 𝐢𝐧𝐟𝐞𝐫𝐞𝐧𝐜𝐢𝐚𝐬 𝐬𝐢𝐠𝐧𝐢𝐟𝐢𝐜𝐚𝐧 𝐦𝐞𝐣𝐨𝐫𝐞𝐬 𝐝𝐞𝐜𝐢𝐬𝐢𝐨𝐧𝐞𝐬.
[Y CURSO ONLINE GRATUITO] 👇🧵

#stats #inference #datascience #phD Image Uno de los cursos que más me han gustado en los últimos tiempos es:
🎓 “𝐈𝐦𝐩𝐫𝐨𝐯𝐢𝐧𝐠 𝐘𝐨𝐮𝐫 𝐒𝐭𝐚𝐭𝐢𝐬𝐭𝐢𝐜𝐚𝐥 𝐈𝐧𝐟𝐞𝐫𝐞𝐧𝐜𝐞𝐬”
📍 Impartido por 𝐃𝐚𝐧𝐢𝐞𝐥 𝐋𝐚𝐤𝐞𝐧𝐬 (Universidad Técnica de Eindhoven)
coursera.org/learn/statisti…Image
Oct 8 5 tweets 1 min read
🤯 ¿Alguna vez quisiste mover una imagen o redimensionar un bloque de texto en tus diapositivas 𝗦𝗜𝗡 volver al código?
🎉Nuevo complemento para presentaciones interactivas en Quarto + Revealjs: 𝐞𝐝𝐢𝐭𝐚𝐛𝐥𝐞 👇🧵

#Quarto #Revealjs #RStats #DataScience #Presentaciones #stats Con 𝐞𝐝𝐢𝐭𝐚𝐛𝐥𝐞, ahora puedes:👇🧵
🔹 𝗥𝗲𝗽𝗼𝘀𝗶𝗰𝗶𝗼𝗻𝗮𝗿 imágenes y cajas de texto

🔹 𝗥𝗲𝗱𝗶𝗺𝗲𝗻𝘀𝗶𝗼𝗻𝗮𝗿𝗹𝗮𝘀 directamente en la vista previa

🔹 𝗖𝗮𝗺𝗯𝗶𝗮𝗿 𝘁𝗮𝗺𝗮ñ𝗼 𝗱𝗲 𝗳𝘂𝗲𝗻𝘁𝗲 y 𝗮𝗹𝗶𝗻𝗲𝗮𝗰𝗶ó𝗻 del texto
Oct 6 6 tweets 2 min read
🧠 Cómo aprovechar los LLMs para el análisis de datos
Por Joe Cheng (CTO de Posit)

Los LLMs han cambiado la forma en que desarrollamos, pero en análisis de datos su verdadero valor no está en analizar datos directamente, sino en generar el código que lo hace posible.👇🧵

#stats Image 👉 Para ello, Posit desarrolló dos paquetes que simplifican la interacción con APIs de LLM:
- Elmer (R)
- Chatless (Python)
Ambos permiten gestionar llamadas HTTP a LLMs de manera sencilla y confiable.
Sep 30 5 tweets 2 min read
🔥Los 13 errores más graves que se cometen en análisis de datos🔥
Y que (casi) nadie te ha contado.
Después de años viendo estos malentendidos afectar decisiones críticas, he recopilado 13 lecciones clave para mejorar tus análisis e interpretaciones de datos (CARRUSEL)🧵
#stats 💡Algunos de estos ERRORES te van a sorprender:
❌ La regresión logística no es una regresión
❌ El p-valor es la probabilidad de que H₀ sea verdadera
❌ Los intervalos de confianza del 95% contienen el valor real con 95% de probabilidad
❌ Los outliers siempre se deben eliminar Image
Sep 24 5 tweets 6 min read
👀 ¿Buscas conjuntos de datos gratuitos para aprender/practicar/crear tu portfolio de #stats #datascience #MachineLearning?
Comparto algunos interesantes:👇🧵

(Comparte y completa la lista) Image ✅ UCI ML Repository buff.ly/3E5H3Wa
✅ OMS buff.ly/3Wmt05X
✅ Zdataset buff.ly/3HSq5Ob
✅ Data Is Plural buff.ly/3vQUS55
✅ Data .gov buff.ly/2C4Z0p9
✅ NASA buff.ly/3FWL8wx
✅ Kaggle lnkd.in/eXYNC2e3

#dataviz #stats Image
Sep 23 7 tweets 2 min read
🔥 ¿QUÉ MODELO DE REGRESIÓN ELEGIR?
Si alguna vez te has topado con siglas como LM, GLM, GAMM o GLMM y has pensado:
"¿Y ahora cuál uso? ¿Me estoy metiendo en un laberinto sin salida?"… este post es para ti. 🌀

Vamos a simplificarlo paso a paso:🧵

#stats #datascience #analytics 1️⃣ Variable respuesta continua?
Sí → Modelo Lineal (LM). Clásico, confiable… si se cumplen los supuestos.
No → seguimos.
Sep 17 9 tweets 2 min read
📊 ¿Cansado de usar iris y mtcars? Aquí tienes datasets MODERNOS listos para usar.
Años viendo los mismos ejemplos, es hora de renovar nuestro arsenal didáctico. Estos datasets no solo son más actuales, sino que abordan problemas reales que conectan con las preocupaciones de hoy. ¿Quieres más?👇

🎯 PARA PRINCIPIANTES (reemplazos directos)
- palmerpenguins::penguins (el nuevo iris)
- qatarcars (nuevo mtcars::dataset o mpg::ggplot2)
- ggplot2::diamonds (misterioso)
- dplyr::starwars (divertido)
Sep 16 6 tweets 2 min read
🎯 ¿Cuánto es suficiente?
La eterna pregunta cuando vas a diseñar un estudio o experimento:
¿Con 30 muestras basta? ¿Y si pongo 100 para estar seguro? ¿O mejor 300 para que nadie me critique? 🤯

La verdad es que… ni muy pocas ni demasiadas.🧵

#stats #Estadística #DataScience Un tamaño de muestra mal elegido puede arruinar meses de trabajo:
📉 Demasiado pequeño → corres el riesgo de que un efecto real pase desapercibido
💸 Demasiado grande → desperdicias tiempo, dinero y energía
🏆 Buscamos el punto justo: como el cuento de Ricitos de Oro.
Sep 15 7 tweets 3 min read
🎨 ggplot2 es mucho más que un sistema de gráficos en R: es un ecosistema entero
Muchos conocen ggplot2 por su sintaxis elegante para crear gráficos, pero pocos exploran su universo de extensiones, que amplían sus capacidades y permiten llevar la visualización a otro nivel.🧵👇 Image 🔹 Algunas familias de extensiones que vale la pena conocer:

1️⃣ Personalización de temas y estilos
ggthemes → colecciones de temas predefinidos (Excel, The Economist, Wall Street Journal).
hrbrthemes → tipografías modernas y gráficas limpias para presentaciones.

#RStats Image
Sep 14 4 tweets 2 min read
🔄Tus datos también necesitan mantenimiento: 5 claves para actualizarlos sin perder reproducibilidad👇
En investigación, los datos no son estáticos. Se corrigen, se amplían y evolucionan con el tiempo. El desafío: mantenerlos vivos sin sacrificar transparencia ni reproducibilidad Image Un reciente artículo publicado en Nature por , nos recomienda algunas buenas prácticas que todo científico de datos o investigador puede aplicar:

#GestiónDeDatos Image
Sep 6 9 tweets 2 min read
🔥El verdadero cuello de botella en analítica: hojas de cálculo caóticas
Quien ha trabajado en análisis de datos conoce esta escena: te llega un Excel “con todo lo que necesitas” para empezar el proyecto. Abres el archivo y, en lugar de datos listos para usar, encuentras el caos. 👉 Columnas con títulos duplicados o mal escritos.
👉 Fechas guardadas como texto o mezcladas con diferentes formatos (dd/mm/aaaa y mm/dd/aaaa conviviendo en la misma columna).
👉 Valores numéricos con comas y puntos intercalados, imposibles de interpretar sin limpieza manual.
Sep 4 9 tweets 2 min read
🚨 Los mitos de los intervalos de confianza (IC) 🚨
💡 Los IC son muy populares en investigación, pero la mayoría de las personas los malinterpreta… y eso puede llevar a conclusiones equivocadas. 🧠

Aquí van algunos mitos que me gustaría aclarar:🧵👇 Image Mito 1️⃣
❌ "Un IC del 95% tiene un 95% de probabilidad de contener el valor verdadero"
✅ Realidad: No, no es así. Si repites el experimento muchas veces, el 95% de los IC que calcules contendrán el valor verdadero.
Es sobre procedimientos repetidos, no sobre un único intervalo😬
Sep 2 10 tweets 3 min read
🎯 ¿CUÁNTO ES SUFICIENTE? El tamaño de muestra ideal explicado fácil y rápido 🚀
Cuando diseñas un experimento, la pregunta del millón es:
¿Cuántos sujetos o casos necesito para que mis resultados sean válidos? 🤔

Aquí está el secreto:👇

#Estadística #DataScience #RStats Image ¿Alguna vez te has encontrado con estudios que fracasan porque la muestra era demasiado pequeña? ¿O has visto proyectos que malgastan recursos con muestras innecesariamente grandes?

#analytics #research #phd #thesis #TamañoDeMuestra #stats
Aug 29 13 tweets 2 min read
🌟👀 ¿Qué hacer cuando un resultado NO es estadísticamente significativo? 🧠
Tranquilo, ¡que un p > 0.05 no es el apocalipsis estadístico! Aquí va una guía rápida para que actúes como un verdadero profesional de los datos y saques partido a ese resultado.👇🧵

#stats #analytics Image 🙈1️⃣ ¿Qué significa realmente un p-valor > 0.05?
No significa que no haya efecto. "La ausencia de evidencia no es evidencia de ausencia" (Carl Sagan). Ese es uno de los errores más comunes. Recuerda: el p-valor no mide la probabilidad de que la hipótesis nula sea verdadera.
Aug 25 4 tweets 3 min read
😳 Cuando empiezas con R, las dudas llueven:
👉 ¿Qué función necesito?
👉 ¿Cómo se usa?
👉 ¿¡Por qué me sale este error infernal!?

Por eso, he recopilado en un solo lugar todos los recursos que te ayudarán a aprender R como un/a pro:

#stats #rstats #EstadísticaConR #DataScience Image 📚 Funciones de ayuda, buscadores especializados, viñetas, ejemplos, CRAN Task Views, foros, FAQs…
Y sí, también cómo hacer preguntas que reciban respuestas útiles

#AprenderR #MásterOnline #RStats #FormaciónContinua #EducaciónEstadística #ComunidadesDeDatos #CRAN #StackOverflow Image
Image
Image
Aug 20 10 tweets 2 min read
👀 Google predijo una epidemia… de malas decisiones. 🔥
El Big Data no sustituye pensar: el caso de Google Flu Trends (GFT).
Un modelo precioso, que no servía para nada.🦠❄️

👇 Hilo crítico sobre hype, errores y lecciones en ciencia de datos:🧵

#stats #datascience #analytics Image Durante años, Google Flu Trends fue el niño bonito del Big Data.
La promesa: predecir brotes de gripe en tiempo real usando nuestras búsquedas.
La realidad: sobreestimó los casos, confundió baloncesto con gripe y falló en la pandemia de 2009.
Sí, baloncesto (ambos en invierno).🏀
Aug 19 8 tweets 2 min read
🎯 No todos los outliers son villanos. Algunos son los héroes que revelan lo que nadie más ve. 👀
👇🧵Te explico cómo distinguir entre errores, casos fuera de contexto y variación natural valiosa.

#DataScience #Analytics #stats #rstats #ML #machinelearning #outliers Eliminar outliers sin justificar puede:
❌ Distorsionar tus modelos
❌ Reducir la robustez de predicciones
❌ Hacerte perder información crítica

Por eso siempre recomiendo: PARA. REVISA Y CONSULTA PRIMERO.