💥14 herramientas secretas impulsadas por #RStats para ahorrar tiempo y esfuerzo en tus proyectos de datos (¡No te lo pierdas!):👀
1️⃣ ¡Edita tus datos de forma interactiva (y guarda el código)! 👀
📦 'editData' es un complemento de RStudio para editar un data.frame o un tibble de forma interactiva
🔗 buff.ly/3U5Tgjy
3️⃣ ¡Elige los colores para tus gráficos de forma interactiva!
📦colourpicker te ayuda a elegir el color y lo actualiza en tiempo real para que puedas ver los cambios de inmediato
🔗 github.com/daattali/colou…
4️⃣ ¡Edita los themes de ggplot2 a golpe de click y personaliza tus gráficos!
📦 ggThemeAssist te permite elegir/ajustar cualquier detalle de tus gráficos
🔗 github.com/calligross/ggt…
8️⃣ ¡Convierte tus análisis en documentos, informes, presentaciones y tableros reproducibles y de alta calidad!
✅ #RMarkdown (o #Quarto) une texto, código y resultados en un único documento
¡Adiós copy & paste, adiós errores!
1️⃣1️⃣ ¡Visualiza paso a paso tus canalizaciones de datos!👀
📦ViewPipeSteps crea pestañas con la vista de datos con los resultados de las funciones encadenadas en tuberías (pipes %>%)
🔗 github.com/daranzolin/Vie…
1️⃣2️⃣ Analiza de manera sencilla las expresiones regulares
- Crea interactivamente tu expresión regular
- Busca coincidencia de cadenas
- Consulta la ayuda interactiva y los recursos incluidos para aprender expresiones regulares
🔗 github.com/gadenbuie/rege… #rstats#datamanagement
1️⃣3️⃣ ¡Si quieres estar a la última con todas las novedades de paquetes de #RStats apunta este addin!💥
- Busca paquetes relevantes
- Obtén metadatos del paquete
- Descubre paquetes
- Mantente al día con CRAN
🔗 buff.ly/2QBkrVP #ML#IA#BigData#datamining#programming
1️⃣4️⃣¡Integra #chatgpt3 en tus análisis de datos con #RStats!
📦gpttools incluye:
📄comentarios de roxygen
💬código de explicación
🧪sugiere pruebas unitarias para funciones
🚀convierte scripts en funciones reutilizables
🔗 github.com/JamesHWade/gpt… #ChatGPT#AI#ML#tech#Data
😉Sígueme para obtener más herramientas y recursos de #DataScience#ML#IA#RStats y aprende las mejores técnicas y enfoques.
¿Cuál es la herramienta que más te ha gustado de esta lista?, ¡Comenta abajo!👇
🔥 Las pruebas estadísticas más comunes son TODAS modelos lineales. 🔥
🧠 Por lo tanto, en lugar de utilizar cientos de pruebas diferentes, ¿por qué no usar un modelo que realiza todas tus pruebas en una sola estructura flexible y robusta?
Te lo resumo en este post:👇🧵
🤔 Cuando piensas en ANOVA, t-tests, test de Mann-Whitney o test Chi-cuadrado, crees que estás aplicando métodos diferentes, pero la realidad es que todos son casos especiales del Modelo Lineal.
🌟 3 razones por las que los modelos de regresión lineal deben ser tu primera opción:
1️⃣ Las Pruebas Clásicas requieren demasiados Supuestos
Modelos como GLM, GEE o regresión cuantil pueden manejar distribuciones sesgadas, correlaciones y dependencias sin esfuerzo.
🚨Los datos ausentes están por todas partes🚨
👉Los NA pueden invalidar los resultados de tu estudio
👉Muchas funciones automáticas pueden no ser las más óptimas para manejarlos
👉El tratamiento incorrecto de los NA puede llevar a conclusiones erróneas o sesgadas
¿Qué hacer?👇🧵
👀 ¿Qué hacer con los NA? 🤔
1️⃣ Identifica los datos ausentes y comprende por qué faltan:
👉 Errores humanos
👉 Interrupciones en el flujo de datos (como meses sin registro)
👉 Problemas de privacidad
👉 Sesgo: Como cuando ciertos participantes del estudio tienen más NA que otros
¡El patrón de NAs es información clave para intentar solucionarlo! 🔑
🌟👀 ¿Qué hacer cuando un resultado NO es estadísticamente significativo?
¡No entres en pánico! 🧘♀️🧠 Un p > 0.05 no es el fin del análisis, sino el inicio de una buena reflexión.
🔥 1. Evita conclusiones simplistas
No estadísticamente significativo (discernible o detectable) ≠ No hay efecto
👉 El p-valor NO te dice si la hipótesis nula es verdadera. Solo indica la compatibilidad de los datos con esa hipótesis, asumiendo que sea cierta.
📏 2. Revisa el tamaño muestral
🔍 ¿Muestra pequeña? → Tal vez no hubo potencia suficiente para detectar el efecto.
💡 TIP: Usa análisis de sensibilidad para ver qué efecto podrías haber detectado.
🔥 ¿QUÉ MODELO DE REGRESIÓN DEBERÍAS ELEGIR? (UNA GUÍA SENCILLA) 🔥
¿Te suena a conjuro estadístico esto de LM, GLM, GAMM, GLMM...?
🧙♂️ Tranquilidad. Vamos paso a paso. Te prometo solo necesitas realizar unos simples pasos para elegir el modelo más adecuado para tu problema:👇🧵
📢 PASO 1: ¿Tu variable respuesta es continua?
✅ Sí → Modelo Lineal (LM)
(Si se cumplen sus supuestos: linealidad, homocedasticidad, normalidad, independencia…)
🚫 No → ¡Sigue leyendo!
📢 PASO 2: ¿Es binaria, de conteo o proporciones?
✅ Sí → Modelo Lineal Generalizado (GLM)
Usa la familia adecuada:
🔷 Binomial (0/1, éxito/fracaso)
🔷 Poisson (conteos)
🔷 Gamma/inversa (datos sesgados, positivos)
🚫 No → Profundicemos.
💡Una de las mejores herramientas que conozco (y de las que más recomiendo) es R Markdown… o su evolución, Quarto.
Siempre que puedo, la incluyo en los cursos/Másters que doy.👌
🧵👇 Hoy un hilo de experiencias y recursos en el que espero que participes con tus aportes.
#rstats
¿Por qué? Porque permite integrar código, resultados y explicaciones en un solo documento.
Eso ahorra tiempo, evita errores y, sobre todo, mejora la reproducibilidad y la comunicación de los análisis.
En mis clases suelo proponer a los estudiantes que reflexionen sobre:
🔹 ¿Qué ventajas concretas le han encontrado a R Markdown?
🔹 ¿Qué errores han podido evitar gracias a su uso?
🔹 ¿Qué les ha despertado curiosidad y les gustaría seguir explorando?
🔹 ¿Usas R Markdown o Quarto en tu trabajo? ¿Tienes alguna anécdota de error evitado (o cometido)?
👀 ¿Cómo evoluciona el análisis desde una comparación de medias simple (ANOVA / t-test), a un análisis de covarianza (ANCOVA) y finalmente a un modelo lineal general con interacción?
Vamos paso a paso, leyendo cada viñeta del gráfico de Adrian Olszewski 🙌:
#stats #datascience
1️⃣ ANOVA/t-test: Efecto principal no ajustado
Se comparan las medias de dos grupos (líneas horizontales morada y verde), ignorando cualquier otra covariable.
Comparación cruda, no se ajusta por covariables (e.g. eje X).
❗Puede haber confusión si esa covariable está relacionada.
2️⃣ANCOVA (igual pendiente): Efecto principal ajustado
Incluye una covariable continua (eje X) y estima el efecto del grupo ajustando por esa covariable.
Las líneas tienen la misma pendiente: se asume que la relación entre la covariable y el resultado es la misma en ambos grupos.