💥14 herramientas secretas impulsadas por #RStats para ahorrar tiempo y esfuerzo en tus proyectos de datos (¡No te lo pierdas!):👀
1️⃣ ¡Edita tus datos de forma interactiva (y guarda el código)! 👀
📦 'editData' es un complemento de RStudio para editar un data.frame o un tibble de forma interactiva
🔗 buff.ly/3U5Tgjy
3️⃣ ¡Elige los colores para tus gráficos de forma interactiva!
📦colourpicker te ayuda a elegir el color y lo actualiza en tiempo real para que puedas ver los cambios de inmediato
🔗 github.com/daattali/colou…
4️⃣ ¡Edita los themes de ggplot2 a golpe de click y personaliza tus gráficos!
📦 ggThemeAssist te permite elegir/ajustar cualquier detalle de tus gráficos
🔗 github.com/calligross/ggt…
8️⃣ ¡Convierte tus análisis en documentos, informes, presentaciones y tableros reproducibles y de alta calidad!
✅ #RMarkdown (o #Quarto) une texto, código y resultados en un único documento
¡Adiós copy & paste, adiós errores!
1️⃣1️⃣ ¡Visualiza paso a paso tus canalizaciones de datos!👀
📦ViewPipeSteps crea pestañas con la vista de datos con los resultados de las funciones encadenadas en tuberías (pipes %>%)
🔗 github.com/daranzolin/Vie…
1️⃣2️⃣ Analiza de manera sencilla las expresiones regulares
- Crea interactivamente tu expresión regular
- Busca coincidencia de cadenas
- Consulta la ayuda interactiva y los recursos incluidos para aprender expresiones regulares
🔗 github.com/gadenbuie/rege… #rstats#datamanagement
1️⃣3️⃣ ¡Si quieres estar a la última con todas las novedades de paquetes de #RStats apunta este addin!💥
- Busca paquetes relevantes
- Obtén metadatos del paquete
- Descubre paquetes
- Mantente al día con CRAN
🔗 buff.ly/2QBkrVP #ML#IA#BigData#datamining#programming
1️⃣4️⃣¡Integra #chatgpt3 en tus análisis de datos con #RStats!
📦gpttools incluye:
📄comentarios de roxygen
💬código de explicación
🧪sugiere pruebas unitarias para funciones
🚀convierte scripts en funciones reutilizables
🔗 github.com/JamesHWade/gpt… #ChatGPT#AI#ML#tech#Data
😉Sígueme para obtener más herramientas y recursos de #DataScience#ML#IA#RStats y aprende las mejores técnicas y enfoques.
¿Cuál es la herramienta que más te ha gustado de esta lista?, ¡Comenta abajo!👇
😳 Cuando empiezas con R, las dudas llueven:
👉 ¿Qué función necesito?
👉 ¿Cómo se usa?
👉 ¿¡Por qué me sale este error infernal!?
Por eso, he recopilado en un solo lugar todos los recursos que te ayudarán a aprender R como un/a pro:
#stats #rstats #EstadísticaConR #DataScience
📚 Funciones de ayuda, buscadores especializados, viñetas, ejemplos, CRAN Task Views, foros, FAQs…
Y sí, también cómo hacer preguntas que reciban respuestas útiles
💡 En el Máster enseñamos mucho más que sintaxis: formamos a personas que saben buscar, preguntar y seguir aprendiendo de forma autónoma. Porque saber usar R no es memorizar, es saber encontrar lo que necesitas, cuando lo necesitas.
👀 Google predijo una epidemia… de malas decisiones. 🔥
El Big Data no sustituye pensar: el caso de Google Flu Trends (GFT).
Un modelo precioso, que no servía para nada.🦠❄️
👇 Hilo crítico sobre hype, errores y lecciones en ciencia de datos:🧵
#stats #datascience #analytics
Durante años, Google Flu Trends fue el niño bonito del Big Data.
La promesa: predecir brotes de gripe en tiempo real usando nuestras búsquedas.
La realidad: sobreestimó los casos, confundió baloncesto con gripe y falló en la pandemia de 2009.
Sí, baloncesto (ambos en invierno).🏀
👀 ¿Qué salió mal? Casi todo.
📍1️⃣ La fiebre del Big Data
Pensar que tener muchos datos equivale a tener buenos datos.
Spoiler: no.
Correlacionaron búsquedas absurdas con brotes... y luego se sorprendieron de que no funcionara.
🎯 No todos los outliers son villanos. Algunos son los héroes que revelan lo que nadie más ve. 👀
👇🧵Te explico cómo distinguir entre errores, casos fuera de contexto y variación natural valiosa.
Eliminar outliers sin justificar puede:
❌ Distorsionar tus modelos
❌ Reducir la robustez de predicciones
❌ Hacerte perder información crítica
Por eso siempre recomiendo: PARA. REVISA Y CONSULTA PRIMERO.
Los valores atípicos no siempre son errores. A veces son:
✨ Variación natural que contiene información valiosa
🔍 Casos excepcionales que revelan patrones ocultos
💡 Las claves del hallazgo más importante
🔥 ¿Qué NO te enseñaron en tu curso de análisis de datos… y tuviste que aprender a golpes?
Nos enseñan métodos, fórmulas y (con suerte) sintaxis.
Pero en el mundo real, los datos llegan sucios, los plazos aprietan y nadie lee tus gráficos si no los entienden.
10 lecciones👇
📉 10 verdades del análisis de datos que no salen en el temario:
1️⃣ El 80% del trabajo es limpiar, ordenar y entender los datos.
Sí, lo has leído mil veces. Pero hasta que no lo vives, no lo crees.
🧼 Si amas la estadística, aprende también a amar el preprocesado.
#stats
2️⃣ Los datos nunca llegan como los necesitas. Nunca.
A veces el problema no es técnico, sino organizativo: fuentes desconectadas, procesos manuales, duplicados...
💡 El mejor analista no es el que espera datos perfectos, sino el que aprende a trabajar con datos imperfectos.
🚨 EL INFIERNO DE LAS FECHAS EN ANÁLISIS DE DATOS 🚨
Sí, lo has vivido. Todos lo hemos vivido.
Si alguna vez has intentado analizar fechas en Excel, sabes de lo que hablo:
🧨 Problemas típicos:
❌ Formatos inconsistentes: ¿DD/MM/AAAA o MM/DD/AAAA?
❌ Fechas como texto: Importas datos y... mágicamente son cadenas.
❌ Zonas horarias: UTC, GMT, hora local… todo mezclado.
❌ Restas y sumas absurdas: Días que no cuadran, meses que desaparecen…
💡 Pero hay una solución: R + lubridate = paz mental 🧘
✅ Limpiar fechas: ymd(), dmy(), mdy()
✅ Sumar días, meses o años: + days(5), + months(3)
✅ Detectar y corregir formatos mixtos: parse_date_time()
✅ Controlar husos horarios: with_tz() y force_tz()
📊 ¿Cómo sabes si tu modelo realmente funciona bien?
Muchos modelos se publican... pero pocos se diagnostican a fondo.
Si usas modelos de regresión en R, este recurso te va a ahorrar tiempo y sustos 🚨👇
📦 {performance} de #RStats te permite evaluar los supuestos clave de tus modelos de forma rápida, clara y eficiente.
check_collinearity() → ¿Predictores correlacionados?
check_normality() → ¿Residuos normales?
check_heteroscedasticity() → ¿Residuos con Varianza constante?
Y lo mejor:
👉 check_model() → Una sola función para un diagnóstico visual completo en segundos.
🚀 ¿Qué más puedes hacer con performance?
🔹 Obtener métricas como R², AIC, BIC, RMSE, ICC...
🔹 Diagnosticar modelos mixtos, con sobredispersión o inflación cero