💥14 herramientas secretas impulsadas por #RStats para ahorrar tiempo y esfuerzo en tus proyectos de datos (¡No te lo pierdas!):👀
1️⃣ ¡Edita tus datos de forma interactiva (y guarda el código)! 👀
📦 'editData' es un complemento de RStudio para editar un data.frame o un tibble de forma interactiva
🔗 buff.ly/3U5Tgjy
3️⃣ ¡Elige los colores para tus gráficos de forma interactiva!
📦colourpicker te ayuda a elegir el color y lo actualiza en tiempo real para que puedas ver los cambios de inmediato
🔗 github.com/daattali/colou…
4️⃣ ¡Edita los themes de ggplot2 a golpe de click y personaliza tus gráficos!
📦 ggThemeAssist te permite elegir/ajustar cualquier detalle de tus gráficos
🔗 github.com/calligross/ggt…
8️⃣ ¡Convierte tus análisis en documentos, informes, presentaciones y tableros reproducibles y de alta calidad!
✅ #RMarkdown (o #Quarto) une texto, código y resultados en un único documento
¡Adiós copy & paste, adiós errores!
1️⃣1️⃣ ¡Visualiza paso a paso tus canalizaciones de datos!👀
📦ViewPipeSteps crea pestañas con la vista de datos con los resultados de las funciones encadenadas en tuberías (pipes %>%)
🔗 github.com/daranzolin/Vie…
1️⃣2️⃣ Analiza de manera sencilla las expresiones regulares
- Crea interactivamente tu expresión regular
- Busca coincidencia de cadenas
- Consulta la ayuda interactiva y los recursos incluidos para aprender expresiones regulares
🔗 github.com/gadenbuie/rege… #rstats#datamanagement
1️⃣3️⃣ ¡Si quieres estar a la última con todas las novedades de paquetes de #RStats apunta este addin!💥
- Busca paquetes relevantes
- Obtén metadatos del paquete
- Descubre paquetes
- Mantente al día con CRAN
🔗 buff.ly/2QBkrVP #ML#IA#BigData#datamining#programming
1️⃣4️⃣¡Integra #chatgpt3 en tus análisis de datos con #RStats!
📦gpttools incluye:
📄comentarios de roxygen
💬código de explicación
🧪sugiere pruebas unitarias para funciones
🚀convierte scripts en funciones reutilizables
🔗 github.com/JamesHWade/gpt… #ChatGPT#AI#ML#tech#Data
😉Sígueme para obtener más herramientas y recursos de #DataScience#ML#IA#RStats y aprende las mejores técnicas y enfoques.
¿Cuál es la herramienta que más te ha gustado de esta lista?, ¡Comenta abajo!👇
1️⃣ "The Art of Statistics: Learning from Data" David Spiegelhalter
Rigor académico accesible. Explica conceptos fundamentales a través de casos reales y actuales, desde ensayos clínicos hasta análisis de políticas públicas.
Regalo de @Capitan_Swing, estoy esperando el segundo 😜
@Capitan_Swing 2️⃣ "How to Lie with Statistics" - Darrell Huff
A pesar de su antigüedad, mantiene su relevancia. Cómo identificar manipulaciones estadísticas comunes en medios de comunicación y presentaciones corporativas. Para desarrollar pensamiento crítico y evaluar la información.
𝗣𝗹𝗮𝗻𝘁𝗶𝗹𝗹𝗮𝘀 𝗲𝗻 𝗥 𝗠𝗮𝗿𝗸𝗱𝗼𝘄𝗻 𝘆 𝗤𝘂𝗮𝗿𝘁𝗼: 𝗲𝗹 𝗮𝘁𝗮𝗷𝗼 𝗽𝗮𝗿𝗮 𝗻𝗼 𝗲𝗺𝗽𝗲𝘇𝗮𝗿 𝘀𝗶𝗲𝗺𝗽𝗿𝗲 𝗱𝗲𝘀𝗱𝗲 𝗰𝗲𝗿𝗼
Una de las herramientas más infravaloradas en los flujos de trabajo reproducibles con R Markdown y Quarto son las plantillas.👇🧵
#rstats
No son solo estética, sirven para estandarizar el análisis, ahorrar tiempo y reducir errores.
Define de antemano:
• estructura del documento
• configuración
• estilo visual
• secciones típicas del análisis
• formato de tablas y gráficos
Crea el esqueleto y un estándar.
𝗘𝗷𝗲𝗺𝗽𝗹𝗼𝘀
Algunas de las plantillas predefinidas más populares o interesantes se encuentran en los siguientes paquetes de R:
🙈 ʟᴀ ᴄᴇɢᴜᴇʀᴀ ᴅᴇʟ ᴛᴀᴍᴀɴ̃ᴏ ᴅᴇ ᴇꜰᴇᴄᴛᴏ
No confundas magnitud (ni significación estadística) con relevancia práctica.
El tamaño de efecto, por sí solo, es una medida abstracta de fuerza de relación o magnitud de diferencia. Necesita un criterio de referencia.🧵
El tamaño de efecto (ES, effect size) es "ciego" a 3 factores que determinan si un resultado es un hito científico o simple ruido.
💡 ¿La solución? Justificar el 𝗦𝗘𝗦𝗢𝗜 (Smallest Effect Size Of Interest)
No confundas magnitud (ni significación estadística) con relevancia práctica.
Sin un criterio de referencia, es un dato huérfano de significado práctico.
📅 𝗘𝗹 𝗰𝗮𝗼𝘀 𝗱𝗲 𝗹𝗮𝘀 𝗳𝗲𝗰𝗵𝗮𝘀 𝗲𝗻 𝗮𝗻á𝗹𝗶𝘀𝗶𝘀 𝗱𝗲 𝗱𝗮𝘁𝗼𝘀 (𝘆 𝗰ó𝗺𝗼 𝗱𝗼𝗺𝗶𝗻𝗮𝗿𝗹𝗼)
Trabajar con fechas en análisis de datos es una fuente constante de errores. Especialmente cuando el flujo depende de hojas de cálculo.
#rstats #datascience #analytics
• Conversión automática sin aviso.
• Formatos ambiguos → DD/MM/AAAA vs MM/DD/AAAA.
• Fechas como texto → Cadenas.
• Zonas horarias inconsistentes → UTC, GMT, hora local. Inconsistencias invisibles.
• Operaciones erróneas → Restas que dan números inesperados.
👉 Los errores con fechas no son triviales. Afectan métricas, modelos y decisiones.
Mi consejo: utiliza el paquete lubridate de R:
Incluye funciones sencillas y claves para manejar fechas.
💡 𝗖𝗼𝗻𝘀𝗲𝗷𝗼𝘀 𝗽𝗮𝗿𝗮 𝗾𝘂𝗲 𝗰𝗼𝗺𝗲𝗻𝘇𝗮𝗿 𝗰𝗼𝗻 𝗥 𝘁𝗲 𝘀𝗲𝗮 𝗮ú𝗻 𝗺á𝘀 𝘀𝗲𝗻𝗰𝗶𝗹𝗹𝗼
Empezar con R no es difícil. Lo que lo vuelve complejo es no conocer bien el entorno. Estos consejos reducen fricción desde el primer día. maximaformacion.es/blog-dat/truco…
𝟭. 𝗨𝘀𝗮 𝗜𝗺𝗽𝗼𝗿𝘁 𝗗𝗮𝘁𝗮𝘀𝗲𝘁 𝗽𝗮𝗿𝗮 𝗮𝗽𝗿𝗲𝗻𝗱𝗲𝗿 𝗮 𝗶𝗺𝗽𝗼𝗿𝘁𝗮𝗿 𝗯𝗶𝗲𝗻
La interfaz de RStudio te permite importar .csv, Excel o SPSS viendo en tiempo real cómo se genera el código.
Consejo: copia ese código a tu script. La reproducibilidad empieza ahí.
𝟮. 𝗨𝘀𝗮 𝗩𝗶𝗲𝘄() 𝗽𝗮𝗿𝗮 𝗲𝗻𝘁𝗲𝗻𝗱𝗲𝗿 𝘁𝘂𝘀 𝗱𝗮𝘁𝗼𝘀
Ordena, filtra y busca valores rápidamente.
No sustituye al código, pero acelera la comprensión inicial del dataset.
🤣 Cuando un modelo de regresión lineal supera a un modelo de aprendizaje profundo...
Muchos piensan que los modelos de deep learning son los más avanzados y precisos. Sin embargo, en ciertas situaciones, ¡Un simple modelo de regresión lineal puede superarlos! ¿Cómo es posible?👇
1️⃣ Datos limitados: Los modelos de aprendizaje profundo requieren grandes cantidades de datos para entrenarse. Si solo dispones de un conjunto de datos pequeño, la regresión lineal puede ofrecer mejores resultados debido a su menor complejidad y menor riesgo de sobreajuste.
2️⃣ Datos de baja dimensión: Cuando las variables de tus datos son pocas y no complejas, los modelos de aprendizaje profundo pueden ser excesivos y propensos a sobreajustarse. En estos casos, la regresión lineal es más eficiente y efectiva.