💥14 herramientas secretas impulsadas por #RStats para ahorrar tiempo y esfuerzo en tus proyectos de datos (¡No te lo pierdas!):👀
1️⃣ ¡Edita tus datos de forma interactiva (y guarda el código)! 👀
📦 'editData' es un complemento de RStudio para editar un data.frame o un tibble de forma interactiva
🔗 buff.ly/3U5Tgjy
3️⃣ ¡Elige los colores para tus gráficos de forma interactiva!
📦colourpicker te ayuda a elegir el color y lo actualiza en tiempo real para que puedas ver los cambios de inmediato
🔗 github.com/daattali/colou…
4️⃣ ¡Edita los themes de ggplot2 a golpe de click y personaliza tus gráficos!
📦 ggThemeAssist te permite elegir/ajustar cualquier detalle de tus gráficos
🔗 github.com/calligross/ggt…
8️⃣ ¡Convierte tus análisis en documentos, informes, presentaciones y tableros reproducibles y de alta calidad!
✅ #RMarkdown (o #Quarto) une texto, código y resultados en un único documento
¡Adiós copy & paste, adiós errores!
1️⃣1️⃣ ¡Visualiza paso a paso tus canalizaciones de datos!👀
📦ViewPipeSteps crea pestañas con la vista de datos con los resultados de las funciones encadenadas en tuberías (pipes %>%)
🔗 github.com/daranzolin/Vie…
1️⃣2️⃣ Analiza de manera sencilla las expresiones regulares
- Crea interactivamente tu expresión regular
- Busca coincidencia de cadenas
- Consulta la ayuda interactiva y los recursos incluidos para aprender expresiones regulares
🔗 github.com/gadenbuie/rege… #rstats#datamanagement
1️⃣3️⃣ ¡Si quieres estar a la última con todas las novedades de paquetes de #RStats apunta este addin!💥
- Busca paquetes relevantes
- Obtén metadatos del paquete
- Descubre paquetes
- Mantente al día con CRAN
🔗 buff.ly/2QBkrVP #ML#IA#BigData#datamining#programming
1️⃣4️⃣¡Integra #chatgpt3 en tus análisis de datos con #RStats!
📦gpttools incluye:
📄comentarios de roxygen
💬código de explicación
🧪sugiere pruebas unitarias para funciones
🚀convierte scripts en funciones reutilizables
🔗 github.com/JamesHWade/gpt… #ChatGPT#AI#ML#tech#Data
😉Sígueme para obtener más herramientas y recursos de #DataScience#ML#IA#RStats y aprende las mejores técnicas y enfoques.
¿Cuál es la herramienta que más te ha gustado de esta lista?, ¡Comenta abajo!👇
👀📏 ¿Por qué tus estudios no convencen? El drama de las muestras pequeñas.
Este error se repite cada día en estudios académicos y proyectos empresariales. ¿Por qué ocurre? ¿Por qué es grave? ¿Cómo arreglarlo?
Te lo cuento en este post👇
#stats #datascience #samplesize #rstats
👉 ¿Por qué pasa?
❌ Presupuesto escaso
❌ Poco tiempo
❌ Mala planificación
❌ Dificultad para acceder a la población de interés
👉 ¿Por qué es grave?
😱 Pierdes potencia
🤯 Riesgo de conclusiones erróneas
🫣 Imposibles de replicar
😳 Decisiones de negocio mal fundamentadas
👉 ¿Cómo arreglarlo?
✅ Antes de empezar, calcula el tamaño muestral necesario con herramientas de potencia estadística y el diseño de estudio en mente (G*Power o R como {pwr}).
😱 “Mis datos no son normales… ¿Y ahora qué hago?” 💥
💬 Una de las frases más comunes que escucho es:
“Hice la prueba de Shapiro-Wilk y me salió p < 0.05, así que mis datos no son normales. ¿Qué prueba uso ahora?”
📢 CUIDADO. Sigue leyendo...
Que tus datos no sean perfectamente normales no significa que tengas que abandonar todos los métodos clásicos o correr directamente a una prueba "no paramétrica".
🔑 Lo que realmente necesitas saber:
1️⃣ La normalidad es un supuesto de los errores (residuos), no de la respuesta directamente.
👉 Muchas pruebas estadísticas (t-test o ANOVA) asumen normalidad del error dentro del modelo, no de la respuesta en bruto.
🔎 Histogramas y Shapiro-Wilk no te dicen lo que necesitas saber
🔍 ¿Tu análisis de clustering es fiable? Aprende a validarlo 🧠
El clustering no termina cuando el algoritmo te devuelve unos grupos. ¡Eso es solo el principio! 😉 Antes de sacar conclusiones, asegúrate de que tu agrupación es buena, estable y coherente.👇🧵
3 dimensiones clave de la validación del clustering (los tres mosqueteros🗡️):
🎯 1. CALIDAD del agrupamiento
Evalúa si los grupos formados tienen sentido:
👉 ¿Las observaciones de un mismo grupo son realmente similares?
👉 ¿Los grupos están bien separados entre sí?
🔄 2. ESTABILIDAD del agrupamiento
Realiza el clustering varias veces con diferentes subconjuntos.
Evalúa la CONSISTENCIA en los resultados.
👉 ¿Tu agrupación resiste los cambios en la muestra?
El fútbol ya no se juega solo con los pies... también se juega con datos.
Cada pase, cada sprint, cada decisión táctica deja una huella digital que puede ser analizada, modelizada… y transformada en ventaja competitiva.
#datascience
En esta entrada del blog exploramos el trabajo de quienes analizan el juego más allá de lo que capta el ojo humano:
👉Datos de eventing (eventos con balón)
👉Datos de tracking (posición y orientación de jugadores y balón en cada instante)
👉Métricas avanzadas como xG/xT/VAEP/OBV
👉 Modelos predictivos para prevenir lesiones
👉 Grafos para visualizar redes de pase
👉 Análisis de estilo de juego y búsqueda de fichajes similares
✨ Elegir la prueba de hipótesis correcta (o el modelo correcto) para una repuesta continua no es solo un "ANOVA vs. Kruskal-Wallis" o "t-test vs Mann-Whitney".
👇 Hay 6 aspectos clave que debes considerar antes de tomar una decisión:🚀
#stats #datascience #analytics #research
1️⃣ ¿Qué quieres comparar?
📉 Igualdad de medias
📈 igualdad de medianas (según la distribución de los datos).
💨 Equivalencia estocástica (los grupos son similares en distribución) vs Superioridad estocástica (un grupo tiende a valores mayores que otro).
⚠️ Advertencias clave
👉 El método debe elegirse según H0 y la pregunta de investigación, no según la distribución de los datos.
👉 "No paramétrico" no significa "sin supuestos" ni "sin problemas".
👉 Métodos como Mann-Whitney o pruebas de rangos modifican la hipótesis original.