🚫No seleccionar la prueba de hipótesis o el modelo de regresión correcto para tu objetivo🎃
¿Cuáles son las hipótesis? ¿Cómo son las muestras? ¿Qué tipo de prueba/modelo elegir? ¿Una cola o dos colas? ¿Qué hacer si mis datos no cumplen los supuestos? BOOO!! 👻
🚫No distinguir la significación estadística de la significación práctica🤦🏻♀️p-valor nos dice la dirección y tamaño del efecto la magnitud
Que exista una diferencia no significa que sea grande
Muestras muy grandes detectan diferencias muy pequeñas. Big Data da MIEDO! #HorrorStats
🚫Decir "se comprueba la hipótesis nula H0" o "H0 es cierta"
👉Así como la falta de evidencia no demuestra que el acusado es inocente, un resultado no estadísticamente significativo (e.g. p>.05) no demuestra que H0 sea verdadera. Solo “no hay suficiente evidencia"💀 #HorrorStats
🚫Decir "el p-valor es la probabilidad de que H0 sea cierta"
😱Las hipótesis son o no son. p-valor mide la fuerza de la evidencia contra H0. A menor p-valor, mayor evidencia contra H0 a largo plazo🧙
🚫No informar el p-valor exacto ni los resultados completos de la prueba de hipótesis.
😱p-valor depende de:
📌tamaño de efecto (ES), ES grandes son más fáciles de detectar.
📌tamaño de muestra (N). muestras grandes dan pruebas más sensibles
📌Diseño de estudio...
👀 La correlación puede no significar lo que crees que significa.
💥 La interpretación de la correlación y su relevancia práctica debe considerar tanto el contexto específico como las limitaciones estadísticas.
👇 20 Precauciones clave 🧵
#stats #analytics #datascience #data
1️⃣ Las asociaciones observadas deben ser confirmadas en otros datos.
2️⃣ No se deben inferir correlaciones indirectas sin justificación.
3️⃣ Utilizar la regresión en lugar de la correlación puede ser más adecuado.
4️⃣ Correlación nula (o pequeña) ≠ Ausencia de relación.
5️⃣ La correlación no refleja bien las relaciones no lineales (o no monótonas).
6️⃣ Es crucial revisar los gráficos de dispersión antes de interpretar la correlación (e.g. cuarteto de Anscombe).
📉Visualización de datos: introducción práctica by @kjhealy
"Una guía de visualización de datos a la vez práctica y elegante. Healy combina la belleza y el conocimiento de Tufte con la utilidad concreta de Stack Exchange.”— Elizabeth Bruch
@kjhealy 🎨 Fundamentos de visualización de datos by @ClausWilke
Ideal para los que deseen crear #dataviz convincentes.
Desarrolla el ojo crítico para visualizaciones efectivas.
Principios generales y aplicación práctica con ggplot2 en R.
💡Seguro conoces la frase "basura entra, basura sale", pero la calidad de los resultados no solo depende de la calidad de los datos, sino también de la validez del diseño de estudio que les dio forma; un buen diseño es la base para una buena inferencia.
🧵Cómo evaluar la validez?
1️⃣ Validez externa -> generalizar los resultados -> Representatividad de la muestra
👉 Precisión: tamaño de muestra (unidad experimental vs unidad de observación, tratamiento, réplica y pseudo-réplica)
👉 Exactitud: tipo de muestreo (aleatorio y representativo -evitar sesgos-)
2️⃣ Validez externa ecológica/practica -> generalizar a entornos de la vida real. Su practicidad.
👉 Si los métodos, los materiales y el contexto del estudio se aproximan a la situación real que se estudia o no.
6. Crea informes, presentaciones y tableros reproducibles y de alta calidad
📦 R Markdown (o Quarto) texto, código y resultados en un único documento; ¡Adiós copy & paste!
🤖📚 Descubre las mejores herramientas impulsadas por #AI para la investigación académica y ahorra tiempo para hacer lo que más te gusta
📚 Accede a más información en menos tiempo!
🚀 Dale un impulso a tu investigación académica! #GPT#DataScience#science#chatGPT#research#ML
✅Scispace
Espacio de trabajo para automatizar tareas
Obtén una explicación simple de texto, matemáticas y tablas confusas
Haz preguntas de seguimiento y obtén respuestas instantáneas
Busca papers relevantes
Mejora la colaboración buff.ly/3gz7LhQ #Researchtools#science
✅Elicit
Automatiza flujos de trabajo
Encuentra papers relevantes sin palabras clave exactas
Resume conclusiones del documento específicas para tu pregunta
Extrae información clave de los documentos
Lluvia de ideas, resumen y clasificación de textos buff.ly/30DwBok #GPT4
🤯¡Los datos ausentes están por todas partes!😜
👉Pueden invalidar los resultados de tu estudio
👉Muchas funciones utilizan métodos automáticos que pueden no ser óptimos
👉El impacto de la falta de datos es un tema que la mayoría quiere evitar, pero hoy no
¿Qué hacer con los NA?:
🎯Necesitas identificar los datos ausentes, averiguar por qué y cómo faltan:
- errores humanos
- interrupciones del flujo de datos (e.g. meses)
- problemas de privacidad
- sesgo (e.g. tipos de participantes del estudio que tienen >NA)