⚖️¿Falso positivo o falso negativo? El arte de tomar decisiones bajo incertidumbre
Cuando ponemos a prueba una hipótesis no solo buscamos respuestas, también gestionamos el riesgo. Eliminar el error es imposible, el objetivo es intentar comprenderlo, cuantificarlo y equilibrarlo.
Entender la diferencia entre el Error Tipo I y II es fundamental para cualquier profesional que tome decisiones basadas en datos.
👉FAQs
¿Cómo se interpretan estos errores?
¿Cómo minimizar ambos errores a la vez?
¿Cómo decidir qué error priorizar?
¿Qué error es peor?
💥 El "trade-off" inevitable
Para un N fijo, reducir un tipo de error suele aumentar el otro. La clave es evaluar las consecuencias:
Y tú, ¿Cómo gestionas tú este equilibrio en tus proyectos de análisis de datos? Te leo en los comentarios 👇
¿Y si el próximo salto de la IA no dependiera de más datos o modelos más grandes, sino de aprender a gestionar la incertidumbre (con un buen uso de la Estadística)?
Cómo convivir inteligentemente con la incertidumbre.👇🧵
Durante la última década, el progreso en IA ha surgido de:
➡️ Más datos
➡️ Más capacidad computacional
➡️ Modelos más grandes
Pero quizás su futuro dependa de desarrollar sistemas capaces de analizar qué saben, qué ignoran y cuándo necesitan replantear su comprensión del mundo.
Porque incluso sistemas avanzados siguen mostrando limitaciones:
- responden con demasiada confianza a preguntas que no saben responder
- alucinan información inexistente
- fallan cuando el contexto cambia ligeramente
- no reconocen cuándo están fuera de su ámbito de experiencia
🚨 ¿Qué es realmente el p-valor y por qué debería importarte?
El p-valor es un sistema de alarma, una "línea de defensa" contra el ruido.
👉 Úsalo para calibrar cuánto te sorprende lo que estás viendo y qué tan dispuesto estás de cambiar tus creencias.
#stats #datascience
Cuando un investigador dice que un resultado es "estadísticamente significativo" (o discernible, habitualmente p < 0.05), no está certificando la verdad, sino señalando que, si el mundo fuera como asume nuestra H0 (y sus supuestos), lo que acabamos de observar sería muy inusual.
La función principal del p-valor es ayudar a distinguir una señal de lo que es meramente ruido aleatorio en los datos. Es un salvaguarda contra el sesgo de confirmación.
🧠 Algunos consejos: (herramientas complementarias al p-valor)
⚖️El diseño de estudio e inferencia estadística son una gestión de riesgo y errores
Nuestra tarea no es "evitar totalmente los errores" (eso es imposible).
Nuestra tarea es decidir qué errores estamos dispuestos a tolerar basándonos en el coste que suponen para nuestra comunidad.
Un test de hipótesis no es un ejercicio de búsqueda de la verdad, sino una estrategia para gestionar el riesgo bajo incertidumbre.
Muchos fijan alfa = 0.05 y 1-beta = 0.80 por defecto, y eso en muchos casos está bien, pero en otros tenemos que pensar mejor las consecuencias.
Si el coste de un Falso Positivo (Error Tipo I) es bajo, y el coste de un Falso Negativo (Error Tipo II) es devastador, lo anterior es irresponsable. Estás optimizando para una situación que no refleja la realidad de tu campo.
👉 Una alternativa: justificación sobre convención.
🔥 ¿Qué modelo de regresión elegir? Guía para investigadores (más allá de los mitos)
👉 (spoiler) Aunque los residuos son el juez final, tú debes ser el arquitecto. Empieza por comprender el origen de tus datos antes de tocar el software.👇🧵
#stats #datascience #estadística
No fuerces tus datos en modelos inadecuados, ni te pierdas en el laberinto de las siglas (LM, GLM, GAMM, GLMM). Utiliza esta guía rápida para elegir el modelo adecuado.
La ruta lógica recomendada para no perderte en el proceso es:
Diseño -> Modelo -> Diagnóstico
Fase I. Diseño (Antes de ajustar nada)
Hazte 3 preguntas estratégicas:
1️⃣ ¿Cuál es la naturaleza de tu variable respuesta (Y)?
¿Es un conteo? -> Poisson / Binomial Negativa
¿Es una proporción o probabilidad? -> Binomial
¿Es continua con valores positivos muy sesgados? -> Gamma
💡Planifica tu estudio para no perderte lo importante
La potencia estadística garantiza que tu estudio tenga el tamaño de muestra necesario para detectar un efecto de interés y evitar así los falsos negativos.
Pero, ¿qué efecto de interés?👇🧵
#cienciadedatos #estadistica
A menudo, los investigadores evitan el cálculo de potencia con la excusa de que "no conocen el tamaño del efecto". Mi consejo: 𝐧𝐨 𝐩𝐥𝐚𝐧𝐢𝐟𝐢𝐪𝐮𝐞𝐬 𝐩𝐚𝐫𝐚 𝐥𝐨 𝐪𝐮𝐞 𝐞𝐬𝐩𝐞𝐫𝐚𝐬, 𝐩𝐥𝐚𝐧𝐢𝐟𝐢𝐜𝐚 𝐩𝐚𝐫𝐚 𝐥𝐨 𝐪𝐮𝐞 𝐧𝐨 𝐪𝐮𝐢𝐞𝐫𝐞𝐬 𝐩𝐚𝐬𝐚𝐫 𝐩𝐨𝐫 𝐚𝐥𝐭𝐨.
👉 El cambio de enfoque es pasar del efecto "esperado" al SESOI.
En lugar de intentar adivinar qué efecto obtendrás, puedes definir el 𝐒𝐄𝐒𝐎𝐈 (Smallest Effect Size of Interest o Tamaño del Efecto Mínimo de Interés).
Justifica tu muestra según alfa, la potencia y tu SESOI.
En 2011, el experimento OPERA anunció un hallazgo que parecía revolucionario: los neutrinos habrían viajado más rápido que la luz. Y con un nivel de 6 sigma, algo extraordinariamente exigente en física.
Si era cierto, las bases de la relatividad de Einstein quedaba en entredicho.
Muchos lo interpretaron como una prueba definitiva, pero el resultado era incorrecto.
El problema no estaba en la inferencia estadística, sino en un cable mal conectado que introducía un error sistemático en el sistema de medición que no había sido detectado inicialmente.