Post

More from @RosanaFerrero

Rosana Ferrero 📈📊🙌

@RosanaFerrero

Jun 23

¿Y si el próximo salto de la IA no dependiera de más datos o modelos más grandes, sino de aprender a gestionar la incertidumbre (con un buen uso de la Estadística)?

Cómo convivir inteligentemente con la incertidumbre.👇🧵

#datascience #stats #cienciadedatos #analytics #AI

Durante la última década, el progreso en IA ha surgido de:
➡️ Más datos
➡️ Más capacidad computacional
➡️ Modelos más grandes

Pero quizás su futuro dependa de desarrollar sistemas capaces de analizar qué saben, qué ignoran y cuándo necesitan replantear su comprensión del mundo.

Porque incluso sistemas avanzados siguen mostrando limitaciones:
- responden con demasiada confianza a preguntas que no saben responder
- alucinan información inexistente
- fallan cuando el contexto cambia ligeramente
- no reconocen cuándo están fuera de su ámbito de experiencia

Read 6 tweets

Rosana Ferrero 📈📊🙌

@RosanaFerrero

Jun 22

🚨 ¿Qué es realmente el p-valor y por qué debería importarte?

El p-valor es un sistema de alarma, una "línea de defensa" contra el ruido.

👉 Úsalo para calibrar cuánto te sorprende lo que estás viendo y qué tan dispuesto estás de cambiar tus creencias.

#stats #datascience

Cuando un investigador dice que un resultado es "estadísticamente significativo" (o discernible, habitualmente p < 0.05), no está certificando la verdad, sino señalando que, si el mundo fuera como asume nuestra H0 (y sus supuestos), lo que acabamos de observar sería muy inusual.

La función principal del p-valor es ayudar a distinguir una señal de lo que es meramente ruido aleatorio en los datos. Es un salvaguarda contra el sesgo de confirmación.

🧠 Algunos consejos: (herramientas complementarias al p-valor)

Relevancia práctica: linkedin.com/posts/rosanafe…

Read 5 tweets

Rosana Ferrero 📈📊🙌

@RosanaFerrero

Jun 18

⚖️El diseño de estudio e inferencia estadística son una gestión de riesgo y errores
Nuestra tarea no es "evitar totalmente los errores" (eso es imposible).
Nuestra tarea es decidir qué errores estamos dispuestos a tolerar basándonos en el coste que suponen para nuestra comunidad.

Un test de hipótesis no es un ejercicio de búsqueda de la verdad, sino una estrategia para gestionar el riesgo bajo incertidumbre.
Muchos fijan alfa = 0.05 y 1-beta = 0.80 por defecto, y eso en muchos casos está bien, pero en otros tenemos que pensar mejor las consecuencias.

Si el coste de un Falso Positivo (Error Tipo I) es bajo, y el coste de un Falso Negativo (Error Tipo II) es devastador, lo anterior es irresponsable. Estás optimizando para una situación que no refleja la realidad de tu campo.

👉 Una alternativa: justificación sobre convención.

Read 7 tweets

Rosana Ferrero 📈📊🙌

@RosanaFerrero

Jun 17

🔥 ¿Qué modelo de regresión elegir? Guía para investigadores (más allá de los mitos)
👉 (spoiler) Aunque los residuos son el juez final, tú debes ser el arquitecto. Empieza por comprender el origen de tus datos antes de tocar el software.👇🧵

#stats #datascience #estadística

No fuerces tus datos en modelos inadecuados, ni te pierdas en el laberinto de las siglas (LM, GLM, GAMM, GLMM). Utiliza esta guía rápida para elegir el modelo adecuado.

La ruta lógica recomendada para no perderte en el proceso es:
Diseño -> Modelo -> Diagnóstico

Fase I. Diseño (Antes de ajustar nada)
Hazte 3 preguntas estratégicas:

1️⃣ ¿Cuál es la naturaleza de tu variable respuesta (Y)?
¿Es un conteo? -> Poisson / Binomial Negativa
¿Es una proporción o probabilidad? -> Binomial
¿Es continua con valores positivos muy sesgados? -> Gamma

Read 8 tweets

Rosana Ferrero 📈📊🙌

@RosanaFerrero

Jun 16

💡Planifica tu estudio para no perderte lo importante

La potencia estadística garantiza que tu estudio tenga el tamaño de muestra necesario para detectar un efecto de interés y evitar así los falsos negativos.

Pero, ¿qué efecto de interés?👇🧵

#cienciadedatos #estadistica

A menudo, los investigadores evitan el cálculo de potencia con la excusa de que "no conocen el tamaño del efecto". Mi consejo: 𝐧𝐨 𝐩𝐥𝐚𝐧𝐢𝐟𝐢𝐪𝐮𝐞𝐬 𝐩𝐚𝐫𝐚 𝐥𝐨 𝐪𝐮𝐞 𝐞𝐬𝐩𝐞𝐫𝐚𝐬, 𝐩𝐥𝐚𝐧𝐢𝐟𝐢𝐜𝐚 𝐩𝐚𝐫𝐚 𝐥𝐨 𝐪𝐮𝐞 𝐧𝐨 𝐪𝐮𝐢𝐞𝐫𝐞𝐬 𝐩𝐚𝐬𝐚𝐫 𝐩𝐨𝐫 𝐚𝐥𝐭𝐨.

👉 El cambio de enfoque es pasar del efecto "esperado" al SESOI.

En lugar de intentar adivinar qué efecto obtendrás, puedes definir el 𝐒𝐄𝐒𝐎𝐈 (Smallest Effect Size of Interest o Tamaño del Efecto Mínimo de Interés).

Justifica tu muestra según alfa, la potencia y tu SESOI.

Read 5 tweets

Rosana Ferrero 📈📊🙌

@RosanaFerrero

Jun 15

💡¿Puede un resultado con 6 sigma estar equivocado?
Sí. Y eso no desacredita a la estadística. Nos enseña a utilizarla mejor.

OPERA y los neutrinos que viajaban más rápido que la luz.🧵👇

#stats #cienciadedatos #Estadística #DiseñoDeInvestigación #DataScience #AnálisisDeDatos

En 2011, el experimento OPERA anunció un hallazgo que parecía revolucionario: los neutrinos habrían viajado más rápido que la luz. Y con un nivel de 6 sigma, algo extraordinariamente exigente en física.
Si era cierto, las bases de la relatividad de Einstein quedaba en entredicho.

Muchos lo interpretaron como una prueba definitiva, pero el resultado era incorrecto.

El problema no estaba en la inferencia estadística, sino en un cable mal conectado que introducía un error sistemático en el sistema de medición que no había sido detectado inicialmente.

Read 11 tweets

Share this page!

Enter URL or ID to Unroll

Rosana Ferrero 📈📊🙌

Try unrolling a thread yourself!

More from @RosanaFerrero

Rosana Ferrero 📈📊🙌

Rosana Ferrero 📈📊🙌

Rosana Ferrero 📈📊🙌

Rosana Ferrero 📈📊🙌

Rosana Ferrero 📈📊🙌

Rosana Ferrero 📈📊🙌

Did Thread Reader help you today?

Don't want to be a Premium member but still want to support us?

Send Email!