El lenguaje matemático es universal. Pero ¿cómo traducir a él nuestras intuiciones?
Ese es el papel de la distribución a priori, criticada por subjetiva a lo largo de la historia.
¿Me dejas que te cuente?
Antes de empezar, debemos situarnos y recordar los elementos de cualquier análisis estadístico.
Primero tenemos que pensar en el objetivo.
Imaginemos que este sea entender cuales son los niveles de glucosa en sangre para una persona sana.
Esos, fuera de los cuales harán que nuestro análisis médico tenga una estrellita
Con este objetivo recogemos valores de variables observables que nos ayuden a entender el proceso.
En el caso de la glucosa, es obvio que la variable de interés sería ese nivel de glucosa en sangre.
Pero también podemos medir otras cosas como la edad o el sexo.
Las mediciones concretas de estas variables en una muestra de la población de personas sanas son lo que llamamos datos.
Esos pequeños seres a los que tenemos que intentar entender, pues hablan un lenguaje peculiar
Ahora toca poner un modelo sobre la variable de interés.
Se trata de una caja de traducción que nos permitirá entender lo que los datos tienen que decir sobre la variable de interés (el nivel de glucosa, en este caso)
Pero esta “caja” tiene ruedecitas, parámetros que hay que tunear para que se adapten a los datos y la traducción sea lo más limpia posible
Para el caso del nivel de glucosa, el parámetro podría ser el nivel medio de glucosa en personas sanas.
Y estos parámetros son los verdaderos protagonistas de la historia, como ya lo fueron cuando hablábamos de la verosimilitud
En estadística Bayesiana, estos parámetros se tratan como variables aleatorias no observables.
Para estudiarlos tenemos que unir, la intuición experta, y lo que nos dicen los datos en forma de distribución de probabilidad
Y aquí llega la parte más complicada.
Traducir la información experta al lenguaje de la probabilidad en lo que llamamos distribución previa o a priori.
El primer escollo con el que nos encontramos cuando tratamos de traducir el conocimiento existente a una distribución es cuál será la forma que esta tenga.
Podemos saber, por un estudio previo, que el valor de la media del nivel de glucosa debe estar entre 90 y 100 pero…
¿Puede tomar cualquier valor entre 90 y 100?
¿Son igual de probables todos los valores?
¿Tiene más una forma de campana?
¿Será simétrica?
Incluso, podemos saber los valores y la forma… pero entonces llega el mayor problema…
El problema computacional o matemático (o como lo queráis llamar)
La cuestión es que esta previa debe combinarse con la verosimilitud en el Teorema de Bayes para dar lugar a la distribución posterior, esa que incorporará tanto la información previa como la información contenida en los datos
Sería ideal que obtuviésemos una expresión sencilla y manejable para ella.
Una posterior con la que podamos trabajar fácilmente y nos diga todo lo que queremos sobre el parámetro desconocido.
Durante siglos, el uso de la estadística bayesiana se restringió a ejemplos sencillos. Aquellos que permitían obtener distribuciones a posteriori conocidas y fáciles de obtener (los típicos ejemplos con dados y monedas).
En la época de la guerra fría aparecieron un tipo de previas llamadas conjugadas.
Estas se combinaban a la perfección con su verosimilitud correspondiente.
El problema es que no encajaban siempre con la información que se tenia sobre el parámetro.
Por ejemplo, ¿y si la media del nivel de glucosa solo puede tomar los valores 90, 95 o 100 y resulta que la previa conjugada para ese modelo requiere valores continuos?
El gran cambio se produjo en los años 90 al introducirse los métodos computacionales como los métodos Montecarlo por Cadenas de Markov (MCMC)
Estos métodos nos permitían usar cualquier tipo de distribución y, aun así, aproximarnos a la distribución posterior.
Pero aun quedaba un último escollo: ¿Qué pasa cuando no sabemos nada?
La opción fácil era utilizar previas llamadas vagas que permitían que cualquier valor del parámetro fuese posible.
El problema es que los resultados podían depender muchísimo de la elección de la distribución
Para solucionarlo se empezó a trabajar en el enfoque conocido como Previas Objetivas.
Pero este es uno de los campos de estudio más matemático y complicado dentro del análisis Bayesiano.
La cuestión es que, muchos de los problemas prácticos sobre la distribución previa, se han ido solucionando a lo largo de la historia.
Sin embargo, todavía queda un escollo: Su mala fama
En el fondo, la elección de la previa está basada (excepto en el caso de las previas objetivas) en la intuición humana. ¿Muy subjetivo quizás? Esta fue la gran discusión que mantuvo a la estadística Bayesiana arrinconada hasta bien entrado el siglo XX.
Pero lo cierto es que, da igual el enfoque estadístico que utilicemos. Hay un montón de decisiones subjetivas.
Y la gran ventaja de la distribución previa es que siempre podemos cuantificar su efecto mediante un análisis llamado "de sensibilidad".
Así que, todo el mundo a cuantificar sus creencias y a usar Estadística Bayesiana, sin miedo. 😜
Y si has llegado leyendo hasta aquí, ¡gracias!🥰
Espero que te haya gustado, y si ha sido así, se agradece que compartas. 🙏
• • •
Missing some Tweet in this thread? You can try to
force a refresh
❓¿Qué os parece si hacemos un Calendario de Adviento de Estadística?
🎄Total, la Navidad está llena de gráficos de cuanto hemos gastado en tal o cuál cosa... o resúmenes haciendo balance del año que se va.
¿Qué mejor que llegar hasta ella con algunos conceptos aprendidos?
1⃣Empecemos por el origen del término.
La palabra Estadística proviene del término alemán Statistik del latín: status (estado) + icus (relativo a) es decir: “la ciencia del estado” y fue popularizada en el siglo XVIII por el economista alemán Gottfried Achenwall.
2⃣ Pero, ¿Para qué sirve? Os doy mi versión:
💡Partimos de la idea que todo pasa por una razón, una ley para la que no tenemos una fórmula exacta.
👁️Observamos una versión distorsionada de esa ley
🔝La Estadística nos permite aproximarnos a esa realidad a partir de los datos
El nombre de está filosofía (porque, sí, podemos entenderla como tal) se lo debemos al reverendo presbiteriano Thomas Bayes (1702-1761) del que ya os conté algunas cosas en este hilo:
En la vida en general, hay un montón de cosas que, si no se empiezan por el principio no hay forma de entenderlas. Pero ¿cuál es el principio en estadística?
Hablamos de los conceptos de Población y muestra. ¿Qué los une? ¿Qué los diferencia?
¿Me dejas que te cuente?
Si nos vamos a la RAE vemos que las primeras acepciones para "población" hacen referencia a aquello que seguramente ya os imaginabais.
Sin embargo, la definición que más nos interesa en este caso es la quinta.
Cuando hablamos de población en estadística nos referimos a un conjunto de elementos sobre los que queremos estudiar una determinada característica.
De hecho, lo que define a una población estará determinado por la investigación que se quiera realizar.
A lo largo de nuestras vidas es posible que nos preguntemos si algo ha variado tras una intervención.
Por ejemplo:
🟣Mejoró mi salario después de cambiar de empresa?
🟣Bajó mi colesterol después de reducir mi consumo de embutido
Una cosilla, si encontráis un gráfico de puntos con una linea que parece indicar que cuando una variable crece la otra también o que cuando una crece la otra decrece: NO MIREIS A LA LINEA Mirad más allá.
Porque a pesar de esa linea, puede que no haya relación
Me explico:
Mirad esta gráfica:
Si miráis a la linea podríais pensar que hay una relación directa entre x e y:
A mayor valor de x mayor valor de y.
Pero fijaos ahora en los puntos, están repartidos bastante al azar ¿no?
El otro día comenzaba a seguir expectante la encuesta de @JCesarPL sobre el significado de un Intervalo de Confianza. Una vez más queda patente que es un concepto que no se termina de entender.
Imaginad la flor más bonita del mundo plantada en vuestro jardín (igual es mucho imaginar... pero viene lo peor)
Un malvado mago que odia la belleza la ha cubierto con un conjuro de invisibilidad aunque no ha conseguido acabar con su intenso aroma.
Para recuperarla vuestra única opción es encontrarla y transplantarla a un lugar libre de magia.
Cada mañana salís al jardín, aspiráis el aroma alrededor de donde debería estar, tomando siempre la misma cantidad de aire (Val ya se que no se puede, pero seguid imaginando porfa)