El lenguaje matemático es universal. Pero ¿cómo traducir a él nuestras intuiciones?
Ese es el papel de la distribución a priori, criticada por subjetiva a lo largo de la historia.
¿Me dejas que te cuente?

Todo el texto en: anabelforte.com/2021/01/24/tra…
Antes de empezar, debemos situarnos y recordar los elementos de cualquier análisis estadístico.
Primero tenemos que pensar en el objetivo.

Imaginemos que este sea entender cuales son los niveles de glucosa en sangre para una persona sana.

Esos, fuera de los cuales harán que nuestro análisis médico tenga una estrellita
Con este objetivo recogemos valores de variables observables que nos ayuden a entender el proceso.

En el caso de la glucosa, es obvio que la variable de interés sería ese nivel de glucosa en sangre.

Pero también podemos medir otras cosas como la edad o el sexo.
Las mediciones concretas de estas variables en una muestra de la población de personas sanas son lo que llamamos datos.

Esos pequeños seres a los que tenemos que intentar entender, pues hablan un lenguaje peculiar
Ahora toca poner un modelo sobre la variable de interés.

Se trata de una caja de traducción que nos permitirá entender lo que los datos tienen que decir sobre la variable de interés (el nivel de glucosa, en este caso)
Pero esta “caja” tiene ruedecitas, parámetros que hay que tunear para que se adapten a los datos y la traducción sea lo más limpia posible

Para el caso del nivel de glucosa, el parámetro podría ser el nivel medio de glucosa en personas sanas.
Y estos parámetros son los verdaderos protagonistas de la historia, como ya lo fueron cuando hablábamos de la verosimilitud

En estadística Bayesiana, estos parámetros se tratan como variables aleatorias no observables.

Para estudiarlos tenemos que unir, la intuición experta, y lo que nos dicen los datos en forma de distribución de probabilidad
Y aquí llega la parte más complicada.

Traducir la información experta al lenguaje de la probabilidad en lo que llamamos distribución previa o a priori.
El primer escollo con el que nos encontramos cuando tratamos de traducir el conocimiento existente a una distribución es cuál será la forma que esta tenga.

Podemos saber, por un estudio previo, que el valor de la media del nivel de glucosa debe estar entre 90 y 100 pero…
¿Puede tomar cualquier valor entre 90 y 100?

¿Son igual de probables todos los valores?

¿Tiene más una forma de campana?

¿Será simétrica?
Incluso, podemos saber los valores y la forma… pero entonces llega el mayor problema…

El problema computacional o matemático (o como lo queráis llamar)
La cuestión es que esta previa debe combinarse con la verosimilitud en el Teorema de Bayes para dar lugar a la distribución posterior, esa que incorporará tanto la información previa como la información contenida en los datos
Sería ideal que obtuviésemos una expresión sencilla y manejable para ella.

Una posterior con la que podamos trabajar fácilmente y nos diga todo lo que queremos sobre el parámetro desconocido.
Durante siglos, el uso de la estadística bayesiana se restringió a ejemplos sencillos. Aquellos que permitían obtener distribuciones a posteriori conocidas y fáciles de obtener (los típicos ejemplos con dados y monedas).
En la época de la guerra fría aparecieron un tipo de previas llamadas conjugadas.

Estas se combinaban a la perfección con su verosimilitud correspondiente.
El problema es que no encajaban siempre con la información que se tenia sobre el parámetro.

Por ejemplo, ¿y si la media del nivel de glucosa solo puede tomar los valores 90, 95 o 100 y resulta que la previa conjugada para ese modelo requiere valores continuos?
El gran cambio se produjo en los años 90 al introducirse los métodos computacionales como los métodos Montecarlo por Cadenas de Markov (MCMC)

Estos métodos nos permitían usar cualquier tipo de distribución y, aun así, aproximarnos a la distribución posterior.
Pero aun quedaba un último escollo: ¿Qué pasa cuando no sabemos nada?
La opción fácil era utilizar previas llamadas vagas que permitían que cualquier valor del parámetro fuese posible.

El problema es que los resultados podían depender muchísimo de la elección de la distribución
Para solucionarlo se empezó a trabajar en el enfoque conocido como Previas Objetivas.

Pero este es uno de los campos de estudio más matemático y complicado dentro del análisis Bayesiano.
La cuestión es que, muchos de los problemas prácticos sobre la distribución previa, se han ido solucionando a lo largo de la historia.

Sin embargo, todavía queda un escollo: Su mala fama
En el fondo, la elección de la previa está basada (excepto en el caso de las previas objetivas) en la intuición humana. ¿Muy subjetivo quizás? Esta fue la gran discusión que mantuvo a la estadística Bayesiana arrinconada hasta bien entrado el siglo XX.
Pero lo cierto es que, da igual el enfoque estadístico que utilicemos. Hay un montón de decisiones subjetivas.

Y la gran ventaja de la distribución previa es que siempre podemos cuantificar su efecto mediante un análisis llamado "de sensibilidad".
Así que, todo el mundo a cuantificar sus creencias y a usar Estadística Bayesiana, sin miedo. 😜

Y si has llegado leyendo hasta aquí, ¡gracias!🥰

Espero que te haya gustado, y si ha sido así, se agradece que compartas. 🙏

• • •

Missing some Tweet in this thread? You can try to force a refresh
 

Keep Current with BayesAna 😷

BayesAna 😷 Profile picture

Stay in touch and get notified when new unrolls are available from this author!

Read all threads

This Thread may be Removed Anytime!

PDF

Twitter may remove this content at anytime! Save it as PDF for later use!

Try unrolling a thread yourself!

how to unroll video
  1. Follow @ThreadReaderApp to mention us!

  2. From a Twitter thread mention us with a keyword "unroll"
@threadreaderapp unroll

Practice here first or read more on our help page!

More from @AnaBayes

1 Dec 20
❓¿Qué os parece si hacemos un Calendario de Adviento de Estadística?

🎄Total, la Navidad está llena de gráficos de cuanto hemos gastado en tal o cuál cosa... o resúmenes haciendo balance del año que se va.

¿Qué mejor que llegar hasta ella con algunos conceptos aprendidos?
1⃣Empecemos por el origen del término.

La palabra Estadística proviene del término alemán Statistik del latín: status (estado) + icus (relativo a) es decir: “la ciencia del estado” y fue popularizada en el siglo XVIII por el economista alemán Gottfried Achenwall.
2⃣ Pero, ¿Para qué sirve? Os doy mi versión:

💡Partimos de la idea que todo pasa por una razón, una ley para la que no tenemos una fórmula exacta.

👁️Observamos una versión distorsionada de esa ley

🔝La Estadística nos permite aproximarnos a esa realidad a partir de los datos
Read 21 tweets
22 Nov 20
Quiero dar la bienvenida a todas las personas que se han dejado caer por aquí estos días y las gracias a las que llevo tiempo dando la turra…

Hoy toca explicar que es eso de la Estadística Bayesiana

¿Me dejas que te cuente?

Todo el texo en el blog: anabelforte.com/2020/11/22/y-e…
El nombre de está filosofía (porque, sí, podemos entenderla como tal) se lo debemos al reverendo presbiteriano Thomas Bayes (1702-1761) del que ya os conté algunas cosas en este hilo:
Thomas Bayes desarrolló el teorema que lleva su nombre alrededor de 1740 aunque este no se hizo público hasta 1963, dos años después de su muerte.
Read 25 tweets
1 Nov 20
En la vida en general, hay un montón de cosas que, si no se empiezan por el principio no hay forma de entenderlas. Pero ¿cuál es el principio en estadística?

Hablamos de los conceptos de Población y muestra. ¿Qué los une? ¿Qué los diferencia?

¿Me dejas que te cuente?
Si nos vamos a la RAE vemos que las primeras acepciones para "población" hacen referencia a aquello que seguramente ya os imaginabais.

Sin embargo, la definición que más nos interesa en este caso es la quinta.
Cuando hablamos de población en estadística nos referimos a un conjunto de elementos sobre los que queremos estudiar una determinada característica.

De hecho, lo que define a una población estará determinado por la investigación que se quiera realizar.
Read 25 tweets
25 Oct 20
Hoy vengo en plan Coco a intentar explicar la diferencia entre mucho y poco.

Bueno más concretamente vengo a hablaros del concepto de diferencia estadísticamente significativa.

¿Me dejáis que os cuente?
Basado en lo que @SantiGarciaCC y yo os contamos en este episodio de Raíz de 5 (@raizde5rne):
go.ivoox.com/rf/58268119
A lo largo de nuestras vidas es posible que nos preguntemos si algo ha variado tras una intervención.
Por ejemplo:
🟣Mejoró mi salario después de cambiar de empresa?
🟣Bajó mi colesterol después de reducir mi consumo de embutido
Read 20 tweets
16 Oct 20
Una cosilla, si encontráis un gráfico de puntos con una linea que parece indicar que cuando una variable crece la otra también o que cuando una crece la otra decrece: NO MIREIS A LA LINEA Mirad más allá.

Porque a pesar de esa linea, puede que no haya relación

Me explico:
Mirad esta gráfica:
Si miráis a la linea podríais pensar que hay una relación directa entre x e y:

A mayor valor de x mayor valor de y.

Pero fijaos ahora en los puntos, están repartidos bastante al azar ¿no?
Read 9 tweets
16 May 20
El otro día comenzaba a seguir expectante la encuesta de @JCesarPL sobre el significado de un Intervalo de Confianza. Una vez más queda patente que es un concepto que no se termina de entender.

Voy a intentar clarificarlo.

Abro hilo, me seguís
Imaginad la flor más bonita del mundo plantada en vuestro jardín (igual es mucho imaginar... pero viene lo peor)

Un malvado mago que odia la belleza la ha cubierto con un conjuro de invisibilidad aunque no ha conseguido acabar con su intenso aroma.
Para recuperarla vuestra única opción es encontrarla y transplantarla a un lugar libre de magia.

Cada mañana salís al jardín, aspiráis el aroma alrededor de donde debería estar, tomando siempre la misma cantidad de aire (Val ya se que no se puede, pero seguid imaginando porfa)
Read 20 tweets

Did Thread Reader help you today?

Support us! We are indie developers!


This site is made by just two indie developers on a laptop doing marketing, support and development! Read more about the story.

Become a Premium Member ($3/month or $30/year) and get exclusive features!

Become Premium

Too expensive? Make a small donation by buying us coffee ($5) or help with server cost ($10)

Donate via Paypal Become our Patreon

Thank you for your support!

Follow Us on Twitter!