, 32 tweets, 6 min read Read on Twitter
En el mes con mayor cantidad de cumples en el mundo

🆃🅴🅾🆁🅴🅼🅰 (del cumpleaños)🎂

Va en forma de pregunta: ¿Cuántas personas tiene que haber en un grupo para que la probabilidad de que haya al menos dos que cumplen el mismo día sea mayor a 50%?

#TeRegaloUnTeorema
Dedicado a @violegroisman en el mes de su cumple y a mis dos hermanos que cumplen un día antes y un día después que yo.

Es justamente un teorema para entender (un poquito) el papel de las casualidades.
La respuesta viene en el próximo tweet, pero se sugiere fuertemente arriesgar un número antes de mirar.

🗣️Y rewtwitear ya!! Porque si no tres rayos caerán simultáneamente sobre ti un día soleado.
¿Cuántas personas tiene que haber en un grupo para que la probabilidad de que haya al menos dos que cumplen el mismo día sea mayor a 50%?
🆃🅴🅾🆁🅴🅼🅰 23 personas son suficentes.

Más interesante, si queremos que esa probabilidad sea 97%, alcanza con 50. Si queremos que sea 99,9%, alcanza con 70. Más claro: en un grupo de 70 personas, con probabilidad 99,9% al menos dos personas cumplen el mismo día.
Si no me creés, juntá 70 personas y fijate.
El teorema tmb asume que la cantidad de nacimientos por día no cambia a lo largo del año, cosa que es falsa como muestra esta imagen. Sin embargo, después demostraremos que esta hipótesis no es necesaria. También asume que no hay nacimientos el 29/2, pero tampoco hace falta
🅳🅴🅼🅾🆂🆃🆁🅰🅲🅸ó🅽

Vamos a calcular la probabildad de que eso no pase. Es decir, que en un grupo de 23 personas, todas cumplan en días distintos. Mostraremos que esa probabilidad es menor a 50%.
Podemos numerar a las personas del 1 al 23 y al evento en que estamos interesados, repensarlo como que la persona 2 no cumpla el mismo día que la 1, que la 3 no cumpla el mismo día que la 2 ni que la 1,... y que la 23 no cumpla el mismo día que ninguna de las anteriores.
La primera probabilidad es 364/365, la segunda (condicional a la ocurrencia del evento anterior) es 363/365, luego 362/365, … y así hasta 343/365. Todas son probabilidades condicionales a todo lo que ocurrió antes. Entonces la probabilidad que buscamos es
QED (quod erat demonstrandum = ‘lo que se quería demostrar" = FIN)

El que llegó hasta acá, feliz cumple! Aplauso, medalla, beso y bolsita con caramelos.

Lo que sigue es para osados (nivel Rambo)
Fíjense que parece razonable pensar que si hay días más probables para nacer que otros (en lugar de ser todos equiprobables), entonces la probabilidad de que haya al menos dos personas que cumplen el mismo día aumenta 🤔🤔
Eso se puede demostrar usando la siguiente desigualdad, cuya demostración queda como ejercicio (el tweetero amigo que tenga ganas de agregarla al final de este hilo es sumamente bienvenido!)

Para todo a y b
Vamos a demostrar

🆃🅴🅾🆁🅴🅼🅰 Si p_1 es la probabilidad de haber nacido el 1 de enero, p_2 la de 2 de enero, etc.

Entonces la probabilidad de que en un grupo de 23 personas haya al menos dos que cumplen el mismo día se minimiza cuando p_1 = p_2 = p_3 = · · · = p_365.
Observemos que el problema de encontrar dos cumpleaños el mismo día es equivalente a colocar bolitas en urnas. Una urna por cada día del año y una bolita por cada persona del grupo.
Colocamos las bolitas al azar en las urnas y si dos bolitas caen en la misma urna significa que hay dos personas que cumplen el mismo día.
Si los cumpleaños se distribuyen uniformemente a lo largo del año, cada bolita tiene probabilidad p_i=1/365 de ir a parar a cada una de las urnas. Si por el contrario hay días con mas cumpleaños que otros, traducimos ese hecho en que hay urnas que son más probables que otras.
Llamaremos entonces p_1 a la probabilidad de tirar la bolita en la urna 1 (la que representa el 1ro de enero), p_2 la probabilidad de tirar la bolita en la urna 2, etc. Antes supusimos que todo los p_i eran iguales y ahora vamos ver qué pasa si son distintos.
Vamos a concentrarnos en la probabilidad de que no haya dos cumpleaños iguales y ver que esa probabilidad se maximiza cuando los p_i son todos iguales.
Si hay 23 personas en el grupo, podemos calcular (escribir en realidad, porque no vamos a calcular nada) a la probabilidad de que todas las bolitas caigan en distintas urnas como una suma de muchas probabilidades de la forma

p_1·p_2·p_3 · · · p_23
La que está arriba es la probabilidad de que las 23 personas cumplan todas en días distintos y que además esos días sean justo el 1 de enero, 2 de enero, 3 de enero, etc.
La probabilidad que estamos buscando es mucho más grande porque es una cuenta como esa pero variando los días en que cumplen cada una de las personas. Pero al final es sumar muchas cosas como esa, en donde aparecen las p_i correspondientes a los días en que queremos que cumplan.
O sea, es una suma en la que por cada elección de 23 días distintos del año, aparece un término con los p_i correspondientes.
Ahora la cuestión es si toda esa suma es mayor cuando todos los p_i son iguales o cuando puede haber alguno distinto (o varios, o todos).
(sigue mas tarde... se me acabó el tiempo por ahoa)
Entonces supongamos que tenemos una elección de los p_i en los que no son todos iguales. Por ejemplo p_1 es distinto de p_3. Yo digo que entonces podemos construir una nueva elección de los p_i en los que nuestra probabilidad nos da más grande.
La forma de conseguirla es cambiar a p_1 y a p_3 por su promedio (p_1+p_3)/2. Si hacemos eso y volvemos a hacer nuestra cuenta para calcular nuestra querida probabilidad, vamos a ver que muchos términos no cambian. Todos los términos en donde no aparecen ni p_1 ni p_3 no cambian.
Los términos en donde aparece p_1 ó p_3, pero solo uno de los dos aparecen en parejas, uno con p_1 y uno con p_3 y el resto de los factores iguales. Por ejemplo está p_1·p_2·p_4·p_5 · · ·p_24 y p_3·_p_2·p_4·p_5 ·p_24.
Así que a cada una de estas parejitas le podemos sacar factor común y nos quedan cosas como

(p_1+p_3)·p_2·p_4·p_5 · · ·p_24

En todas estas parejitas, si cambiamos a p_1 por (p_1+p_3)/2 y a p_3 por (p_1+p_3)/2, nos queda lo mismo (¿lo ven?)🤔🤔🤔
Hasta ahora no cambió nada entonces. Pero nos falta mirar los términos que tienen a p_1 y p_3. En todos esos, usando la desigualdad de arriba con a=p_1 y b=p_3 obtenemos que al cambiar a p_1 y p_3 por su promedio, la cuenta da más grande.

Charaaaannnn
Entonces la cuenta total da más grande.

Fijense que siempre va a dar más grande salvo que todos los p_i sean iguales, en cuyo caso al hacer esto, da igual.

Si llegaste hasta acá, te mereces un cacho de torta. Podés reclamarla!
Y para los recontraosados: hay algo que no está del todo bien en la demo, pero quien encuentre el problema sabrá también como arreglarlo (tal vez). Contribuciones, preguntas y quejas bienvenidas.

Buen viernes!
Missing some Tweet in this thread?
You can try to force a refresh.

Like this thread? Get email updates or save it to PDF!

Subscribe to Pablo Groisman
Profile picture

Get real-time email alerts when new unrolls are available from this author!

This content may be removed anytime!

Twitter may remove this content at anytime, convert it as a PDF, save and print for later use!

Try unrolling a thread yourself!

how to unroll video

1) Follow Thread Reader App on Twitter so you can easily mention us!

2) Go to a Twitter thread (series of Tweets by the same owner) and mention us with a keyword "unroll" @threadreaderapp unroll

You can practice here first or read more on our help page!

Follow Us on Twitter!

Did Thread Reader help you today?

Support us! We are indie developers!


This site is made by just three indie developers on a laptop doing marketing, support and development! Read more about the story.

Become a Premium Member ($3.00/month or $30.00/year) and get exclusive features!

Become Premium

Too expensive? Make a small donation by buying us coffee ($5) or help with server cost ($10)

Donate via Paypal Become our Patreon

Thank you for your support!