#semiofftopic He leido varias reflexiones sobre la abstención en las elecciones como argumento para desligitimarlas. No voy a entrar en cuestiones ideológicas, solo quiero lanzar una reflexión estadística. Para eso hemos de entender los conceptos de muestra y población. Turra va.
Población es todo el conjunto que quieres caracterizar. Si quieres medir la media de horas que dedica un(a) joven español a los videojuegos, tu población serán todos esos jovenes menores de 30 años que viven en el pais. Pero claro, no puedes entrevistarlos a todos.
Ahí entra la muestra. Seleccionas una serie de jovenes representativos, lo suficientemente heterogénea como para que "represente" a tu población. Les entrevistas, les preguntas las horas que juegan y sacas una media (2 horas). Si tu muestra es buena, puedes decir...
"Cada joven en España juega una media de 2 horas al día".

Remember: La media no es toda la estadística, es un indicador más, a veces no representa bien tu muestra y puede ser muy pobre, pero me sirve para este ejemplo.
Pensad ahora en los sondeos previos a unas elecciones. Se hacen sobre una muestra de por ejemplo, 500-1000 personas. Y aunque fallan, es evidente, la fotografía general es bastante precisa. No hay locuras como que una fuerza minoritaría gane las elecciones.
¿Por qué? Porque se escoge muy bien los segmentos de población en función de localización, renta, género, edad... el objetivo en toda encuesta es tener una muestra lo más representativa posible de la población general.
Llegamos a las elecciones. Pensadlas como una macro encuesta. Aún con una abstención brutal como la de Catalunya el pasado domingo, tenemos una muestra de 54% de la población. Más de 3 millones de personas. Y muy heterogénea (la abstención se reparte bastante)...
Por tanto, al igual que el sondeo previo nos daba una foto general más o menos decente, estas elecciones o macro encuesta nos da una todavía mejor. Casi perfecta.
Colocar la abstención como "gente aparte" no es correcto. Si les obligaramos a posicionarse alterarían poco el mapa general. Como las posiciones más polarizadas tienden a votar más, los partidos moderados tendrían más votos y algún escaño más, pero nada que rompa la foto general
Así que, sed muy cautelosos cuando tratéis con esa abstención. Y no desestiméis el valor de una muestra por muy pequeña que os parezca o porque no englobe toda la población. Os sorprendería las maravillas que se pueden hacer si se escoge bien.

• • •

Missing some Tweet in this thread? You can try to force a refresh
 

Keep Current with Un mal Kicker

Un mal Kicker Profile picture

Stay in touch and get notified when new unrolls are available from this author!

Read all threads

This Thread may be Removed Anytime!

PDF

Twitter may remove this content at anytime! Save it as PDF for later use!

Try unrolling a thread yourself!

how to unroll video
  1. Follow @ThreadReaderApp to mention us!

  2. From a Twitter thread mention us with a keyword "unroll"
@threadreaderapp unroll

Practice here first or read more on our help page!

More from @Unmalkicker

29 Jan 20
Analizada a fondo la SB. (Desde el punto de vista de las stats avanzadas, claro). Entre en el análisis pensando que SF era mejor equipo, a mitad me fui a KC y ahora he vuelto a SF pero sin tenerlo demasiado claro. Resumen: Ni idea. Algunas ideas y datos sueltos.
- SF ha usado mucho personal 21 (un 35%) de las veces con un Success Rate del 54%.
- KC ha usado principalmente personal 11 (47%) con un Success Rate del 50%.
- Ambos han usado de forma similar el PA, con mejores resultado (medido en ypa) para SF.

Datos de @SharpFootball
KC es muy brillante en el pase. MUCHO. Algo que todos sabemos. 2º mejor ataque en RS tanto en EPA/play como en DVOA de @fboutsiders. En cambio, SF es más estable en todas las facetas. Es más equipo.
Read 18 tweets
25 Aug 19
Andrew Luck se retira. Es una historia triste, pero más si piensas en todo lo que podrían haber hecho los Colts (y Grigson en concreto) para evitarlo. Aquí va nuestro pequeño homenaje como lo hacemos por aquí, con números.
La carrera de Luck duró seis temporadas. La 2017 la pasó en blanco recuperándose de su operación de hombro. En 2015 tan solo jugo 7 partidos (lesiones de hombro y de riñón). Aquí el Epa / dropback medio por temporada. 2018 fue su mejor temporada, a nivel élite (0,17 por dropback)
Mérito especial las tres primeras temporadas, donde, solo (y luego hablaremos de esto), consigió llevar a su equipo a PO. Sus numeros de 2014 y 2016 también son muy destacables. Siempre en ascensión (pese a sus lesiones)
Read 9 tweets
27 Jun 19
¡Comienzan las clases de estadística básica para amantes de las Analytics! Para ello vamos a utilizar los salarios de los 15 Centers mejor pagados. ¿Por qué Centers? Porque es la posición más olvidada y mi favorita, sin más. A gustos, colores.
Empezamos por lo básico: cada fila es una observación, cada columna es una variable y lo que hay dentro de la columna es el valor. Puedes mirar esta tabla y hacerte una idea de los salarios de los centers. Pero ¿y si os digo que hay otras formas visuales para ver esta variable?
Una de ellas es el boxplot. Es una de las formas más útiles para visualizar una muestra. Aquí el boxplot de los 15 centers mejor pagados. El rectángulo es donde se encuentran los valores situados entre el 25% y el 75% (o entre el primer y tercer cuartil).
Read 13 tweets
10 Jun 19
PON UNA OL EN TU VIDA. Es más o menos lo que dice este artículo de ESPN, que va de analytics y está muy bien explicado. Parece que el bloqueo de pase es más importante que el pass rushing.
espn.com/nfl/story/_/id…
ESPN trabaja con dos métricas que miden la efectividad en la trinchera. Pass Block Win Rating (PBWR) y Pass Rush Win Rating (PRWR). Se mide el enfrentamiento entre cada unidad de las líneas durante 2.5s (el tiempo promedio que tarda un QB en lanzar) y anotan quién vence.
Esto no lo hacen de forma manual, si no a partir del tracking de los jugadores facilitado por NFL Gen Stats (Y al que el resto de mortales no tenemos acceso).
Read 7 tweets
5 Jun 19
Hoy en @Pepebrasin se ha hablado de Analytics con @Catanovski. Me voy a erigir como portavoz de los Nerds del mundo (y sin legitimidad alguna) que no han podido defenderse. ¡HILAZO!
Primero, todo tiene sesgo. Tanto las Analytics, como las opiniones o el vídeo. Así nos acercamos al conocimiento, enfocando una parte y dejando de un lado otras. Las Analytics no buscan dar la respuesta definitiva, ni tener la verdad. Es una pata más del juego.
El proceso sería el siguiente: Formulamos una pregunta o hipótesis, miramos los datos, los trabajamos, observamos vídeos y escuchamos opiniones. Con eso formulamos una respuesta. La presentamos y discutimos y planteamos nuevas dudas para volver al primer paso.
Read 9 tweets
29 May 19
Vamos con el WIN PROBABILITY (WP), otro concepto ligado al EPA (Expected Points Added). Para los nuevos, tenéis una explicación del EPA aquí: ).
Hay varios modelos de WP, pero el único abierto es el proporcionado en @nflscrapR, y, aunque mejorable, nos sirve. El WP parte del EP. En cada situación de partido, y a partir del histórico de situaciones similares, cálcula la probabilidad de ganar.
Es otra forma de analizar un partido. EPA nos da el valor de la jugada, WP nos que probabilidades tenemos de ganar en cada situacion de partido. Con el WP podemos hacer las Win Probability Charts. Aquí un ejemplo que acabo de programar, la última Superbowl entre Rams y Patriots.
Read 6 tweets

Did Thread Reader help you today?

Support us! We are indie developers!


This site is made by just two indie developers on a laptop doing marketing, support and development! Read more about the story.

Become a Premium Member ($3/month or $30/year) and get exclusive features!

Become Premium

Too expensive? Make a small donation by buying us coffee ($5) or help with server cost ($10)

Donate via Paypal Become our Patreon

Thank you for your support!

Follow Us on Twitter!