¿Cuál es el problema con la encuesta a boca de urna?

A pesar de estar acostumbrados al flash electoral mientras tomamos lonche y revisamos nuestros rosarios, ekekos, budas o lo que usemos de amuleto, el procedimiento de boca de urna es riesgoso.
Colaboración de @Mauricio_Castr
Pero entendemos y partimos del hecho de que se trata de una institución nacional. El FLASHHHHHH ELECTORAL, que hasta tiene cronómetro descendente en los últimos procesos (afortunadamente sin picapica). Pero es riesgoso.
Para explicar un poco más, volvemos a la conversa con @Mauricio_Castr, PhD en estadística y que sabe de encuestas electorales. El comienza comentando el tema del margen de error con el que vale la pena empezar el post.
Cuando diseñas una muestra (quiénes van a responder una encuesta), buscas que esos que responden te den un resultado “x”, que no conoces, que es lo que quieres estimar con la encuesta.
Para determinar el tamaño de esa muestra (la cantidad de gente que debe responder la encuesta), necesitas definirlo como que la diferencia absoluta entre el valor verdadero de “x” y lo que vas a usar para estimar “x” es el margen de error.
Manzanita: quiero saber el porcentaje de intención de voto por Qwerty. Pero lo más preciso posible, esto es con menor margen de error. Entonces, encuesto (con un buen diseño) a 400 personas. Eso me arrojaría 5% de error, mucho para mi.
Duplico la muestra, 800 casos, 3.4% de margen. Mejor 1,600 casos, 2.4% de margen. Ahí me quedo. Se que el resultado que obtenga por el señor Qwerty estará 2.4% para arriba y para abajo. Mas cerca quieres estar de “x”, más muestra deberás incluir. Ahora que quedo claro, volvamos.
¿Qué pasa en la boca de urna? Si bien teóricamente puedes hablar de margen de error también, el problema es que “x” (tu resultado) pasa porque realmente selecciones una muestra aleatoria de la población. Ahí está el problema.
Porque el marco muestral es de difícil acceso. (Marco muestral es el repositorio donde están todos los individuos a encuestar: manzanas en encuestas presenciales, panelbook en encuestas por Internet, listados de teléfonos en encuestas telefónicas).
Entonces, tienes que asumir homogeneidad en todo: que la gente que vota en la mañana piensa igual que en la tarde, que la gente en un distrito o provincia piensa igual que en otro, etc. En la práctica, el margen de error real termina siendo mucho mayor que el que supusimos.
Entonces, teóricamente no hay como decir que hay más error muestral en una encuesta “normal” que en la de boca de urna. Pero el error no muestral en la boca de urna es mucho mayor que en la encuesta normal.
En la encuesta normal muestreas hogares, teléfonos, listados. En la boca de urna muestreas locales de votación, y de allí seleccionas individuos. Hay que hacer un supuesto grande en cuanto a la homogeneidad de las unidades muestrales que en otros casos no pasa.
Incluso si tienes cuidado de entrevistar durante la mayoría de las horas del día no lo puedes hacer hasta el final sino no puedes procesar. Entonces en la practica el error de la encuesta de boca urna debe ser mayor que la de encuesta en hogares.
No pasa eso en el conteo rápido, pues ahí el marco muestra son las mesas. Las mesas no se mueven y no te mienten. Si tomas una buena muestra de las mesas, tienes una estimación bien certera.
En el contexto de Perú, con horas específicas para que cierta gente vote, el margen de error se va a disparar pues es muy difícil garantizar aleatoriedad.
Nos exponemos a un escenario en que la boca de urna podría decir algo, el conteo rápido otra cosa, y el fantasma del fraude vuela y vuela con candidatos a la espera de activarlo.
Y ya vamos a tener una cosa interesante ahora nomás con las encuestas por el tema del ausentismo. No todos los que han sido encuestados van a votar. No es algo que se calcule por encuesta.
Entonces nuevamente, la población que vote será una parte de la población electoral, dada la pandemia. Por lo que el resultado incluso de la encuesta mejor hecha podría cambiar radicalmente en el conteo rápido.

Fin

• • •

Missing some Tweet in this thread? You can try to force a refresh
 

Keep Current with Mauricio Saravia

Mauricio Saravia Profile picture

Stay in touch and get notified when new unrolls are available from this author!

Read all threads

This Thread may be Removed Anytime!

PDF

Twitter may remove this content at anytime! Save it as PDF for later use!

Try unrolling a thread yourself!

how to unroll video
  1. Follow @ThreadReaderApp to mention us!

  2. From a Twitter thread mention us with a keyword "unroll"
@threadreaderapp unroll

Practice here first or read more on our help page!

More from @ojoenlagente

4 Apr
Hablemos de estadística (hilo mancomunado para leer con calma)

Nada mejor para un sábado en la noche que hablar y entender un poco de estadística. Como tampoco es que yo sea un gran experto en la materia, este es un hilo compartido.
El verdadero autor y culpable de tus bostezos es el gran Mauricio Castro, @Mauricio_Castr, amigazo y PhD en estadística que sabe lo que son encuestas. Nos conocimos trabajando en una
Revisemos con él algunos conceptos importantes que te servirán para revisar mañana con tu desayuno. Marca este hilo en “guardados” para que puedas volver a él cuando lo necesites. Acá vamos, hablaremos del error de las encuestas:
Read 18 tweets
2 Apr
Las 7 preguntas del viernes santo

Luego de haber recibido los resultados del simulacro de DATUM, quedan dudas que son importantes discutir de cara a lo que queda, que para esta campaña no es poco. Vamos a hacer preguntas -no necesariamente técnicas-

admin.datum.com.pe/datum/descarga…
1. ¿Por qué no esperar al debate?
A veces a las encuestadoras nos falta poder de decisión sobre el cliente que termina afectándonos. Si no se podía esperar debate porque nuestro contratante no publica fin de semana (Gestión), sacar la última el domingo previo hubiese sido mejor.
No incluir al debate genera suspicacias válidas. Porque considerar que no se va a mover nada en ESTA campaña, con esos porcentajes es clarividencia, no es ciencia. Y además, que el medio publique los resultados con fotos del debate…
Read 13 tweets
1 Apr
Encuestas, simulacros y resultados (hilo corto)

Estamos en elecciones complicadas por el contexto (y diría por calidad de la oferta). Acaba de salir un simulacro que aun no puedo comentar sin la ficha técnica completa. Pero no "recoge" el debate. Entonces, datarqueología...
¿Las tendencias cambian después del debate? Por lo menos las dos últimas elecciones presidenciales NO. Usando datos de IPSOS, podemos ver el cuadro y notar que fundamentalmente el voto reportado en la encuesta-simulacro previo se mantuvo. Pero eran escenarios distintos
Hablamos de movimientos de muy baja intensidad. pero que en esta elección pueden ser de enorme impacto. De 2 a 4 puntos de variación, logran mover el orden y el potencial ingreso a segunda vuelta. Por eso la propuesta de IEP de verlos como rangos es muy razonable
Read 7 tweets
17 Nov 20
Apuntes de crisis, hipótesis para la comprensión (Hilo).

Uno
Estamos viviendo (en) tiempos distintos. Cuando la política formal planteaba plazos, estos ya habían sido desbordados por el movimiento de protesta. “Mañana” era hoy. En unas horas eran minutos.
Flores Aráoz quedó en permanente offside. La interconexión ayudó muchísimo. Todo se movió a un nivel sub-oficial, sin medios masivos. A nivel redes. Lo que a De Althaus le parecía una estructura organizada, era algo que con una PC podías hacer en segundos. Jamás se entendió.
Dos
Nos mueven los valores, no la necesidad. Tengo la sensación de que lo que nos movilizó fuertemente fue ver la libertad amenazada. No marchamos por una política económica. No se salió por una causa de DDHH. No por elecciones ni por promesas. Se salió porque nos amenazaron.
Read 16 tweets
16 Nov 20
En esta crisis, hubo quienes SI informaron. Mi top 5:
- Jaime Chincha (@JaimeChincha)
- Martin Hidalgo (@martinhidalgo )
- Carlos Villarreal (@kikesitov67)
- M. Sifuentes (@ocram )
- Todo @Ojo_Publico

Seguro hay muchos más y omisiones.
Agrego:
- El gran Jimmy Chinchay (@Jimmychinchay)
- Mabel Huertas (@mabel_huertas)
- Lorena Alvarez (@lorealvareza)
- Martin Riepl (@martinwriepl)
- Cesar Romero (@CesarRomeroC )
- Todo IRTP (¡Dignidad!)

En otras crisis, bastaría un tuit para esto. Hoy algo más cambió
- Claudia Cisneros (@claudiacisneros)
- Paola Ugaz (@larryportera)
- Luis Villanueva (@LuisVillanuevaO)
- Raúl Tola (@eldiarionegro)

Muchos ponen a RMP. No lo considero. Su posición ayer frente a RSS me pareció deplorable.
Read 6 tweets

Did Thread Reader help you today?

Support us! We are indie developers!


This site is made by just two indie developers on a laptop doing marketing, support and development! Read more about the story.

Become a Premium Member ($3/month or $30/year) and get exclusive features!

Become Premium

Too expensive? Make a small donation by buying us coffee ($5) or help with server cost ($10)

Donate via Paypal Become our Patreon

Thank you for your support!

Follow Us on Twitter!