¿Cuál es el problema con la encuesta a boca de urna?
A pesar de estar acostumbrados al flash electoral mientras tomamos lonche y revisamos nuestros rosarios, ekekos, budas o lo que usemos de amuleto, el procedimiento de boca de urna es riesgoso.
Colaboración de @Mauricio_Castr
Pero entendemos y partimos del hecho de que se trata de una institución nacional. El FLASHHHHHH ELECTORAL, que hasta tiene cronómetro descendente en los últimos procesos (afortunadamente sin picapica). Pero es riesgoso.
Para explicar un poco más, volvemos a la conversa con @Mauricio_Castr, PhD en estadística y que sabe de encuestas electorales. El comienza comentando el tema del margen de error con el que vale la pena empezar el post.
Cuando diseñas una muestra (quiénes van a responder una encuesta), buscas que esos que responden te den un resultado “x”, que no conoces, que es lo que quieres estimar con la encuesta.
Para determinar el tamaño de esa muestra (la cantidad de gente que debe responder la encuesta), necesitas definirlo como que la diferencia absoluta entre el valor verdadero de “x” y lo que vas a usar para estimar “x” es el margen de error.
Manzanita: quiero saber el porcentaje de intención de voto por Qwerty. Pero lo más preciso posible, esto es con menor margen de error. Entonces, encuesto (con un buen diseño) a 400 personas. Eso me arrojaría 5% de error, mucho para mi.
Duplico la muestra, 800 casos, 3.4% de margen. Mejor 1,600 casos, 2.4% de margen. Ahí me quedo. Se que el resultado que obtenga por el señor Qwerty estará 2.4% para arriba y para abajo. Mas cerca quieres estar de “x”, más muestra deberás incluir. Ahora que quedo claro, volvamos.
¿Qué pasa en la boca de urna? Si bien teóricamente puedes hablar de margen de error también, el problema es que “x” (tu resultado) pasa porque realmente selecciones una muestra aleatoria de la población. Ahí está el problema.
Porque el marco muestral es de difícil acceso. (Marco muestral es el repositorio donde están todos los individuos a encuestar: manzanas en encuestas presenciales, panelbook en encuestas por Internet, listados de teléfonos en encuestas telefónicas).
Entonces, tienes que asumir homogeneidad en todo: que la gente que vota en la mañana piensa igual que en la tarde, que la gente en un distrito o provincia piensa igual que en otro, etc. En la práctica, el margen de error real termina siendo mucho mayor que el que supusimos.
Entonces, teóricamente no hay como decir que hay más error muestral en una encuesta “normal” que en la de boca de urna. Pero el error no muestral en la boca de urna es mucho mayor que en la encuesta normal.
En la encuesta normal muestreas hogares, teléfonos, listados. En la boca de urna muestreas locales de votación, y de allí seleccionas individuos. Hay que hacer un supuesto grande en cuanto a la homogeneidad de las unidades muestrales que en otros casos no pasa.
Incluso si tienes cuidado de entrevistar durante la mayoría de las horas del día no lo puedes hacer hasta el final sino no puedes procesar. Entonces en la practica el error de la encuesta de boca urna debe ser mayor que la de encuesta en hogares.
No pasa eso en el conteo rápido, pues ahí el marco muestra son las mesas. Las mesas no se mueven y no te mienten. Si tomas una buena muestra de las mesas, tienes una estimación bien certera.
En el contexto de Perú, con horas específicas para que cierta gente vote, el margen de error se va a disparar pues es muy difícil garantizar aleatoriedad.
Nos exponemos a un escenario en que la boca de urna podría decir algo, el conteo rápido otra cosa, y el fantasma del fraude vuela y vuela con candidatos a la espera de activarlo.
Y ya vamos a tener una cosa interesante ahora nomás con las encuestas por el tema del ausentismo. No todos los que han sido encuestados van a votar. No es algo que se calcule por encuesta.
Entonces nuevamente, la población que vote será una parte de la población electoral, dada la pandemia. Por lo que el resultado incluso de la encuesta mejor hecha podría cambiar radicalmente en el conteo rápido.
Fin
• • •
Missing some Tweet in this thread? You can try to
force a refresh
Hablemos de estadística (hilo mancomunado para leer con calma)
Nada mejor para un sábado en la noche que hablar y entender un poco de estadística. Como tampoco es que yo sea un gran experto en la materia, este es un hilo compartido.
El verdadero autor y culpable de tus bostezos es el gran Mauricio Castro, @Mauricio_Castr, amigazo y PhD en estadística que sabe lo que son encuestas. Nos conocimos trabajando en una
Revisemos con él algunos conceptos importantes que te servirán para revisar mañana con tu desayuno. Marca este hilo en “guardados” para que puedas volver a él cuando lo necesites. Acá vamos, hablaremos del error de las encuestas:
Luego de haber recibido los resultados del simulacro de DATUM, quedan dudas que son importantes discutir de cara a lo que queda, que para esta campaña no es poco. Vamos a hacer preguntas -no necesariamente técnicas-
1. ¿Por qué no esperar al debate?
A veces a las encuestadoras nos falta poder de decisión sobre el cliente que termina afectándonos. Si no se podía esperar debate porque nuestro contratante no publica fin de semana (Gestión), sacar la última el domingo previo hubiese sido mejor.
No incluir al debate genera suspicacias válidas. Porque considerar que no se va a mover nada en ESTA campaña, con esos porcentajes es clarividencia, no es ciencia. Y además, que el medio publique los resultados con fotos del debate…
Estamos en elecciones complicadas por el contexto (y diría por calidad de la oferta). Acaba de salir un simulacro que aun no puedo comentar sin la ficha técnica completa. Pero no "recoge" el debate. Entonces, datarqueología...
¿Las tendencias cambian después del debate? Por lo menos las dos últimas elecciones presidenciales NO. Usando datos de IPSOS, podemos ver el cuadro y notar que fundamentalmente el voto reportado en la encuesta-simulacro previo se mantuvo. Pero eran escenarios distintos
Hablamos de movimientos de muy baja intensidad. pero que en esta elección pueden ser de enorme impacto. De 2 a 4 puntos de variación, logran mover el orden y el potencial ingreso a segunda vuelta. Por eso la propuesta de IEP de verlos como rangos es muy razonable
Apuntes de crisis, hipótesis para la comprensión (Hilo).
Uno
Estamos viviendo (en) tiempos distintos. Cuando la política formal planteaba plazos, estos ya habían sido desbordados por el movimiento de protesta. “Mañana” era hoy. En unas horas eran minutos.
Flores Aráoz quedó en permanente offside. La interconexión ayudó muchísimo. Todo se movió a un nivel sub-oficial, sin medios masivos. A nivel redes. Lo que a De Althaus le parecía una estructura organizada, era algo que con una PC podías hacer en segundos. Jamás se entendió.
Dos
Nos mueven los valores, no la necesidad. Tengo la sensación de que lo que nos movilizó fuertemente fue ver la libertad amenazada. No marchamos por una política económica. No se salió por una causa de DDHH. No por elecciones ni por promesas. Se salió porque nos amenazaron.