Hablemos de estadística (hilo mancomunado para leer con calma)

Nada mejor para un sábado en la noche que hablar y entender un poco de estadística. Como tampoco es que yo sea un gran experto en la materia, este es un hilo compartido.
El verdadero autor y culpable de tus bostezos es el gran Mauricio Castro, @Mauricio_Castr, amigazo y PhD en estadística que sabe lo que son encuestas. Nos conocimos trabajando en una
Revisemos con él algunos conceptos importantes que te servirán para revisar mañana con tu desayuno. Marca este hilo en “guardados” para que puedas volver a él cuando lo necesites. Acá vamos, hablaremos del error de las encuestas:
Hoy día mucha gente se pregunta por qué las encuestas varían entre una y otra, si todas reportan un margen de error muy similar. La respuesta es que todas reportan el error muestral pero no consideran el error no muestral en sus análisis.
Las encuestas, incluyendo las electorales, están sujetas a dos tipos de errores: el error muestral y error no muestral. El muestral se refiere a que examinamos una muestra o una parte de la población y no la población completamente.
Eso hace que haya ciertas diferencias, que son calculables en función del tamaño de la muestra y de qué tan seguro quiero estar de lo que digo (intervalo de confianza, después volvemos sobre esto).
Por su lado el otro error, el “no muestral”, considera los sesgos en la selección de las unidades a muestrear, no-respuesta de los entrevistados, errores en la medición de la respuesta, problemas con el cuestionario a usar, entre otros… Mejor con manzanitas
Manzana 1
Un ejemplo del error no muestral: si hay grupos de individuos que no están representados en el marco muestral, se tiene que estos individuos tienen probabilidad 0 (cero, no o) de ser elegidos en la muestra. Lo anterior origina lo que se conoce como sesgo de selección.
Manzana 2
O por ejemplo, un alto número de sujetos que no contesta la encuesta (en alguna región o con alguna característica “x”), lo que genera poca representación de ese grupo en la muestra (probabilidades cercanas a 0).
Manzana 3
Otras situaciones que contribuyen al error no muestral son los errores en el registro de la respuesta (contesto A pero encuestador marca B), problemas con el cuestionario (preguntas mal formuladas o que derechamente no se entienden), etc.
Todos nos equivocamos, pero el error muestral es parte del dolor cotidiano. Solemos saber menos del no muestral. Pero es importante empezar a comprenderlo, abrazarlo, y tratar de enmendarlo.
Desde el punto de vista estadístico existen técnicas que pueden cuantificar el error no muestral. Para esto, es vital contar con información completa de cómo se diseñó el muestreo. Entonces, a poner ojo en las fichas técnicas de mañana y a como se han venido difundiendo.
Porque el análisis estadístico de encuestas tiene alto impacto en las conclusiones del estudio. Por ejemplo, reportar intervalos de confianza sin decir que niveles de confianza se utilizó, o simplemente no reportarlos nos puede dar una falsa idea del fenómeno en estudio.
¿Ah? Ya, vamos a las manzanitas otra vez. Cuando tu obtienes el % de voto estimado del candidato X, digamos p, puedes obtener un intervalo de confianza para p. Entonces...
Si yo calculo el intervalo con un 90% de confianza, en la práctica lo que digo es que si soy capaz de repetir mi muestreo 100 veces y calcular 100 intervalos, 90 de ellos contendrán el verdadero valor de p.
Por el contrario, si construyo el intervalo al 95% en 95 de estos intervalos estará el verdadero valor de p. Si pongo intervalo y no la confianza, no se sabrá qué tan buen intervalo o mal intervalo estás analizando. Y la probabilidad de error al interpretarlo es alta.
Si llegaste hasta acá, muchas gracias. El tema es relevante porque aclara muchas de las diferencias que se tienen entre sondeos y le mete presión a aspectos como el muestreo, la dispersión y el método.
Necesitamos encuestas más informativas y la mayor docencia posible para la interpretación de resultados. Con el gran @Mauricio_Castr haremos algo más paja para después de la primera vuelta. Y estaremos atentos a lo que las encuestadoras reportan. Buenas noches.

• • •

Missing some Tweet in this thread? You can try to force a refresh
 

Keep Current with Mauricio Saravia

Mauricio Saravia Profile picture

Stay in touch and get notified when new unrolls are available from this author!

Read all threads

This Thread may be Removed Anytime!

PDF

Twitter may remove this content at anytime! Save it as PDF for later use!

Try unrolling a thread yourself!

how to unroll video
  1. Follow @ThreadReaderApp to mention us!

  2. From a Twitter thread mention us with a keyword "unroll"
@threadreaderapp unroll

Practice here first or read more on our help page!

More from @ojoenlagente

2 Apr
Las 7 preguntas del viernes santo

Luego de haber recibido los resultados del simulacro de DATUM, quedan dudas que son importantes discutir de cara a lo que queda, que para esta campaña no es poco. Vamos a hacer preguntas -no necesariamente técnicas-

admin.datum.com.pe/datum/descarga…
1. ¿Por qué no esperar al debate?
A veces a las encuestadoras nos falta poder de decisión sobre el cliente que termina afectándonos. Si no se podía esperar debate porque nuestro contratante no publica fin de semana (Gestión), sacar la última el domingo previo hubiese sido mejor.
No incluir al debate genera suspicacias válidas. Porque considerar que no se va a mover nada en ESTA campaña, con esos porcentajes es clarividencia, no es ciencia. Y además, que el medio publique los resultados con fotos del debate…
Read 13 tweets
1 Apr
Encuestas, simulacros y resultados (hilo corto)

Estamos en elecciones complicadas por el contexto (y diría por calidad de la oferta). Acaba de salir un simulacro que aun no puedo comentar sin la ficha técnica completa. Pero no "recoge" el debate. Entonces, datarqueología...
¿Las tendencias cambian después del debate? Por lo menos las dos últimas elecciones presidenciales NO. Usando datos de IPSOS, podemos ver el cuadro y notar que fundamentalmente el voto reportado en la encuesta-simulacro previo se mantuvo. Pero eran escenarios distintos
Hablamos de movimientos de muy baja intensidad. pero que en esta elección pueden ser de enorme impacto. De 2 a 4 puntos de variación, logran mover el orden y el potencial ingreso a segunda vuelta. Por eso la propuesta de IEP de verlos como rangos es muy razonable
Read 7 tweets
17 Nov 20
Apuntes de crisis, hipótesis para la comprensión (Hilo).

Uno
Estamos viviendo (en) tiempos distintos. Cuando la política formal planteaba plazos, estos ya habían sido desbordados por el movimiento de protesta. “Mañana” era hoy. En unas horas eran minutos.
Flores Aráoz quedó en permanente offside. La interconexión ayudó muchísimo. Todo se movió a un nivel sub-oficial, sin medios masivos. A nivel redes. Lo que a De Althaus le parecía una estructura organizada, era algo que con una PC podías hacer en segundos. Jamás se entendió.
Dos
Nos mueven los valores, no la necesidad. Tengo la sensación de que lo que nos movilizó fuertemente fue ver la libertad amenazada. No marchamos por una política económica. No se salió por una causa de DDHH. No por elecciones ni por promesas. Se salió porque nos amenazaron.
Read 16 tweets
16 Nov 20
En esta crisis, hubo quienes SI informaron. Mi top 5:
- Jaime Chincha (@JaimeChincha)
- Martin Hidalgo (@martinhidalgo )
- Carlos Villarreal (@kikesitov67)
- M. Sifuentes (@ocram )
- Todo @Ojo_Publico

Seguro hay muchos más y omisiones.
Agrego:
- El gran Jimmy Chinchay (@Jimmychinchay)
- Mabel Huertas (@mabel_huertas)
- Lorena Alvarez (@lorealvareza)
- Martin Riepl (@martinwriepl)
- Cesar Romero (@CesarRomeroC )
- Todo IRTP (¡Dignidad!)

En otras crisis, bastaría un tuit para esto. Hoy algo más cambió
- Claudia Cisneros (@claudiacisneros)
- Paola Ugaz (@larryportera)
- Luis Villanueva (@LuisVillanuevaO)
- Raúl Tola (@eldiarionegro)

Muchos ponen a RMP. No lo considero. Su posición ayer frente a RSS me pareció deplorable.
Read 6 tweets

Did Thread Reader help you today?

Support us! We are indie developers!


This site is made by just two indie developers on a laptop doing marketing, support and development! Read more about the story.

Become a Premium Member ($3/month or $30/year) and get exclusive features!

Become Premium

Too expensive? Make a small donation by buying us coffee ($5) or help with server cost ($10)

Donate via Paypal Become our Patreon

Thank you for your support!

Follow Us on Twitter!