Gente, aquí *sí* toca un Mea Culpa sobre el tema de los datos y "análisis" de las elecciones, pero advertencia... *no* va a complacer a alguien que está en estos momentos en modo full izquierda o full derecha. ;-)
Abro hilo (1/12)
Uno de los propósitos principales de datos abiertos es *transparentar* una situación. Permite que cualquier persona pueda cargar datos en su software de análisis favorito, indagar, ordenar y tratar de producir entendimiento - responder preguntas - sobre la data (2/12)
A tantas preguntas sobre si hubo fraude, que hasta el comienzo de la semana pasada parecían puras *opiniones* y ejemplos aislados, junto a @TAGACAT, decidimos publicar datos abiertos sobre este tema con 2 búsquedas simples para demostrar que había data -*nada* de análisis (3/12)
Ese fue el momento donde la cosa se salió de control. La derecha, agarró el ejemplo de la búsqueda a favor de FP (que no era *ningún* análisis) y lo utilizó como prueba de lo que querían ver. Otros, hicieron exactamente lo mismo,"refutando" lo que no era análisis de *nada*(4/12)
Aquí viene mi error más grave. Pensando que podía contribuir a mejorar la calidad de esta discusión, hago un *simple* análisis para responder una pregunta: "¿Hay irregularidades potenciales en estas elecciones que se pueden detectar con datos?" (5/12)
La *única* conclusión de ese análisis es que "sí se puede obtener irregularidades *potenciales* usando un algoritmo". La prueba son los 8 ejemplos y la argumentación lógica se hace con una prueba de contradicción (que existe desde Aristóteles) es.wikipedia.org/wiki/Prueba_po… (6/12)
La explosión por esto,fue *peor*. En vez de *refutar* los *ejemplos* (la *base* del argumento), y decir "esto no es sospechoso porque..." (la manera apropiada de refutar lógicamente este argumento) vi cualquier cosa, incluyendo atribuirme "conclusiones" que no había hecho. (7/12)
Irónicamente, la mejor reflexión sobre este tema no la obtuve de las varias llamadas/mensajes que tuve con varios PhDs/Politólogos/expertos en fraude electoral en EEUU o congresistas/periodistas/políticos que me pedían que me retracte/indague más 🤷. (8/12)
La mejor reflexión vino de una conversación con una amiga, que tiene la 1/2 de años que yo, y x2 de sensibilidad social también! En el contexto social en el que estamos, se ignora "no digo fraude", nadie va a leer la definición de la REA de "irregular"o mirar los ejemplos! (9/12)
Lo *más* peligroso, donde *sí* soy re-culpable, es que debí haberme dado cuenta que inocentemente tiré la fórmula de la bomba atómica en el centro del campo de batalla, en medio de la guerra, confiando que se iba a hacer lo correcto. Mal pues. Estamos hablando de política.(10/12)
Creo que, en el fondo, la mayoría de personas en *ambos* lados, *sí* tienen buenas intenciones y quieren lo mejor para el país - con diferentes puntos de vista de cómo hacerlo. Pero me parece innegable, que algunos políticos (no todos) nos quieren separar. (11/12)
Al final, ya entiendo que es imposible mejorar procesos en *este* momento (sí después). La reconstrucción tiene que empezar después que acaba la guerra - no durante.
Ojo: si venían buscando argumentos a favor/en contra de las Casinos de menta sorry. Yo soy full Coronitas
(12/12)
• • •
Missing some Tweet in this thread? You can try to
force a refresh
¿Hay irregularidades potenciales en estas elecciones que se pueden detectar con datos? UN ROTUNDO SÍ. Aquí 8 ejemplos concretos, y enseño cómo utilizando un poco de estadística se pueden encontrar mesas problemáticas. Lean el hilo completo y tranquilos antes de opinar pf (1/10)
Para empezar, *no* estoy gritando ¡fraude!, estoy utilizando estadística para detectar mesas *súper* sospechosas que necesitan verificación para concluir algo.Para hacerlo primero generamos #datosabiertos de la ONPE que cualquier persona puede bajar.(2/10)
Luego creé un algoritmo simple para analizar todas las mesas de todas el país; el truco está en mirar los patrones de las mesas *en el mismo local de votación* para detectar comportamiento de una mesa en particular que actúa distinta a otras *en el mismo local* 4🍊vs 4✏️ (3/10)
Así como en la pandemia, en estas elecciones los #datosabiertos también son importantes porque ayudan a analizar resultados de la @ONPE_oficial. Como no han sido publicados, @tagacat y yo tuvimos que extraerlos 😉. Abro hilo con algunos resultados preliminares de interés (1/8)
A simple vista existe una diferencia visual gigantesca de los distritos rojos (PL) vs los distritos naranjas (FP). (2/8)
Así como en la pandemia donde tenemos que prestar atención a la población para comparar, también lo podemos hacer generando un pie chart cuyo tamaño representa la cantidad de votos válidos y el area de cada pie chart la asignación de votos. (3/8)
¿En cuánto tiempo estaremos vacunados? @OpenCovidPeru v2 (estrenado hoy) tiene un infográfico que se actualiza diariamente con los datos abiertos de vacunación. A la velocidad actual, todos estaríamos vacunados el 30 de Mayo del 2022. Pero *ojo* esto representa un [...](1/7)
... incremento considerable en la velocidad de vacunación en comparación con hace un mes. Para entender si estamos "bien" o "mal" hemos creado esta visualización. Las barras azules representan las dosis aplicadas. La linea es una meta de las dosis que deberíamos de hacer... (2/7)
..si queremos tener a todos vacunados el 31 de Dic del 2021. La meta es dinámica (si no llegas a la meta diaria, tienes que hacer más dosis los días siguientes para compensar), por eso está subiendo. Existe una jeringa que te dice cuando terminaríamos con la velocidad actual(3/7)
Existe mucha confusión acerca de qué es un Blockchain después del debate de ayer. Les explico brevemente qué es, y para qué sirve, para que ustedes mismos puedan evaluar cuándo tiene sentido usarlo y cuándo es humo total. Abro hilo (1/10)
La bases de datos tradicionales (i.e. software diseñado para grabar transacciones) son *centralizadas*. Es decir, hay un nodo *principal* - un componente/ente/algo - que está a cargo de decidir cuál es el estado "oficial" de los datos. Ese nodo resuelve cualquier conflicto.(2/10)
Un blockchain es conceptualmente una base de datos *descentralizada*, no existe un nodo "oficial" a cargo de todo. La manera como se decide cuáles son los valores "oficiales" o se resuelve conflicto es a travez de una series de pasos llamado *consenso* (i.e. por mayoría). (3/10)
Quiero agradecer a @yonhy_lescano y @Vero_Mendoza_F por responder mi pregunta sobre cómo brindar acceso a Internet a zonas rurales. Yo *sí* creo que se necesita comprar un satélite de comunicaciones, pero me gustaría dar algo de contexto antes de compartir sus respuestas (1/9)
La red dorsal de fibra óptica (RDNFO) es una red de cables físicos que está esparcida por varias partes del Perú. Representa una inversión del US$323M+ que ya se ha hecho y que sufre de un *terrible* contrato con Azteca que pone un precio tan alto por mbit que no se usa (2/9)
La latencia (i.e. cuánto "se demora" una señal de Internet) es muy baja en fibra óptica (bueno!) porque viaja a velocidades cercanas la velocidad de la luz! La latencia en un satélite es alta, porque tienes una señal de radio que tiene que viajar al espacio y regresar! (3/9)
¿Por qué no existe un padrón de vacunación único para todo el Perú? Les presento una solución lista para ser usada hoy para ayudar a resolver este problema... y la razón real por la que es demasiado difícil que sea adoptada por el gob peruano. Abro hilo (1/8)
La primera reacción siempre es preguntar ¿por qué no se usa la base de datos del @ReniecPeru para la vacunación? Si se usa, pero existen problemas como
- las direcciones no están al día
- muchas personas mayores se han mudado temporalmente con familiares durante la pandemia
(2/8)
Aparte, existen otras bases de datos relevantes *que no están interconectadas* (e.g. ESSALUD, Fuerzas Armadas, Personal Médico, etc). Cada base de datos usa sus propios campos con diferente información. ¿Qué base de datos tiene prioridad cuando hay una discrepancia? (3/8)