Jaime Gómez-Obregón Profile picture
Jan 28, 2022 11 tweets 4 min read Read on X
Hoy he dedicado mi día a perfeccionar el método de extracción del NIF de los contratistas que encuentro en los datos oficiales. A priori parece fácil. Basta con utilizar el dígito de control (o la letra) para comprobar la validez de cada NIF.

Chupado, ¿verdad? Pues no.
El problema es bastante más complejo. Y, algorítmicamente, muy interesante.

La primera vuelta de tuerca viene cuando el funcionario aplica la imaginación a la hora de escribir el NIF en el expediente. Pero tiene fácil solución 🎉.
Pero con tantísimos contratos públicos, tarde o temprano te encuentras con casos más exóticos, como estos de la imagen. Porque las herramientas informáticas de algunas administraciones no validan los datos al introducirlos, así que pueden escribir cualquier cosa…

Una fiesta.
Algunos contratos tienen lotes y varios adjudicatarios. ¡No problemo! Se añaden al expediente tantos como sea necesario, ¿no?

Pues tampoco. En la práctica, a veces encuentro que meten TODOS los adjudicatarios como si fueran uno solo. EN EL MISMO CAMPO. Y tengo que separarlos…
Lógicamente no hago nada manualmente. Sería imposible. He escrito un programa y lo aplico a los 3,2 millones de expedientes.

En uno me he topado con esto. Es un caso excepcional, muy extraño; y que puede inducir fácilmente a error. Por eso lleva tanto tiempo hacerlo bien™️.
Ahora viene la segunda derivada: los contratistas extranjeros. Si ya tiene tela detectar un NIF español, solo en la 🇪🇺UE hay 27 formatos más.

Una primera opción es hacer una detección formal. Es decir, detectarlos por su forma. Mediante expresiones regulares queda así. 👇
Un segundo paso es aplicar el algoritmo de cálculo del dígito de control. Pero… ¿dónde está definido el algoritmo oficial que usa cada país? 🔍

Spoiler: algunos países no utilizan algoritmo alguno… Y en otros hay dígitos que son simplemente aleatorios.
La cosa puede complicarse todo lo que queramos. Veamos, por ejemplo, este contrato del Ayuntamiento de Cullera.

¡Al NIF del contratista le falta un dígito! Podríamos darlo por perdido pero… ¿y si es justo la pyme del cuñado del alcalde? 🤣
Una solución es aplicar el algoritmo inverso y calcular el dígito faltante. Así podemos corregir unos cuantos miles de contratos que, si no, no podrían cruzarse con otras fuentes de datos.

🚫 B9699103 👈 Lo que publica el Estado… (incorrecto)
✅ B96991039 👈 El NIF corregido
Esto es solo una pincelada de la complejidad que puede alcanzar resolver un problema que no debería haberse creado. Porque si no se validan los datos en el momento de su introducción, arreglarlo luego puede ser imposible. Y al sistema llega todo tipo de chatarra inútil como esta.
Como siempre, muchísimas gracias a mis patronos ❤️, que es quienes hacen posible que pueda poner mis magulladas neuronas a resolver esto. Que servirá para que pronto todos tengamos una nueva herramienta digital que dará más transparencia a los concursos y al dinero público. 🙏

• • •

Missing some Tweet in this thread? You can try to force a refresh
 

Keep Current with Jaime Gómez-Obregón

Jaime Gómez-Obregón Profile picture

Stay in touch and get notified when new unrolls are available from this author!

Read all threads

This Thread may be Removed Anytime!

PDF

Twitter may remove this content at anytime! Save it as PDF for later use!

Try unrolling a thread yourself!

how to unroll video
  1. Follow @ThreadReaderApp to mention us!

  2. From a Twitter thread mention us with a keyword "unroll"
@threadreaderapp unroll

Practice here first or read more on our help page!

More from @JaimeObregon

Dec 23, 2023
Susana es concejala y ha tenido una idea. 🫣
He estudiado y escrito tanto sobre esta fiebre que no sé ni por dónde comenzar a contestar a @SusanaHornillo. 😅

Quizá por el sentido del humor… 👇
Estimada @SusanaHornillo:

He estudiado más de cien «amazon locales» puestos en marcha con dinero público. He intentado visibilizar las conclusiones en artículos como este. Sin mucho éxito, parece. 👇

jaime.gomezobregon.com/la-fiebre-de-l…
Read 4 tweets
Nov 13, 2023
Mis 🔟 propuestas para mejorar la transparencia en la contratación del sector público.

Recién publicado hoy en European Public Mosaic, la revista de la @EAPCcat destinada a la mejora de la Administración:

🔗
(Página 80 y siguientes)gencat.cat/eapc/epum/N21/…





Image
Image
Image
Image
👆 Mi artículo en el enlace del tuit de arriba contiene muchos enlaces a los amenos hilos de Twitter donde he ido destripando cada problema y proponiendo soluciones.

👇 Aquí en castellano, también con abundantes enlaces a mis investigaciones:

🔗 jaime.gomezobregon.com/tmp/diez_propu…

Diez propuestas para una mejor transparencia en la contratación pública JAIME GÓMEZ-OBREGÓN En los últimos tres años he trabajado informáticamente 1,9 millones de expedientes de la plataforma española de contratación pública y los porta- les de transparencia. Lo he abordado con las herramientas de un ingeniero especializado en big data y la mirada curiosa de un ciudadano interesado en escrutar los asuntos públicos. Regreso de esta aventura con este decá- logo de ideas para mejorar la transparencia en las compras públicas. La opacidad en los asuntos públicos alienta la corrupción. Y cuando e...
Así es como he podido aflorar y dar visibilidad pública al hecho de que en algunas adjudica- ciones de contratos del Gobierno de Cantabria concurrían licitadores conchabados o varias sociedades controladas por un mismo empresario. O la adjudicación de un contrato de obra civil al que licitaban dos empresas promotoras diferentes que, ¡oh!, sin embargo comparten un mismo domicilio social y número de teléfono. Publicar un censo abierto de uniones temporales de empresas. ¿Cómo conectar sistemá- ticamente una Unión Temporal de Empresas (UTE) con cada una de las sociedades que la conforman? En la...
🎥 …Y aquí las diez propuestas desarrolladas en una ponencia que di en el Congreso Internacional de Transparencia, @COTransparencia:

Read 5 tweets
May 16, 2023
📈 Para mí es importante que nadie tenga que confiar en «mis» datos. ¡No son míos! Yo los extraigo de fuentes oficiales. Con sacacorchos, porque lo ponen difícil. Por eso acabo de añadir a mi herramienta algo imprescindible: el enlace de cada dato en las memorias del Gobierno. 😊
Creo que esto servirá para que mucha gente pueda buscar en mi herramienta fácilmente (¡y de forma divertida!) los datos de su interés. Y luego ir a tiro hecho a la infumable «fuente primaria» del Gobierno (PDF de más de 200 páginas) para confirmar la veracidad de los datos. Image
Creo que esto será útil…

✅ A la ciudadanía, para entender mejor su país.

✅ A los parlamentarios, para controlar mejor al Gobierno y detectar chanchullos.

✅ A los periodistas, para vigilar el reparto equitativo del dinero público. Image
Read 5 tweets
May 14, 2023
💡 ¿Cuáles son las campañas del Gobierno Vasco con menor y mayor presupuesto en los últimos cinco años?

🤏 La más modesta: 20 € en 2018 para la promoción de la seguridad alimentaria en Facebook.

🦣 La de mayor importe: 490 173 € en 2021 sobre el «Basque Green Deal». ImageImage
No sé qué es el «Basque Green Deal» (no soy vasco ni resido allí), pero esta es la información institucional que he encontrado en un vistazo rápido:

🔗 euskadi.eus/gobierno-vasco… Image
¿Y cuáles son los contratos más grandes de estos años y quiénes se los han llevado? Mi 🤖robotito come-contratos responde:

🥇 El récord lo tiene El Diario Vasco, que se llevó 245 000 € en 2018 por esta campaña sobre «Euskadi gastronómica». Repitió en 2019, con 220 000 €. Image
Read 6 tweets
May 7, 2023
🔴 La Ley 6/2010 de Publicidad y Comunicación de #Euskadi indica que el Gobierno Vasco tiene que remitir anualmente al Parlamento una memoria con el reparto del dinero público a los medios de comunicación.

Pero esas memorias tienen errores.
Por ejemplo: 👇 Ejemplo del desglose de una...
El Gobierno entrega los datos en un PDF que impide:

👉 A los diputados, controlar eficazmente el gasto del Gobierno.

👉 A la ciudadanía, entender cómo se reparte el dinero público.

👉 A los periodistas, comprobar si se cumplen las leyes.

¡Esto no puede ser!
📰 La última de estas memorias, del año 2022, acaba de ser publicada este mismo viernes.

Alguien en el Gobierno Vasco las escribe con Microsoft Word partiendo, parece, de una plantilla de 2017.

— Esto es sumamente ineficiente.
— Y produce un PDF que no da #transparencia real. Image
Read 9 tweets
Mar 31, 2023
Señor alcalde @gonzalojacome:

No tengo claro que ser la ciudad más subsidiada de España sea motivo de celebración. Quiero pensar que la métrica del éxito es otra. Pero he estudiado cien iniciativas similares a la suya y encuentro un denominador común: fracasan.

Verá… 👇
Este triunfal anuncio es compatible con un cuadro agudo de subvencionitis. Una pandemia que está causando estragos en alcaldes y concejales de toda bandera. El delirio: intentar salvar el comercio local con un «Amazon» municipal.

🔗 m.facebook.com/story.php?stor…
El virus lo inocula el Estado canalizando una línea de subvenciones con fondos europeos. Las entidades locales concurren porque hay dinero de Europa. Es la solución a la búsqueda de un problema. Y a alguien se le enciende la bombilla: un «marketplace». 🎉
Read 16 tweets

Did Thread Reader help you today?

Support us! We are indie developers!


This site is made by just two indie developers on a laptop doing marketing, support and development! Read more about the story.

Become a Premium Member ($3/month or $30/year) and get exclusive features!

Become Premium

Don't want to be a Premium member but still want to support us?

Make a small donation by buying us coffee ($5) or help with server cost ($10)

Donate via Paypal

Or Donate anonymously using crypto!

Ethereum

0xfe58350B80634f60Fa6Dc149a72b4DFbc17D341E copy

Bitcoin

3ATGMxNzCUFzxpMCHL5sWSt4DVtS8UqXpi copy

Thank you for your support!

Follow Us!

:(