Sigo revisando los trillones de datos de la Plataforma de Contratación. En los capítulos anteriores os contaba que hay cientos de organismos públicos cuyos datos son manifiestamente erróneos. Es el caso, por ejemplo, del Ayuntamiento de Centenera…
Hoy he dado un paso más en la validación de los datos de los contratantes y contratistas: he buscado todos los NIF en el censo de contribuyentes de la Agencia Tributaria 🎉.
Así he podido cazar errores difíciles de cazar.
¡Veamos uno muy escurridizo! 👇
Se trata de los datos erróneos de la empresa pública HOSTELERÍA ASTURIANA, S. A. (HOASA). En el portal de contratación del Estado, y si te fijas mucho, puedes ver dos NIF diferentes para esta empresa, lo cual ya es un cantazo…
Aunque para encontrarlo hace falta sacarse un doctorado, porque el portal y su «buscador» tienen tela…
Es para achatarrarlo, rociarlo con gasolina y prenderlo fuego.
El caso es que para HOASA nos están dando estos NIF:
👉 A03024007
👉 A33013160
¿Y cuál es el correcto?
Esta imagen describe el algoritmo de validación de los NIF españoles de personas jurídicas. No he logrado encontrarlo en ningún documento normativo oficial (como el BOE). Lo más parecido que he encontrado es esta página de la Junta de Andalucía…
Tras aplicar este algoritmo a los dos NIF que veíamos antes, y que son los que constan para la empresa pública HOASA en los datos oficiales, llegamos a la conclusión de que…
🎉 ¡Ambos son válidos!
Por cierto, ¿sabéis esas páginas de internet donde metes un DNI y te dicen si es válido o no? Pues no las uséis, porque algunas también están mal 🤣.
A mí me da igual porque al final he programado yo los algoritmos y los he testeado, pero a saber qué hacen esas páginas…
Así que tenemos dos NIF válidos para una empresa pública… y eso no puede ser. Uno sobra. ¿Cuál?
La Agencia Tributaria tiene un servicio web al que es posible enviar un NIF y te responden si les consta en el censo de contribuyentes.
Les he enviado unas decenas de miles… 🤓
Incluyendo el de HOASA. Y esto es lo que me ha respondido Hacienda:
❌ A03024007 no pertenece a nadie
✅ A33013160 es el NIF de HOASA.
Nótese que el NIF incorrecto cumple el algoritmo de cálculo del dígito de control de un NIF español.
👌 Es válido porque supera la prueba de validación
👎 Pero es incorrecto porque no pertenece a nadie
Es muy difícil dar con este caso (y otros similares que estoy encontrando).
Pero, ¿qué ha pasado? ¿cómo ha llegado el NIF incorrecto a los datos oficiales? Se trata de dos números muy diferentes, así que no parece que sea que les ha bailado una cifra al teclearlo…
Como buen frik… digo… ingeniero, TENGO QUE LLEGAR HASTA EL FINAL DE ESTE ASUNTO 🤣.
Lo que ha pasado es que alguien en vaya-usted-a-saber qué despacho ha confundido el NIF de la empresa pública con su código DIR3.
✨ El DIR3 es el «Directorio Común de Unidades Orgánicas y Oficinas», un cacharrito para identificar organismos públicos.
1️⃣ ¡Muchos códigos DIR3 tienen la misma forma que un NIF! Quien fuere que inventó los códigos DIR3 debería, en mi opinión, haberlos dado una forma diferente. Porque ahora son fáciles de confundir con los NIF. Que es justo lo que ha pasado.
Un paréntesis… 😉
Hace tiempo me hacía en voz alta esta reflexión sobre la conveniencia de utilizar bases numéricas distintas a la decimal para los códigos administrativos…
2️⃣ El azar ha querido que el código DIR3 de HOASA satisfaga el algoritmo de validación de un NIF español. Estadísticamente hay una probabilidad entre 23 de que esto suceda (un 4,3 %).
Infrecuente, pero posible.
Así que aunque en la Plataforma de Contratación validaran los datos que introducen los órganos del Estado —algo que ya hemos visto en capítulos anteriores que no hacen—, no habrían detectado este problema con HOASA.
Pero ya estoy yo aquí para meter el dedo en el ojo 🤣.
Lógicamente este escurridizo caso lo he encontrado procesando masiva y automáticamente, con los programas que estoy escribiendo, todos los expedientes que he descargado.
No es que vaya mirando de uno en uno cada organismo… 😃🔫.
¿Y por qué estoy a la caza y resolución de estos errores?
He descargado 3,2 millones de expedientes y he hecho un buscador para explorarlos. Si cada expediente cupiese en un folio, todos juntos cubrirían el césped de 28 campos de fútbol.
En la herramienta que voy a publicar podrás escribir el nombre de una empresa, un ayuntamiento… y navegar por todos sus contratos. Pero con tantísimos datos… ¿cómo saber cuáles son exactamente las adjudicaciones de la entidad que te interesa?
Por su NIF. Y si el NIF está mal…
Así que hay que limpiar, estructurar, organizar y relacionar los datos públicos. Una tarea que algunos días se parece a lo del vídeo. Pero… ¿y lo que nos vamos a reír luego levantando las alfombras de todos los concejales de España? 😂🔥🔥🔥
Y que todo arda.
• • •
Missing some Tweet in this thread? You can try to
force a refresh
Hoy he dedicado mi día a perfeccionar el método de extracción del NIF de los contratistas que encuentro en los datos oficiales. A priori parece fácil. Basta con utilizar el dígito de control (o la letra) para comprobar la validez de cada NIF.
Chupado, ¿verdad? Pues no.
El problema es bastante más complejo. Y, algorítmicamente, muy interesante.
La primera vuelta de tuerca viene cuando el funcionario aplica la imaginación a la hora de escribir el NIF en el expediente. Pero tiene fácil solución 🎉.
Pero con tantísimos contratos públicos, tarde o temprano te encuentras con casos más exóticos, como estos de la imagen. Porque las herramientas informáticas de algunas administraciones no validan los datos al introducirlos, así que pueden escribir cualquier cosa…
❗️ Lo que dice Mikel es para reflexionar. ¿Qué transparencia es esta si para utilizar los datos públicos hay que ser un supermán o darse la paliza que me estoy dando? Las AAPP tienen que publicar datos que tengan un mínimo de calidad.
Y la calidad del dato no es solo que estén libre de errores (los que me leéis os lo estaréis pasando pipa con la cantidad de ellos que estoy cazando y comentando). Es también que los datos sean precisos.
Qué curioso esto. Entre los órganos de contratación del Estado encuentro RUMASA. La empresa original, la de 1961 que fue expropiada en 1983. Está aún en liquidación.
Por cotillear, me he bajado el último informe de auditoría y las cuentas anuales, donde se resume la historia. 👇
No puedo enlazar el documento porque es uno de esos enlaces mágicos del Estado que desaparecen… ☹️. Ni siquiera Google llega a ellos, y por lo tanto no aparecen en buscadores.
Documentos públicos que no se publican.
La transparencia de Schrödinger.
La historia de siempre.
La memoria dice que el culebrón de RUMASA provocó MÁS DE 1.500 JUICIOS y procedimientos.
📄 Anoche explicaba que hay miles de expedientes oficiales de contratación con datos erróneos de empresas, y ponía ejemplos. Bueno, ¡pues también en los órganos de contratación hay errores!
De verdad, alucino con la pésima calidad de los datos públicos. Me explico… 👇
El órgano de contratación es la entidad pública que contrata. El pagano (el que paga, vamos). Cuando este órgano es una corporación local (un ayuntamiento), su NIF comienza por la letra «P».
Es lo que sucede, por ejemplo, en el Ayuntamiento de Torrelavega (Cantabria). 👇
Sin embargo, hay entes públicos cuyos datos están mal en la Plataforma de Contratación del Sector Público 🤦♂️. Es el caso, por ejemplo, del Ayuntamiento de Vierlas (Zaragoza). Han puesto un DNI en lugar del NIF del ayuntamiento. Y eso no puede ser. 👇
Observo que en los contratos públicos el nombre de un mismo contratista puede aparecer de muchas formas diferentes:
ACME, S.A.
ACME, S. A.
ACME S.A.
ACME SA
ACME SOCIEDAD ANÓNIMA
…
En mi herramienta quiero presentar los nombres de una forma homogénea, dentro de lo posible. ¿Alguien sabe si hay una forma canónica, un estándar para nombrar?
Se me ha ocurrido ir a la Agencia Tributaria y mirar su listado de grandes morosos. Suelen hacer estas cosas bien™️.
Pero parece que en la AEAT tampoco hay una forma canónica, estándar, de nombrar las sociedades. Solo en esta página aleatoria del listado de morosos veo que utilizan hasta cuatro sufijos diferentes para las sociedades limitadas.
Esta noche estoy en una fiesta.
¡Es la fiesta de los NIF de los contratistas del Estado 🎉🥳🍾!
Os lo cuento… 🧵
A los contratos públicos concurren licitadores (empresas y autónomos) que presentan sus ofertas. El nombre del ganador (o ganadores, pues pueden ser varios si el contrato tiene lotes) queda grabado con letras áureas en los anales de la historia: el expediente del contrato.
(Sí; eso de «los anales de la historia» suena fatal).