Hace unos días explicaba cómo descargar la Base de Datos Nacional de Subvenciones, sorteando los obstáculos del portal del Ministerio de Hacienda que dificultan el acceso a los datos.
👇 A continuación comparto cómo trabajar estos datos.
La base de datos contiene registros tanto de empresas, fundaciones, partidos… como de personas.
✅ De las subvenciones a empresas vamos a escudriñar hasta el último átomo.
❌ A las personas y sus circunstancias las vamos a proteger disociando y anonimizando sus datos.
Si bien el servidor de Hacienda nos devuelve los datos en forma JSON, en el hilo anterior opté por transformarlos a un formato tabular y más compacto: CSV.
Para trabajar este formato emplearé una popular herramienta de línea de comandos: CSVkit
El NIF de una persona jurídica española está formado por una letra indicativa de su naturaleza¹ seguida de siete cifras y un dígito de control, que puede ser un guarismo o una letra de la A a la J.²
💡 Vamos a apalancarnos en este patrón para separar las subvenciones a empresas y entidades de las subvenciones a personas.
👍 Obtenemos así 3,82 millones de subvenciones a entidades.
Ahora es trivial extraer el nombre del beneficiario —décima columna— y ordenarlos por frecuencia.
¡Allá vamos! 👇
Obtenemos así las organizaciones que más subvenciones parecen haber recibido, que son:
🥇 El Consejo Superior de Investigaciones Científicas
🥈 La Cruz Roja
🥉 Las universidades públicas
🎖️ La Diputación de Almería
…
También podemos reunir todo en un solo comando y reducir el análisis exclusivamente a las sociedades anónimas y limitadas, que son aquellos beneficiarios cuyo NIF comienza por las letras A y B respectivamente.
Esto arroja las empresas españolas que más veces aparecen en la BDNS como concesionarias de subvenciones públicas. De un vistazo rápido, parecen empresas de producción agrícola, de servicios, Telefónica, un hotel en Bilbao, Iberia…
👇 La primera columna es el número de ayudas.
⚠️ ¡Cuidado! Hasta aquí, esto es solo una curiosidad estadística. No extraigamos aún rápidas pero erróneas conclusiones cuñadas de estos primeros resultados.
Hay que entrar al detalle y ahondar más en los datos antes de extraer conclusiones significativas.
He subido los datos a GitHub. Propongo juntar muchos cerebros y hacer algo creativo para auditar a nuestros gestores públicos:
🤓 Programadores
📈 Analistas de datos
✍️ Periodistas
💅 Diseñadores
👨👩👦 …
A continuación voy a explicar cómo descargar la Base de Datos Nacional de Subvenciones (BDNS) desde su portal oficial del Ministerio de Hacienda: infosubvenciones.es.
✅ El portal ofrece un buscador limitado
⛔ Pero no permite descargar los datos
¡Vamos allá! 💪
🧵…
El portal oficial tiene notables limitaciones. Entre ellas destacan dos: los límites a la descarga de datos y el tiempo de respuesta del portal.
1️⃣ La funcionalidad de descarga que ofrece el Ministerio simplemente no funciona si tu búsqueda comprende más de 10.000 resultados.
El Ministerio podría haber paliado parcialmente esta limitación permitiendo la exportación de los primeros 10.000 resultados de las búsquedas que arrojen más. En vez de esto, ponen al ciudadano en un callejón sin salida: si hay muchos resultados, no puedes exportar ninguno. 🤷
Regarding this dataset of companies classified to contract with the government, published by the Ministry of Finance and Public Administrations of Spain…
Es la transparencia de Schrödinger: transparente y opaco a la vez. 🤷
El art. 344 de la Ley de Contratos del Sector Público (LCSP) establece que el ROLECE «será público y se podrá acceder de forma abierta previa identificación». Y que un reglamento «determinará modalidades y requisitos para la publicidad del Registro».
Ayer estuve trabajando en la exportación a XLSX (Excel…) de los resultados de las búsquedas de contratos y contratistas.
Hubiera bastado con exportar a CSV, pero he implementado la generación de una tabla con autofiltros, enlaces, formatos… Está quedando guay™️. 😃
El interfaz web que estoy programando es suficiente para explorar los datos. Pero las búsquedas están paginadas. Al darle al ciudadano un botón de descarga XLSX, puede bajarse todo de golpe. Y utilizar Excel o LibreOffice o lo que quiera… para hacer el análisis que desee.
Para el caso de Cantabria ya implementé un botón de descarga directa con el que quien quiera puede bajarse todo y trabajarlo plácidamente desde la intimidad de su hogar 😂. El Gobierno no ofrece tal opción… Fue un placer programarlo; especialmente si molesta a algún político. 👌🏼