Frederico Muñoz Profile picture
Cloud & Architecture Lead, Europe @SASsoftware. @kubernetesio 1.25-1.30 RT. Unix, LISP, Archaeology (@letras_ulisboa), Physics (@FC_UL). @fsm@mastodon.sdf.org

Sep 22, 2020, 14 tweets

Direita? Esquerda? Centro? Onde se devem sentar os partidos? Qual a proximidade entre eles?

Com base na análise de todas as votações da passada legislatura pode-se ir para além dos discursos

nbviewer.jupyter.org/github/fsmunoz…

#DataScience #portugal

* CDU separada de BE/Livre(JKM)
* PAN como primeira separação mas "à esquerda"
* PS agrupado com PSD
* IL/CDS/CH próximos

- Partidos à esquerda mais próximos em termos absolutos que os à direita
- Ainda assim, partidos à direita com menores diferenças no grupo IL/CDS/CH
- PS quase equidistante mas com maior proximidade à direita.
- LIVRE/JKM mais próximos do BE

Visualização integrada com reagrupação dos partidos de acordo com a distância (método de Ward)

- Separação entre IL e CDS-PP/CH (margem curta)
- Separação entre PS e PSD acontece antes (menor distância) que entre IL/CDS-PP/CH
- PCP+PEV / BE+L/JKM, com PAN diferenciado primeiro.

Clustering com 4 grupos e MDS para visualização de distâncias:

- "Linha" esquerda/direita parece fácil de identicar.
- Grupos anteriores são visíveis.
- À esquerda, CDU separa-se de BE/L/PAN (agrupados)
- PS+PSD, um bloco central em termos de votações.
- CDS-PP/IL/CH agrupados

MDS a 3 dimensões: "faça o seu próprio quadrante ideológico".

Redução das dimensões para 3D e visualização interactiva, com agrupamentos por Spectrum Clustering.

TL;DR: mais uma forma de ver os agrupamentos e distâncias entre partidos *baseando apenas nas suas votações*

(feito com #Python , #Jupyter , #ScikitLearn e #IBM Watson Studio com base em dados abertos do @parlamentopt )

Para terminar, uma imagem que resumo a 14a Legislatura e é a base para o que já foi mencionado: um "mapa térmico" de todas as votações no Parlamento (Iniciativas e Actividades) Cada linha é uma votação, cada coluna um partido. Mais que detalhes, identificam-se tendências.

- Maior tendência "A Favor" à esquerda
- Diferenciação do PS nos votos Contra
- Acompanhamento do PSD nos votos contra do PS
- Mais abstenções à direita
- Ausências no Livre/Joacine Katar Moreira e Chega
- PAN parece estar "deslocado"
- Aparente maior heterogeneidade à direita

Uma das perguntas que mais tenho recebido: mas afinal, quem vota mais vezes com quem? Actualizei a análise com estes dados e uma explicação da razão pela qual a matriz de distância é um melhor indicador.
Para já, os dados: quantidade de votações onde os partidos votaram o mesmo.

Contabilizar "apenas" isto descarta informação importante: uma Abstenção é diferente de um voto Contra, e esta análise considera que qualquer voto diferente tem o mesmo peso. O ideal seria pois saber não só quando votam de forma idêntica, mas a "distância" de quando não o fazem.

... e é isso que acaba por ser reflectido na matriz de distâncias e correspondente dendograma: a distância entre todos os partidos, e todas as votações, considerando que "Favor/Favor" < "Favor/Abstenção" < "Favor/Contra".
(imagem com os dados ao dia de hoje).

O momento actual ajudou ao interesse neste trabalho. De forma tangencial acrescento que uma análise inicial indica que a distribuição é essencialmente a mesma desde o início da legislatura. Votos de há um ano e de hoje foram feitos, nesta perspectiva, em contextos semelhantes.

Actualização: adicionada análise por "Tema", o que permite ver como os diferentes partidos divergem consoante o tema (Orçamento, Saúde, Educação, Europa, etc).
Os resultados têm como base diferentes quantidades (indicadas no título), quanto menos pior a leitura possível.

Share this Scrolly Tale with your friends.

A Scrolly Tale is a new way to read Twitter threads with a more visually immersive experience.
Discover more beautiful Scrolly Tales like this.

Keep scrolling