My Authors
Read all threads
🧵Draadje over de wet van #Benford.

1/

Dit draadje gaat over de wet van Benford en hoe je met deze wetmatigheid kunt controleren of data zijn gemanipuleerd of een natuurlijke oorsprong hebben.
2/

Wikipedia deel 1: De wet van Benford beschrijft de frequentieverdeling van het begincijfer van getallen in grote dataverzamelingen waarin een beperkte mate van stochasticiteit optreedt.
3/

Wikipedia deel 2: De wet van Benford werd in 1881 ontdekt door de Amerikaanse wiskundige en astronoom Simon Newcomb, maar kreeg grote bekendheid door de herontdekking en publicaties in 1938 van Frank Benford
4/

Wikipedia deel 3: In 1938 publiceerde Benford een artikel in een wetenschappelijk tijdschrift, waarin hij het verschijnsel beschrijft dat in veel verzamelingen van getallen uit het normale leven (maar niet allemaal) de meeste van die getallen met een 1 beginnen.
5/

Wikipedia deel 4: Minder getallen beginnen met een 2 en de minste met een 9. Dit wijst erop dat de kans om begincijfer te zijn niet voor alle cijfers van 1 tot en met 9 hetzelfde is.
6/

De wetmatigheid van Benford is eigenlijk best simpel. Als je een data set met getallen hebt, kijk je alleen naar het eerste getal van de getallen uit de dataset. Voorbeeld: 10, 24, 55, 33, 121, 9, 400 zou worden: 1, 2, 5, 3, 1, 9, 4
7/

Mits er niet is geknoeid met data komt daar altijd het volgende uit:

Getal 1 komt ≈ 30,1% voor
Getal 2 ≈ 17,6%
Getal 3 ≈ 12,5%
Getal 4 ≈ 9,7%
Getal 5 ≈ 7,9%
Getal 6 ≈ 6,7%
Getal 7 ≈ 5,8%
Getal 8 ≈ 5,1%
Getal 9 ≈ 4,6%

Een logaritmische lijn naar beneden.
8/

Op deze manier kun je dus verschillende data (bijna alle data!) controleren op fraude.

- Mocht je Netflix hebben raad ik aan de aflevering Digits van de serie Connected te kijken, dit is een makkelijke begrijpelijke uitleg over de wet van Benford. -
9/

Waarom begin ik over de wet van Benford in Corona tijd? Nou simpel. Als je naar de data van het RIVM omtrent Corona kijkt en je past daar de wet van Benford op toe, gaat het niet via de wet van Benford, oftewel de data is niet natuurlijk maar gefabriceerd / gemanipuleerd.
10/

Ik heb ongeveer 2 maanden lang iedere dag een update op Twitter gegeven met statistieken afkomstig van het #RIVM. Als ik deze nu met terugwerkende kracht volgens de wet van Benford controleer klopt het niet en ziet het er zo uit 👇🏻
11/

Mocht je denken dit is wel heel raar, probeer het zelf eens uit met bijvoorbeeld de eerste 20 transacties op je bankrekening. (Let op als de transactie begint met een 0, dan geld het eerste getal dat geen 0 is van die transactie.)

Je zult verbaast zijn dat dit altijd klopt.
12/

Online calculator:
dcode.fr/benford-law
Bijlagen/

De Benford curve ten opzichte van het aantal besmettingen in diverse landen.

Ook een tabel met Outliers, waarvan de data dus niet kloppen.
Missing some Tweet in this thread? You can try to force a refresh.

Keep Current with Gezond Verstand

Profile picture

Stay in touch and get notified when new unrolls are available from this author!

Read all threads

This Thread may be Removed Anytime!

Twitter may remove this content at anytime, convert it as a PDF, save and print for later use!

Try unrolling a thread yourself!

how to unroll video

1) Follow Thread Reader App on Twitter so you can easily mention us!

2) Go to a Twitter thread (series of Tweets by the same owner) and mention us with a keyword "unroll" @threadreaderapp unroll

You can practice here first or read more on our help page!

Follow Us on Twitter!

Did Thread Reader help you today?

Support us! We are indie developers!


This site is made by just two indie developers on a laptop doing marketing, support and development! Read more about the story.

Become a Premium Member ($3.00/month or $30.00/year) and get exclusive features!

Become Premium

Too expensive? Make a small donation by buying us coffee ($5) or help with server cost ($10)

Donate via Paypal Become our Patreon

Thank you for your support!