Ben Wilbrink Profile picture
psychology & educational research, involving assessment in particular; debunking pseudo-science, obscurantism, bureaucracy

Feb 4, 2024, 35 tweets

Nadenkend over de geschiedenis van beoordelen in het onderwijs van de 20e eeuw kom ik op de volgende stelling:
De overgang van het eeuwenoude rangordenen op het moderne cijfergeven, 2e helft 19e eeuw (citaat uit Wilbrink 1997), leidde tot een andere selectieve cultuur.

Ging het bij het rangordenen om de strijd om de beste te zijn, beloond met een prijsboek (), bij het cijfergeven was het voortaan zaak niet tot de slechtsten te horen: 'onvoldoende' cijfers betekenden zittenblijven of afstromen.repository.ubn.ru.nl/handle/2066/26…

Maar dat cijfergeven is niet iets totaal anders dan het rangordenen () hè! Cijfergeven is nog steeds rangordenen, maar het is een vorm van gestandaardiseerd rangordenen, en tegelijk een sterkere kwantificering van (verschillen in) prestaties.press.princeton.edu/books/hardcove…

Geheel in overeenstemming met het 19e-eeuwse streven naar standaardiseren en nauwkeuriger kwantificeren ('The values of precision' ).
Dat mag allemaal zo zijn, de precisie van het cijfergeven is vooral bedrieglijk, 'window dressing', schone schijn.press.princeton.edu/books/paperbac…

Ik geef hier twee aanwijzingen voor die schone schijn. De eerste kent u wel, het door Posthumus 1940 beschreven effect van vrijwel constante percentages zittenblijvers in de HBS, tot 1940, wat er ook in de wereld veranderde (en dat was heel wat).dbnl.org/tekst/_gid0011…

De tweede aanwijzing: het analysemodel van James Coleman (1990 ) maakt aannemelijk dat leerlingen en leraren in voortdurende 'onderhandeling' zijn over te behalen, respectievelijk te geven cijfers. Ze hebben elkaar in een houdgreep. hup.harvard.edu/books/97806743…
benwilbrink.nl/publicaties/92…

Er zijn tegelijk andere voor het beoordelen belangrijke ontwikkelingen. Ik noem er weer twee. Allereerst is dat de explosie van de deelname aan (publiek) onderwijs.. Vervolgens is dat de invloed van de intelligentietest op onderwijs en samenleving. Of is die volgorde omgekeerd?

Beide genoemde ontwikkelingen vormden echt een breuk met al het voorgaande in de geschiedenis van het beoordelen in onderwijs, reden om mijn 1997 'geschiedenis' ervan af te sluiten rond het jaar 1900. Het is een fikse uitdaging die geschiedenis uit te breiden met de 20e eeuw.

Met welk type probleem heb ik eigenlijk te maken, bij een geschiedenis van 'educational assessment and measurement' in de 20e eeuw? Ik begin te vermoeden dat het probleem wel eens in de sfeer van emergentie kan liggen. Wat dat is?

Een 'nieuw' fenomeen op basis van talloze micro-gebeurtenissen. Temperatuur is een voorbeeld van emergentie; temperatuur is de resultante van bewegingen van atomen, het is geen eigenschap van atomen. Gasdruk: idem. Over emergentie zie bijvoorbeeld: mitpress.mit.edu/9780262524759/…

De vraag is bijvoorbeeld of de impliciete onderhandeling tussen leerlingen enerzijds en leraren anderzijds over cijfers volgens model van James Coleman een emergent verschijnsel is. Concreter: bijvoorbeeld of zak-slaaggrenzen (bij overgangen, examens) een emergent fenomeen zijn.

Hoe er in het onderwijs ook beoordeeld en gewaardeerd wordt, niets daarvan gebeurt op basis van absolute normen. Ook het antwoord op de vraag 2 + 2 = ? : vragen op dit niveau stellen we niet bij eindexamens (hoop ik dan maar). Of vragen passend zijn, is contextueel, relatief.

Als normen voor beoordeling en waardering niet absoluut zijn, dan zijn ze kennelijk de resultante van tal van kleine invloeden en beslissingen van betrokkenen: emergent. Nota bene: dit is niet hetzelfde als het cesuurprobleem in de onderwijsliteratuur research.utwente.nl/en/publication…

Een belangrijke vraag is hoe betrokkenen, of een bepaalde partij, deze loop der dingen kan onderbreken.

Tot de geschiedenis van het beoordelen in de 20e eeuw behoren dan ook eventuele pogingen om de traditie te doorbreken. Zoals daar zijn: door de inzet van psychologische tests (vooral in de USA); Bloom's leren voor beheersing; cijfervrij onderwijs; methoden voor cesuurbepaling.

Een wel heel speciaal doorbreken van beoordelingsgewoonten is de inzet van een loting in plaats van vergelijkende selectie voor het verdelen van schaarse studieplaatsen in het hoger onderwijs. Eigenpromotie, ik weet het. Maar toch hè! (ook in het Engels)benwilbrink.wordpress.com/2023/07/11/in-…

Ik kan misschien het best aan de hand van het cijfergeven analyseren wat ik van een geschiedenis van beoordelen in onderwijs in de 20e eeuw verwacht, en wat nut en noodzaak ervan is.

In de 20e eeuw weet vrijwel niemand meer wat de oorsprong en idee van het cijfergeven is. De auteur van 'Vijven en zessen', A. D. de Groot, bekende dat de vraag naar de oorsprong van dat cijfergeven niet bij hem opgekomen was. In de literatuur zijn cijferstelsels een gegeven.

Zonder inzicht in de wortels van cijfergeven in het rangordene gaat dat cijfergeven een eigen leven leiden. Dat gaat nog enigszins goed bij beantwoorden van de vraag naar het meetniveau van cijfers: dat is ordinaal, je mag niet middelen (doen we toch, wat kan het schelen).

En zo stuit ik onverwacht en na een goede nachtrust op wat een verschil is tussen een geschiedenis van toetsen, en kritische analyse ervan. Een geschiedenis gaat over het hoe en waarom van de ontwikkelingen.

Cijfergeven was na zijn brede adoptie in het onderwijsveld gewoon een gereedschap dat ook van pas kwam waar het oorspronkelijk niet voor was bedoeld, niets mee te maken had. Behaalde cijfers waren bijvoorbeeld een mooie kapstok om overgangsbeslissingen aan op te hangen.

Of dat past bij oorspronkelijke bedoelingen is goed om te weten voor een normatieve analyse van beoordelen en toetsen (doen we het eigenlijk wel goed, moet het misschien anders, en hoe dan?), maar voor een historische analyse kan het blijven bij een constatering.

Langs deze lijn zijn er ontwikkelingen van eind 19e eeuw tot begin van de 21e die op interessante wijze in elkaar haken, elkaar soms versterken, soms dempen. Ik noem alvast het wijd verbreide denken over toetsen in termen van de psychometrie: die kwam velen kennelijk van pas.

'Wat velen kennelijk van pas kwam' is ook een inzicht dat deze geschiedenis vele (groepen van) actoren of belanghebbenden kent, binnen brede maatschappelijke ontwikkelingen. De 19e eeuw: opkomst van examens voor van alles en nog wat. Wat heb je in je mars, niet wie is je vader.

Begin 21e eeuw: de ICT-industrie doet een greep in de budgetten van het publieke onderwijs, vooral met lobby voor digitaliseren van examens als paard van Troje voor algehele digitalisering. (Ben Willamson brengt die netwerken in beeld) ChatGPT gaat als smeerolie fungeren.

unroll @threadreaderapp

Deze draad begon ik met een stelling over een verschuiving in de cultuur van het beoordelen in de klas. Daar moet ik nog wat mee. Interessanter is dat deze draad een verkenning is geworden, een verkenning naar mogelijkheden voor een geschiedenis van beoordelen in de 20e eeuw.

Die verkenning is nog maar net begonnen, maar dit begin smaakt naar meer. Ik wil er echt mee doorgaan, maar sluit deze draad hier voorlopig af. Ik ga nog wat droodelen met een conceptmap; als die wat inzicht biedt, hang ik hem hier als slot aan de draad.

PS Voorkennis activeren (de stelling in tweet #1) is vaak nuttig. Zo zie ik nu plots dat overgaan van rangordenen op cijfergeven het mogelijk maakte dat leerlingen en leraren in voortdurende impliciete onderhandeling zijn over die cijfers. Bingo!benwilbrink.nl/publicaties/92…

Over een klassieke rangorde valt voor leraren/docenten niets te onderhandelen: gemaakte fouten bepalen de rangorde. Leerlingen kunnen wèl aan de bak: meer tijd investeren levert een beter resultaat op. Tenzij anderen dat ook fanatiek gaan doen: het is wel competitief.

Voor een geschiedenis van beoordelen in onderwijs zoek ik naar de kern van de zaak, waarop ik kan bouwen. Die kern is mogelijk: alle beoordelen en waarderen in onderwijs is relatief, absolute maatstaven bestaan hier niet. Bij cijfergeven wordt dat dus touwtrekken tussen actoren.

Ik vermoed dat ik hiermee een fundament heb voor een geschiedenis van beoordelen in de 20e eeuw. In een ontwerp voor zo'n bouwwerk komen veel zaken aan de orde die al uitgebreid op mijn website staan. Mogelijk is dat een tikje eenzijdig, dat is dan het lot van de wetenschapper.

De hele draad, tot hier, is als pdf beschikbaar:
Wie erover wil discussiëren, of vragen heeft: graag.threadreaderapp.com/thread/1754101…

'Beoordelen en waarderen': het onderscheid tussen die twee is wel van belang hè!
Bij het rangordenen gaat het om gemaakte fouten in opgegeven werk: kwestie van beoordelen. Daar kan wel iets van waardering insluipen, maar de kern is vakinhoudelijk oordelen.

Bij het cijfergeven gaat het er aanvankelijk om, zoals bij de Agrégation halverwege de 19e eeuw, zo dicht mogelijk bij het rangordenen te blijven. Dat duurt niet lang: het cijfergeven wordt een autonoom gereedschap voor leraren, het wordt de waardering van beoordeeld werk.

Share this Scrolly Tale with your friends.

A Scrolly Tale is a new way to read Twitter threads with a more visually immersive experience.
Discover more beautiful Scrolly Tales like this.

Keep scrolling