Ben Wilbrink Profile picture
Feb 4 35 tweets 8 min read Read on X
Nadenkend over de geschiedenis van beoordelen in het onderwijs van de 20e eeuw kom ik op de volgende stelling:
De overgang van het eeuwenoude rangordenen op het moderne cijfergeven, 2e helft 19e eeuw (citaat uit Wilbrink 1997), leidde tot een andere selectieve cultuur. Image
Ging het bij het rangordenen om de strijd om de beste te zijn, beloond met een prijsboek (), bij het cijfergeven was het voortaan zaak niet tot de slechtsten te horen: 'onvoldoende' cijfers betekenden zittenblijven of afstromen.repository.ubn.ru.nl/handle/2066/26…
Maar dat cijfergeven is niet iets totaal anders dan het rangordenen () hè! Cijfergeven is nog steeds rangordenen, maar het is een vorm van gestandaardiseerd rangordenen, en tegelijk een sterkere kwantificering van (verschillen in) prestaties.press.princeton.edu/books/hardcove…
Geheel in overeenstemming met het 19e-eeuwse streven naar standaardiseren en nauwkeuriger kwantificeren ('The values of precision' ).
Dat mag allemaal zo zijn, de precisie van het cijfergeven is vooral bedrieglijk, 'window dressing', schone schijn.press.princeton.edu/books/paperbac…
Ik geef hier twee aanwijzingen voor die schone schijn. De eerste kent u wel, het door Posthumus 1940 beschreven effect van vrijwel constante percentages zittenblijvers in de HBS, tot 1940, wat er ook in de wereld veranderde (en dat was heel wat).dbnl.org/tekst/_gid0011…
De tweede aanwijzing: het analysemodel van James Coleman (1990 ) maakt aannemelijk dat leerlingen en leraren in voortdurende 'onderhandeling' zijn over te behalen, respectievelijk te geven cijfers. Ze hebben elkaar in een houdgreep. hup.harvard.edu/books/97806743…
benwilbrink.nl/publicaties/92…
Er zijn tegelijk andere voor het beoordelen belangrijke ontwikkelingen. Ik noem er weer twee. Allereerst is dat de explosie van de deelname aan (publiek) onderwijs.. Vervolgens is dat de invloed van de intelligentietest op onderwijs en samenleving. Of is die volgorde omgekeerd?
Beide genoemde ontwikkelingen vormden echt een breuk met al het voorgaande in de geschiedenis van het beoordelen in onderwijs, reden om mijn 1997 'geschiedenis' ervan af te sluiten rond het jaar 1900. Het is een fikse uitdaging die geschiedenis uit te breiden met de 20e eeuw.
Met welk type probleem heb ik eigenlijk te maken, bij een geschiedenis van 'educational assessment and measurement' in de 20e eeuw? Ik begin te vermoeden dat het probleem wel eens in de sfeer van emergentie kan liggen. Wat dat is?
Een 'nieuw' fenomeen op basis van talloze micro-gebeurtenissen. Temperatuur is een voorbeeld van emergentie; temperatuur is de resultante van bewegingen van atomen, het is geen eigenschap van atomen. Gasdruk: idem. Over emergentie zie bijvoorbeeld: mitpress.mit.edu/9780262524759/…
De vraag is bijvoorbeeld of de impliciete onderhandeling tussen leerlingen enerzijds en leraren anderzijds over cijfers volgens model van James Coleman een emergent verschijnsel is. Concreter: bijvoorbeeld of zak-slaaggrenzen (bij overgangen, examens) een emergent fenomeen zijn.
Hoe er in het onderwijs ook beoordeeld en gewaardeerd wordt, niets daarvan gebeurt op basis van absolute normen. Ook het antwoord op de vraag 2 + 2 = ? : vragen op dit niveau stellen we niet bij eindexamens (hoop ik dan maar). Of vragen passend zijn, is contextueel, relatief.
Als normen voor beoordeling en waardering niet absoluut zijn, dan zijn ze kennelijk de resultante van tal van kleine invloeden en beslissingen van betrokkenen: emergent. Nota bene: dit is niet hetzelfde als het cesuurprobleem in de onderwijsliteratuur research.utwente.nl/en/publication…
Een belangrijke vraag is hoe betrokkenen, of een bepaalde partij, deze loop der dingen kan onderbreken.
Tot de geschiedenis van het beoordelen in de 20e eeuw behoren dan ook eventuele pogingen om de traditie te doorbreken. Zoals daar zijn: door de inzet van psychologische tests (vooral in de USA); Bloom's leren voor beheersing; cijfervrij onderwijs; methoden voor cesuurbepaling.
Een wel heel speciaal doorbreken van beoordelingsgewoonten is de inzet van een loting in plaats van vergelijkende selectie voor het verdelen van schaarse studieplaatsen in het hoger onderwijs. Eigenpromotie, ik weet het. Maar toch hè! (ook in het Engels)benwilbrink.wordpress.com/2023/07/11/in-…
Ik kan misschien het best aan de hand van het cijfergeven analyseren wat ik van een geschiedenis van beoordelen in onderwijs in de 20e eeuw verwacht, en wat nut en noodzaak ervan is.
In de 20e eeuw weet vrijwel niemand meer wat de oorsprong en idee van het cijfergeven is. De auteur van 'Vijven en zessen', A. D. de Groot, bekende dat de vraag naar de oorsprong van dat cijfergeven niet bij hem opgekomen was. In de literatuur zijn cijferstelsels een gegeven.
Zonder inzicht in de wortels van cijfergeven in het rangordene gaat dat cijfergeven een eigen leven leiden. Dat gaat nog enigszins goed bij beantwoorden van de vraag naar het meetniveau van cijfers: dat is ordinaal, je mag niet middelen (doen we toch, wat kan het schelen).
En zo stuit ik onverwacht en na een goede nachtrust op wat een verschil is tussen een geschiedenis van toetsen, en kritische analyse ervan. Een geschiedenis gaat over het hoe en waarom van de ontwikkelingen.
Cijfergeven was na zijn brede adoptie in het onderwijsveld gewoon een gereedschap dat ook van pas kwam waar het oorspronkelijk niet voor was bedoeld, niets mee te maken had. Behaalde cijfers waren bijvoorbeeld een mooie kapstok om overgangsbeslissingen aan op te hangen.
Of dat past bij oorspronkelijke bedoelingen is goed om te weten voor een normatieve analyse van beoordelen en toetsen (doen we het eigenlijk wel goed, moet het misschien anders, en hoe dan?), maar voor een historische analyse kan het blijven bij een constatering.
Langs deze lijn zijn er ontwikkelingen van eind 19e eeuw tot begin van de 21e die op interessante wijze in elkaar haken, elkaar soms versterken, soms dempen. Ik noem alvast het wijd verbreide denken over toetsen in termen van de psychometrie: die kwam velen kennelijk van pas.
'Wat velen kennelijk van pas kwam' is ook een inzicht dat deze geschiedenis vele (groepen van) actoren of belanghebbenden kent, binnen brede maatschappelijke ontwikkelingen. De 19e eeuw: opkomst van examens voor van alles en nog wat. Wat heb je in je mars, niet wie is je vader.
Begin 21e eeuw: de ICT-industrie doet een greep in de budgetten van het publieke onderwijs, vooral met lobby voor digitaliseren van examens als paard van Troje voor algehele digitalisering. (Ben Willamson brengt die netwerken in beeld) ChatGPT gaat als smeerolie fungeren.
unroll @threadreaderapp
Deze draad begon ik met een stelling over een verschuiving in de cultuur van het beoordelen in de klas. Daar moet ik nog wat mee. Interessanter is dat deze draad een verkenning is geworden, een verkenning naar mogelijkheden voor een geschiedenis van beoordelen in de 20e eeuw.
Die verkenning is nog maar net begonnen, maar dit begin smaakt naar meer. Ik wil er echt mee doorgaan, maar sluit deze draad hier voorlopig af. Ik ga nog wat droodelen met een conceptmap; als die wat inzicht biedt, hang ik hem hier als slot aan de draad.
PS Voorkennis activeren (de stelling in tweet #1) is vaak nuttig. Zo zie ik nu plots dat overgaan van rangordenen op cijfergeven het mogelijk maakte dat leerlingen en leraren in voortdurende impliciete onderhandeling zijn over die cijfers. Bingo!benwilbrink.nl/publicaties/92…
Over een klassieke rangorde valt voor leraren/docenten niets te onderhandelen: gemaakte fouten bepalen de rangorde. Leerlingen kunnen wèl aan de bak: meer tijd investeren levert een beter resultaat op. Tenzij anderen dat ook fanatiek gaan doen: het is wel competitief.
Voor een geschiedenis van beoordelen in onderwijs zoek ik naar de kern van de zaak, waarop ik kan bouwen. Die kern is mogelijk: alle beoordelen en waarderen in onderwijs is relatief, absolute maatstaven bestaan hier niet. Bij cijfergeven wordt dat dus touwtrekken tussen actoren.
Ik vermoed dat ik hiermee een fundament heb voor een geschiedenis van beoordelen in de 20e eeuw. In een ontwerp voor zo'n bouwwerk komen veel zaken aan de orde die al uitgebreid op mijn website staan. Mogelijk is dat een tikje eenzijdig, dat is dan het lot van de wetenschapper.
De hele draad, tot hier, is als pdf beschikbaar:
Wie erover wil discussiëren, of vragen heeft: graag.threadreaderapp.com/thread/1754101…
'Beoordelen en waarderen': het onderscheid tussen die twee is wel van belang hè!
Bij het rangordenen gaat het om gemaakte fouten in opgegeven werk: kwestie van beoordelen. Daar kan wel iets van waardering insluipen, maar de kern is vakinhoudelijk oordelen.
Bij het cijfergeven gaat het er aanvankelijk om, zoals bij de Agrégation halverwege de 19e eeuw, zo dicht mogelijk bij het rangordenen te blijven. Dat duurt niet lang: het cijfergeven wordt een autonoom gereedschap voor leraren, het wordt de waardering van beoordeeld werk.

• • •

Missing some Tweet in this thread? You can try to force a refresh
 

Keep Current with Ben Wilbrink

Ben Wilbrink Profile picture

Stay in touch and get notified when new unrolls are available from this author!

Read all threads

This Thread may be Removed Anytime!

PDF

Twitter may remove this content at anytime! Save it as PDF for later use!

Try unrolling a thread yourself!

how to unroll video
  1. Follow @ThreadReaderApp to mention us!

  2. From a Twitter thread mention us with a keyword "unroll"
@threadreaderapp unroll

Practice here first or read more on our help page!

More from @benwilbrink

Apr 22
Contextrekenopgaven: algebraïseren.
Stelling: we zijn ons door versimpelde contexten in rekenmethoden en -examens niet meer goed bewust van hoe lastig algebraïseren van concrete situaties vaak is.
Hoe algebraïseert u bijvoorbeeld wat er gebeurt bij toetsen van beheersing?
Er moet toch een wiskundig model zijn op te stellen, want we hebben er wel voor gezorgd dat de toets kwantiteiten oplevert, zoals 'aantal goed'.
Als u er niet uit komt, waar zou u in de literatuur gaan zoeken naar mogelijke modellen?
Misschien moet ik toch twee aanwijzingen geven:
1) de beheersing van de stof moet in het model voorkomen, noem deze 'p'.
2) een toets is geen meting, maar een steekproef; of eigenlijk: evenveel steekproeven als er bijvoorbeeld vragen in de toets zijn, noem dit aantal 'n'.
Read 31 tweets
Feb 23
Wroetend in mijn omgevallen boekenkast kom ik iets verrassends tegen. Het zal wel weer een publicatie van Patrick Suppes zijn? Ja, 'Testing theories and the foundations of statistics'. Dat natuurkundigen van alle tijden zich niets aantrokken van meetfouten. Ptolemeus, Newton, /1
Laplace, Maxwell, de hele quantum mechanica. Lees het zelf:
De publicaties van filosoof etc. Patrick Suppes, altijd waardevol, zijn lastig te vinden; zijn corpus is afgeschermd voor Stanfordianen, maar zie bijv. van 1976-1980: /2suppescorpusd9.sites.stanford.edu/sites/g/files/…
suppescorpusd9.sites.stanford.edu/bibliography/1…
Ontbrekende aandacht voor meetfouten in natuurkundige publicaties (lesmethoden dus ook) wekt de indruk dat het hier om exacte wetenschap gaat, als zou het wiskunde zijn. Nancy Cartwright laat zien dat zoiets een misvatting is: (1993). 'How the laws of physics lie. Oxford UP /3
Read 12 tweets
Nov 18, 2023
Toetsresultaten scheiden in 'onvoldoende' en 'voldoende' resultaten.
'Is absoluut noodzakelijk' is natuurlijk te verdedigen: meteen 'onvoldoendes' en 'zittenblijven' afschaffen leidt tot chaos.
Maar het bredere perspectief is anders. Zouden we het beoordelen in onderwijs opnieuw mogen ontwerpen, is het werken met cesuren dan optimaal?
'Dat spreekt vanzelf' ligt erg voor de hand. Ik heb mij bij herhaling en over meerdere decennia schuldig gemaakt aan deze stilzwijgende vooronderstelling.
Maar de juistheid van die vooronderstelling moet echt worden onderzocht. Ik heb daarin gefaald, hoewel vaak op het randje.
Read 31 tweets
Sep 29, 2023
Inzicht van de dag.

Een belangrijke bron van ongelijkheid in het onderwijs zelf zijn de talrijke toetsen en tests.

Dat zit zo. Een toets maken is een gelegenheid bij uitstek om kennis te consolideren. En dat werkt alleen wanneer de opdrachten ook maakbaar zijn: makkelijk.
Bij de heersende toetsideologie van niet alleen leraren zelf, maar vooral van leveranciers zoals het Cito, zijn toetsvragen vooral MOEILIJK. In die visie zijn toetsvragen ideaal die de helft van de leerlingen goed kunnen maken.

De hel op aarde, voor te veel leerlingen.
Sorry, mijn vingers schoten even uit over het toetsenbord.

Wat neemt een leerling mee van toetsen/toetsvragen die te moeilijk zijn? Op zijn best helemaal niks, zonde van de tijd. Dat mag eens een keer gebeuren, maar wanneer dit stelselmatig is, groeien leerlingen uit elkaar.
Read 13 tweets
Sep 11, 2023
Wat test een eindtoets basisonderwijs?
Jammer dat er maar 4 alternatieven zijn. Ik kom er dinsdag natuurlijk inhoudelijk op terug.
Na 125 deelnemers tekent zich een interessante verdeling af. Ik moet me maar eens gaan voorbereiden op een snuggere duiding van een en ander. Ga ondertussen door met beantwoorden van deze eenvoudige eindtoetsvraag. (Het is niet gezegd dat er maar één antwoord goed is ... )
Read 68 tweets
Sep 7, 2023
Eindtoetsmythe #1: Vanzelfsprekend is het al dan niet op grond van de eindtoets bijgestelde advies bepalend voor de toelating tot voortgezet onderwijs.
Kort commentaar: er zijn alternatieven hè! Elders gaat het anders, misschien beter? Thorbecke: laat ouders de keuze. 1/n
Eindtoetsmythe #2: De eindtoets is een objectief gegeven naast het advies van de school.
Kort commentaar: dit is een vage kreet. Professioneel gaat het om de informatie die zo'n toets toevoegt aan wat overigens al bekend is (en dat zit juist in het advies, nietwaar).
2/n
Eindtoetsmythe #3: het gaat om zo goed mogelijk te voorspellen welke type vo passend blijkt.
Kort commentaar: maar zo werkt de toets als een self-fulfilling prophecy'. Professioneel gaat het om validiteit van de toelating tot vo, EXPERIMENTEEL te bepalen. Echt iets anders.
3/n
Read 35 tweets

Did Thread Reader help you today?

Support us! We are indie developers!


This site is made by just two indie developers on a laptop doing marketing, support and development! Read more about the story.

Become a Premium Member ($3/month or $30/year) and get exclusive features!

Become Premium

Don't want to be a Premium member but still want to support us?

Make a small donation by buying us coffee ($5) or help with server cost ($10)

Donate via Paypal

Or Donate anonymously using crypto!

Ethereum

0xfe58350B80634f60Fa6Dc149a72b4DFbc17D341E copy

Bitcoin

3ATGMxNzCUFzxpMCHL5sWSt4DVtS8UqXpi copy

Thank you for your support!

Follow Us!

:(