Nadenkend over de geschiedenis van beoordelen in het onderwijs van de 20e eeuw kom ik op de volgende stelling:
De overgang van het eeuwenoude rangordenen op het moderne cijfergeven, 2e helft 19e eeuw (citaat uit Wilbrink 1997), leidde tot een andere selectieve cultuur.
Ging het bij het rangordenen om de strijd om de beste te zijn, beloond met een prijsboek (), bij het cijfergeven was het voortaan zaak niet tot de slechtsten te horen: 'onvoldoende' cijfers betekenden zittenblijven of afstromen.repository.ubn.ru.nl/handle/2066/26…
Maar dat cijfergeven is niet iets totaal anders dan het rangordenen () hè! Cijfergeven is nog steeds rangordenen, maar het is een vorm van gestandaardiseerd rangordenen, en tegelijk een sterkere kwantificering van (verschillen in) prestaties.press.princeton.edu/books/hardcove…
Geheel in overeenstemming met het 19e-eeuwse streven naar standaardiseren en nauwkeuriger kwantificeren ('The values of precision' ).
Dat mag allemaal zo zijn, de precisie van het cijfergeven is vooral bedrieglijk, 'window dressing', schone schijn.press.princeton.edu/books/paperbac…
Ik geef hier twee aanwijzingen voor die schone schijn. De eerste kent u wel, het door Posthumus 1940 beschreven effect van vrijwel constante percentages zittenblijvers in de HBS, tot 1940, wat er ook in de wereld veranderde (en dat was heel wat).dbnl.org/tekst/_gid0011…
De tweede aanwijzing: het analysemodel van James Coleman (1990 ) maakt aannemelijk dat leerlingen en leraren in voortdurende 'onderhandeling' zijn over te behalen, respectievelijk te geven cijfers. Ze hebben elkaar in een houdgreep. hup.harvard.edu/books/97806743… benwilbrink.nl/publicaties/92…
Er zijn tegelijk andere voor het beoordelen belangrijke ontwikkelingen. Ik noem er weer twee. Allereerst is dat de explosie van de deelname aan (publiek) onderwijs.. Vervolgens is dat de invloed van de intelligentietest op onderwijs en samenleving. Of is die volgorde omgekeerd?
Beide genoemde ontwikkelingen vormden echt een breuk met al het voorgaande in de geschiedenis van het beoordelen in onderwijs, reden om mijn 1997 'geschiedenis' ervan af te sluiten rond het jaar 1900. Het is een fikse uitdaging die geschiedenis uit te breiden met de 20e eeuw.
Met welk type probleem heb ik eigenlijk te maken, bij een geschiedenis van 'educational assessment and measurement' in de 20e eeuw? Ik begin te vermoeden dat het probleem wel eens in de sfeer van emergentie kan liggen. Wat dat is?
Een 'nieuw' fenomeen op basis van talloze micro-gebeurtenissen. Temperatuur is een voorbeeld van emergentie; temperatuur is de resultante van bewegingen van atomen, het is geen eigenschap van atomen. Gasdruk: idem. Over emergentie zie bijvoorbeeld: mitpress.mit.edu/9780262524759/…
De vraag is bijvoorbeeld of de impliciete onderhandeling tussen leerlingen enerzijds en leraren anderzijds over cijfers volgens model van James Coleman een emergent verschijnsel is. Concreter: bijvoorbeeld of zak-slaaggrenzen (bij overgangen, examens) een emergent fenomeen zijn.
Hoe er in het onderwijs ook beoordeeld en gewaardeerd wordt, niets daarvan gebeurt op basis van absolute normen. Ook het antwoord op de vraag 2 + 2 = ? : vragen op dit niveau stellen we niet bij eindexamens (hoop ik dan maar). Of vragen passend zijn, is contextueel, relatief.
Als normen voor beoordeling en waardering niet absoluut zijn, dan zijn ze kennelijk de resultante van tal van kleine invloeden en beslissingen van betrokkenen: emergent. Nota bene: dit is niet hetzelfde als het cesuurprobleem in de onderwijsliteratuur research.utwente.nl/en/publication…
Een belangrijke vraag is hoe betrokkenen, of een bepaalde partij, deze loop der dingen kan onderbreken.
Tot de geschiedenis van het beoordelen in de 20e eeuw behoren dan ook eventuele pogingen om de traditie te doorbreken. Zoals daar zijn: door de inzet van psychologische tests (vooral in de USA); Bloom's leren voor beheersing; cijfervrij onderwijs; methoden voor cesuurbepaling.
Een wel heel speciaal doorbreken van beoordelingsgewoonten is de inzet van een loting in plaats van vergelijkende selectie voor het verdelen van schaarse studieplaatsen in het hoger onderwijs. Eigenpromotie, ik weet het. Maar toch hè! (ook in het Engels)benwilbrink.wordpress.com/2023/07/11/in-…
Ik kan misschien het best aan de hand van het cijfergeven analyseren wat ik van een geschiedenis van beoordelen in onderwijs in de 20e eeuw verwacht, en wat nut en noodzaak ervan is.
In de 20e eeuw weet vrijwel niemand meer wat de oorsprong en idee van het cijfergeven is. De auteur van 'Vijven en zessen', A. D. de Groot, bekende dat de vraag naar de oorsprong van dat cijfergeven niet bij hem opgekomen was. In de literatuur zijn cijferstelsels een gegeven.
Zonder inzicht in de wortels van cijfergeven in het rangordene gaat dat cijfergeven een eigen leven leiden. Dat gaat nog enigszins goed bij beantwoorden van de vraag naar het meetniveau van cijfers: dat is ordinaal, je mag niet middelen (doen we toch, wat kan het schelen).
En zo stuit ik onverwacht en na een goede nachtrust op wat een verschil is tussen een geschiedenis van toetsen, en kritische analyse ervan. Een geschiedenis gaat over het hoe en waarom van de ontwikkelingen.
Cijfergeven was na zijn brede adoptie in het onderwijsveld gewoon een gereedschap dat ook van pas kwam waar het oorspronkelijk niet voor was bedoeld, niets mee te maken had. Behaalde cijfers waren bijvoorbeeld een mooie kapstok om overgangsbeslissingen aan op te hangen.
Of dat past bij oorspronkelijke bedoelingen is goed om te weten voor een normatieve analyse van beoordelen en toetsen (doen we het eigenlijk wel goed, moet het misschien anders, en hoe dan?), maar voor een historische analyse kan het blijven bij een constatering.
Langs deze lijn zijn er ontwikkelingen van eind 19e eeuw tot begin van de 21e die op interessante wijze in elkaar haken, elkaar soms versterken, soms dempen. Ik noem alvast het wijd verbreide denken over toetsen in termen van de psychometrie: die kwam velen kennelijk van pas.
'Wat velen kennelijk van pas kwam' is ook een inzicht dat deze geschiedenis vele (groepen van) actoren of belanghebbenden kent, binnen brede maatschappelijke ontwikkelingen. De 19e eeuw: opkomst van examens voor van alles en nog wat. Wat heb je in je mars, niet wie is je vader.
Begin 21e eeuw: de ICT-industrie doet een greep in de budgetten van het publieke onderwijs, vooral met lobby voor digitaliseren van examens als paard van Troje voor algehele digitalisering. (Ben Willamson brengt die netwerken in beeld) ChatGPT gaat als smeerolie fungeren.
unroll @threadreaderapp
Deze draad begon ik met een stelling over een verschuiving in de cultuur van het beoordelen in de klas. Daar moet ik nog wat mee. Interessanter is dat deze draad een verkenning is geworden, een verkenning naar mogelijkheden voor een geschiedenis van beoordelen in de 20e eeuw.
Die verkenning is nog maar net begonnen, maar dit begin smaakt naar meer. Ik wil er echt mee doorgaan, maar sluit deze draad hier voorlopig af. Ik ga nog wat droodelen met een conceptmap; als die wat inzicht biedt, hang ik hem hier als slot aan de draad.
PS Voorkennis activeren (de stelling in tweet #1) is vaak nuttig. Zo zie ik nu plots dat overgaan van rangordenen op cijfergeven het mogelijk maakte dat leerlingen en leraren in voortdurende impliciete onderhandeling zijn over die cijfers. Bingo!benwilbrink.nl/publicaties/92…
Over een klassieke rangorde valt voor leraren/docenten niets te onderhandelen: gemaakte fouten bepalen de rangorde. Leerlingen kunnen wèl aan de bak: meer tijd investeren levert een beter resultaat op. Tenzij anderen dat ook fanatiek gaan doen: het is wel competitief.
Voor een geschiedenis van beoordelen in onderwijs zoek ik naar de kern van de zaak, waarop ik kan bouwen. Die kern is mogelijk: alle beoordelen en waarderen in onderwijs is relatief, absolute maatstaven bestaan hier niet. Bij cijfergeven wordt dat dus touwtrekken tussen actoren.
Ik vermoed dat ik hiermee een fundament heb voor een geschiedenis van beoordelen in de 20e eeuw. In een ontwerp voor zo'n bouwwerk komen veel zaken aan de orde die al uitgebreid op mijn website staan. Mogelijk is dat een tikje eenzijdig, dat is dan het lot van de wetenschapper.
'Beoordelen en waarderen': het onderscheid tussen die twee is wel van belang hè!
Bij het rangordenen gaat het om gemaakte fouten in opgegeven werk: kwestie van beoordelen. Daar kan wel iets van waardering insluipen, maar de kern is vakinhoudelijk oordelen.
Bij het cijfergeven gaat het er aanvankelijk om, zoals bij de Agrégation halverwege de 19e eeuw, zo dicht mogelijk bij het rangordenen te blijven. Dat duurt niet lang: het cijfergeven wordt een autonoom gereedschap voor leraren, het wordt de waardering van beoordeeld werk.
• • •
Missing some Tweet in this thread? You can try to
force a refresh
I want to start a thread about a special theme.
Educational careers extend over about 20 years. That means that very small effects can accumulate to a major effect. That especially concerns everything that has to do with assessment. Think along with me, if you want.
A simple example to start with. The multiple-choice format of tests forces students to make many considerations that are not relevant for open questions. Such as guessing when not knowing. For a single test, that is not a problem. But as a daily routine, for twenty years?
What does that do to students? This is a question I have had for almost half a century. In that half century I have not come across any research on this. I will check it again in Scholar See?scholar.google.nl/scholar?hl=nl&…
Ik woon een paar honderd meter van een Agora-school. Een oud-rechter vertelt ons dat zij haar zoon naar dit wonderwijs stuurt [Aisha Dutrieux, Volkskrant 8-8] . De jongen zal beste tegen de nodige problemen aanlopen, maar zijn ouders gaan dat prima voor hem oplossen. /n
'Eigentijds rekenen', wat mag dat zijn? Ik vraag dat naar aanleiding van het artikel 'Naar heldere, eigentijdse kerndoelen voor rekenen en wiskunde' in Van 12 tot 18, mei 2023. Ja, ik loop achter met bijhouden van mijn literatuur. Maar toch, ik sla er steil van achterover. /n
De vroegste populaire Europese rekenboeken berusten op het uitvoerige werk uit 1202 van Fibonacci: 'Liber abaci' . Rekenen is in die meer dan 800 tussenliggende jaren niet 'eigentijdser' geworden. Dus waar is SLO nu mee bezig? Ah, met 4 'domeinen'! /nlink.springer.com/book/10.1007/9…
1) de wiskundige attitude, 2) wiskundige denk- en werkwijzen, 3) wiskundige concepten, 4) wiskunde en de wereld. Bent u er nog? Erg 21e-eeuws vaardig. De kerndoelen moeten ook nog bijdragen aan gelijke kansen voor leerlingen, staat in de opdracht van OCW aan SLO. Lees maar: /n
Contextrekenopgaven: algebraïseren.
Stelling: we zijn ons door versimpelde contexten in rekenmethoden en -examens niet meer goed bewust van hoe lastig algebraïseren van concrete situaties vaak is.
Hoe algebraïseert u bijvoorbeeld wat er gebeurt bij toetsen van beheersing?
Er moet toch een wiskundig model zijn op te stellen, want we hebben er wel voor gezorgd dat de toets kwantiteiten oplevert, zoals 'aantal goed'.
Als u er niet uit komt, waar zou u in de literatuur gaan zoeken naar mogelijke modellen?
Misschien moet ik toch twee aanwijzingen geven: 1) de beheersing van de stof moet in het model voorkomen, noem deze 'p'. 2) een toets is geen meting, maar een steekproef; of eigenlijk: evenveel steekproeven als er bijvoorbeeld vragen in de toets zijn, noem dit aantal 'n'.
Wroetend in mijn omgevallen boekenkast kom ik iets verrassends tegen. Het zal wel weer een publicatie van Patrick Suppes zijn? Ja, 'Testing theories and the foundations of statistics'. Dat natuurkundigen van alle tijden zich niets aantrokken van meetfouten. Ptolemeus, Newton, /1
Ontbrekende aandacht voor meetfouten in natuurkundige publicaties (lesmethoden dus ook) wekt de indruk dat het hier om exacte wetenschap gaat, als zou het wiskunde zijn. Nancy Cartwright laat zien dat zoiets een misvatting is: (1993). 'How the laws of physics lie. Oxford UP /3
Toetsresultaten scheiden in 'onvoldoende' en 'voldoende' resultaten.
'Is absoluut noodzakelijk' is natuurlijk te verdedigen: meteen 'onvoldoendes' en 'zittenblijven' afschaffen leidt tot chaos.
Maar het bredere perspectief is anders. Zouden we het beoordelen in onderwijs opnieuw mogen ontwerpen, is het werken met cesuren dan optimaal?
'Dat spreekt vanzelf' ligt erg voor de hand. Ik heb mij bij herhaling en over meerdere decennia schuldig gemaakt aan deze stilzwijgende vooronderstelling.
Maar de juistheid van die vooronderstelling moet echt worden onderzocht. Ik heb daarin gefaald, hoewel vaak op het randje.