Ben Wilbrink Profile picture
Mar 9, 2023 37 tweets 8 min read Read on X
Toetsen & onderwijs. Een Gordiaanse kluwen van belanghebbende partijen heeft zich sinds de 60er jaren op die toetsen gestort. Onderwijs bezwijkt onder de last, de leerlingen voorop. Stoppen ermee. Dat toetsen heeft geen baten meer, alleen maar torenhoge kosten. Wat denkt u?
Als ik duizend woorden krijg voor een helikoptervisie op beoordelen/toetsen/testen en onderwijs, wat is dan belangrijk genoeg om er zeker in op te nemen?
Ik ga wat proberen, anders komt het er niet van. Toch? Discussie is welkom. Leraren zijn mijn doelgroep.
Bovenaan mijn lijstje staat dan de vraag 'Op welke manier zijn er grenzen gesteld aan het handelen van leraren?' En dan bedoel ik niet de voorschriften van het CvTE bij de centrale eindexamens. Wat hier voor leraren geldt, geldt uiteraard ook voor de Cito's van het land.
Ik denk dan aan een drieslag, hoewel deze drie niet strict van elkaar zijn te scheiden. 1) integriteit, in de zin van passend/functioneel binnen het onderwijs. 2) het recht, in het bijzonder betreft dat algemene beginselen als 'fair play', motivering, evenredigheid. 3) ethiek.
Niet strict van elkaar te scheiden: het recht vraagt dat toetsing integer is; ethiek vraagt dat toetsing integer is en dat het recht is gerespecteerd.
In deze context betekent 'integer' NIET dat toetsen allereerst aan psychometrische eisen (betrouwbaarheid, validiteit) voldoen,
betekent 'het recht' NIET wat onder onderwijsrecht wordt verstaan (zoals bij Noorlander 'Recht doen aan leerlingen en ouders' te vinden), en is 'ethiek' misschien een vooral onontgonnen gebied waar bijvoorbeeld @IngridRobeyns onze gids zou kunnen zijn.
Uit deze drie leidende beginselen, laat ik ze zo maar noemen, volgt vrijwel al het andere. Althans, dat is mijn stelling.
Allereerst volgt eruit dat het bij al dat beoordelen of toetsen in de eerste plaats gaat om de INDIVIDUELE leerling die recht heeft op goed onderwijs.
En dat is een geweldig inzicht, omdat vrijwel alles wat er over toetsen en beoordelen in het onderwijs is geschreven en geregeld gaat over GROEPEN leerlingen die toetsen maken en waarover overgangsbeslissingen worden genomen, statistieken berekend, en ga zo maar door.
Eind jaren '60 gebeurt er iets bijzonders. Adriaan de Groot en Bob van Naerssen pakken ideologisch gedreven uit met een boek (1969) over studietoetsen (= vierkeuzetoetsen). Na de onderdompeling in deze technocratische vorm van toetsen, komt bij beiden een moment van bezinning.
De Groot schrijft in 1970 een artikel waarin hij pleit voor een overkoepelend kwaliteitscriterium voor toetsen: die moeten voor de leerling doeltreffend zijn voor te bereiden. Strategisch dus ook. Van Naerssen geeft daar in zijn inaugurele rede in 1970 een wiskundig model voor.
Beide publicaties maken in feite korte metten met heel het technocratisch apparaat (de psychometrie) dat in één koop vanuit de Verenigde Staten naar ons polderland was gehaald. Beiden nemen de INDIVIDUELE leerling als uitgangspunt bij het ontwerpen van toetsen. Revolutionair.
In feite te revolutionair voor dit land van dominees en kooplieden, want er is nauwelijks aandacht aan besteed. Voor Bob van Naerssen was een teleurstelling dat zijn tentamenmodel plat was gevallen, en niet tot verder onderzoek en ontwikkeling leidde.
Ik was zelf eigenlijk de enige die er wèl mee aan de slag ging (zie mijn website, bijvoorbeeld het SPA-model; op mijn website ook de 1970-publicaties va zowel De Groot als Van Naerssen), maar ook mijn werk kreeg geen belangstelling. 'It's all in the game', in goed Nederlands.
Integer toetsen is een kwestie van kritisch gezond verstand, en afdwingbaar langs de weg van de kwaliteitseis 'evidence informed' te werken. Dat beoordelen binnen de grenzen van het recht blijft is in het hoger onderwijs afdwingbaar via beroepsprocedures (CoBEx). Het hoger
onderwijs loopt hier sterk voor op het vo en po. Zie Job Cohen 1981 'Studierechten' benwilbrink.nl/projecten/toet…; Henk van Berkel Henk van Berkel (2017). Juridisch correct examineren. Implicaties van uitspraken door beroepsorganen in het hoger onderwijs. nvexamens.nl/wp-content/upl…
Wie leerlingen beoordeelt, krijgt ook te maken met ethische dilemma's. Al is het maar het dilemma dat die algemene beginselen van behoorlijk bestuur/onderwijs best wel lastig kunnen zijn in de praktijk van het onderwijs: lap je ze dan aan je laars, of investeer je er juist in?
'Vijven en zessen' van A.D. de Groot sloeg in 1966 in als een bom, maar heeft niet echt geleid tot verbeterde toetsen. Wat weten we nu eigenlijk over dat cijfergeven? Het cijfergeven is vooral een 19e-eeuwse poging om het gangbare rangordenen van leerlingen te 'objectiveren'.
Cijfergeven is nog steeds rangordenen, het is relatief, er zijn geen absolute normen. Leraren hebben buitengewoon sterke tradities/gewoonten bij dat cijfergeven, door Posthumus in De Gids 1940 beschreven dbnl.org/tekst/_gid0011… Zittenblijven/afstromen altijd ca 23%. Dat is gek!
Omdat cijfers relatief zijn, is er strijd met het beginsel van A.D. de Groot dat toetsen doeltreffend moeten zijn voor te bereiden. Immers, het is praktisch onmogelijk voor leerlingen om zich collectief doeltreffend voor te bereiden op iedereen een '8'. Laat het even inzinken.
Posthumus heeft laten zien dat leraren kennelijk niet anders kunnen dan telkens een vast percentage onvoldoende te geven, te laten zitten, niet toe te laten.
Maar dat moet betekenen dat leerlingen als collectief evenmin bij machte zijn om dat traditionele patroon te doorbreken.
Wat is er aan de hand met deze toetserij? Want laten we wel wezen, dit fenomeen is compleet in strijd met hoe langs rationele weg selectieprocedures worden ontworpen. Hier is iedere ratio ver te zoeken, behalve de ratio 'we gaan het niet anders doen dan onze voorouders deden'.
Maar is het louter traditie? Of zijn er ook 'systemische' krachten aan het werk die we door die traditie heen niet goed in de peiling hebben? 'Vijven en zessen' gaf al iets aan van onderlinge concurrentie van leraren. Zouden leraren misschien ook met leerlingen in concurrentie
zijn? Wat denkt u? Socioloog James Coleman hup.harvard.edu/catalog.php?is… presenteerde een model voor zeg maar een 'stilzwijgende onderhandeling' tussen leraren en leerlingen. De leraren zetten hun cijfers in, in ruil voor tijdbesteding van hun leerlingen.
Tegelijk zetten leerlingen hun tijdbesteding in om goede cijfers van hun leraren te krijgen. Een dynamisch systeem, waarin leraren en leerlingen elkaar in een houdgreep hebben, en geen van beide partijen in staat lijkt de beoordelingstradities te veranderen. Zou dat kunnen?
Ja, dat kan, ik heb het aannemelijk kunnen maken met een dataset voor de propedeuse rechten (UvA, 1992) benwilbrink.nl/publicaties/92…
Maar dit is in het onderwijs geen gezonde situatie hè! Dat cijfergeven moet echt worden aangepakt. En dat kan in beginsel best makkelijk, want het
is in feite niet nodig om goed onderwijs te geven, en daar integere vormen van toetsing bij te gebruiken. Tot aan de uitvinding van cijfers als pseudo-gestandaardiseerde vorm van rangordenen in de 19e eeuw deden we het immers zonder. Maar wel met altijd maar weer rangordenen.
Dat rangordenen is voor goed onderwijs niet nodig. Het was een manier om leerlingen te motiveren, maar heeft altijd het bezwaar gehad dat het alleen de beste leerlingen motiveert. Zowel rangordenen als cijfergeven scheppen een eigen, onveilige, schoolwereld—los van inhouden.
Oké, ik pad de draad weer op. Het voorgaande is bijeengeharkt in: threadreaderapp.com/thread/1633742…
Wat volgt: vakmatig beoordelen (iets anders dan cijfergeven hè!), en weer concreter/praktischer dus. En een persoonlijke noot: de kiem voor dit alles was al eind 70er jaren gelegd.
Het probleem is nu dat 'vakmatig beoordelen' sterk is besmet door de eeuwenlange traditie van rangordenen. Het is dus niet zo, helaas, dat weghalen van het cijfergeven (stop ermee, zegt Dylan Wiliam) voldoende is om een zuiver vakmatige beoordeling over te houden.
Er is een ijzersterke koppeling tussen het 'vijven en zessen' van het cijfergeven, en de moeilijkheid van vragen in toetsen en examens. Moeilijkheid die in de buurt van 60% wordt gehouden door ontwikkelaars, of dat nu leraren zelf zijn, of leraren in dienst van bijvoorbeeld Cito.
Een opgave wiskunde die 40% van de leerlingen niet goed beantwoorden mag wiskundig gezien helemaal oké zijn, maar in het onderwijs is het van de gekke om in toetsen vragen op te nemen die gemiddeld zo moeilijk zijn. Want dat staat haaks op wat er voor onderwijs nodig is.
Zulke moeilijke toetsen belemmeren leerlingen bij het zich doeltreffend voorbereiden (De Groot, 1970); zijn voor de meeste leerlingen demotiverend, zo niet erger; zijn op zich geen goed leermoment; en zijn ook niet optimaal wat het consolideren van kennis betreft.
Ik heb destijds in mijn 'Toetsvragen schrijven' (Aula 809, 1983) deze thematiek van gemiddeld te moeilijke vragen over het hoofd gezien. Gemiste kans. Destijds heb ik wel gebruik van de taxonomie van Bloom c.s. ontraden, zoals ook van meerkeuzevragen in het onderwijs.
Wat heb ik over het hoofd gezien? Ik heb nog te weinig aandacht gegeven aan 'backwash' effecten. Een paar opmerkingen daarover, ter afsluiting. Dat toetsen en examens enorme invloed hebben op het eraan voorafgaande, dat weet iedereen wel. Toch wordt er zelden naar gehandeld.
Voor Bob van Naerssen stond het vast dat toetsen een sterke hefboom zijn die we op het onderwijs zetten. Ten goede, of ten kwade. Het voorbeeld-bij-uitstek van het kwade is de 'citotoets' die in een halve eeuw tijd het basisonderwijs sterk heeft misvormd.
Het is een waarheid als een koe (waar we onze ogen liever voor sluiten) dat alle prestatie-indicatoren, ook toetsen en examens, hun betekenis als indicatoren verliezen zodra er sancties aan worden gekoppeld. Dan gaat iedereen zich strategisch gedragen, hoe schadelijk ook.
We doen het onszelf aan, door toetsen en examens te behandelen als losstaand van het onderwijs, in plaats van als integraal onderdeel van onderwijs, instructie, en leren.
Weten we nu in welke richting we het moeten zoeken, met ons toetsen en examineren? Ja toch?

• • •

Missing some Tweet in this thread? You can try to force a refresh
 

Keep Current with Ben Wilbrink

Ben Wilbrink Profile picture

Stay in touch and get notified when new unrolls are available from this author!

Read all threads

This Thread may be Removed Anytime!

PDF

Twitter may remove this content at anytime! Save it as PDF for later use!

Try unrolling a thread yourself!

how to unroll video
  1. Follow @ThreadReaderApp to mention us!

  2. From a Twitter thread mention us with a keyword "unroll"
@threadreaderapp unroll

Practice here first or read more on our help page!

More from @benwilbrink

Feb 23
Wroetend in mijn omgevallen boekenkast kom ik iets verrassends tegen. Het zal wel weer een publicatie van Patrick Suppes zijn? Ja, 'Testing theories and the foundations of statistics'. Dat natuurkundigen van alle tijden zich niets aantrokken van meetfouten. Ptolemeus, Newton, /1
Laplace, Maxwell, de hele quantum mechanica. Lees het zelf:
De publicaties van filosoof etc. Patrick Suppes, altijd waardevol, zijn lastig te vinden; zijn corpus is afgeschermd voor Stanfordianen, maar zie bijv. van 1976-1980: /2suppescorpusd9.sites.stanford.edu/sites/g/files/…
suppescorpusd9.sites.stanford.edu/bibliography/1…
Ontbrekende aandacht voor meetfouten in natuurkundige publicaties (lesmethoden dus ook) wekt de indruk dat het hier om exacte wetenschap gaat, als zou het wiskunde zijn. Nancy Cartwright laat zien dat zoiets een misvatting is: (1993). 'How the laws of physics lie. Oxford UP /3
Read 12 tweets
Feb 4
Nadenkend over de geschiedenis van beoordelen in het onderwijs van de 20e eeuw kom ik op de volgende stelling:
De overgang van het eeuwenoude rangordenen op het moderne cijfergeven, 2e helft 19e eeuw (citaat uit Wilbrink 1997), leidde tot een andere selectieve cultuur. Image
Ging het bij het rangordenen om de strijd om de beste te zijn, beloond met een prijsboek (), bij het cijfergeven was het voortaan zaak niet tot de slechtsten te horen: 'onvoldoende' cijfers betekenden zittenblijven of afstromen.repository.ubn.ru.nl/handle/2066/26…
Maar dat cijfergeven is niet iets totaal anders dan het rangordenen () hè! Cijfergeven is nog steeds rangordenen, maar het is een vorm van gestandaardiseerd rangordenen, en tegelijk een sterkere kwantificering van (verschillen in) prestaties.press.princeton.edu/books/hardcove…
Read 35 tweets
Nov 18, 2023
Toetsresultaten scheiden in 'onvoldoende' en 'voldoende' resultaten.
'Is absoluut noodzakelijk' is natuurlijk te verdedigen: meteen 'onvoldoendes' en 'zittenblijven' afschaffen leidt tot chaos.
Maar het bredere perspectief is anders. Zouden we het beoordelen in onderwijs opnieuw mogen ontwerpen, is het werken met cesuren dan optimaal?
'Dat spreekt vanzelf' ligt erg voor de hand. Ik heb mij bij herhaling en over meerdere decennia schuldig gemaakt aan deze stilzwijgende vooronderstelling.
Maar de juistheid van die vooronderstelling moet echt worden onderzocht. Ik heb daarin gefaald, hoewel vaak op het randje.
Read 31 tweets
Sep 29, 2023
Inzicht van de dag.

Een belangrijke bron van ongelijkheid in het onderwijs zelf zijn de talrijke toetsen en tests.

Dat zit zo. Een toets maken is een gelegenheid bij uitstek om kennis te consolideren. En dat werkt alleen wanneer de opdrachten ook maakbaar zijn: makkelijk.
Bij de heersende toetsideologie van niet alleen leraren zelf, maar vooral van leveranciers zoals het Cito, zijn toetsvragen vooral MOEILIJK. In die visie zijn toetsvragen ideaal die de helft van de leerlingen goed kunnen maken.

De hel op aarde, voor te veel leerlingen.
Sorry, mijn vingers schoten even uit over het toetsenbord.

Wat neemt een leerling mee van toetsen/toetsvragen die te moeilijk zijn? Op zijn best helemaal niks, zonde van de tijd. Dat mag eens een keer gebeuren, maar wanneer dit stelselmatig is, groeien leerlingen uit elkaar.
Read 13 tweets
Sep 11, 2023
Wat test een eindtoets basisonderwijs?
Jammer dat er maar 4 alternatieven zijn. Ik kom er dinsdag natuurlijk inhoudelijk op terug.
Na 125 deelnemers tekent zich een interessante verdeling af. Ik moet me maar eens gaan voorbereiden op een snuggere duiding van een en ander. Ga ondertussen door met beantwoorden van deze eenvoudige eindtoetsvraag. (Het is niet gezegd dat er maar één antwoord goed is ... )
Read 68 tweets
Sep 7, 2023
Eindtoetsmythe #1: Vanzelfsprekend is het al dan niet op grond van de eindtoets bijgestelde advies bepalend voor de toelating tot voortgezet onderwijs.
Kort commentaar: er zijn alternatieven hè! Elders gaat het anders, misschien beter? Thorbecke: laat ouders de keuze. 1/n
Eindtoetsmythe #2: De eindtoets is een objectief gegeven naast het advies van de school.
Kort commentaar: dit is een vage kreet. Professioneel gaat het om de informatie die zo'n toets toevoegt aan wat overigens al bekend is (en dat zit juist in het advies, nietwaar).
2/n
Eindtoetsmythe #3: het gaat om zo goed mogelijk te voorspellen welke type vo passend blijkt.
Kort commentaar: maar zo werkt de toets als een self-fulfilling prophecy'. Professioneel gaat het om validiteit van de toelating tot vo, EXPERIMENTEEL te bepalen. Echt iets anders.
3/n
Read 35 tweets

Did Thread Reader help you today?

Support us! We are indie developers!


This site is made by just two indie developers on a laptop doing marketing, support and development! Read more about the story.

Become a Premium Member ($3/month or $30/year) and get exclusive features!

Become Premium

Don't want to be a Premium member but still want to support us?

Make a small donation by buying us coffee ($5) or help with server cost ($10)

Donate via Paypal

Or Donate anonymously using crypto!

Ethereum

0xfe58350B80634f60Fa6Dc149a72b4DFbc17D341E copy

Bitcoin

3ATGMxNzCUFzxpMCHL5sWSt4DVtS8UqXpi copy

Thank you for your support!

Follow Us!

:(