Ben Wilbrink Profile picture
Mar 4, 2022 41 tweets 10 min read Read on X
Karen Heij 'Van de kat en de bel. Tellen en vertellen met de eindtoets basisonderwijs' karenheij.bijzonderboeken.nl krijgt een repliek in 'De Psycholoog'. Dupliek van Heij, en commentaar van Marcel Veenman tijdschriftdepsycholoog.nl/artikelen/de-e… Open, bedankt @vittoriobusato @RedactieDP Draadje vv
De repliek van Rob Meijer en Klaas Sijtsma, in vol psychometrisch/methodologisch ornaat, geeft mooi en scherp aan wat mijns inziens het kernprobleem is met de standaard-toetserij in ons onderwijs, al dan niet via Cito:
"Mensen kunnen de Eindtoets gebruiken op een manier waar je van alles van kunt vinden, maar dat is een kwestie van beleid en politiek."

Dit staat haaks op alles wat er in de wereld van test- en toetspsychologie de laatste halve eeuw is uitgedokterd over kwaliteitsstandaarden.
Kunt u zich nog deze tweet van destijds Cito CEO Marten Roorda herinneren? En u weet toch dat die #rekentoets waar het over gaat uiteindelijk, na een half miljard euro van de belastingbetaler, met de vuilnisman is meegegeven?
Image
Disclosure. Zoals Karen in haar voorwoord aangeeft, heb ik haar op psychometrisch gebied met raad en daad terzijde gestaan. Ik zal dat nu ook doen.
Ik heb haar dupliek met veel genoegen gelezen, ze doet onverstoord haar verhaal over wat er problematisch is aan de eindtoets. /n
Ter zake. Zoals het citaat van Meijer en Sijtsma aangeeft, koppelen zij de TOETS zelf los van het GEBRUIK ervan. Is dat terecht? Dat is de hamvraag.
Er zijn psychologische tests in de handel die voor van alles en nog wat gebruikt kunnen worden. Zoals intelligentietests. /n
Als de overheid een bestaande intelligentietest wil gebruiken bij de toelating tot onderwijs, moet zij aannemelijk maken (onderzoeken) dat dit gebruik van de test valide is. Anders dan M & S stellen is er een legitieme validiteitskwestie bij het GEBRUIK van de test. /n
De Eindtoets Basisonderwijs is, anders dan een IQ-test, ontwikkeld voor één specifiek doel: betere beslissingen bij de overgang van basis- naar voortgezet onderwijs. De ontwikkelaar (Cito) is hier de verantwoordelijke om toets EN GEBRUIK te valideren. /n
Een voorbeeld. Als groeiend schaduwonderwijs zal validiteit van de Eindtoets bij de overgang naar het vo afnemen: de toets bevoordeelt steeds sterker de kinderen van ouders die investeren in schaduwonderwijs. Schaduwonderwijs is een vorm van 'coaching' (Standards) /n
'Validiteit' is het sleutelwoord. A.D. de Groot heeft er een nog steeds bruikbare paragraaf 8.2 over geschreven in zijn 1961 'Methodologie' dbnl.org/tekst/groo004m… Jammer dat hij aan de overgang basis- voortgezet onderwijs geen aandacht schonk. /n
Waar vindt u als ouder, leraar, bestuurder houvast voor deze kwaliteitseisen? In Nederland is de Commissie Testaangelegenheden (Cotan) (Nederlands Instituut voor Psychologen, NIP) de instantie die tests en gestandaardiseerde toetsen keurt. (uitzonderingen daargelaten) /n
De richtlijnen die de Cotan daarbij aanhoudt zijn de Amerikaanse 'Standards for Educational and Psychological Testing' 2014 testingstandards.net/open-access-fi…, zie het uitvoerige deel over 'validity'. Dit is een wereld-standaard.
Merk op dat validiteit gaat over GEBRUIK van toetsen. /n
Moet ik nog melden dat 'Van de kat en de bel. Tellen en vertellen met de eindtoets basisonderwijs' gaat over het GEBRUIK van de Eindtoets Basisonderwijs? En niet over de Eindtoets zelf?
Laat de professie ophouden met kokervisies zoals die uitspraak van Meijer en Sijtsma. /n
Disclosure. Zoals Karen in haar voorwoord aangeeft, heb ik haar op psychometrisch terrein met raad en daad terzijde gestaan. Ik zal dat nu ook doen.
Ik heb haar dupliek met veel genoegen gelezen, ze doet onverstoord haar verhaal over wat er problematisch is aan de eindtoets.
Ter zake. Zoals het citaat van Meijer en Sijtsma aangeeft, koppelen zij de TOETS zelf los van het GEBRUIK ervan. Is dat terecht? Dat is de hamvraag.
Er zijn psychologische tests in de handel die voor van alles en nog wat gebruikt kunnen worden. Zoals intelligentietests. /n
Als de overheid een bestaande intelligentietest wil gebruiken bij de toelating tot onderwijs, moet zij aannemelijk maken (onderzoeken) dat dit gebruik van de test valide is. Anders dan M & S stellen is er een legitieme validiteitskwestie bij het GEBRUIK van de test. /n
De Eindtoets Basisonderwijs is, anders dan een IQ-test, ontwikkeld voor één specifiek doel: betere beslissingen bij de overgang van basis- naar voortgezet onderwijs. De ontwikkelaar (Cito) is hier de verantwoordelijke om toets EN GEBRUIK te valideren. /n
Een voorbeeld. Als groeiend schaduwonderwijs zal validiteit van de Eindtoets bij de overgang naar het vo afnemen: de toets bevoordeelt steeds sterker de kinderen van ouders die investeren in schaduwonderwijs. Schaduwonderwijs is een vorm van 'coaching' (Standards) /n
'Validiteit' is het sleutelwoord. A.D. de Groot heeft er een nog steeds bruikbare paragraaf 8.2 over geschreven in zijn 1961 'Methodologie' dbnl.org/tekst/groo004m… Jammer dat hij aan de overgang basis- voortgezet onderwijs geen aandacht schonk. /n
Waar vindt u als ouder, leraar, bestuurder houvast voor deze kwaliteitseisen? In Nederland is de Commissie Testaangelegenheden (Cotan) (Nederlands Instituut voor Psychologen, NIP) de instantie die tests en gestandaardiseerde toetsen keurt. (uitzonderingen daargelaten) /n
De richtlijnen die de Cotan daarbij aanhoudt zijn de Amerikaanse 'Standards for Educational and Psychological Testing' 2014 testingstandards.net/open-access-fi…, zie het uitvoerige deel over 'validity'. Dit is een wereld-standaard.
Merk op dat validiteit gaat over GEBRUIK van toetsen. /n\
Moet ik nog melden dat 'Van de kat en de bel. Tellen en vertellen met de eindtoets basisonderwijs' gaat over het GEBRUIK van de Eindtoets Basisonderwijs? En niet over de Eindtoets zelf?
Laat de professie ophouden met kokervisies zoals die uitspraak van Meijer en Sijtsma. /n
Een lastige vraag waar Karen en ik niet tijdig uit konden komen: hoe is het in godsnaam mogelijk om met één enkele toets al die leerlingen redelijk valide te plaatsen in een stuk of 7 typen voortgezet onderwijs?
Dat kan ook niet, zie benwilbrink.wordpress.com/2020/09/24/kun… /einde (denk ik)
Oké, ik verwees naar de 'Standards' voor de eisen, internationaal en in NL, aan toetsgebruik, ook juridisch afdwingbaar. Maar die Standards gaan niet specifiek over de situatie van onze overgang basis- voortgezet onderwijs. Ik sla wat piketpaaltjes om het glashelder te maken. /n
De 'Standards' wijzen voortdurend op de noodzaak om empirisch te onderbouwen dat het gebruik van toetsen de bedoelde consequenties heeft, en geen andere. Lees daar niet te snel overheen: empirisch onderbouwen betekent dat er experimenteel onderzoek nodig is, volledig analoog /n
aan wat er nodig is om aan te tonen dat nieuwe medicijnen, vaccins, of behandelingen werkzaam zijn en geen ernstige ongewenste bijwerkingen hebben. 'Meten is weten' is hier echt een gepasseerd station. Het gaat om RCT's, Randomized Controled Trials ncbi.nlm.nih.gov/pmc/articles/P… /n
2de piketpaaltje: onderwijs is geen bedrijf. Selectie voor onderwijstrajecten is echt een ander domein dan selectie door werkgevers op de arbeidsmarkt. Hoewel ook werkgevers gebonden zijn aan wet en regelgeving, en fatsoen, gaat het bij selectie in het onderwijs om veel meer. /n
Onderwijskansen van kinderen en jongeren zijn beschermd door internationale verdragen die Nederland heeft onderschreven. Dit internationaal recht gaat BOVEN nationaal recht (zoals na de Urgenda-zaak eindelijk breder bekend is). Dit is OOK zaak voor toetsontwikkelaars, dus. /n
Het kan niet zo zijn dat het voor valideren van het gebruik van de Eindtoets volstaat een dubbelblind-experiment te doen met bijvoorbeeld bereikt onderwijsniveau als doelvariabele, dat zou een bedrijfsmodel-benadering zijn. Maar zelfs zo'n minimaal ingevuld experiment/RCT is /n
om ethische en praktische redenen volstrekt onuitvoerbaar. U mag hieruit concluderen dat gebruik van de Amsterdamse Schooltoets, zijn opvolger 'de Citotoets', de huidige Eindtoets, en de komende 'doorstroomtoets' NOOIT is gevalideerd. VALIDITEIT ONBEKEND.
Zeker, er zijn publicaties (oa Margo Jansen, Cito, 70er jaren) die laten zien dat 'de citotoets' ongeveer net zo goed 'voorspelt' als het advies van hoofdonderwijzers. Maar dat haalt je de koekoek. Dit zijn correlaties, geen RCT's. Het is één grote 'self-fulfilling prophecy'. /n
Voor een indruk van hoe er gerommeld wordt, in plaats van een RCT op te zetten, zie:
J. W. Oosterbaan (1973). De Amsterdamse schooltoets 1969 in relatie tot enige conclusies van ’Het Verborgen Talent’ Sociologische Gids, 20 #2, 88-97 open access rjh.ub.rug.nl/sogi/issue/vie… /n
Dat validiteit ONBEKEND is van beslissingen die mede op een Eindtoets zijn gebaseerd, moet alle betrokkenen klip en klaar worden meegedeeld:

Standard 1.3
"If validity for some common or likely interpretation for a given use has not been evaluated, or if such an /n
interpretation is inconsistent with available evidence, that fact should be made clear and potential users should be strongly cautioned about making unsupported interpretations."

Hebt u ooit van Cito, CvTE, Inspectie, de school van uw kind, uw Kamerlid, zo'n waarschuwing gehad?
Is er een oplossing, dan? Nee, niet zolang de maatschappelijke bovenlaag vast blijft houden aan het standenonderwijs zoals we sinds de HBS van Thorbecke hebben. En Thorbecke had dan nog een noodverband: laat niet de school, maar de ouders beslissen over toegang tot de HBS. /n
Wie de onderwijsgeschiedenis kent, weet dat die 'open school'-gedachte van Thorbecke maar vijf jaar stand hield: leraren van die nieuwe HBS wilden selectie-aan-de-poort, en die kregen ze. Want Thorbecke was geen minister meer, maar MP. Hielp dat? dbnl.org/tekst/_gid0011… /n
Alles wat problematisch is aan de Eindtoets, is dat mogelijk ook voor het advies dat leerlingen meekrijgen van de school. Met dit verschil dat de leerkracht in groep 8 bovendien heel veel belangrijke informatie heeft over de leerling en relevante omstandigheden.
Ik zou zeggen: investeer in de kwaliteit van de schooladvisering, zodat ouders daar meer steun aan hebben. En nogmaals: waarom ouders niet de beslissende stem geven? Ik hoor uit sociologische hoek al roepen: dat bevoordeelt goed gebekte ouders. Maar is dat onvermijdelijk zo?
Belangrijke kwestie is uiteraard: wat is kwaliteit bij de schooladvisering? Werk dat uit, onderzoek het. Cruciaal is in ieder geval dat leerkrachten hun verantwoordelijkheid nemen, ophouden zich te verschuilen achter discriminerende ideeën over intelligentie en aanleg.
Want ja, dat is de ijzeren 'wetmatigheid van Posthumus': zolang leerkrachten het voor het eigen zeggen hebben: zij zien altijd wel leerlingen die het relatief minder goed doen dan anderen, huppekee, weg ermee. Maar dat kan zo niet langer. Bind de kat de bel aan.

• • •

Missing some Tweet in this thread? You can try to force a refresh
 

Keep Current with Ben Wilbrink

Ben Wilbrink Profile picture

Stay in touch and get notified when new unrolls are available from this author!

Read all threads

This Thread may be Removed Anytime!

PDF

Twitter may remove this content at anytime! Save it as PDF for later use!

Try unrolling a thread yourself!

how to unroll video
  1. Follow @ThreadReaderApp to mention us!

  2. From a Twitter thread mention us with a keyword "unroll"
@threadreaderapp unroll

Practice here first or read more on our help page!

More from @benwilbrink

Sep 6
I want to start a thread about a special theme.
Educational careers extend over about 20 years. That means that very small effects can accumulate to a major effect. That especially concerns everything that has to do with assessment. Think along with me, if you want.
A simple example to start with. The multiple-choice format of tests forces students to make many considerations that are not relevant for open questions. Such as guessing when not knowing. For a single test, that is not a problem. But as a daily routine, for twenty years?
What does that do to students? This is a question I have had for almost half a century. In that half century I have not come across any research on this. I will check it again in Scholar See?scholar.google.nl/scholar?hl=nl&…
Read 26 tweets
Aug 8
Ik woon een paar honderd meter van een Agora-school. Een oud-rechter vertelt ons dat zij haar zoon naar dit wonderwijs stuurt [Aisha Dutrieux, Volkskrant 8-8] . De jongen zal beste tegen de nodige problemen aanlopen, maar zijn ouders gaan dat prima voor hem oplossen. /n
Dit type onderwijs () was al eens onderwerp van een parlementaire enquête ( ). Ik begrijp niet dat ook sommige collega's in het onderwijsveld dit wonderlijke onderwijsconcept [van Sjef Drummen ] promoten. /nverenigingagoraonderwijs.nl
parlement.com/id/vhnnmt7mtyq…
onderwijskunstenaar.nl
Zo is er een Taskforce Ontwikkelingsgericht Onderwijs (TOO) die zich inzet voor aan Agora-onderwijs verwante onderwijsvormen . Een funderende notitie is geschreven door Dolf van den Berg: /ntaskforceoo.nl/wie-zijn-too/
taskforceoo.nl
taskforceoo.nl/wp-content/upl…
Read 8 tweets
Aug 7
'Eigentijds rekenen', wat mag dat zijn? Ik vraag dat naar aanleiding van het artikel 'Naar heldere, eigentijdse kerndoelen voor rekenen en wiskunde' in Van 12 tot 18, mei 2023. Ja, ik loop achter met bijhouden van mijn literatuur. Maar toch, ik sla er steil van achterover. /n
De vroegste populaire Europese rekenboeken berusten op het uitvoerige werk uit 1202 van Fibonacci: 'Liber abaci' . Rekenen is in die meer dan 800 tussenliggende jaren niet 'eigentijdser' geworden. Dus waar is SLO nu mee bezig? Ah, met 4 'domeinen'! /nlink.springer.com/book/10.1007/9…
1) de wiskundige attitude, 2) wiskundige denk- en werkwijzen, 3) wiskundige concepten, 4) wiskunde en de wereld. Bent u er nog? Erg 21e-eeuws vaardig. De kerndoelen moeten ook nog bijdragen aan gelijke kansen voor leerlingen, staat in de opdracht van OCW aan SLO. Lees maar: /n
Read 12 tweets
Apr 22
Contextrekenopgaven: algebraïseren.
Stelling: we zijn ons door versimpelde contexten in rekenmethoden en -examens niet meer goed bewust van hoe lastig algebraïseren van concrete situaties vaak is.
Hoe algebraïseert u bijvoorbeeld wat er gebeurt bij toetsen van beheersing?
Er moet toch een wiskundig model zijn op te stellen, want we hebben er wel voor gezorgd dat de toets kwantiteiten oplevert, zoals 'aantal goed'.
Als u er niet uit komt, waar zou u in de literatuur gaan zoeken naar mogelijke modellen?
Misschien moet ik toch twee aanwijzingen geven:
1) de beheersing van de stof moet in het model voorkomen, noem deze 'p'.
2) een toets is geen meting, maar een steekproef; of eigenlijk: evenveel steekproeven als er bijvoorbeeld vragen in de toets zijn, noem dit aantal 'n'.
Read 31 tweets
Feb 23
Wroetend in mijn omgevallen boekenkast kom ik iets verrassends tegen. Het zal wel weer een publicatie van Patrick Suppes zijn? Ja, 'Testing theories and the foundations of statistics'. Dat natuurkundigen van alle tijden zich niets aantrokken van meetfouten. Ptolemeus, Newton, /1
Laplace, Maxwell, de hele quantum mechanica. Lees het zelf:
De publicaties van filosoof etc. Patrick Suppes, altijd waardevol, zijn lastig te vinden; zijn corpus is afgeschermd voor Stanfordianen, maar zie bijv. van 1976-1980: /2suppescorpusd9.sites.stanford.edu/sites/g/files/…
suppescorpusd9.sites.stanford.edu/bibliography/1…
Ontbrekende aandacht voor meetfouten in natuurkundige publicaties (lesmethoden dus ook) wekt de indruk dat het hier om exacte wetenschap gaat, als zou het wiskunde zijn. Nancy Cartwright laat zien dat zoiets een misvatting is: (1993). 'How the laws of physics lie. Oxford UP /3
Read 12 tweets
Feb 4
Nadenkend over de geschiedenis van beoordelen in het onderwijs van de 20e eeuw kom ik op de volgende stelling:
De overgang van het eeuwenoude rangordenen op het moderne cijfergeven, 2e helft 19e eeuw (citaat uit Wilbrink 1997), leidde tot een andere selectieve cultuur. Image
Ging het bij het rangordenen om de strijd om de beste te zijn, beloond met een prijsboek (), bij het cijfergeven was het voortaan zaak niet tot de slechtsten te horen: 'onvoldoende' cijfers betekenden zittenblijven of afstromen.repository.ubn.ru.nl/handle/2066/26…
Maar dat cijfergeven is niet iets totaal anders dan het rangordenen () hè! Cijfergeven is nog steeds rangordenen, maar het is een vorm van gestandaardiseerd rangordenen, en tegelijk een sterkere kwantificering van (verschillen in) prestaties.press.princeton.edu/books/hardcove…
Read 35 tweets

Did Thread Reader help you today?

Support us! We are indie developers!


This site is made by just two indie developers on a laptop doing marketing, support and development! Read more about the story.

Become a Premium Member ($3/month or $30/year) and get exclusive features!

Become Premium

Don't want to be a Premium member but still want to support us?

Make a small donation by buying us coffee ($5) or help with server cost ($10)

Donate via Paypal

Or Donate anonymously using crypto!

Ethereum

0xfe58350B80634f60Fa6Dc149a72b4DFbc17D341E copy

Bitcoin

3ATGMxNzCUFzxpMCHL5sWSt4DVtS8UqXpi copy

Thank you for your support!

Follow Us!

:(