De COTAN en de WISC-III De COTAN en de WISC-III Verkoop WISC-III stopgezet Verkoop WISC-III voorlopig stopgezet Beoordeling WISC-III volgens COTAN-normen Beoordeling WISC-III volgens COTAN
WISC-III NDC aan gebruikers NDC aan gebruikers WISC-III De normering Normering WISC-III: representativiteit WISC-III Opmerkingen en Suggesties Handleiding WISC-III: opmerkingen
WISC-III Een illusie armer De WISC-III; Een illusie armer Afname WAIS-III of WISC-III? Afname WAIS-III of WISC-III? Steekproef WISC-III schiet te kort Steekproef WISC-III schiet te kort
Het herstel van de WISC-III Het herstel van de WISC-III De COTAN-beoordeling 2003 WISC-III De COTAN-beoordeling 2003 WISC-III de WISC-IV De WISC-IV
De aangepaste normen van de WISC-III De aangepaste normen van de WISC-III Critici WISC-III in het ongelijk gesteld Critici WISC-III in het ongelijk gesteld Boom stopt distributie WISC-III Boom stopt distributie WISC-III
Enquête toekomst WISC-III Enquête toekomst WISC-III Representatieve normen WISC-III van de baan Representatieve normen van de baan Hoe retourneer ik de WISC-III? Hoe retourneer ik de WISC-III?
Nieuwe CBS-tabel ontkracht WISC-III normen CBS-tabel ontkracht WISC-III normen Derde versie normen WISC-III Derde versie normen WISC-III .


Dit artikel is ook te downloaden als Word document: klik.

De derde versie van de normen van de WISC-IIINL

Peter Tellegen

Persoonlijkheids- en Differentiële Psychologie, RuG

juni 2005


Drie jaar na de publicatie van de Handleiding van de WISC-III NL (Kort, Schittekatte, Compaan, Bosmans, Bleichrodt, Vermeir, Resing & Verhaeghe, 2002) is enkele weken geleden de Handleiding en Verantwoording verschenen (Kort, Schittekatte, Dekker, Verhaeghe, Compaan & Vermeir, 2005).
De normering is voor de tweede keer herzien en gegevens over de betrouwbaarheid en validiteit zijn toegevoegd.
De WISC-III zal opnieuw door de COTAN beoordeeld worden zodat over enige tijd duidelijk is of de test weer kan worden toegepast.
De afgelopen jaren hebben we regelmatig aandacht besteed aan de gebreken in de normering van de WISC-III (zie de artikelen op deze site). In dit artikel geven we een eerste evaluatie van de nieuwe normen.


De samenstelling van de Nederlandse normgroep van 13-16 jaar

Onze kritiek op de normering had vooral betrekking op het hoge percentage leerlingen op Havo/Vwo-niveau in het Nederlandse deel van de normgroep. In tabel 1 zijn deze percentages weergegeven voor de oorspronkelijke normgroep (2002); voor de verbeterde normering die anderhalf jaar later werd uitgebracht (2003); en voor de nieuwe normen die nu zijn gepubliceerd (2005). De populatie-gegevens zijn gebaseerd op een tabel die op ons verzoek door het CBS is samengesteld (zie Tellegen, 2004).

Tabel 1
Samenstelling van de normgroepen van de WISC-III NL naar onderwijsniveau
(Nederlandse normgroep 13-16 jaar)
onderwijsniveau populatie
CBS
normgroep
2002
normgroep
2003
normgroep
2005

Havo/Vwo 38 % 55.4 % 44.5 % 41.0 %
Vmbo/Mbo (incl. Lwoo) 58 % 42.4 % 55.5 % 59.0 %
Speciaal. ond. (incl. Basisond.) 4 % 2.1 % 0.0 % 0.0 %

Het is duidelijk dat met de beide herzieningen het percentage Havo/Vwo-leerlingen dichter bij de reële populatiewaarde is gekomen. De auteurs van de WISC-III NL vermelden echter wel dat het aantal Havo/Vwo-leerlingen in de steekproef nog steeds te hoog is (p. 38, tabel 2.12).

Onduidelijk is ook in hoeverre leerlingen uit het speciaal (voortgezet) onderwijs, het praktijkonderwijs en (achterblijvende) leerlingen uit het basisonderwijs in de steekproef van 13-16 jaar zijn opgenomen. In de oorspronkelijke steekproef werden 4 leerlingen van het praktijkonderwijs en 2 leerlingen die nog op de basisschool zaten vermeld, maar in de verbeterde steekproef werden deze leerlingen niet meer genoemd. In de beschrijving van de nieuwe normgroep wordt gesteld dat het Praktijkonderwijs apart voorkwam én als onderdeel van het Vmbo (p. 36), maar er worden geen aantallen vermeld van geteste leerlingen van het Praktijkonderwijs en van achterblijvende basisschoolleerlingen. Ook in de bespreking van de samenhang van onderwijsniveau met testscores wordt deze groep niet onderscheiden (p. 64). Het is daarom aannemelijk dat in de normgroep van 13-16 jaar geen, of nog steeds te weinig, zeer zwakke leerlingen zijn opgenomen.
Door Harcourt is verklaard dat in deze leeftijdsgroep leerlingen van het speciaal onderwijs niet in de steekproef werden opgenomen vanwege mogelijke gedragsproblemen (persoonlijke mededeling van Larry Weiss, psychometricus van de Wechsler-tests, januari 2005). In de Handleiding en Verantwoording wordt alleen melding gemaakt dat ten opzichte van de verbeterde normgroep het percentage MBO-leerlingen is aangepast (p. 37).

Overigens is de beschrijving van de steekproef bij het voortgezet onderwijs verder onvolledig omdat geen onderscheid wordt gemaakt tussen de verschillende leerwegen bij het VMBO.

Ofschoon dit niet expliciet wordt gemeld, blijkt ook de Vlaamse steekproef bij het voortgezet onderwijs te zijn aangepast. In de Handleiding wordt vermeld dat het aantal leerlingen op BSO-niveau gelijk was aan 21 en dat het aantal leerlingen op TSO/ASO-niveau 138 was (zie tabel 4.13b). Nu is het aantal voor BSO gelijk aan 23 en voor TSO/ASO is het aantal nu 101 (zie tabel 3.20). Het percentage leerlingen op het lage BSO-niveau is dus toegenomen van 13% tot 19%.


Leerlingen in het speciaal basisonderwijs in Nederland

Bij het basisonderwijs wordt vermeld dat 4% van de steekproef uit het Speciaal onderwijs afkomstig is en dat dit eigenlijk 5% zou moeten zijn (p. 35). Het is opvallend dat geen gegevens worden gepresenteerd over de uitkomsten bij deze groep kinderen, terwijl dit toch een van de belangrijke doelgroepen is van de WISC-III.


Allochtone leerlingen

In de normgroep zijn alleen kinderen opgenomen die tenminste zes jaar in Nederland of Vlaanderen woonden (p. 33). In de Nederlandse normgroep is het percentage allochtonen (tenminste één ouder met andere dan Nederlandse nationaliteit) 12.2%. De auteurs geven aan dat dit percentage 15.1% zou moeten zijn (p. 34). In de Vlaamse steekproef is het percentage 8.9%. Het is niet duidelijk of dit ook een ondervertegenwoordiging is.
Het is overigens merkwaardig dat elders in de Handleiding en Verantwoording wordt vermeld dat uitsluitend voor het Nederlandse deel van de steekproef gegevens over de allochtoon-etnische achtergrond zijn verzameld (p. 65).
In de Nederlandse normgroep scoren de allochtonen 9.7 IQ-punten lager dan de autochtone leerlingen.


Doubleren

In het najaar van 2002 bleek uit een persoonlijke mededeling van Mark Schittekatte, de auteur die verantwoordelijk is voor de samenstelling van de Vlaamse normgroep, dat in het Vlaamse deel van de steekproef van het voortgezet onderwijs geen leerlingen waren geselecteerd die eerder wel eens waren blijven zitten of die op latere leeftijd waren ingestroomd. Dit zou betekenen dat het gemiddeld niveau van de Vlaamse steekproef te hoog is.

Uit onderzoek met de NIO (Van Dijk & Tellegen, 2004) bij leerlingen die getest waren in de tweede klas van het voortgezet onderwijs, bleek dat 26% qua leeftijd een of meer jaar achterliep. Hun gemiddelde score was 11.1 IQ-punten lager. Dit betekent dat de gemiddelde score van een steekproef bijna 3 IQ-punten te hoog wordt als de groep van zittenblijvers wordt weggelaten. Het effect op de genormeerde scores van de WISC-III in de leeftijd van 13-16 jaar is dat de genormeerde scores van de WISC-III alleen als gevolg hiervan bijna 1 IQ-punt te laag worden (iets minder dan 1/3 van de steekproef bestaat uit een Vlaams deel). Dit onder de aanname dat de situatie met betrekking tot zittenblijvers in Vlaanderen en Nederland vergelijkbaar is.

Hoewel dit punt in verschillende publicaties naar voren is gebracht, en ook genoemd is door de BFP, de Belgische Commissie Psychodiagnostiek die de WISC-III beoordeeld heeft, wordt hier in de Handleiding en Verantwoording niet op ingegaan. Er worden ook geen redenen gegeven waarom de steekproef op dit punt niet is aangepast.

Het is uit de gepresenteerde gegevens niet op te maken of bij de basisschoolleerlingen en bij de leerlingen van het voortgezet onderwijs in Nederland wel voldoende rekening is gehouden met de aanwezigheid van zittenblijvers. Er is geen informatie hoe de leerlingen binnen de scholen zijn geselecteerd.

Veranderingen in de normen

In de Handleiding en Verantwoording wordt er vrijwel geen aandacht aan besteed dat dit nu de derde normering is van de WISC-III NL. Er wordt niet duidelijk aangegeven hoe en waarom de steekproef is veranderd en wat het effect hiervan is op de normen. Met betrekking tot de eerste aanpassing werd door het NIP-Dienstencentrum en door Harcourt verklaard dat het hier om enkele kleine aanpassingen ging die van niet al te grote betekenis waren (brief van McKeown aan de gebruikers, 2004). Over de recente aanpassing van de normering meldt Harcourt dat de verbeterde normering een minimaal of zelfs niet-significant effect heeft op de normen (brief van McKeown aan de gebruikers, 2005). In de Handleiding en Verantwoording staat wel een tabel die betrekking heeft op veranderingen in genormeerde scores maar een toelichting ontbreekt.

Voor een aantal sets ruwe scores hebben wij voor de leeftijdsgroep van 16;8-16;11 jaar berekend wat de genormeerde scores zijn volgens, respectievelijk, de oorspronkelijke normen; de verbeterde normen; en volgens de huidige opnieuw verbeterde normen (zie tabel 2). Deze ruwe scores resulteerden bij de oorspronkelijke normering in genormeerde subtestscores van respectievelijk 5, 10 en 14 of 15. De gebruikte ruwe scores staan in tabel 2 vermeld. Aangezien verschillende ruwe scores soms dezelfde genormeerde score hebben, zijn de berekeningen voor meerdere scorecombinaties uitgevoerd. Dit kan resulteren in de weergave van halve IQ-scores.

Tabel 2
Veranderingen in IQ-score als gevolg van verandering van de normen
(leeftijdsgroep 16.8.0-16.11.30)
. oorspronkelijke
normgroep
2002
verbeterde
normgroep
2003
nieuwe
normgroep
2005
verandering
2002-2005

lage
scores
PIQ 66 PIQ 67 PIQ 67 + 1
VIQ 71 VIQ 71 VIQ 72.5 + 1.5
TIQ 66 TIQ 66 TIQ 67.5 + 1.5

midden
scores
PIQ 99 PIQ 101 PIQ 100 + 1
VIQ 99 VIQ 101 VIQ 102.5 + 3.5
TIQ 99 TIQ 101 TIQ 102 + 3

hoge
scores
PIQ 138 PIQ 139 PIQ 139 + 1
VIQ 134 VIQ 133 VIQ 136.5 + 2.5
TIQ 142 TIQ 141.5 TIQ 144.5 + 2.5

ruwe scores ot in su ov po re bp wo fi be
laag 19 17-18 49-53 16-17 22-25 18-19 43-46 41-43 28-29 26
midden 24 26 73-77 25-26 43-45 25-26 60-62 55-56 36-37 32
hoog 27 30 95-97 32 57-58 32-33 69 65-66 43 36

De eerste aanpassing van de normering leidt bij de IQ's rond de 100 tot veranderingen van 2 IQ-punten. Bij de lage en hoge scores zijn de veranderingen gering. Bij de tweede aanpassing van de normering zijn er ook relatief grote veranderingen bij de lage en hoge scores. De veranderingen zijn bij het VIQ groter dan bij het PIQ. De veranderingen variëren van 1 tot 4 punten; gemiddeld zijn de veranderingen ten opzichte van de eerste normering 2 IQ-punten.
Voor de leeftijdsgroep van 13;8-13;11 jaar hebben wij de midden-scores vergeleken. Hier was de toename voor het PIQ 2 punten; voor het VIQ 4 punten en voor het TIQ 3 punten.

Dat er veranderingen in de normen zijn opgetreden blijkt ook uit de gemiddelde scores van sommige groepen. In de Handleiding (p. 80) is het gemiddelde TIQ van de Havo-leerlingen 103.8 (n=89); in de Handleiding en Verantwoording (p. 64 & 65) is de gemiddelde score van de Havo-groep 106.9 (n=76). De gemiddelde score van de BSO-groep in Vlaanderen was 84.3 (n=21); in de Handleiding en Verantwoording is de gemiddelde score van de BSO-groep 87.0 (n=23). Bij beide groepen zijn de scores gemiddeld met ongeveer drie IQ-punten gestegen.
Overigens is het merkwaardig dat de gemiddelde score van de Havo-leerlingen wel met bijna 3 punten is toegenomen terwijl het gemiddelde van de VWO-leerlingen vrijwel gelijk bleef (een toename van 115.0 naar 115.6). Het is ook merkwaardig dat in de Havo-groep de verandering in PIQ (2.9 punten) groter is dan de verandering in VIQ (2.4 punten). In de door ons berekende voorbeelden zijn de veranderingen in VIQ relatief veel groter.

Omzetting genormeerde somscore in IQ

Bij de Wechsler-tests wordt de som van de genormeerde subtestscores omgezet in IQ-scores (PIQ, VIQ, TIQ). Hierbij wordt geen onderscheid gemaakt naar leeftijd. In tabel 3 is weergegeven hoe de omzetting verloopt bij de verschillende normeringen. Voor de eenvoud van presentatie is in de tabel de gemiddelde subtestscore vermeld i.p.v. de som van de subtestscores.

Tabel 3
Omzetting van genormeerde subtestsscores in IQ bij de verschillende normeringen
gem. subtests oorspronkelijke
normgroep
2002
verbeterde
normgroep
2003
nieuwe
normgroep
2005
verandering
2002-2005
PIQ VIQ TIQ PIQ VIQ TIQ PIQ VIQ TIQ PIQ VIQ TIQ

4.0 60 66 60 60 64 59 60 64 60 0 -2 0
6.0 72 76 72 72 75 71 72 75 71 0 -1 -1
8.0 85 87 85 85 87 84 85 87 84 0 0 -1
10.0 99 99 99 99 99 99 99 99 99 0 0 0
12.0 115 113 116 115 112 116 115 112 116 0 -1 0
14.0 132 127 134 132 126 133 132 126 133 0 -1 -1
16.0 150 142 154 149 141 153 - 140 - - -2 -

Voor het PIQ zijn er geen veranderingen opgetreden. Voor het VIQ nemen de IQ-scores echter met 1 of 2 punten af indien de gemiddelde genormeerde subtestscores niet dicht bij de gemiddelde waarde van 10 liggen. De veranderingen voor het TIQ blijven beperkt tot 1 punt. Ook hier nemen de scores af.

De veranderingen in de steekproef (die vooral op de oudere kinderen betrekking hadden), die tot gevolg hebben dat de oudere leerlingen nu hogere scores krijgen, blijken als onverwacht effect te hebben dat de IQ's van een deel van de jongere kinderen juist wat lager uitvallen. Dit komt omdat bij de verschillende normeringen ten onrechte van de veronderstelling is uitgegaan dat de verdeling van de genormeerde somscores gelijk is over alle leeftijden.
Dus, bij de oudere kinderen nemen bij de nieuwe normering de genormeerde subtestscores toe en hierdoor is er toch sprake van een netto-stijging van het IQ. Bij de jonge kinderen verandert er echter niets aan de genormeerde subtestwaarden waardoor voor hen het netto-effect negatief is.


Leeftijdsgroepen bij de normering

Bij de WISC-III worden bij de normering leeftijdsintervallen gebruikt die vier maanden breed zijn. Bij de presentatie van de WISC-III en in een artikel in De Psycholoog (Tellegen, 2002) is erop gewezen dat dit bij de jongere leeftijdsgroepen tot grote onnauwkeurigheden kan leiden indien het kind een leeftijd heeft die niet dicht bij het midden van het leeftijdsinterval ligt. Van de ene op de andere dag kan (als het kind in een andere leeftijdsgroep komt) het IQ zo 6 punten veranderen. De veranderingen kunnen in sommige gevallen zelfs 8-12 IQ-punten groot zijn. Dit betekent dat er systematische fouten worden gemaakt die kunnen variëren van -6 tot +6 punten. Deze fouten kunnen opgeheven worden door gebruik van een computerprogramma dat bij de normering van de exacte leeftijd uitgaat (zoals bijv. bij de SON-tests gebeurt) of de fouten kunnen sterk verminderd worden door gebruik van minder brede leeftijdstabellen.

In een reactie op deze kritiek werd door de directeur van het NIP-Dienstencentrum in een brief aan de gebruikers toegezegd dat zou worden overgegaan op twee-maandelijkse normgroepen (brief van Baneke, november 2002). Bovendien zou een computerprogramma beschikbaar komen dat gebruik zou maken van de exacte leeftijd.
Een jaar later, bij het uitbrengen van de verbeterde normen werd deze toezegging echter ingetrokken. In een nieuwe brief aan de gebruikers werd gemeld dat in overleg met Harcourt de vier-maandelijkse normen zouden worden gehandhaafd. "Een verfijning van de normen zou maar ten onrechte suggereren dat het mogelijk is tot een zeer nauwkeurige aanduiding van het IQ te komen" (brief van Baneke, oktober 2003).
Inmiddels heeft Larry Weiss, de psychometricus van de Wechsler-tests, laten weten dat overwogen wordt in de toekomst met nauwere leeftijdsintervallen te werken. Voor de Nederlandse uitgave van de WISC-III zal dit echter nog niet gebeuren

Veroudering normen

Bij de presentatie van de WISC-III in 2002 bracht het NDC in een persbericht naar buiten dat de scores met de WISC-III wel 10 tot 20 punten lager zouden uitvallen in vergelijking tot de vorige uitgave van de test. In de Handleiding werd de verwachting uitgesproken dat ten opzichte van de WISC-R er een verschuiving in de normen zou optreden van 7 tot 10 punten. In de Handleiding en Verantwoording wordt nu een in Vlaanderen uitgevoerd onderzoek gepubliceerd waaruit blijkt dat de scores op de WISC-III minder dan 3 IQ-punten lager zijn dan de scores op de WISC-R. De WISC-R was gemiddeld drie jaar eerder afgenomen. Dit is een aanmerkelijk kleiner verschil dan op grond van het Flynn-effect werd verwacht. Ook de resultaten van het onderzoek met de SON-R 2,5-7 (Tellegen, Winkel, Wijnberg-Williams & Laros, 1998) duidden erop dat het Flynn-effect minder sterk is geworden.


Verantwoording

Dit is de derde normering van de WISC-III NL die binnen enkele jaren is uitgebracht. Iedere keer verklaarden de auteurs dat de steekproef representatief was en conform CBS-gegevens. Op de kritiek waaruit bleek dat dit niet het geval was, werd niet gereageerd. Van een wetenschappelijke verantwoording mag worden verwacht dat de noodzaak van aanpassingen in de normering wordt toegelicht en dat duidelijk wordt waaruit de veranderingen bestaan. Hierin schiet de Handleiding en Verantwoording tekort. Het is bijvoorbeeld onduidelijk hoeveel kinderen ten behoeve van de nieuwe normering zijn toegevoegd en hoeveel er uit de steekproef zijn verwijderd.
Bij wetenschappelijk onderzoek is het gebruikelijk dat gegevens voor derden controleerbaar zijn. Inzage in de gegevens van de oorspronkelijke normering van de WISC-III werd echter geweigerd terwijl een commissie die de verbeterde normering moest controleren geen inzage kon krijgen in het normbestand. Geen van de ter beschikking gestelde bestanden bleek namelijk te corresponderen met de normgegevens (De Boeck, Kamphuis & Spelberg, 2003).
Ondanks de betere beschrijving van de normgroep blijven er toch de nodige twijfels in hoeverre de gegevens nu wel conform de beschrijving zijn.
Deze twijfels worden versterkt door het feit dat twee auteurs van de Handleiding die jarenlang bij de totstandkoming van de WISC-III NL betrokken zijn geweest, enkele maanden voor de publicatie van de Handleiding en Verantwoording zich als auteur hebben teruggetrokken. Daarom is het gewenst dat het gegevensbestand toegankelijk wordt gemaakt omdat anders een valide beoordeling van de normering niet goed mogelijk is.


Conclusie

In de Handleiding en Verantwoording wordt nu veel meer informatie gegeven over de samenstelling van de normgroep. De representativiteit van de normgroep is ook verbeterd hetgeen met name voor de oudere kinderen heeft geleid tot een verandering van de normen. Toch zijn er nog steeds een aantal belangrijke tekortkomingen:

  • leerlingen van het speciaal basisonderwijs zijn ondervertegenwoordigd,
  • leerlingen van het voortgezet speciaal onderwijs en het praktijkonderwijs zijn ondervertegenwoordigd,
  • er zijn geen zittenblijvers bij het Vlaams voortgezet onderwijs,
  • er zijn te weinig allochtone leerlingen,
  • er zijn teveel Havo/Vwo-leerlingen.

Al deze afwijkingen hebben tot gevolg dat de normgroep te hoog presteert waardoor de scores die op de nieuwe normtabellen worden gebaseerd, nog steeds te laag uitvallen. Bovendien zijn de normtabellen niet voldoende naar leeftijd gedifferentieerd zodat bij de jongere kinderen grote afwijkingen in positieve en negatieve zin kunnen optreden.
Psychologen die de test gebruiken zullen er rekening mee moeten houden dat zij bij de interpretatie veel bredere marges moeten gebruiken dan de betrouwbaarheidsintervallen die in de Handleiding en Verantwoording staan. Dit als gevolg van de nog bestaande gebreken in de normering.
Voor ouders is het belangrijk om te weten dat zij in veel gevallen terecht bezwaar aan kunnen tekenen tegen beslissingen die op de WISC-III worden gebaseerd.


Literatuur

Boeck, P. de, Kamphuis, H.J. & Spelberg, H. Lutje (2003). Commissie WISC-III. Beoordeling Nederlandstalige WISC III. Amsterdam: NIP-Dienstencentrum.

Dijk, H. van & Tellegen, P.J. (2004). NIO, Nederlandse Intelligentietest voor Onderwijsniveau. Handleiding en Verantwoording. Amsterdam: Boom test uitgevers.

Kort, W., Schittekatte, M., Compaan, E.L., Bosmans, M., Bleichrodt, N., Vermeir, G., Resing, W.C.M. & Verhaeghe, P. (2002). WISC-III NL. Handleiding. London: The Psychological Corporation.

Kort, W., Schittekatte, M., Dekker, P.H., Verhaeghe, P., Compaan, E.L., Bosmans, M. & Vermeir, G.. (2005). WISC-III NL. Handleiding en Verantwoording. London: The Psychological Corporation.

McKeown, P. (2004). Betreft WISC-III NL.

NDC (2003). Errata en Normtabellen WISC-III NL. Amsterdam: NIP-Dienstencentrum.

Tellegen, P.J. (2002). De WISC-III NL. Een illusie armer. De Psycholoog, 37, 607-610.

Tellegen, P.J. (2004). Nieuwe CBS-tabel geeft uitsluitsel over representativiteit WISC-III NL normen.

Tellegen, P.J., Winkel, M., Wijnberg-Williams, B. & Laros, J.A. (1998). SON-R 2,5-7. Handleiding en Verantwoording. Lisse: Swets & Zeitlinger.


to top to top to top to top

homepage T&T homepage SON-tests