De kwaliteit van de normen van de WAIS-III De normen van de WAIS-III Afname WAIS-III of WISC-III; Verantwoord en Verstandig? Afname WAIS-III of WISC-III? COTAN beoordeling WAIS-III COTAN beoordeling WAIS-III
Betrouwbaarheid en validiteit WAIS-III Betrouwbaarheid en validiteit WAIS-III Veranderingen in steekproef en testmateriaal Veranderingen in steekproef en testmateriaal. S&Z aan de gebruikers S&Z mailing aan de gebruikers
Normering WAIS-III ingrijpend herzien Normering WAIS-III ingrijpend herzien Herziene normering in strijd met CBS gegevens Normering in strijd met CBS gegevens .


Dit artikel is ook te downloaden als Word document: klik,.

De Psycholoog, december 2002, p. 677-679

Afname van de WAIS-III of WISC-III
Verantwoord en verstandig?

Peter Tellegen

Nu bekend wordt dat de normgroepen van de WAIS-III en van de WISC-III niet representatief zijn, beginnen gebruikers zich af te vragen of ze er wel verstandig aan doen de nieuwe tests af te nemen.
Kan niet beter worden gewacht tot goede normen beschikbaar zijn?

De aanschaf van de test

Wanneer van een goed bekend staande en veel gebruikte test een nieuwe versie verschijnt, zullen de meeste testgebruikers niet aarzelen deze aan te schaffen. Voor intelligentietests is een doorslaggevend argument dat men niet langer met sterk verouderde normen wil werken. De nadelen van de kosten van aanschaf, de noodzaak om zich opnieuw in te werken in de test en de gewenning aan nieuwe normen, wegen niet op tegen het besef dat alleen met goede normen verantwoorde diagnostiek mogelijk is. Het is dus niet verwonderlijk dat de WAIS-III die begin 2001 is uitgebracht, en de WISC-III die deze zomer verscheen, al door veel psychologen en (ortho)pedagogen worden gebruikt. Van de WISC-III zijn in vijf maanden tijd zelfs al meer dan 1.200 exemplaren verkocht.

Het is begrijpelijk dat het oordeel van de COTAN, de Commissie Test Aangelegenheden Nederland, niet wordt afgewacht. Voor de WAIS-III heeft het bijna twee jaar geduurd voordat de test is beoordeeld. De WAIS en de WISC-R zijn indertijd positief beoordeeld, de normen kregen het predikaat ‘goed’. De WAIS-III wordt uitgebracht door een grote Nederlandse testuitgever en de ontwikkeling van de nieuwe versie en de samenstelling van de normeringsgroep zijn begeleid door een gerenommeerd psycholoog. De WISC-III is uitgebracht door het NDC, het NIP Dienstencentrum dat kwaliteitsbevordering als doelstelling heeft. Twee van de Nederlandse auteurs van de WISC-III zijn tevens auteur van de RAKIT, één van de best beoordeelde intelligentietests. Op grond hiervan kon men zeker vertrouwen hebben in de kwaliteit van de WAIS-III en van de WISC-III.

Inmiddels staat de representativiteit van de normgroepen van deze tests ter discussie, en daarmee de bruikbaarheid van de nieuwe normen. Dit heeft gevolgen voor de beantwoording van de vraag of het verantwoord is, en verstandig, de WAIS-III en de WISC-III te gebruiken.

De normen van de WAIS-III

Al in het eerste jaar dat de WAIS-III uitkwam, verschenen kritische artikelen in De Psycholoog over de kwaliteit van de normen en over de extreem grote veranderingen in scores in vergelijking tot de oude WAIS (Kessels & Wingbermühle, 2001; Van der Laan & Oswald, 2001). In een reactie daarop van Swets Test Publishers worden deze veranderingen verklaard met het Flynn-effect (Uterwijk, 2001). In de Technische Handleiding (Uterwijk, 2000) stelt Swets Test Publishers dat de normering is gebaseerd op een representatieve steekproef. Omdat gebruik is gemaakt van een naar opleiding gestratificeerd steekproefplan, kan de gebruiker volgens Swets Test Publishers ervan uitgaan dat de normgroep een representatieve weergave is van de volwassen bevolking uit het Nederlands taalgebied. De informatie over de verdeling van opleidingen zou gebaseerd zijn op bevolkingsgegevens van het CBS uit 1995. Een tabel met daarin de aantallen in de steekproef naar leeftijd, opleiding en sekse, geeft de representativiteit van de steekproef weer. Aldus Swets Test Publishers (Uterwijk, 2000).

Pas nadat in De Psycholoog een artikel is verschenen waarin aannemelijk wordt gemaakt dat het opleidingsniveau in de normeringssteekproef van de WAIS-III niet representatief kán zijn (Tellegen, 2002a), wordt door Swets Test Publishers erkend dat de normen niet goed zijn en dat een hernormering wenselijk is (Span, 2002). Ook is onderzocht wat het effect op de normering is van een weging naar opleidingsniveau, gebaseerd op CBS-gegevens. Daaruit blijkt een toename van de IQ-scores van gemiddeld ongeveer 2 punten. Het wegingsonderzoek was beperkt tot de leeftijd van 65 jaar. Mogelijk zijn de benodigde correcties bij de ouderen groter.

De uitgever geeft aan nauwkeurige normen dermate belangrijk te vinden dat men op korte termijn aanvullende gegevens voor een hernormering zal verzamelen. Tevens zal met meer gedifferentieerde leeftijdsgroepen worden gewerkt om te vermijden dat tussen groepen grote verschuivingen in de normen plaatsvinden. Bovendien zal gebruik worden gemaakt van het normeringsmodel van Tellegen waarmee leeftijdsnormen nauwkeuriger kunnen worden bepaald (Laros & Tellegen, 1991, p. 156). In een mailing heeft Swets Test Publishers de gebruikers hierover geïnformeerd (zie: S&Z aan de gebruiker).

De normen van de WISC-III

De WISC-III is uitgebracht met een Handleiding (Kort et al., 2002) die aanzienlijk meer informatie bevat over de constructie en kenmerken van de test dan de Afname- en Scoringshandleiding van de WAIS-III. In de Technische Handleiding van de WISC-III, die mogelijk in het voorjaar van 2003 zal verschijnen, zal achtergrondinformatie worden gegeven over de constructie van de test en zullen de resultaten worden vermeld van nog uit te voeren valideringsonderzoek, test-hertestonderzoek, en onderzoek naar de overeenstemming met de WISC-R.

Volgens de Handleiding is per leeftijdsgroep een naar sekse en schooltype gestratificeerde steekproef getrokken, voor Nederland gebaseerd op gegevens van het CBS. Voor kinderen uit het voortgezet onderwijs is een zo goed mogelijke verdeling naar niveau aangehouden. De wijze waarop het normeringsonderzoek is uitgevoerd roept echter vraagtekens op. In de Handleiding wordt niet vermeld dat het aantal leerlingen per niveau bij het voortgezet onderwijs sterk afwijkt van CBS-gegevens. Ook wordt niet vermeld dat in België bij het voortgezet onderwijs geen zittenblijvers zijn getest. Op grond van een globale schatting kwam Tellegen (2002b) tot de conclusie dat bij de oudere leeftijdsgroepen het IQ gemiddeld ongeveer drie punten te laag zal uitvallen.
In de begeleidende brief bij een overzicht van correcties op de Handleiding, laat het NDC de gebruikers weten dat bij een door hen uitgevoerde berekening niet zodanige verschillen naar voren kwamen dat aanpassing van de normen nodig is (zie: NDC aan de gebruiker). Bij deze herberekening is er echter van uitgegaan dat de Belgische steekproef voor de oudere kinderen wel representatief is, en wordt het percentage havo/vwo-leerlingen in de populatie vermoedelijk te hoog geschat. Helaas is het niet mogelijk om een discussie te voeren over het effect van de gebreken van de steekproef op de berekening van het IQ. Het NDC is niet bereid inzage te geven in het stratificatieschema dat bij de normering is gebruikt en aan te geven op grond van welke CBS-tabellen dit schema is samengesteld. Het NDC is zelfs niet ingegaan op ons verzoek mee te delen in welk jaar het normeringsonderzoek heeft plaatsgevonden.

Het NDC heeft wel besloten om over te gaan tot twee-maandelijkse normgroepen in plaats van vier-maandelijkse. Er wordt rekening mee gehouden dat uit aanvullende gegevens, die nu verzameld worden, toch zal blijken dat correcties moeten worden uitgevoerd in verband met de verdeling van de schooltypen. Op grond van wat nu bekend is over de steekproef van de WISC-III lijkt het zeer waarschijnlijk dat correcties noodzakelijk zijn.

De grootte van de correcties

Tussen de IQ-scores die nu berekend worden, en de IQ-scores die straks volgens de nieuwe normen bepaald worden, zullen discrepanties bestaan. De grootte van het verschil kan beschouwd worden als een systematische meetfout die nu optreedt als gevolg van een steekproeftrekking en normering die niet optimaal zijn. Op grond van deze meetfouten zullen de scores van de oudere kinderen bij de WISC-III, en van de volwassenen bij de WAIS-III, straks vermoedelijk gemiddeld 2 à 3 IQ-punten hoger zijn. Aangezien bij de nieuwe normering ook de spreiding van de scores kan veranderen alsmede de vorm van de verdeling, kunnen veranderingen verwacht worden van 1 tot 4 IQ-punten.

Daarbij komen dan nog de veranderingen door het gebruik van smallere leeftijdsintervallen, of door berekening van de IQ-score met een computerprogramma waarbij de normen op de exacte leeftijd worden gebaseerd. Bij de jongere kinderen van de WISC-III geeft dit correcties variërend van -3 tot +3 punten. Bij de oudere kinderen zal dit variëren van -1 tot +1 punt. Bij de WAIS-III zijn voor een aantal leeftijdsgroepen de correcties gering. Voor het Performaal IQ (PIQ) kunnen de aanpassingen echter extreem groot zijn, rond de 65 jaar zelfs 10 of 11 punten in positieve of negatieve richting (Tellegen, 2002a).
Bij de WAIS-III komt daar als derde factor bij dat de nieuwe en betere normeringsmethode die men wil gebruiken ook tot veranderingen in de IQ-scores zal leiden.
Het is moeilijk om vooraf aan te geven hoe groot de veranderingen als gevolg van deze verschillende factoren precies zullen zijn. Onze verwachting is dat het voor het merendeel van de onderzochte personen zal variëren van 0 tot 5 punten. In het geval van een combinatie van factoren, en vooral bij lage en hoge IQ-scores, zullen de veranderingen soms oplopen tot 10 punten. Voor de WAIS-III kan de verandering nog groter zijn bij de overgang bij oudere leeftijdsgroepen.

Is het gebruik van de WISC-III en de WAIS-III op dit moment verantwoord?

In het artikel over de stand van zaken met de WAIS-III (Span, 2002) is door Swets Test Publishers naar voren gebracht dat, hoewel de normen voor verbetering vatbaar zijn, de normgroep van de WAIS-III een veel betere afspiegeling is van de huidige populatie dan de normgroepen van ieder andere in Nederland verkrijgbare intelligentietest. Het is de vraag of dat wel zo is. Swets Test Publishers heeft natuurlijk wel gelijk dat de normen van de WAIS van dertig jaar geleden zeer sterk verouderd zijn en tot grotere afwijkingen leiden dan de huidige normen van de WAIS-III, ook al zijn deze niet optimaal. Als bezwaar van de huidige normen kan gelden dat onzeker is hoe groot de afwijkingen zijn en dat de afwijkingen niet voor iedereen gelijk zijn. Dit is zo, maar ook bij de oude WAIS geldt dat niet bekend is of het Flynn-effect voor alle leeftijden even groot is of dat het constant is over de range van scores.

In Nederland wordt het acceptabel geacht dat tests met sterk verouderde normen (bijvoorbeeld de RAKIT, GIT, BOS 2-30, Raven PM en de LDT) en/of tests met sterke afwijkingen als gevolg van brede leeftijdsintervallen (zoals de WISC-R, RAKIT, LDT en BOS 2-30) gebruikt worden voor indicatiestelling (Resing et al., 2002) of voor het nemen van belangrijke onderwijskundige beslissingen (Ministerie van OCW, 2002). Hierbij steken de afwijkingen in de normen van de WAIS-III niet ongunstig af. Voor de WISC-III geldt dit des te meer daar extreme afwijkingen bij de WISC-III niet te verwachten zijn.

Wanneer de beperkingen, die ook voor de hiervoor genoemde andere tests gelden, in acht worden genomen, is het gebruik van de WISC-III en de WAIS-III met de huidige normen naar onze mening wel verantwoord. Aangezien het COTAN-oordeel voor de normen van de WAIS-III een onvoldoende is, en de WISC-III nog niet is beoordeeld, dient men met de uitslagen van deze tests wel met grote omzichtigheid om te gaan.

Is het gebruik van de WISC-III en de WAIS-III op dit moment verstandig?

Ofschoon de systematische afwijkingen bij de WAIS-III en de WISC-III niet ongunstig afsteken bij een aantal andere veel gebruikte intelligentietests, doet zich bij deze twee tests toch een unieke situatie voor. Over enige tijd zullen verbeterde normen bekend worden waarvan de IQ-scores een betere schatting van het intelligentieniveau geven. De huidige IQ-scores moeten daarom als voorlopige scores worden beschouwd. Op grond van ethische overwegingen is de psycholoog verplicht dit bekend te maken aan de cliënt en aan de opdrachtgever. Bovendien zal de psycholoog, zodra de verbeterde score bekend is, deze moeten meedelen aan de cliënt en aan de opdrachtgever.

Volgens artikel III.2.5 van de Beroepscode voor Psychologen (NIP, 1998) moet de cliënt verbeteringen kunnen aanbrengen in zijn of haar dossier en in de rapportage. De cliënt is daartoe alleen in staat indien de psycholoog hem op de hoogte brengt van de verbeterde testscore. Als de psycholoog niet vooraf waarschuwt dat de testuitkomst een voorlopig karakter heeft, loopt hij of zij het risico later aansprakelijk te worden gesteld door een cliënt die zich benadeeld kan achten door een beslissing die gebaseerd is op de eerdere, afwijkende score.

Het hoeft hierbij niet om grote verschillen te gaan. Een paar IQ-punten kan al het verschil maken of ouders te horen krijgen dat hun kind ‘licht zwakzinnig’ is dan wel ‘laag begaafd’ (zie Resing & Blok, 2002). In psychologisch en sociaal opzicht is dit echter een ingrijpend onderscheid. Ook binnen de indicatiestelling worden bandbreedtes gehanteerd met absolute grenzen. Bij de gehandicaptenzorg en bij de financiering hiervan in het kader van de AWBZ, worden in sommige gevallen eveneens absolute IQ-grenzen gehanteerd. In een recent persbericht van de Gezondheidsraad is zelfs een verband gelegd tussen een IQ-grens van 60 en de onwenselijkheid van ouderschap.

De ethische verplichting om de cliënt en opdrachtgever te informeren omtrent het voorlopige karakter van de testuitkomsten die nu met de WISC-III of de WAIS-III worden verkregen, geldt natuurlijk ook voor alle personen die tot nu toe al met de nieuwe tests zijn onderzocht. Voor zover in deze gevallen sprake is van schade voor de cliënt, de opdrachtgever of voor de onderzoeker zelf, zouden de uitgevers/auteurs daarvoor aansprakelijk kunnen worden gesteld. Zij zijn immers verantwoordelijk voor het uitbrengen van een test waarbij ten onrechte is gesteld dat de normen op een representatieve steekproef gebaseerd zijn.
Het gebruik van voorlopige normen brengt de psycholoog in een onmogelijke situatie. De wetenschap dat de score straks zal worden bijgesteld, zal verlammend werken bij advisering en maakt de tests onbruikbaar om belangrijke beslissingen op te baseren. Dit probleem zal mogelijk alleen maar groter worden als de datum van publicatie van de nieuwe normen dichterbij komt. Ook al is van een claimcultuur vooralsnog in Nederland geen sprake, het gebruik van de WISC-III en de WAIS-III lijkt niet verstandig zolang de goede normen nog niet beschikbaar zijn. Wanneer de gebruikers op grote schaal de WAIS-III en de WISC-III gaan terugsturen, zal het in de toekomst niet meer voorkomen dat dergelijke belangrijke tests zo slordig worden uitgebracht.

Dr. P.J. Tellegen is universitair docent/onderzoeker bij de afdeling Persoonlijkheidspsychologie en Differentiële Psychologie van de Rijksuniversiteit Groningen. Hij is auteur van verschillende intelligentietests. E-mail <p.j.tellegen@ppsw.rug.nl>.

Literatuur

Kessels, R.P.C. & Wingbermühle, P.A.M. (2001). De WAIS-III als neuropsychologisch instrument. De Psycholoog, 36, 296-299.
Kort, W., Schittekatte, M., Compaan, E.L., Bosmans, M., Bleichrodt, N., Vermeir, G., Resing, W.C.M. & Verhaeghe, P. (2002). WISC-III NL. Handleiding. Nederlandse bewerking. London: The Psychological Corporation.
Laan, E.C. van der & Oswald, H.L. (2001). WAIS-III in discussie. De Psycholoog, 36, 677-678.
Laros, J.A. & Tellegen, P.J. (1991). Construction and validation of the SON-R 5,5-17, the Snijders-Oomen non-verbal intelligence test. Groningen: Wolters-Noordhoff.
Ministerie van OCW (2002). Gele katern nr. 24. Den Haag: Ministerie van OCW.
NIP (1998). Beroepsethiek voor Psychologen. Nieuwe Beroepscode 1998. Amsterdam: NIP.
Resing, W. & Blok, J. De classificatie van intelligentiescores. Voorstel voor een eenduidig systeem. De Psycholoog, 37, 244-249.
Resing, W.C.M., Evers, A., Koomen, H.M.Y., Pameijer, N.K., Bleichrodt, N. & Boxtel, H. van (2002). Indicatiestelling: condities en instrumentarium. In het kader van leerlinggebonden financiering. Amsterdam: NDC/Boom.
Span, M.M. (2002). WAIS-III. De stand van zaken. De Psycholoog, 37, 602-606.
Tellegen, P.J. (2002a). De kwaliteit van de normen van de WAIS-III. De Psycholoog, 37, 463-465.
Tellegen, P.J. (2002b). De WISC-III NL. Een illusie armer. De Psycholoog, 37, 607-610.
Uterwijk, J. (2000). WAIS-III Nederlandstalige bewerking. Technische handleiding. Lisse: Swets & Zeitlinger.
Uterwijk, J. (2001). WAIS-III in discussie. Reactie Swets. De Psycholoog, 36, 678.


to top to top to top to top

homepage T&T homepage SON-tests