De kwaliteit van de normen van de WAIS-III De normen van de WAIS-III Afname WAIS-III of WISC-III; Verantwoord en Verstandig? Afname WAIS-III of WISC-III? COTAN beoordeling WAIS-III COTAN beoordeling WAIS-III
Betrouwbaarheid en validiteit WAIS-III Betrouwbaarheid en validiteit WAIS-III Veranderingen in steekproef en testmateriaal Veranderingen in steekproef en testmateriaal S&Z aan de gebruikers S&Z mailing aan de gebruikers
Normering WAIS-III ingrijpend herzien Normering WAIS-III ingrijpend herzien Herziene normering in strijd met CBS gegevens Normering in strijd met CBS gegevens .


Dit artikel is ook te downloaden als Word document: klik.


De Psycholoog, september 2002, 463-465

De kwaliteit van de normen van de WAIS-III

Peter Tellegen

Bezorgdheid van gebruikers

Na het verschijnen van de Technische Handleiding van de WAIS-III is het mogelijk om na te gaan of de bezorgdheid van gebruikers over de kwaliteit van de normen terecht is. Het blijkt dat in de normgroep personen met middelbare en hogere opleidingen sterk oververtegenwoordigd zijn. Dit leidt tot te lage IQ-scores. Het verklaart, in aanvulling op het Flynn-effect, in belangrijke mate de extreme discrepanties tussen de uitkomsten op de oude en de nieuwe WAIS. Verder zijn bij de normtabellen de leeftijdsgroepen te breed waardoor veel te abrupte veranderingen in de normen plaatsvinden.
De Technische Handleiding schiet in veel opzichten tekort. Zo worden belangrijke gegevens voor de validiteit niet vermeld, terwijl zij wel bekend zijn. De Nederlandse bewerking van de WAIS-III kent geen auteurs. Dat door steeds wisselende personen aan de test is gewerkt komt de kwaliteit van de uitgave niet ten goede. Zolang er geen goede normen zijn, en de test niet voldoende is gedocumenteerd, is het gebruik van de WAIS-III niet verantwoord.

In verschillende bijdragen in deze rubriek is twijfel geuit over de deugdelijkheid van de normen van de WAIS-III. Zo zijn er extreme discrepanties ten opzichte van scores op de oude WAIS (Van der Laan & Oswald, 2001) en zijn er opvallende pieken geconstateerd in de scoreverdeling van een groep cliënten waarbij ook de discrepantie tussen PIQ en VIQ afweek van de verwachting (Mijnhardt & Van Stee, 2002). Aan de hand van de gegevens in de Technische Handleiding die onlangs is verschenen (Wechsler, 2000), is onderzocht of de normering van de WAIS-III kwalitatief in orde is.

Normen en onderwijsniveau

Volgens de informatie in de Technische Handleiding is de normgroep een representatieve weergave van de volwassen bevolking van het Nederlands taalgebied. Hierbij zou zijn uitgegaan van een naar opleiding gestratificeerd steekproefplan. Opvallend is echter dat er een grote oververtegenwoordiging is van vrouwen (56%) terwijl ook het aantal personen in de leeftijdsgroepen sterk varieert. Blijkbaar is de steekproef niet in overeenstemming met het plan hetgeen niet verwonderlijk aangezien de proefpersonen voornamelijk zijn geworven via advertenties in stads- en streekbladen. Voor de verdeling naar opleiding in de populatie wordt verwezen naar bevolkingsgegevens van het CBS uit 1995. In de literatuurlijst staat echter maar één CBS publicatie vermeld, een internettabel uit het jaar 2000 over sterfte naar geslacht en leeftijd.
In de Technische Handleiding staat een overzicht van de steekproef met het hoogst behaalde opleidingsniveau naar leeftijd en geslacht. Enkele kenmerken hiervan zijn in tabel 1 overgenomen waarbij mannen en vrouwen zijn samengenomen. De kenmerken zijn vergeleken met populatiegegevens van het CBS en het SCP. In kolom 3 staat het percentage personen met HAVO en VWO-opleiding in de WAIS-III steekproef (inclusief de categorie HBO en WO). Ter vergelijking is daarnaast voor een aantal jaren het percentage leerlingen weergegeven dat in het derde leerjaar van het voortgezet onderwijs in een HAVO/VWO klas zat (SCP, 2002, p.99). Opvallend is dat het percentage met HAVO/VWO-opleiding in de WAIS-III steekproef veel hoger is dan in de populatie. Bovendien blijft het percentage in de steekproef constant hoog van 16 tot 51 jaar terwijl de gegevens van het SCP een sterke toename laten zien gedurende de afgelopen 15 jaar.
In kolom 5 staat het percentage in de WAIS-III steekproef met opleiding op MAVO/HAVO/VWO-niveau. In de steekproef is dit percentage constant rond de 62% voor de leeftijd van 21 tot 76 jaar. Ter vergelijking is in kolom 6 weergegeven het aantal leerlingen van MAVO/HAVO/VWO (CBS, 2002) gedeeld door het aantal personen die geboren zijn in een periode van 5 jaar, 12 tot 16 jaar eerder (CBS, 2001). Deze proportie is niet direct vergelijkbaar met het weergegeven percentage van de steekproef. Een beperking is onder meer dat de opleidingsduur voor MAVO en VWO verschilt en dat de opleidingsduur in de loop der tijd is toegenomen. De cijfers maken echter wel duidelijk dat er de afgelopen 60 jaar een enorme toename is geweest in het opleidingsniveau. Dit is echter in de WAIS-III steekproef niet terug te vinden.

Tabel 1
Opleidingsniveau van de WAIS-III steekproef in vergelijking tot populatiegegevens
. . WAIS-III populatie WAIS-III populatie
Lft.groep N Ha/Vwo Ha/Vwo (jaar) Ma/Ha/Vwo Ma/Ha/Vwo*
(1) (2) (3) (4) (5) (6)
16-20 87 46% 35% (1999) 71% .
21-25 97 53% 30% (1990) 62% .77 (1990)
26-35 140 51% 27% (1985) 61% .68 (1980)
36-50 113 48% . 64% .51 (1970)
51-65 132 42% . 64% .25 (1950)
66-75 94 37% . 61% .18 (1938)
76-85 75 36% . 48% .12 (1930)
* zie toelichting in tekst

Uit de handleiding van de oude WAIS van 1970 blijkt dat 61% van de normgroep van 15-55 jaar, niet meer dan basisonderwijs heeft als hoogste onderwijsniveau. Dertig jaar later correspondeert dit met de bevolking van 45-85 jaar. In de oudste 3 leeftijdsgroepen van de WAIS-III heeft echter 22% alleen basisonderwijs als hoogste niveau. Voor de aanvullende normen van de WAIS voor de leeftijd van 55 tot 65 jaar (gepubliceerd in 1976) was het percentage met alleen basisonderwijs 87%. Bij de WAIS-III is het percentage met alleen basisonderwijs in de corresponderende leeftijdsgroep van 76 tot 86 jaar slechts 31%.
De conclusie is dat het opleidingsniveau in de steekproef van de WAIS-III veel te hoog is geweest en dat dit in het bijzonder geldt voor de oudere leeftijdsgroepen. Omdat opleidingsniveau sterk samenhangt met intelligentie, is het intelligentieniveau van de steekproef te hoog hetgeen leidt tot te lage genormeerde scores.
Bij een onderzoek dat in de Technische Handleiding vermeld wordt, waarbij twee tot twaalf weken na de WAIS-III de oude WAIS werd afgenomen (N=77) was het TIQ op de oude WAIS gemiddeld 19.8 punten hoger. Bij een hertestonderzoek met de WAIS-III (N=60) was het TIQ bij de tweede afname gemiddeld 5.5 punten hoger. Rekening houdend met een hertesteffect, betekent dit dat het verschil tussen beide versies ongeveer 14 IQ-punten bedraagt. Als verklaring voor de lagere scores bij de nieuwe normen wordt het Flynn-effect gegeven. Het is echter de vraag of het Flynn-effect bij de WAIS, waarbij ongeveer 30 jaar tussen beide normeringen zit, wel zo groot zal zijn. Gebaseerd op de Stanford-Binet en de Wechsler-tests kwam Flynn (1984) voor de Verenigde Staten tot een geschatte verandering van 3 IQ-punten per 10 jaar. Hoewel bij dienstplichtigen in Nederland grotere veranderingen werden geconstateerd, bleek bij het valideringsonderzoek van de SON-R 2.5-7 dat de gemiddelde scores minder afweken van de scores op eerder genormeerde tests, zoals de BOS, RAKIT, LDT en WISC-R, dan op grond van een correctie van 3 IQ-punten per 10 jaar te verwachten was (Tellegen, Winkel, Wijnberg-Williams & Laros, 1998, p. 114). Het is daarom goed mogelijk dat de genormeerde scores van de WAIS-III op grond van een onjuiste steekproef tenminste 5 IQ-punten te laag uitvallen. Voor de ouderen is de onderschatting van het intelligentieniveau waarschijnlijk nog groter.

Normen en leeftijd

In de Technische Handleiding wordt nauwelijks informatie gegeven over de wijze waarop de testprestaties met de leeftijd samenhangen. Onbegrijpelijk voor een test die beoogt geschikt te zijn voor de leeftijd van 16 tot 86 jaar. Een motivatie waarom men tot de gehanteerde leeftijdsgroepen voor de normering is gekomen, ontbreekt bovendien. Om enig zicht te krijgen op veranderingen in de prestaties, is voor bepaalde ruwe scores op de subtests die gebruikt worden bij de bepaling van het TIQ, nagegaan wat de bijbehorende genormeerde scores zijn in elke leeftijdsgroep. De geselecteerde ruwe scores zijn de ruwe scores die in de referentiegroep van 21-35 jaar een genormeerde score van 10 hebben. Indien in een andere leeftijdsgroep deze ruwe scores een hogere genormeerde waarde hebben, betekent dit dat de prestaties in deze leeftijdsgroep lager waren, de ruwe scores worden daarom hoger gewaardeerd.
Voor de eerste zes verbale subtests blijken de veranderingen relatief gering. In de jongste leeftijdsgroep, en vanaf 51, jaar zijn de prestaties wat minder maar de variaties in het VIQ zijn beperkt tot de range 96-104. Voor de 5 performale subtests zijn de prestaties stabiel tot 36 jaar. Daarna beginnen ze echter zeer sterk af te nemen. Voor het TIQ zijn de veranderingen aanzienlijk vanaf de leeftijd van 51 jaar.

Tabel 2
Genormeerde leeftijdsscores op de WAIS-III bij constante ruwe scores
genormeerde score binnen leeftijdsgroep
Subtest Ruwe Sc. 16-20 21-25 26-35 36-50 51-65 66-75 76-85

W 46-48 12 11.3 9.7 9.7 10.3 10.7 10.7
O 27 11 10 10 10 11 12 12
R 14 11 10 10 10 11 11 11
Cr 15-16 10 10 9.5 11.5 11.5 11.5 12
I 16-17 10.5 10.5 9.5 9.5 10 10 10.5
B 24-25 10.5 10 10 9.5 10 10 10.5

OT 21 10 10 10 11 12 13 15
SS-C 79-83 10.2 10 10 10.2 13.6 15.2 15.4
Bp 45-51 10 10 10.1 13.3 13.7 17 17.1
MR 20 10 10 10 11 12 14 14
PO 15 10 10 10 11 13 16 17

VIQ . 102 99 96 97 101 102 104
PIQ . 98 98 98 107 118 139 146
TIQ . 100 98 96 102 109 118 123

Voor de oudere leeftijdsgroepen zijn de onderlinge verschillen in genormeerde testscores bij dezelfde testprestatie zo groot dat buiten het midden van de leeftijdsgroep onacceptabele onnauwkeurigheden optreden in de berekening van de IQ-scores. Voor de beoordeling van de intelligentie zou het natuurlijk niet uit mogen maken of iemand net 51 is geworden of dat hij dat de volgende week wordt. In het rekenvoorbeeld in tabel 2 maakt het echter 7 IQ-punten verschil, en bij de overgang van 65 naar 66 jaar is het verschil voor het PIQ maar liefst 21 punten. De discrepantie tussen VIQ en PIQ verandert op dat moment ook van 17 naar 37. De conclusie moet zijn dat de huidige indeling in leeftijdsgroepen veel te grof is om nauwkeurige voor leeftijd genormeerde scores te kunnen berekenen. Indien men dergelijke systematische afwijkingen van 2 IQ-punten nog net acceptabel acht, dienen genormeerde totaalscores niet meer dan 4 punten te veranderen bij overgang naar een aangrenzende leeftijdsgroep.

Opvallend is dat de sterke verslechteringen in prestatie met leeftijd vooral optreden bij drie performale subtests, namelijk Blokpatronen, Plaatjes Ordenen en Symbool Substitutie Coderen. Hierbij wordt een beroep gedaan op motorische vaardigheden waarbij de snelheid van handelen ook een rol speelt. Het zou daarom goed kunnen dat fysieke veranderingen bij ouderen primair verantwoordelijk zijn voor de achteruitgang in prestaties. Dit zou betekenen dat deze onderdelen niet geschikt zijn voor de beoordeling van intelligentie van ouderen. Ook een goede normering zou deze beperking in de bruikbaarheid van deze testonderdelen voor ouderen niet opheffen.

De Technische Handleiding

Door Kessels en Wingbermühle (2001) zijn verschillende onnauwkeurigheden geconstateerd in de Handleiding. In de Technische Handleiding staan ook diverse fouten. Zo kloppen de randtotalen niet in tabel 2.3 en is de hertestcorrelatie voor het TIQ gelukkig niet slechts .77 maar .94. De test werd afgenomen door 60 proefleiders (p. 14), of misschien door 50 proefleiders (p. 16), terwijl op pagina 106 opeens 71 proefleiders bij naam worden genoemd.
Belangrijker dan deze onnauwkeurigheden is de onvolledigheid van de Technische Handleiding. Zo wordt er niet ingegaan op mogelijke verschillen tussen de Nederlandse en Vlaamse steekproef, demografische verschillen, sekseverschillen (er blijken aanzienlijke IQ-verschillen ten gunste van de mannen te zijn). Gezien de beperkte validiteitsgegevens is het ook niet te begrijpen dat de samenhang niet wordt gepresenteerd tussen opleidingsniveau en testprestaties.
In de Handleiding worden in de normtabellen bij de IQ-scores betrouwbaarheidsintervallen weergegeven die volgens een voetnoot gebaseerd zijn op de gegevens van de Amerikaanse versie. Een vreemde handelwijze. In de Technische Handleiding worden wel betrouwbaarheidsgegevens gepresenteerd voor de Nederlandstalige normgroep maar er ontbreekt een vergelijking met de Amerikaanse gegevens. Bovendien worden hier worden meetfouten gepresenteerd waarbij wel wordt vermeld dat in de normtabellen schattingsintervallen worden gegeven die op een andere wijze zijn berekend, maar hierbij wordt niet vermeld dat deze gebaseerd waren op de Amerikaanse normgroep. Bovendien wordt ten onrechte gesteld dat betrouwbaarheids- en schattingsintervalleen op dezelfde wijze kunnen worden geïnterpreteerd (zie Snijders, Tellegen & Laros, 1988, p. 60).

Conclusie

De normering van de WAIS-III schiet ernstig tekort. Aangezien het aannemelijk is dat de IQ-scores het cognitief functioneren sterk onderschatten, en omdat daarnaast aanzienlijke systematische vertekeningen optreden aan de randen van de leeftijdsgroepen, is het gebruik van de test niet verantwoord. Bovendien zijn er belangrijke lacunes in de presentatie van betrouwbaarheids- en validiteitsgegevens. Aangezien de normgroep in omvang al erg beperkt is, is het niet verstandig om de normen te verbeteren door een weging naar onderwijsniveau. Beter kan men de normgroep zodanig aanvullen dat een goede stratificatie naar leeftijd, sekse en onderwijsniveau wordt bereikt. Bij de huidige normering heeft men verschillen tussen normgroepen gladgestreken. Het verdient de voorkeur om de gegevens van alle normgroepen in een keer te fitten aan de hand van een wiskundig model (zie Snijders, Tellegen & Laros, 1988). Dit geeft meer accurate normen en bovendien kunnen deze dan voor elke willekeurige leeftijd berekend worden zodat grote overgangen tussen leeftijdsgroepen vermeden kunnen worden.
Aangezien de normen van de WAIS uit 1970 sterk verouderd zijn, is afname van de oude WAIS geen alternatief zolang er nog geen goede normen zijn voor de WAIS-III. Omdat niet te verwachten valt dat in de leeftijd van 16-50 jaar sterke veranderingen in de testprestaties optreden, is het gebruik van de normen van de oudste leeftijdsgroep van de SON-R 5.5-17 of van de WISC-III, voor volwassenen mogelijk een geschikt alternatief. Voor volwassenen met ernstige verstandelijke handicaps is de SON-R 5.5-17 zeker bruikbaar omdat deze test optimale mogelijkheden heeft om de verstandelijke leeftijd te berekenen.
Hoewel Swets & Zeitlinger zeer bereidwillig was om ons informatie te verstrekken en inmiddels een aantal correcties heeft vermeld op de website van de WAIS-III, is de situatie niet gelukkig dat geen duidelijke auteurs aanwezig zijn die verantwoordelijkheid dragen voor de Nederlandstalige uitgave van de test. Persoonlijk daarop aanspreekbare auteurs hadden mogelijk hogere kwaliteitseisen gesteld voordat de test was uitgebracht.

Dr. P.J. Tellegen is universitair docent/onderzoeker bij de afdeling Persoonlijkheidspsychologie en Differentiële Psychologie van de Rijksuniversiteit Groningen. Hij is auteur van verschillende intelligentietests.
E-mail p.j.tellegen@ppsw.rug.nl

Literatuur

Bronneman-Helmers, H.M., Herweijer, L.J. & Vogels, H.M.G. (2002). Voortgezet onderwijs in de jaren negentig. Den Haag: SCP.
CBS (2001). Tweehonderd jaar statistiek in tijdreeksen 1800-1999. Voorburg/Heerlen: CBS.
CBS (2002). Historie onderwijs en wetenschapsbeoefening vanaf 1900. Http:/statline.cbs.nl.
Flynn, J.R. (1984). The Mean IQ of Americans: Massive Gains 1932 to 1978. Psychological Bulletin, 95, 29-51.
Kessels, R.P.C. & Wingbermühle, P.A.M. (2001). De WAIS-III als neuropsychologisch instrument. De Psycholoog, 36, 296-299.
Laan, E.C. van der & Oswald, H.L. (2001). WAIS-III in discussie. De Psycholoog, 36, 677-678.
Mijnhardt, F. & Stee, M.J.M. van (2002). WAIS-III in discussie (2). De Psycholoog, 37, 206-207.
Snijders, J.Th., Tellegen, P.J. & Laros, J.A. (1988). Snijders-Oomen Niet-verbale Intelligentietest SON-R 5.5-17. Verantwoording en Handleiding. Groningen: Wolters-Noordhoff.
Tellegen, P.J., Winkel, M., Wijnberg-Williams, B.J. & Laros, J.A. (1998). Snijders-Oomen Niet-verbale Intelligentietest SON-R 2.5-7. Handleiding en Verantwoording. Lisse: Swets & Zeitlinger.
Wechsler, D. (2000). WAIS-III Nederlandstalige Bewerking. Technische Handleiding. Lisse: Swets & Zeitlinger.


to top to top to top to top

homepage T&T homepage SON-tests