De COTAN en de WISC-III De COTAN en de WISC-III Verkoop WISC-III stopgezet Verkoop WISC-III voorlopig stopgezet Beoordeling WISC-III volgens COTAN-normen Beoordeling WISC-III volgens COTAN
WISC-III NDC aan gebruikers NDC aan gebruikers WISC-III De normering Normering WISC-III: representativiteit WISC-III Opmerkingen en Suggesties Handleiding WISC-III: opmerkingen
WISC-III Een illusie armer De WISC-III; Een illusie armer Afname WAIS-III of WISC-III? Afname WAIS-III of WISC-III? Steekproef WISC-III schiet te kort Steekproef WISC-III schiet te kort
Het herstel van de WISC-III Het herstel van de WISC-III De COTAN-beoordeling 2003 WISC-III De COTAN-beoordeling 2003 WISC-III de WISC-IV De WISC-IV
De aangepaste normen van de WISC-III De aangepaste normen van de WISC-III Critici WISC-III in het ongelijk gesteld Critici WISC-III in het ongelijk gesteld Boom stopt distributie WISC-III Boom stopt distributie WISC-III
Enquête toekomst WISC-III Enquête toekomst WISC-III Representatieve normen WISC-III van de baan Representatieve normen van de baan Hoe retourneer ik de WISC-III? Hoe retourneer ik de WISC-III?
Nieuwe CBS-tabel ontkracht WISC-III normen CBS-tabel ontkracht WISC-III normen Derde versie normen WISC-III Derde versie normen WISC-III .


Dit artikel is ook te downloaden als Word document: klik.


jump to Reactie NDC jump to Reactie NDC hieronder

De Psycholoog, november 2002, 607-610
----------------------------------------------------------

De WISC-IIINL

Een illusie armer

Peter Tellegen

Op 12 september jongstleden is de nieuwe Nederlandstalige versie van de Wechsler Intelligence Scale for Children (WISC), de WISC-III NL, gepresenteerd. Dit is de eerste testuitgave van het NIP Dienstencentrum in samenwerking met uitgeverij Boom.
Wie verwacht dat deze test die onder auspiciën van het NIP is uitgebracht, van goede kwaliteit is, zal teleurgesteld zijn.

Onvoldoende kwaliteit tests

Enkele jaren geleden is het NIP Dienstencentrum (NDC) begonnen met de uitgave van psychologische tests. De rechten zijn verworven om herzieningen van de WISC en de DAT (Differentiële Aanleg Testserie) uit te geven en in De Psycholoog zijn oproepen verschenen aan auteurs om hun tests bij het NDC uit te brengen. Aan deze ontwikkeling heeft bijgedragen dat het steeds moeilijker wordt om financiering te vinden voor de herziening van belangrijke tests. Bovendien heeft Swets & Zeitlinger een aantal jaren geleden vrijwel een monopoliepositie verworven in de uitgave van psychologische tests. Dit leidt tot een ongewenste afhankelijkheid van klanten en auteurs, te meer daar niet iedereen even tevreden is over de voorlichting, de service en de kwaliteit van de testuitgaven van Swets.

In het licht van deze situatie kan een belangrijke bijdrage aan het testgebruik in Nederland worden geleverd door een uitgever die de kwaliteit van de tests en de belangen van degene die getest wordt, op de eerste plaats stelt. Door de grote winsten die worden behaald met de publicatie van veelgebruikte tests te investeren in testontwikkeling, kan een eind worden gemaakt aan de bizarre en beschamende situatie dat de meest gebruikte intelligentietests in Nederland normen hebben van onvoldoende kwaliteit.

Wie echter vanuit deze verwachtingen het eerste product van het NDC beoordeelt, en de Handleiding van de WISC-III leest (Kort et al., 2002), wordt teleurgesteld. Op een aantal kritiekpunten wordt hier ingegaan.

Normering

De normering van de WISC-III is gebaseerd op een Vlaams/Nederlandse steekproef van 1229 kinderen, gestratificeerd naar leeftijd, geslacht, schooltype, urbanisatiegraad en regio. De samenstelling naar leeftijd, sekse, regionale verdeling en bevolkingsdichtheid blijkt redelijk goed overeen te komen met Nederlandse en Vlaamse populatiegegevens. Opmerkelijk is dat bij de beschrijving van de normgroep gegevens ontbreken over het onderwijsniveau bij het voortgezet onderwijs. Uit de mededeling dat een zo goed mogelijk verdeling naar niveau is aangehouden, zou men echter mogen concluderen dat de steekproef in dit opzicht in orde is.

In het hoofdstuk over validiteit worden in een tabel gemiddelde IQ-scores per onderwijstype in Nederland gepresenteerd. Het aantal havo/vwo-leerlingen is 163 op een totaal van 233. Dit zou betekenen dat 70% van de kinderen bij de oudere leeftijdsgroepen uit havo/vwo-leerlingen bestaat, een ongekende vertekening. Gelukkig bleek het bij navraag niet zo ernstig. Uit de tabel was een moeilijk te classificeren groep weggelaten (helaas werd dit niet vermeld) en het percentage havo/vwo-leerlingen in de Nederlandse onderzoeksgroep van 13 tot en met 16 jaar was 55%. Deze kinderen hadden een gemiddeld IQ van 108.9. De 45% met lagere opleiding had een gemiddeld IQ van 89.6; voor de totale groep is het gemiddelde 100.2. De CBS-gegevens voor het schooljaar 1999/2000 geven echter een percentage havo/vwo leerlingen voor het derde leerjaar van 38% (CBS, 2002). Een weging op grond van een tweedeling in onderwijsniveau volgens dit CBS-percentage, resulteert in een gemiddeld IQ van 96.9, ruim drie IQ-punten lager dan het IQ dat nu berekend wordt.

De huidige normen zijn voor de oudere leeftijdsgroepen dus te hoog gesteld en onderschatten het intelligentieniveau van de leerlingen in het voortgezet onderwijs. Het lijkt erop dat dit voor de Vlaamse onderzoeksgroep eveneens het geval is. Daar zijn namelijk, naar bij navraag blijkt, bij het voortgezet onderwijs uitsluitend leerlingen getest die niet eerder waren blijven zitten.

De overschatting van de prestaties van de oudere kinderen komt ook tot uitdrukking in de veranderingen van de gemiddelde itemscore met leeftijd. Op grond van een kwadratische regressievergelijking is de verwachte verandering van 12 naar 13 jaar .035. Feitelijk is de verandering .052. Een extra verandering met .017 correspondeert bij de leeftijd van 14 jaar globaal met een verandering van 4 IQ-punten.
Ten slotte is er een grote discrepantie tussen het gemiddelde WISC Totale IQ (TIQ) van de havo-leerlingen van 103.8, met het gemiddelde havo-IQ van 111.1 dat bij de normering van de GIVO (Groninger Intelligentietest voor Voortgezet Onderwijs) is gevonden (Van Dijk & Tellegen, 1994). Weliswaar vond die normering tien jaar eerder plaats en was het percentage havo/vwo-leerlingen toen lager, maar een verandering van ruim zeven IQ-punten voor het gemiddelde havo-IQ lijkt toch erg groot.

Voor alle leeftijden worden de normtabellen gepresenteerd per vier maanden. Dit betekent dat bij de jongere leeftijden aan de rand van de intervallen systematische vertekeningen optreden van +3 en -3 punten. Dergelijke storende fouten hadden gemakkelijk voorkomen kunnen worden door kleinere intervallen van bijvoorbeeld twee maanden te nemen bij de jongste leeftijdsgroepen en eventueel bredere intervallen voor de oudere kinderen (overeenkomstig de SON-R 5.5-17). Bij het computerprogramma dat voor de WISC-III in ontwikkeling is, zal wel van de exacte leeftijd van het kind worden uitgegaan zodat dit probleem bij gebruik van het programma niet optreedt.

In de Handleiding wordt gesteld dat de normtabel voor het totaal IQ loopt van 40-160. De grenzen in de tabel zijn echter 47-188. Voor alle IQ- en factorscores zou het veel beter zijn om grenzen te hanteren van 55-145 zoals bij de RAKIT (Revisie Amsterdamse Intelligentie Test)en de SON-R 5.5-17 (Snijders-Oomen Niet-verbale Intelligentietest). Meer extreme normen zijn moeilijk met enige nauwkeurigheid vast te stellen, de schalen hebben dan niet meer dezelfde differentiatiemogelijkheden, en zeer extreme scores komen zo weinig voor dat het ook weinig zin heeft daarvoor normen te geven (een IQ van meer dan 180 heeft één op de 25 miljoen personen, dus waarom normen voor IQ’s van 180-188).

Betrouwbaarheid

De betrouwbaarheid van de subtestscores en van de totaalscores is gebaseerd op de (gestratificeerde) coëfficiënt alpha. Er wordt geen aandacht aan besteed dat alpha in het geval van instap- en afbreekregels bij de afname van de test de betrouwbaarheid overschat (COTAN, 1999). Terecht wordt vermeld dat voor twee snelheidstests de betrouwbaarheid niet met alpha kan worden berekend. Hoe dit dan echter wel is gedaan wordt niet verteld. Naast de alpha’s wordt ook een tabel gepresenteerd met betrouwbaarheidscoëfficiënten volgens de split-half-methode. Waarom dit is gedaan, is niet duidelijk. Voor het feit dat deze betrouwbaarheidscoëfficiënten iets hoger uitvallen, wordt geen verklaring gegeven (een verklaring is dat de kunstmatige verhoging van de betrouwbaarheid als gevolg van de instap- en afbreekregels bij de split-half-methode maximaal is; uit de gevonden verschillen tussen beide methodes kan de conclusie worden getrokken dat ook alpha de betrouwbaarheid van de WISC-III overschat).
In de tabellen worden ook betrouwbaarheden gepresenteerd voor de totale groep. Voor de subtests hebben deze betrekking op de ruwe scores en voor de totaalscores op de genormeerde scores, iets wat niet iedere lezer duidelijk zal zijn. De betrouwbaarheid van de ruwe scores in de totale groep is bovendien irrelevant en misleidend. In een heterogene leeftijdsgroep wordt de betrouwbaarheid van ruwe scores vanzelf hoog.

Bij het interbeoordelaarsbetrouwbaarheidsonderzoek zijn (naar het lijkt) de ruwe scores vergeleken in een heterogene leeftijdsgroep. De overeenstemming had echter beoordeeld dienen te worden op grond van de genormeerde scores, of binnen homogene leeftijdsgroepen. De nu gepresenteerde waarden overschatten de betrouwbaarheid aanzienlijk.

Bij de IQ-scores worden betrouwbaarheidsintervallen gepresenteerd waarvan de breedte gebaseerd is op de standaardmeetfout en die symmetrisch worden berekend ten opzichte van de geschatte ‘betrouwbare’ score. Volgens de Handleiding geeft het interval aan waar de betrouwbare score zich waarschijnlijk bevindt. Dit is echter een waarschijnlijkheidsinterval met een standaardschattingsfout die kleiner is dan de standaardmeetfout. Het betrouwbaarheidsinterval is breder en ligt symmetrisch rond de geobserveerde score (Snijders, Tellegen & Laros, 1988; COTAN, 1999). Praktisch gezien is bij de IQ-scores die een hoge betrouwbaarheid hebben, het onderscheid tussen standaardmeetfout en standaardschattingsfout niet groot. Toch dient een correcte berekening en beschrijving van het interval vanzelfsprekend te zijn.

Voor de verschillende totaalscores worden over alle leeftijden dezelfde intervallen gepresenteerd. Voor de meeste totaalscores lijkt dit terecht. Voor de factor Verwerkingssnelheid neemt de betrouwbaarheid echter met de leeftijd toe. Het is weinig consistent dat bij de toetsing van de verschillen tussen totaalscores weer wel wordt uitgegaan van verschillende betrouwbaarheden per leeftijdsjaar.

Terecht wordt in de Handleiding opgemerkt dat de betrouwbaarheid van de subtests niet zo hoog is dat bij individuele diagnostiek verschillen tussen subtestscores verantwoord geïnterpreteerd kunnen worden. Vervolgens worden in tabellen grenswaarden gepresenteerd voor significantie op het 5% en het 15% niveau. Bij dergelijke vergelijkingen, waar zo gemakkelijk sprake kan zijn van kanskapitalisatie (45-78 subtestcombinaties), is het veel verstandiger, als men dan toch wil toetsen, om het 1% significantieniveau te hanteren. Een ander bezwaar is dat de toetsen gebaseerd worden op de betrouwbaarheden per leeftijdsgroep. Deze zijn echter zeer gevoelig voor steekproeffluctuaties. Het was verstandig geweest om in het normeringsmodel ook de betrouwbaarheid van de testonderdelen als functie van leeftijd te ‘fitten’.

Voor het verschil tussen Performaal IQ (PIQ) en Verbaal IQ (VIQ) wordt erop gewezen dat een statistisch significant verschil nog niet hoeft te betekenen dat het verschil uitzonderlijk is. Een frequentieverdeling van de verschilscores ontbreekt echter. Zelfs de correlatie tussen PIQ en VIQ is in de handleiding niet te vinden.

Validiteit

Het is te begrijpen dat de herziening van een test die veel wordt gebruikt, en waar een grote behoefte aan bestaat, wordt uitgebracht voordat een aantal valideringsonderzoeken is uitgevoerd. Zeker in het geval van de WISC-III of de WAIS-III waar al veel bekend is van de validiteit van de voorgangers en waarvan het buitenlandse valideringsonderzoek ten dele ook relevant is voor Nederland. De testgebruiker wordt echter tekort gedaan indien relevante uitkomsten van het normeringsonderzoek niet of gebrekkig worden gepresenteerd.

Een belangrijk doel van de herziening was het gelijkwaardig maken van de verbale subtests voor de Nederlandse en Vlaamse populatie. Er worden echter geen empirische vergelijkingen tussen beide landen gemaakt. Dergelijke uitkomsten worden noch voor het vooronderzoek, noch voor het normeringsonderzoek gepresenteerd. Over sekseverschillen wordt niet gerapporteerd. Er wordt gebrekkig informatie verstrekt over de samenhang met schoolresultaten en schoolniveau. Slechts van een deel van de kinderen zijn gemiddelde resultaten voor Rekenen en Taal bekend (er wordt niet meegedeeld waar dat gemiddelde op is gebaseerd). Er worden correlaties gegeven met de IQ-scores maar informatie over gemiddelde en spreiding van de scores ontbreekt, zodat niet valt te beoordelen of de onderzoeksgroep representatief is. Niet vermeld zijn de correlaties van schoolsucces met de factorscores. Voor de samenhang met schoolniveau wordt verteld dat voor Nederland is uitgegaan van vijf niveaus. Niet duidelijk wordt waarom in de tabel vier niveaus worden gebruikt en waarom een deel van de onderzoeksgroep buiten de tabel is gehouden. In de Handleiding staat niet vermeld dat ook informatie is verzameld over het sociaal economisch milieu van de kinderen. Over de prestaties van allochtonen geen woord.

Het hoofdstuk over het valideringsonderzoek eindigt met de conclusie dat een drietal factoren naar voren is gekomen die de gebruiker in staat stellen meer specifieke informatie te verkrijgen en niet alleen uit te gaan van de algemene intelligentie of het Verbale dan wel Performale IQ. Mogelijk een nuttige uitbreiding, maar in de Handleiding wordt helaas geen informatie gegeven over de validiteit van deze factoren, en ook niet over de onderlinge samenhang en over de relatie met de IQ-scores.

Slordigheid

In het algemene gedeelte van de Handleiding staan veel slordigheden. Het meest pijnlijk is wellicht dat in het voorbeeld voor de berekening van het IQ een fout is geslopen. Eveneens is er een fout bij de weergave van de leeftijdsberekening. Het gaat daarbij maar om een verschil van drie dagen, maar drie dagen kan bij de WISC-III bij een zesjarig kind een verschil betekenen van zes IQ-punten. De subtest Doolhoven wordt in Tabel 1.2 bij het Verbale deel ondergebracht. De totale aantallen geteste kinderen in de normeringssteekproef (Tabel 2.5) blijken voor meerdere leeftijdsgroepen niet te kloppen en het aantal in Nederland geteste meisjes van zes jaar is 33 en niet 38. Een wortelteken wordt als kleine letter ‘v’ weergegeven waardoor de formule voor de standaardmeetfout onbegrijpelijk is. Er wordt gesproken over 95% significantieniveau waar 5% niveau wordt bedoeld. In de literatuuropgave zijn twee publicaties van Flynn verhaspeld tot drie publicaties waardoor hij een artikel met dezelfde titel in twee verschillende jaren publiceert en twee artikelen met verschillende titel in verschillende jaren maar met dezelfde paginanummers.

Allochtonen

In de Handleiding wordt terecht opgemerkt dat voor anderstaligen een lage score op de WISC-III niet noodzakelijkerwijs betekent dat het intellectuele niveau laag is. Helaas wordt niet de logische conclusie getrokken dat deze sterk verbaal gerichte test daarom niet bruikbaar is om de intelligentie van anderstaligen te beoordelen. Bovendien kan uit het feit dat een allochtoon kind ‘normaal’ of ‘hoog’ scoort, of dat er geen verschil is tussen PIQ en VIQ, ook niet de conclusie worden getrokken dat in dit geval van benadeling geen sprake is geweest. De potentiële benadeling is gelegen in het feit dat de ene groep beoordeeld wordt met een ‘talige’ test, afgenomen in de moedertaal, terwijl bij de andere groep dezelfde test wordt afgenomen in de tweede taal. Het lijkt haast of het NIP-Dienstencentrum nog nooit heeft gehoord van de aanbevelingen van de Test Screeningscommissie (Hofstee et al., 1990). Het mag duidelijk zijn dat voor kinderen uit een niet-westerse cultuur de vraag wie Anne Frank was of de vraag naar de afstand tussen Rotterdam en Antwerpen, een sterk etnocentrische inhoud heeft.

Informatie over de testprestaties van allochtone kinderen is in de Handleiding niet te vinden. Deze informatie wordt bewaard voor de pers zodat men in de krant kan lezen dat het IQ van allochtonen op de WISC-III ongeveer 10 punten lager is. Het persbericht van het NDC meldt dat het er op lijkt dat allochtonen en autochtonen qua intelligentie dichter bij elkaar komen. Ten onrechte wordt hier voor allochtonen weer intelligentie en testprestatie aan elkaar gelijk gesteld. Het SON-IQ van de 209 allochtone kinderen (één of beide ouders in het buitenland geboren) die in 1993 bij het normeringsonderzoek van de SON-R 2.5-7 zijn getest, was 96.2, een verschil van 4.5 met de autochtone kinderen (Tellegen, Winkel, Wijnberg-Williams & Laros, 1998). Dit doet vermoeden dat het intelligentieniveau van allochtone kinderen met de WISC-III gemiddeld ongeveer 5 punten wordt onderschat. Voor sommige kinderen zal het negatieve effect geringer zijn terwijl voor anderen de handicap van een Nederlandstalige testafname aanzienlijk kan zijn.

Geconcludeerd moet worden dat de WISC-III NL niet gebruikt kan worden om op een zuivere manier het intelligentieniveau van anderstaligen te beoordelen (zie Tellegen, 2000). Gelukkig is er voor kinderen in het leeftijdsbereik van de WISC-III een uitstekend alternatief voorhanden (Evers, Van Vliet-Mulder & Groot, 2000, p. 480; Resing, Evers, Koomen, Pameijer, Bleichrodt & Van Boxtel, 2002, p. 99).

WPPSI-R, WISC-III & WAIS-III

De Wechslertests zijn in Nederland de meest gebruikte intelligentietests, zowel wat aantal gebruikers betreft als frequentie van gebruik (Evers, Zaal & Evers, 2002). De laatste versie van de WPPSI-R (Wechsler Preschool and Primary Scale of Intelligence; Vander Steene & Bos, 1997) is door de COTAN zeer negatief beoordeeld. Alleen de kwaliteit van het testmateriaal was goed; de uitgangspunten bij de constructie, de normen, de betrouwbaarheid en de criteriumvaliditeit werden als onvoldoende beoordeeld. Samen met de MOS 2.5-8.5 (McCarthy Ontwikkelings Schalen) behoort de WPPSI-R tot de ongunstigst beoordeelde intelligentietests/ontwikkelingsschalen voor jongere kinderen (Winkel & Tellegen, 2001).
Bij de vorige uitgaven van de WISC en de WAIS werd met name de (criterium)validiteit als onvoldoende beoordeeld. De kwaliteit van het testmateriaal en de normen waren voor beide tests goed; de betrouwbaarheid en de kwaliteit van de handleiding voldoende of goed. In het licht van de kritiek op de WAIS-III (Tellegen, 2002) en de hier geconstateerde gebreken van de WISC-III, valt te vrezen dat de COTAN-beoordeling van deze nieuwe versies in meerdere opzichten negatiever zal zijn dan bij de voorgaande versies.

Het is toch wel een treurige situatie voor de psychologie in Nederland dat, nadat jarenlang is gewerkt met verouderde testversies met normen die niet meer representatief zijn, er nu herzieningen van de Wechslertests verschijnen waarvan de kwaliteit van de normen ook onvoldoende is. Op grond van ondeugdelijke resultaten die met deze tests kunnen worden behaald, worden echter wel beslissingen genomen die soms zeer ingrijpend zijn voor de onderzochte kinderen en volwassenen.

Als reden voor het uitblijven van deugdelijk onderzoek wordt wel genoemd dat dit zo kostbaar is. In vergelijking met de WAIS in 1995 is de prijs van de WAIS-III gestegen van ¤ 218,- naar ¤ 973,50. De prijs van de WISC-III is in vergelijking met de WISC-R in 1995, verhoogd van ¤ 412,- naar ¤ 925,-. Aan de auteurs van de SON heeft Swets & Zeitlinger laten weten dat op het materiaal van de SON-tests een winst wordt behaald van 67%, gerekend over de catalogusprijs exclusief btw. Het zou niet onredelijk zijn om van testuitgevers te verlangen dat een deel van hun inkomsten gestort wordt in een fonds voor (normerings)onderzoek.

Conclusie

Het niet rapporteren van informatie waaruit blijkt dat de steekproef van de oudere kinderen bij de WISC-III niet representatief is, terwijl de suggestie wordt gewekt dat de steekproef wel representatief is, is niet correct. Hetzelfde geldt voor de WAIS-III waar ook ten onrechte is gesteld dat de steekproef representatief is en zou corresponderen met CBS-gegevens voor opleidingsniveau (Uterwijk, 2000).

Ook in andere opzichten blijkt dat bij de uitvoering van het onderzoek en bij de presentatie van de uitkomsten niet altijd even zorgvuldig te werk is gegaan. Dat onderzoeksuitkomsten niet aan de gebruikers van de test ter beschikking worden gesteld, maar wel aan de pers, is bovendien onverantwoord. Als de WISC-III inderdaad ‘Dé nieuwe Nederlandstalige intelligentietest’ is, zoals het NDC trots aan de pers meldt, dan is het slecht gesteld met tests in Nederland.
In de huidige situatie is het beste wat gedaan kan worden om het vertrouwen in intelligentietests te behouden, het volgende: zorgen voor een kwalitatief goede uitgave van de WISC-III met representatieve normen. Inmiddels heeft Swets & Zeitlinger gekozen voor een nieuwe normering van de WAIS-III. Het NDC kan niet achterblijven.

Dr. P.J. Tellegen is universitair docent/onderzoeker bij de afdeling Persoonlijkheidspsychologie en Differentiële Psychologie van de Rijksuniversiteit Groningen. Hij is auteur van verschillende intelligentietests. E-mail <p.j.tellegen@ppsw.rug.nl>.

Literatuur

CBS (2002). Aantal leerlingen in het voortgezet onderwijs per leerjaar, 1999/2000. Internettabel.
COTAN (1999). Beoordelingssysteem voor de Kwaliteit van Tests. Amsterdam: NIP.
Dijk, H. van & Tellegen, P.J. (1994). Handleiding GIVO: Groninger Intelligentietest voor Voortgezet Onderwijs. Lisse: Swets & Zeitlinger.
Evers, A., Vliet-Mulder, J.C. van & Groot, C.J. (2000). Documentatie van tests en testresearch in Nederland. Assen: Van Gorcum/Amsterdam: NIP Dienstencentrum.
Evers, A., Zaal, J.N. & Evers, A.K. (2002). Ontwikkelingen in het testgebruik van Nederlandse psychologen. De Psycholoog, 37, 54-61.
Hofstee, W.K.B., Campbell, W.H., Eppink, A., Joe, R.C., Koppel, J.M.H. van de, Zweers, H., Choenni, C.E.S. & Zwan, T.J. van der (1990). Toepasbaarheid van psychologische tests bij allochtonen. Utrecht: Landelijk Bureau Racismebestrijding. LBR-serie nr. 11.
Kort, W., Schittekatte, M., Compaan, E.L., Bosmans, M., Bleichrodt, N., Vermeir, G., Resing, W.C.M. & Verhaeghe, P. (2002). WISC-III NL. Handleiding. Nederlandse bewerking. London: The Psychological Corporation.
Resing, W.C.M., Evers, A., Koomen, H.M.Y., Pameijer, N.K., Bleichrodt, N. & Boxtel, H. van (2002). Indicatiestelling: Condities en instrumentarium. In het kader van leerlinggebonden financiering. Amsterdam: NDC/Boom.
Snijders, J.Th., Tellegen, P.J. & Laros, J.A. (1988). Snijders-Oomen Niet-verbale Intelligentietest SON-R 5.5-17. Verantwoording en handleiding. Groningen: Wolters-Noordhoff.
Tellegen, P.J. (2000). Verantwoord testgebruik bij allochtonen. Een reactie. De Psycholoog, 35, 231-235.
Tellegen, P.J. (2002). De kwaliteit van de normen van de WAIS-III. De Psycholoog, 37, 463-465.
Tellegen, P.J., Winkel, M., Wijnberg-Williams, B.J. & Laros, J.A. (1998). Snijders-Oomen Niet-verbale Intelligentietest SON-R 2.5-7. Handleiding en verantwoording. Lisse: Swets & Zeitlinger.
Uterwijk, J. (2000). WAIS-III Nederlandstalige bewerking. Technische handleiding. Lisse: Swets & Zeitlinger.
Vander Steene, G. & Bos, A. (1997). WPPSI-R. Vlaams-Nederlandse Aanpassing. Voorlopige versie. Handleiding. Lisse: Swets & Zeitlinger.
Wechsler, D. (2000). WAIS-III Nederlandstalige bewerking. Technische handleiding. Lisse: Swets & Zeitlinger.
Winkel, M. & Tellegen, P.J. (2001). Intelligentietests voor jonge kinderen: de SON-R 2.5-7 en andere intelligentietests. Kind en Adolescent, 22, 141-151.Reactie NIP Dienstencentrum

Een auteur of bewerker van een test moet bij het ontwerpen van een handleiding altijd een afweging maken. Enerzijds moet de handleiding praktisch hanteerbaar zijn en de gebruiker snel inzicht bieden in de wijze waarop de test kan worden afgenomen en geïnterpreteerd. Anderzijds moet er voldoende inzicht worden gegeven in de gegevens op grond waarvan de testconstructie heeft plaatsgevonden. Bij een test als de WISC-III, die wereldwijd wordt gebruikt, komt daar nog nog bij dat de handleiding qua opzet vergelijkbaar dient te zijn met handleidingen elders in de wereld. Dit heeft de auteurs van de WISC-III NL doen besluiten een handleiding en een technisch rapport te ontwikkelen.

In de handleiding wordt de test beschreven (conform de Engelstalige handleiding) en wordt een beknopte beschrijving gegeven van de onderzoeksopzet en de belangrijkste onderzoeksresultaten. Op deze wijze beschikt de gebruiker over alle essentiële gegevens om de test af te kunnen afnemen en interpreteren. Nadere details over het onderzoek, gegevens over betrouwbaarheid en validiteit, en bruikbaarheid bij specifieke groepen, worden beschreven in een afzonderlijk technisch rapport, waarbij men zich een zo goed mogelijk beeld kan vormen van de wijze waarop het onderzoek heeft plaatsgevonden. Inmiddels is de nieuwe test op dit moment reeds uitgebracht, maar zonder het technisch rapport.

Tegen deze achtergrond is het prematuur een oordeel te vellen over de kwaliteit van de test zonder over de noodzakelijke gegevens te beschikken. Wij betreuren het dan ook dat dit toch is gebeurd. Immers, deze handelwijze kan bij gebruikers de indruk wekken dat de constructie van de WISC-III op een onzorgvuldige wijze heeft plaatsgevonden. Wij zijn van mening dat alle informatie zorgvuldig gewogen dient te worden, voor men een dergelijk oordeel zou mogen vellen.

Aan het technisch rapport wordt nog gewerkt: het leek de auteurs gewenst de testgebruikers zo snel mogelijk te voorzien van de nieuwe WISC-III die immers in Amerika reeds in 1991 op de markt is gebracht. Een definitieve beoordeling van de kwaliteit van de WISC-III dient ons inziens te geschieden door de COTAN, een onafhankelijke commissie van het NIP bestaande uit deskundigen op het gebied van psychodiagnostiek. Het oordeel van deze commissie – op grond van handleiding en technisch rapport – wordt met vertrouwen tegemoet gezien.

Binnenkort zal aan de redactie van De Psycholoog een artikel ter publicatie worden aangeboden, waarin aandacht wordt geschonken aan de problematiek van de normen.

Drs. W. Kort.


to top to top to top to top

homepage T&T homepage SON-tests