Intelligentietests voor jonge kinderen Intelligentietests voor jonge kinderen A nonverbal alternative to the Wechsler scale A nonverbal alternative to the Wechsler scale Cross-cultural research with the SON-tests Cross-cultural research with the SON-tests
Construction & Validation of the SON-R 5.5-17 Construction & Validation of the SON-R 5.5-17 Is the SON-R 5.5-17 a test for learning potential? Is the SON-R 5.5-17 a test for learning potential? De SON-R tests voor personen met een verstandelijke handicap De SON-R tests voor personen met een verstandelijke handicap
De verkorte vorm van de SON-R 5.5-17 De verkorte vorm van de SON-R 5.5-17 Bibliography SON-tests Bibliography SON-tests Cultural bias in a nonverbal intelligence test Cultural bias in a nonverbal intelligence test
De SON-test in Kenia De SON-test in Kenia De SON-test in Marokko De SON-test in Marokko Fair Assessment of Cultural Minorities


Dit artikel is ook te downloaden als Word document: klik.

Kind en Adolescent, 2001, 22 (3), p. 141-151

Mevr. dr. M. Winkel is freelance onderzoeker.
Dr. P. J. Tellegen is universitair docent aan de Rijksuniversiteit Groningen, Psychologie Algemeen.
Contactadres: Dr. P. J. Tellegen, Rijksuniversiteit Groningen, Psychologie Algemeen, Grote Kruisstraat 2/1 9712 TS Groningen, p.j.tellegen@ppsw.rug.nl
--------------------------------------------------------------------

Intelligentietests voor jonge kinderen:
de SON-R 2.5-7 en andere intelligentietests

Marjolijn Winkel en Peter J. Tellegen

Samenvatting: Voor het bepalen van het cognitieve niveau bij jonge kinderen wordt bij diagnostisch onderzoek regelmatig gebruikgemaakt van ontwikkelingsschalen en intelligentietests.
De SON-R 2.5-7 is een voorbeeld van een niet-verbale algemene intelligentietest voor jonge kinderen. In dit artikel wordt deze test beschreven. Vervolgens wordt de SON-R 2.5-7 vergeleken met andere tests voor jonge kinderen. Bovendien wordt ingegaan op aandachtspunten bij de keuze van een intelligentietest bij bepaalde vraagstellingen en type kinderen.
Voor die keuze is het van groot belang dat verschillende goed geconstrueerde, genormeerde en gevalideerde tests beschikbaar zijn.

Testkeuze

Bij jonge kinderen doen zich in korte tijd ingrijpende veranderingen in de ontwikkeling voor. Ouders, leerkrachten, schoolpsychologen en -pedagogen kunnen zich daarbij geplaatst zien voor praktische vragen. Voorbeelden hiervan zijn vragen over schoolkeuze, tijdige onderkenning van leerproblemen of vragen over een afwijkende ontwikkeling. De afgelopen jaren is de behoefte om bij kinderen op jonge leeftijd diagnostisch onderzoek uit te voeren sterk toegenomen. Daarbij kan het gebruik van intelligentietests een belangrijke functie hebben. Zicht op het cognitieve niveau van kinderen is noodzakelijk, zeker wanneer men twijfelt aan de intellectuele mogelijkheden van het kind. Het doel van dit artikel is om een indruk te geven van de SON-R 2.5-7, een niet-verbale algemene intelligentietest, en deze te vergelijken met een aantal andere tests en ontwikkelingsschalen die beschikbaar zijn voor jonge kinderen. Bovendien wordt ingegaan op aandachtspunten bij de keuze van een test bij jonge kinderen.

Overzicht van ontwikkelingsschalen en intelligentietests voor jonge kinderen

Tabel 1 geeft een overzicht van ontwikkelingsschalen en intelligentietests die in Nederland gebruikt worden voor het bepalen van het (cognitieve) ontwikkelingsniveau van kinderen.

Tabel 1. Overzicht van ontwikkelingsschalen en intelligentietests voor jonge kinderen
Test Constructeurs Soort test Leeftijds-bereik Jaar handleiding
DOS Cools & Hermanns Ontwikkelingsschaal 0-6;6 jaar 1979
BOS 2-30 Van der Meulen & Smrkovsky Ontwikkelingsschaal 2-30 maanden 1983
GOS 2.5-4.5 Neutel, Van der Meulen, & Lutje Spelberg Ontwikkelingsschaal 2;6-4;6 jaar 1996
MOS 2.5-8.5 Van der Meulen & Smrkovsky Ontwikkelingsschaal 2;6-8;6 jaar 1986
SON-R 2.5-7 Tellegen, Winkel, Wijnberg, & Laros Intelligentietest 2;6-7;0 jaar 1998
WPPSI-R VanderSteene & Bos Intelligentietest 4;0-7;6 jaar 1997
LDT Schroots & Alphen de Veer Intelligentietest 4-8 jaar 1976
RAKIT Bleichrodt, Drenth, Zaal, & Resing Intelligentietest 4;2-11;2 jaar 1984
SON-R 5.5-17 Snijders, Tellegen, & Laros Intelligentietest 5;6-17 jaar 1988
WISC-R Nederlandse WISC-werkgroep Intelligentietest 6-16 jaar 1986
LEM Hamers, Hessels, & Van Luit Leertest 5-8 jaar 1991

Voor kinderen tot vier jaar is het aantal cognitieve tests beperkt. Wel heeft men de beschikking over ontwikkelingsschalen waarvan het leeftijdsbereik wisselt. De testitems betreffen bij de jongste kinderen vooral observaties. Bij iets oudere kinderen zijn het opdrachten die steeds meer overeen komen met de opdrachten uit intelligentietests. Het gehele onderzoek betreft over het algemeen de motoriek, de cognitie, het sociale gedrag, de taalontwikkeling en de zelfredzaamheid. Voorbeelden van ontwikkelingsschalen zijn: de Denver Ontwikkeling Screeningstest (DOS); de Bayley Ontwikkelingsschalen (BOS 2-30); de Groningse Ontwikkelingsschalen (GOS 2.5-4.5) en de McCarthy Ontwikkelingsschalen (MOS 2.5-8.5). Voorbeelden van intelligentietests voor kinderen zijn de Snijders-Oomen Niet-verbale Intelligentietest voor jonge kinderen (SON-R 2.5-7), de Wechsler Preschool and Primary Scale of Intelligence-Revised (WPPSI-R); de Leidse Diagnostische Test (LDT); de Revisie Amsterdamse Kinder Intelligentie Test (RAKIT), de Snijders-Oomen Niet-verbale Intelligentietest voor oudere kinderen (SON-R 5.5-17) en de Wechsler Intelligence Scale for Children-Revised (WISC-R). Er zijn intelligentietests die een specifiek doel hebben en die daardoor een specifieke constructie en/of instructie hebben. Een voorbeeld hiervan is de Leertest voor Etnische Minderheden (LEM), die speciaal is gericht op afname bij Turkse en Marokkaanse kinderen.

Beschrijving van de SON-R 2.5 -7

De Snijders-Oomen Niet-verbale Intelligentietest, de SON-test, had oorspronkelijk ook een specifiek doel. De test werd aanvankelijk geconstrueerd voor dove en slechthorende kinderen (Snijders-Oomen, 1943). De test werd in de loop van de tijd ontwikkeld tot een algemeen bruikbare niet-verbale intelligentietest. Voor kinderen tussen vijfenhalf en zeventien jaar is de SON-R 5.5-17 uitgebracht (Snijders, Tellegen, & Laros, 1988). De SON-R 2.5 -7 is bedoeld voor kinderen van tweeënhalf tot zeven jaar (Tellegen, Winkel, Wijnberg-Williams, & Laros, 1998; Winkel, 1999). Beide tests zijn geschikt voor kinderen met communicatieve handicaps, zoals kinderen met taal/spraakproblemen, dove en slechthorende kinderen, autistische kinderen en kinderen die anderstalig of tweetalig zijn opgegroeid. Daarnaast zijn de tests goed bruikbaar voor kinderen die moeilijk testbaar zijn, voor moeilijk lerende kinderen, en voor kinderen met een ontwikkelingsachterstand.

De SON-R 2.5-7 is een ingrijpende herziening van de Kleuter-SON (Snijders & Snijders-Oomen, 1975). De test bevat geen verbale onderdelen, en kan worden afgenomen zonder gebruik van gesproken of geschreven taal. De instructies kunnen verbaal, via gebaren of door een combinatie daarvan gegeven worden. Belangrijk is dat de testleider de voorbeelditems voordoet, net zolang tot het kind begrijpt wat er van hem of haar wordt verwacht. Bijzonder is dat de testleider na elk item feedback geeft. Is het antwoord goed, dan wordt door de testleider gezegd “goed zo”, of “o.k.”, of laat de testleider op andere wijze merken dat het antwoord goed is. Is het antwoord fout, dan laat de testleider de juiste oplossing aan het kind zien, zonder daarbij uit te leggen waarom de oplossing fout is. Bovendien probeert de testleider het kind actief bij de oplossing te betrekken door het bijvoorbeeld zelf de laatste handeling te laten verrichten. Het geven van feedback is vanuit het kind gezien vanzelfsprekend en motiverend. Het is een aanvulling op de instructie en het bevordert bovendien een meer natuurlijke interactie tussen kind en testleider. Het testmateriaal is zeer gevarieerd en doet een beroep op ruimtelijk inzicht en redeneren. De test is zo opgebouwd dat de opgaven steeds moeilijker worden. Door een instap- en een afbreekregel toe te passen worden juist die opgaven gemaakt die van belang zijn, en worden niet veel opgaven voorgelegd die te moeilijk zijn.

De SON-R 2.5-7 bestaat in totaal uit negentig items, verdeeld over zes subtests, te weten Mozaïeken, Categorieën, Puzzels, Analogieën, Situaties, en Patronen. Er wordt bij de items een beroep gedaan op het vermogen om methoden en regels te ontdekken en deze vervolgens toe te passen bij steeds moeilijker opgaven. Bij Mozaïeken worden met gekleurde steentjes mozaïekpatronen nagelegd. Bij Categorieën sorteert het kind kaartjes. Puzzels worden geconstrueerd, en bij Analogieën worden steentjes op vorm, kleur dan wel grootte gesorteerd. Situaties bestaat uit tekeningen waarbij het kind ontbrekende stukjes dient aan te vullen en bij Patronen moet het kind voorbeeldpatronen natekenen. Categorieën, Analogieën, en Situaties zijn typische redeneertests. Mozaïeken, Puzzels, en Patronen zijn meer ruimtelijke tests waarbij de oplossing actief wordt geconstrueerd.

De genormeerde subtestscores worden als standaardscores weergegeven met een gemiddelde van 10 en een standaarddeviatie van 3 (range 1-19). Het SON-IQ, gebaseerd op de som van de zes genormeerde subtestscores, heeft een gemiddelde van 100 en een standaarddeviatie van 15 (range 50-150). Daarnaast wordt de percentielscore gegeven en een 80%-interval dat aangeeft hoe nauwkeurig men op grond van de testuitkomst een uitspraak kan doen over het intelligentieniveau. Aparte totaalscores kunnen berekend worden voor de drie redeneertests en voor de drie performale tests. Deze totaalscores hebben dezelfde verdelingskenmerken als de IQ-score. De genormeerde scores worden bij gebruik van het computerprogramma van de SON-R 2.5-7 op de exacte leeftijd gebaseerd; bij de normtabellen wordt gewerkt met leeftijdsgroepen van een maand. Voor de subtestscores en de totaalscores kunnen ook referentieleeftijden worden bepaald. De referentieleeftijd, die ook wel mentale leeftijd genoemd wordt, kan men het best omschrijven als ‘de leeftijd waarbij de gemiddelde prestatie van kinderen overeenkomt met de prestatie van dit geteste kind’. De interpretatie van de referentieleeftijd dient te gebeuren in samenhang met de leeftijd bij afname van de test. De betrouwbaarheid van de subtests (gemiddeld 0,72) is gebaseerd op de interne consistentie van de itemscores en is berekend met de formule voor labda2. De betrouwbaarheid van de IQ-score neemt iets toe met de leeftijd en is gemiddeld 0,90 (Tellegen e.a., 1998).

De doelstelling van de SON-R 2.5-7 is een indruk te geven van het algemene intelligentieniveau van het kind. De samenstelling met heel verschillende subtests heeft niet het doel om onderlinge verschillen in prestatie tussen de subtests vast te stellen. Diverse subtests worden gebruikt omdat de invloed van specifieke kenmerken van de subtests op de totaalscore kleiner wordt naarmate de test uit meerdere, verschillende, subtests is opgebouwd. Naarmate de samenstelling van de test meer divers is, kan beter gegeneraliseerd worden naar een algemeen niveau van intelligentie. Het SON-IQ is de genormeerde en gestandaardiseerde totaalscore. Het is de best bruikbare, generaliseerbare, en meest betrouwbare uitkomst van de test. Tezamen met het 80%-interval geeft het SON-IQ een goede indicatie van het intelligentieniveau van het kind. Hoewel het af te raden is om conclusies te verbinden aan uitkomsten op subtestniveau, kan het de moeite waard zijn om verschillen tussen subtestscores te evalueren in samenhang met andere informatie die men over het kind heeft, of met indrukken die tijdens de afname van de test zijn opgedaan. Het gaat hierbij om exploratief gebruik van de subtestgegevens. Dit kan zinvol zijn wanneer de onderlinge verschillen tussen de subtestuitkomsten voldoende groot zijn. Met het computerprogramma wordt de spreiding van de subtestscores berekend en kan beoordeeld worden of de verschillen tussen de subtestscores opvallend groot zijn

De SON-R 2.5-7 en andere tests voor jonge kinderen

De tests waarmee de SON-R 2.5-7 het best mee kan worden vergeleken, zijn de GOS, de RAKIT, en de WPPSI-R. Omdat de LEM alleen is uitgegeven voor experimenteel gebruik met experimentele normen wordt deze test niet bij de vergelijking betrokken, hoewel er wel verwantschap is met deze test. De BOS 2-30 is bedoeld voor baby’s en heel jonge kinderen terwijl de WISC-R en de SON-R 5.5-17 bedoeld zijn voor oudere kinderen. De MOS 2.5-8.5 is een experimentele bewerking. De DOS en de LDT zijn meer dan twintig jaar oud. Aangezien prestaties op intelligentietests in de westerse landen per tien jaar met ongeveer drie punten toenemen (Flynn, 1987), geven de verouderde normen van de DOS en de LDT een zeer vertekend beeld van het niveau van het kind. Bovendien is het testmateriaal ook aan veroudering onderhevig.

Een overeenkomst tussen de SON-R 2.5-7 en de GOS, RAKIT, en WPPSI-R is dat de intelligentie beoordeeld wordt op grond van prestaties op een aantal zeer verschillende taken. Hierbij geldt natuurlijk wel de beperking dat specifieke verbale onderdelen niet in de SON-R 2.5-7 zijn opgenomen. Ten opzichte van niet-verbale onderdelen in andere intelligentietests zijn er twee belangrijke verschillen. Vaak beperken niet-verbale onderdelen uit andere tests zich tot typisch performale opdrachten terwijl in de SON-R 2.5-7 verschillende subtests zijn opgenomen die op niet-verbale wijze een sterk beroep doen op het vermogen tot abstract en concreet redeneren. Dergelijke onderdelen (bv. Analogieën) hebben in andere tests vaak een verbale vorm. Bovendien worden niet-verbale onderdelen in andere intelligentietests over het algemeen met behulp van verbale instructies afgenomen. Alleen het gebruikte testmateriaal is bij de andere tests niet-verbaal. Een ander belangrijk verschil met andere intelligentietests is dat het kind bij de SON-R 2.5-7 hulp en feedback krijgt indien het de opgave niet kan maken, of wanneer het de opgave fout heeft gemaakt. In dit opzicht bestaat er overeenstemming met tests voor leerpotentieel, zoals de LEM, waarbij nagegaan wordt in hoeverre het kind profiteert van aangeboden hulp. Bij de LEM is de training een integraal onderdeel van de test en bestaat er uit dat steeds meer hulp wordt gegeven afhankelijk van de behoefte van het kind.

Keuze van een intelligentietest

Bij de keuze van intelligentietests voor jonge kinderen is het aantal tests waaruit men kan kiezen beperkt. Als het in het kader van het diagnostisch onderzoek noodzakelijk is om een intelligentietest af te nemen dan is het aan te bevelen om bij de keuze voor een bepaalde test rekening te houden met een aantal factoren, zoals a. beoordeling door de Commissie Test Aangelegenheden Nederland (COTAN), b. leeftijd van het kind, en c. de communicatieve mogelijkheden van het kind.

Beoordeling door de COTAN

De COTAN is een onafhankelijk orgaan binnen het Nederlands Instituut van Psychologen (NIP) dat de kwaliteit van psychologische tests beoordeelt. De COTAN beoordeelt tests op de volgende punten: uitgangspunten van de testconstructie, kwaliteit van het testmateriaal, kwaliteit van de handleiding, normen, betrouwbaarheid, begripsvaliditeit, en criteriumvaliditeit. Per onderdeel wordt de beoordeling ‘onvoldoende’,‘voldoende’ of ‘goed’ gegeven. In het algemeen betekent een ‘onvoldoende’ dat òf de gevraagde informatie afwezig is, òf dat de kwaliteit van de wel aanwezige informatie negatief beoordeeld wordt. Een aantal onvoldoende beoordelingen voor een test betekent niet persé dat de test onbruikbaar is. De onvoldoendes betekenen voor de deskundige testgebruiker vooral: wees voorzichtig! Voor minder deskundige gebruikers is de boodschap van onvoldoendes: gebruik de test liever niet.

In tabel 2 wordt een overzicht gegeven van de beoordelingen van de hiervoor besproken tests. Alle oordelen zijn te vinden in de recente uitgave van de COTAN (Evers, Van Vliet-Mulder, & Groot, 2000) waarin, naast een overzicht van in Nederland gepubliceerde tests, ook referenties, beschrijvingen en onderzoeksuitkomsten van de tests opgenomen.
Als laatste kolom is in tabel 2 door ons een totaalscore weergegeven. Hierbij kreeg elk oordeel ‘goed’ twee punten en het oordeel ‘voldoende’ één punt.

Tabel 2.
Overzicht van de COTAN-beoordelingen van intelligentietests en ontwikkelingsschalen
Test Uitgangspunten
testconstructie
Kwaliteit
testmateriaal
Kwaliteit
handleiding
Normen Betrouw-
baarheid
Begrips-
validiteit
Criterium-
validiteit
Totaal
DOS g v v g v o v 8
BOS 2-30 g g g v v v v 10
GOS 2.5-4.5 g g g g g g o 12
MOS 2.5-8.5 o g v o o o o 3
SON-R 2.5-7 g g g g g g g 14
WPPSI-R o g v o o v o 4
LDT g g g g v v v 11
RAKIT g g g g g g g 14
SON-R 5.5-17 g g g g g g g 14
WISC-R g g g g v v o 10
LEM v g g o g v v 9
g = goed (2 punten), v = voldoende (1 punt), o = onvoldoende (0 punt)

Drie tests zijn door de COTAN uitzonderlijk positief beoordeeld. Dit zijn de RAKIT en de beide SON-tests. Op alle onderdelen hebben zij het oordeel ‘goed’. Daarnaast worden de BOS 2-30, de GOS 2.5-4.5, de LDT, de WISC-R en de LEM redelijk tot goed beoordeeld. Bij deze tests zijn de uitgangspunten bij de testconstructie en de kwaliteit van testmateriaal en handleiding in het algemeen ‘goed’. Voldoende of onvoldoende zijn bij deze tests veelal normen en/of betrouwbaarheid en/of validiteit. Twee tests zijn zeer laag beoordeeld en op grond daarvan niet geschikt voor algemeen diagnostisch gebruik. Dit zijn de MOS 2.5-8.5 en de WPPSI-R. Het lage oordeel voor de WPPSI-R is het gevolg van de gebrekkige uitvoering van de Vlaams/Nederlandse aanpassing waarbij Nederlandse normen ontbreken, de betrouwbaarheid niet op relevante wijze wordt vastgesteld en geen onderzoek is gedaan naar de criteriumvaliditeit.

Leeftijd van het kind
In de handleiding van elke test staat aangegeven voor welke leeftijd de test geschikt is. Sommige tests worden wel bij jonge kinderen gebruikt, maar zijn daarvoor echter niet geschikt. Aan de oorspronkelijke test, die bedoeld was voor een oudere doelgroep, zijn dan alleen wat items toegevoegd. Vaak duren de afnames van dergelijke tests (bv. de WPPSI-R of de RAKIT) veel te lang bij jonge kinderen. Bij de SON-R 2.5-7 wordt een adaptieve procedure toegepast en wordt bij iedere subtest de afname gestopt wanneer in totaal drie fouten zijn gemaakt. Voor de motivatie van de kinderen blijkt het heel belangrijk te zijn dat niet te veel items gemaakt moeten worden die boven hun niveau liggen. Bij andere tests wordt soms, ook bij meerkeuzetests, met afbreekregels gewerkt waarbij vier of vijf fouten achter elkaar moeten optreden voordat wordt afgebroken (bv. de subtest Kwantiteit van de RAKIT). Door gissen kan dit er gemakkelijk toe leiden dat tien of meer fouten zijn gemaakt voordat kan worden gestopt. De frustratie die dit geeft is voor testleiders dan vaak een reden om de afbreekregel niet strikt toe te passen. Dit gaat ten koste van een gestandaardiseerde afname en ondergraaft de validiteit van de normering.

Communicatieve mogelijkheden van het kind
Indien kinderen slecht kunnen horen, doof zijn, een andere taal spreken dan de Nederlandse taal, niet van oorsprong Nederlands zijn, of problemen hebben met taal en/of spraak is de keuze voor een intelligentietest zeer beperkt. Als toch verbale tests worden afgenomen is het de vraag of men iets met de uitkomst kan in het kader van het diagnostisch onderzoek, aangezien in deze gevallen een lage testscore wel een achterstand in de taalontwikkeling impliceert maar niet noodzakelijkerwijs een geringe intelligentie. Het beoordelen van kennis van de Nederlandse taal en taalvaardigheid kan natuurlijk ook voor deze kinderen een belangrijk diagnostisch element zijn. Het is in deze gevallen dan echter geen onderdeel van de intelligentiemeting en verbale onderdelen van intelligentietests zijn daarvoor ook niet bedoeld (Tellegen, 2000).

Van sommige tests is bekend dat toepassing van de test goed mogelijk is bij een bepaalde groep. Met de SON-R 2.5-7 is daar uitgebreid onderzoek naar gedaan. In de handleiding en verantwoording van de SON-R 2.5-7 wordt onderzoek bij diverse bijzondere groepen kinderen beschreven. Het betreft kinderen met een algemene ontwikkelingsachterstand, kinderen met een pervasieve ontwikkelingsstoornis, kinderen met taal- en/of spraakstoornissen, slechthorende kinderen en dove kinderen. Ook allochtone kinderen en kinderen waarvan één ouder in het buitenland is geboren zijn getest. Vergelijkingen tussen de SON-R 2.5-7 en andere tests wijzen erop dat de SON-R 2.5-7 veel minder dan andere tests afhankelijk is van cultuurgebonden kennis en vaardigheden (Tellegen e.a., 1998).

Ook voor de RAKIT is onderzoek beschreven over het gebruik van de RAKIT bij allochtoon-etnische groepen en bij leerlingen van het speciaal onderwijs. Uit het onderzoek met allochtonen blijkt dat zij op de verbale onderdelen van de RAKIT aanzienlijk lager scoren dan op de andere onderdelen. Aangeraden wordt om bij kinderen die nog maar kort in Nederland wonen de subtest Woordbetekenis niet te betrekken bij de berekening van de totaalscore (Resing, Bleichrodt, & Drenth, 1986). Het lijkt er echter op dat de negatieve taaleffecten bij de RAKIT niet beperkt zijn tot deze subtest en tot allochtonen die kort in Nederland wonen. De taaleffecten hebben invloed op alle subtests waaruit de verbale leer- en vlotheidsfactor bestaat. Ook allochtonen die langer in Nederland wonen worden met de verbale subtests benadeeld.

In artikelen zijn wel veel Amerikaanse onderzoeken met de WPPSI-R beschreven, maar geen in Nederland uitgevoerde onderzoeken. Bij de GOS 2.5-4.5 worden in de handleiding geen onderzoeken vermeld die bij bijzondere groepen kinderen zijn uitgevoerd.

Vergelijken van testuitslagen

Normen van verschillende tests zijn niet altijd goed vergelijkbaar, bijvoorbeeld omdat de normpopulatie anders is gedefinieerd (wel/geen allochtone kinderen, wel/geen leerlingen van speciaal onderwijs), door de wijze waarop bij de normering wordt omgegaan met kinderen die de test niet, of gedeeltelijk maken, en door bodem- en plafondeffecten die vaak bij de extreme leeftijdsgroepen optreden. Verder wordt de nauwkeurigheid van de normen, en dan vooral de nauwkeurigheid van extreme scores, bepaald door de omvang van de normgroep en door de mate waarop de normen gebaseerd worden op de exacte leeftijd van het kind. Verder zijn normen aan veroudering onderhevig waardoor IQ-scores na tien jaar ongeveer drie punten hoger uitvallen dan ten tijde van de normering.

De normgroep van de SON-R 2.5-7 heeft betrekking op alle in Nederland woonachtige kinderen uit de relevante leeftijdsgroep, waarbij alleen kinderen met zware lichamelijke en/of verstandelijke handicaps buiten beschouwing zijn gebleven. Bij de RAKIT zaten geen kinderen uit het speciaal onderwijs in de normgroep en maar een beperkt deel van de populatie allochtonen. De normgroep van de WPPSI-R omvatte slechts 60 Nederlandse kinderen en het is niet duidelijk of de Vlaamse uitkomsten voor Nederland representatief zijn. Op grond hiervan kunnen WPPSI-R scores niet goed geïnterpreteerd worden en zij kunnen niet goed vergeleken worden met andere testscores. Bij de GOS 2.5-4.5 zijn de normgroepen voor de jongere leeftijden vertekend omdat bij de jongere kinderen een (volledige) testafname vaak niet mogelijk was.

Uit vergelijkend onderzoek waarbij de SON-R 2.5-7 is afgenomen in combinatie met andere intelligentietests blijkt dat de gemiddelde score op de SON-R sterk overeenkomen met de gemiddelde scores van tests die na 1980 in Nederland zijn genormeerd (Tellegen e.a. 1998). Na correctie voor het jaar van uitgave zijn de scores op de andere tests drie tot vier punten lager. Dit zou kunnen komen doordat de andere tests minder rekening houden met de communicatieve handicaps van een deel van de kinderen in de onderzoeksgroepen. Met de GOS, die ook recent is genormeerd, is er geen verschil in gemiddelde scores. De scores op de SON-R 2.5-7 zijn ongeveer dertien punten lager dan op de oude Kleuter-SON.

Als een test onvoldoende gemakkelijke items bevat, dan zal de test niet voldoende verschil kunnen maken tussen kinderen die lager dan het gemiddelde niveau functioneren. Het is dan niet meer mogelijk om op elke leeftijd alle genormeerde scores van de schaal te halen. Dat betekent dat de test op die leeftijd minder goed differentieert, er is dan sprake van een bodemeffect. Zeker als een test wordt gebruikt om het vermoeden te bevestigen dat er bij het kind sprake is van een cognitieve achterstand is het van belang dat de test voldoende gemakkelijke items bevat, zodat de precieze mate van achterstand betrouwbaar kan worden bepaald. Bij de SON-R 2.5-7 is voor het SON-IQ sprake van beperkte bodemeffecten tot een leeftijd van drie jaar. De laagste IQ-score die behaald kan worden is bij 3;0 jaar gelijk aan 50, bij 2;9 jaar 51 en bij 2;6 jaar 63. Bij de GOS is tot een leeftijd van ruim vier jaar sprake van bodemeffecten voor de totaalscore, en bij de WPPSI-R tot een leeftijd van ruim vijf jaar. Bij kinderen tussen de drie en vijf jaar, met een relatief laag cognitief niveau, is het aan te raden om de SON-R 2.5-7 af te nemen omdat deze test voor hen nog voldoende gemakkelijke opgaven heeft.

Wanneer de normering niet voldoende rekening houdt met de leeftijd van het kind kunnen sterke vertekeningen optreden indien het kind zich bevindt aan de rand van een leeftijdsgroep. Voor de RAKIT en de (Amerikaanse) WPPSI-R, waarbij met leeftijdsgroepen van drie of vier maanden gewerkt wordt, kan het zeven IQ-punten uitmaken of het kind nog net in de ene leeftijdsgroep hoort, of in de andere. Systematisch worden de scores aan de rand van de leeftijdsgroepen drie à vier punten over- of onderschat. Met het computerprogramma van de SON-R 2.5-7 worden de scores altijd op de exacte leeftijd gebaseerd en treden deze vertekeningen niet op.

Samenhang tussen cognitieve maten

Voor de validering van de SON-R 2.5-7 is de test in combinatie met een groot aantal andere (intelligentie)tests afgenomen. Dit betreft zowel afnames in het kader van het normeringsonderzoek als testafnames bij bijzondere groepen. Een deel van het onderzoek werd uitgevoerd in Engeland, Australië en de Verenigde Staten. De correlaties met algemene intelligentiematen zijn 0,59 (BOS 2-30), 0,65 (GOS 2.5-4.5), 0,68 WPPSI(-R)/WISC-R, 0,58 (LDT) en 0,58 (RAKIT). De hoogste correlatie (0,87) werd gevonden met de somscore van zes subtests van de British Ability Scales (BAS). Gemiddeld zijn de correlaties 0,65. De correlaties met nonverbale (intelligentie)maten zijn eveneens 0,65. Relatief hoog hierbij zijn de correlaties met het performale deel van de WPPSI-R, de nonverbale subtests van de BAS en met de SON-R 5.5-17. Met maten voor de verbale ontwikkeling en de verbale intelligentie zijn de correlaties gemiddeld 0,48 (Tellegen e.a., 1998).

De volgende factoren dragen bij aan het relatief lage niveau van de correlaties. In de eerste plaats blijken correlaties lager uit te vallen naarmate kinderen jonger zijn. Ten tweede is het onderzoek voor een deel uitgevoerd bij kinderen met handicaps en kinderen die anderszins moeilijk testbaar zijn. Deze kinderen zijn ook minder consistent in hun prestatieniveau en bovendien houden de verschillende tests ook niet op dezelfde wijze rekening met hun handicaps. Ten derde zat er soms een periode van enkele jaren tussen de testafnames.

Dat de consequenties van correlaties in de orde van 0,65-0,70 groot zijn voor het beoordelen van testuitkomsten, blijkt uit de vergelijking van de scores van het SON-IQ met het WPPSI-PIQ van 230 kinderen in een in Amerika uitgevoerd onderzoek. Hierbij waren de scoreverdelingen eerst vergelijkbaar gemaakt. De correlatie was 0,70. Bij 9% van de kinderen was het verschil in scores twintig punten of meer. Bij drie kinderen was het verschil zelfs meer dan veertig punten. Men moet er daarom op bedacht zijn, en dit zal bij jonge kinderen vaker optreden dan bij oudere kinderen, dat een testuitkomst een vertekend beeld kan geven van de capaciteiten van een kind. Vooral bij jonge kinderen moet men rekening houden met een wisselvalligheid in de prestaties die moeilijk voorspelbaar is. Allerlei factoren kunnen hierop van invloed zijn, zoals de houding van de testleider, lichamelijke conditie en gebeurtenissen voorafgaand aan de testafname.

Conclusie

De belangrijkste functie van de afname van een intelligentietest is het verschaffen van informatie over het niveau van de verstandelijke ontwikkeling van een kind ten behoeve van diagnostiek, advies, en hulpverlening. De uitkomsten die verkregen worden kunnen grote gevolgen hebben voor de leefsituatie van het kind en voor zijn of haar ontwikkeling. Ook voor ouders kunnen de gevolgen ingrijpend zijn, en adviezen of besluiten die in het kader van de diagnostiek genomen worden kunnen grote financiële consequenties hebben.

Gezien de moeilijkheden die het testen van jonge kinderen met zich mee kan brengen, en de grote diversiteit van de problemen en de handicaps in verband waarmee jonge kinderen psychologisch worden onderzocht, is het van groot belang dat verschillende goed geconstrueerde, genormeerde en gevalideerde intelligentietests beschikbaar zijn. Het kan zinvol zijn een schatting van het intelligentieniveau van het kind te baseren op afnames van verschillende tests. Specifieke kenmerken van een test kunnen invloed hebben op de score.

Daarnaast is er, zeker bij zeer jonge kinderen, sprake van wisselingen in het prestatieniveau waardoor de stabiliteit van de uitkomsten minder groot is. Verder is er sprake van meetfouten die bij jonge kinderen ook relatief groot zijn omdat de afnameduur beperkter is en omdat jonge kinderen tijdens de afname wisselvalliger zijn in hun prestaties. Het afnemen van een andere test, in combinatie met de SON-R 2.5-7, is aantrekkelijk omdat dan de invloed van verschillende niet-gewenste bronnen van variantie verminderd wordt. Hierbij dient de alternatieve test wel geschikt te zijn voor de doelgroep. Diversiteit in materiaal en methode van test is, voor zover dat mogelijk is, gewenst. Ook is het aan te bevelen de tests door verschillende testleiders af te laten nemen. Juist bij jonge kinderen is de wijze waarop de testleider het kind weet te motiveren, een factor van betekenis.

Omdat de SON-R 2.5-7 in de methode van afnemen, en ook in materiaal zo duidelijk anders is dan veel andere tests, is de SON-R 2.5-7 zeer geschikt om als extra test te worden afgenomen bij kinderen waarbij de afname van een verbale intelligentietest ook goed mogelijk is. Een IQ-score die op twee testafnames is gebaseerd, en bij heel jonge kinderen bij voorkeur op drie, kan met veel meer vertouwen worden geïnterpreteerd als niveau van intelligentie.

Uit het onderzoek met de SON-R 2.5-7 komt naar voren dat van de totale variantie van de test 10% bestaat uit meetfoutvariantie, 10% instabiele variantie, en 10% subtestspecifieke variantie. De 70% ‘valide’ en generaliseerbare variantie kan toenemen tot 85% door twee tests af te nemen bij kinderen vanaf vijf jaar en door drie tests af te nemen bij kinderen van twee tot en met vier jaar. De afname van een extra test is vooral gewenst wanneer de testuitkomst ingrijpende consequenties heeft en/of wanneer er grote discrepanties bestaan tussen testuitkomst en andere informatie over het kind.

Voor kinderen die om verschillende redenen moeilijk testbaar zijn, is een afname van de SON-R 2.5-7 zeker gewenst. Uit onderzoek dat in de handleiding is beschreven blijkt namelijk dat kinderen volgens observaties van de testleider bij afname van de SON-R 2.5-7, in vergelijking tot de GOS 2.5-4.5 en de RAKIT, meer gemotiveerd zijn, beter geconcentreerd zijn, en de instructies beter begrijpen. Het uitgangspunt bij de constructie van de test, namelijk een beperking van de communicatiemogelijkheden van de doelgroep, heeft blijkbaar tot effectieve procedures geleid om het contact met het kind bij de testafname te verbeteren. Uit de uitkomsten blijkt dat de SON-R 2.5-7 bij uitstek geschikt is om bij jonge kinderen te worden afgenomen.

Literatuur

Evers, A., Van Vliet-Mulder, J. C., & Groot, C. J. (2000). Documentatie van Tests en Testresearch in Nederland. Assen: Van Gorcum.
Flynn, J. R. (1987). Massive IQ gains in 14 nations: What IQ tests really measure. Psychological Bulletin, 2, 171-191.
Resing, W. C. M., Bleichrodt, N., & Drenth, P. J. D. (1986). Het gebruik van de RAKIT bij allochtoon etnische groepen. Nederlands Tijdschrift voor de Psychologie, 41, 179-188.
Snijders, J. Th., & Snijders-Oomen, N. (1975). Handleiding van de SON 2.5-7. Groningen: Wolters-Noordhoff.
Snijders, J. Th., Tellegen, P. J., & Laros, J. A. (1988). Snijders-Oomen niet-verbale intelligentietest SON-R 5.5-17. Verantwoording en handleiding. Groningen: Wolters-Noordhoff.
Snijders-Oomen, N. (1943). Intelligentie-onderzoek van doof-stomme kinderen. Nijmegen: Berkhout.
Tellegen, P. J. (2000). Verantwoord testgebruik bij allochtonen. Een reactie. De Psycholoog, 35, 231-235.
Tellegen, P. J., Winkel, M., Wijnberg-Williams, B. J., & Laros, J. A (1998). Snijders-Oomen Niet-verbale Intelligentietest SON-R 2.5-7. Verantwoording en Handleiding. Lisse: Swets & Zeitlinger.
Winkel, M. (1999). Snijders-Oomen Niet-verbale Intelligentietest. SON-R 2.5-7. Constructie, plaatsbepaling en validering van deze algemene niet-verbale intelligentietest voor jonge kinderen. Groningen: Stichting drukkerij C. Regenboog.


to top to top to top to top

homepage T&T homepage SON-tests