NL
Inloggen Demo
088 49 59 000

Kantoorgebouw De Blend

Vleutensevaart 100

3532 AD Utrecht (NL)

Handleiding Divergent Denken Test

Het gebruiksdoel van de DDT is het meten van divergent denken in adviessituaties. Lees hier de handleiding.

Overzicht

  1. Inleiding
  2. Betrouwbaarheid
  3. Begripsvaliditeit
  4. Ontwikkeling
  5. Normering

 

Inleiding

1.1. Gebruiksdoel

Het gebruiksdoel van de DDT is het meten van divergent denken in adviessituaties. De test is ontwikkeld voor kandidaten met HBO-­‐niveau en hoger.

1.2. Theoretische achtergrond

Divergent denken
Guilford (1967) onderscheidde twee manieren van denken: convergent en divergent. Bij convergent denken is slechts één goed antwoord mogelijk, terwijl bij divergent denken verschillende correcte antwoorden bestaan. Intelligentietests meten over het algemeen convergent denken. In de praktijk komt het echter bijna nooit voor dat voor een probleem slechts één oplossing bestaat. Het is daarom nuttig om te meten in hoeverre men in staat is tot divergent denken.

Innovatie
Het doel van divergent denken is vaak innovatie: het komen met nieuwe en bruikbare oplossingen. Divergent denken is hier de eerste stap in: Guilford (1967) zag het als de
productiefase, waarbij een aantal ideeën wordt gegenereerd in de context van een probleem.

Threshold hypothesis
Guilford was in 1967 al vanmening dat creativiteit alleen meetbaar is bij mensen met een (minstens) bovengemiddeld intelligentieniveau. Dit wordt ook dethreshold hypothesis genoemd. Sindsdien is deze hypothese door verschillende onderzoekers getoetst, waarbij deze soms wordt ontkracht en soms bevestigd. Het is inmiddels een gangbare aanname dat pas bij een IQ-­‐score van 120 of hoger, creativiteit meetbaar is, al is niet precies bekend waar deze exacte score vandaan komt (Karwowski & Gralewski, 2013).

Bij het ontwikkelen van de Divergent Denken Test zijn we om deze reden uitgegaan van gebruikers met minimaal HBO-­‐niveau. Toekomstig onderzoek moet uitwijzen of de DDT ook bruikbaar is voor mensen met een lager opleidingsniveau.

Voorspellende waarde divergent denken
De mate van divergent denken heeft een voorspellende waarde op latere creatieve prestaties. Plucker toonde in 1999 aan dat de in 1972 behaalde resultaten van kinderen op de Torrance Tests of Creative Thinking (TTCT, een veelgebruikte maat voor divergent en creatief denken), een drie keer sterkere voorspeller was voor creatieve prestaties in het latere leven dan IQ in de kindertijd. Creatieve prestaties waren niet alleen artistiek, maar konden ook bestaan uit gepubliceerde artikelen, patenten, campagnes, etc.

Helson, Roberts en Agronick (1995) toonden aan dat beroepscreativiteit van vrouwen op 52-­‐jarige leeftijd een correlatie van .31 tot .48 heeft met verschillende maten van creativiteit op 24-­‐jarige leeftijd. Dit laat zien dat creativiteit vrij stabiel is, ook over lange perioden.

1.3. Meten van divergent denken

Er zijn verschillende psychometrische instrumenten om divergent denken te meten, zoals persoonlijkheidsvragenlijsten, interessetests, leraar-­‐, collega-­‐ en leidinggevendebeoordelingen, beoordeling van productie, zelfbeoordeling van creativiteit, etc. Ook zijn er een aantal tests ontwikkeld die divergent denken direct beogen te meten. Voorbeelden hiervan zijn dealternate uses tasks (noem zoveel mogelijk manieren om een paperclip te gebruiken) en incomplete figure task (een figuur van een paar lijnen wordt aangegeven, waarbij de gebruiker deze moet afmaken). Het probleem met deze tests is echter dat ze moeilijk zijn om automatisch te scoren. Bovendien zijn er geen restricties verbonden aan de taak. Zoals Guilford (1967) noemde, bestaat creativiteit in de context van een probleem. Bij bijvoorbeeld de incomplete figure task is hier geen sprake van: er is dus ook geen doel. Taken waarbij wel een duidelijke probleemstelling is, zoals raadsels, het lichtknop-­‐ of kaarsprobleem, of verborgen associaties, zijn gebaseerd op convergent denken: er zijn maar een beperkt aantal oplossingen mogelijk, en meten vaak achtergrondkennis. Bovendien zijn de antwoorden op deze vragen makkelijk vindbaar op internet.

Uitdagingen DDT
Bij het ontwikkelen van de DDT is rekening gehouden met de volgende criteria:

  • moet divergent meten denken
  • moet cultuurvrij zijn, moet geen bestaande kennis meten
  • moet online af te nemen zijn
  • moet automatisch gescoord worden
  • moet even betrouwbaar meten op ieder niveau

 

Betrouwbaarheid

Betrouwbaarheid wordt over het algemeen berekend door middel van Cronbach’s alfa. Om dit te berekenen zijn echter minstens drie items per schaal benodigd. Dat is bij de DDT niet het geval: productie is een enkele maat, en originaliteit is afhankelijk van welke antwoorden men gegeven heeft. Aangezien iedere respondent andere antwoorden geeft, is het niet mogelijk om Cronbach’s alfa te berekenen.

Test hertest-­‐betrouwbaarheid is wel meetbaar. Op zeer korte termijn zal hier onderzoek naar gedaan worden.

Een derde vorm van betrouwbaarheid is de split-­‐half betrouwbaarheid. Hierbij wordt de eerste helft van een vragenlijst vergeleken met de tweede helft. Het is bij de DDT mogelijk om productie en originaliteit op de eerste drie items te vergelijken met productie en originaliteit op de laatste zes items. Deze resultaten hebben echter beperkte waarde: de ene respondent heeft wellicht veel originelere antwoorden gegeven bij de eerste drie items, een andere meer bij de laatste, en bij weer een ander is het gelijk verdeeld.

De split-­‐half betrouwbaarheid is in de onderzoeksgroep (N = 305) berekend. De correlatie tussen de originaliteit van de eerste en die van de tweede helft was niet significant. De correlatie van productie was wel significant (r = .46, p<.000).

Dit resultaat biedt ondersteuning voor de betrouwbaarheid van deproductie-­‐schaal van de DDT.

 

2. Ontwikkeling Divergent Denken Test

2.1 Kenmerken van de test

Om te zorgen dat de DDT cultuurvrij is, is gekozen voor een figuratieve test. Elk item bestaat uit een figuur met 9 grote vakken, waar zich één of meerdere objecten bevinden (zie Figuur 1). De kandidaat dient zoveel mogelijk combinaties van drie vakken te vinden, die een overeenkomst met elkaar hebben die de overige zes vakken niet hebben.

Figuur 1: Voorbeelditem van de DDT waarin een oplossing geselecteerd is

Om aan te geven op welke overeenkomst de selectie gebaseerd is, dient de kandidaat in de vakken de betreffende objecten te selecteren. Tot dit doel zijn de negen grote vakken opgedeeld in negen kleine vakken. De selectie kan gebaseerd zijn op kleur, vorm, aantal, locatie of een combinatie van twee of meer van deze eigenschappen.

In het Figuur 1 is de overeenkomst dat de drie geselecteerd grote vakken allemaal een rondje bevatten, en de overige zes vakken niet. Een ander goed antwoord kan bijvoorbeeld zijn: de drie geselecteerde vakken hebben geen object in de bovenste rij. Of complexer: de drie vakken hebben meer dan twee objecten, waarvan geen vierkanten. De mogelijke complexiteit van de oplossingen zorgt ervoor dat er talloze antwoorden mogelijk zijn.

2.2 Items

De DDT bestaat uit 6 verschillende items. Er is gekozen voor verschillende typen items: sommige bevatten slechts zwarte en witte bolletjes, anderen verschillende figuren, en weer anderen cijfers en letters. De DDT is tijd-­‐per-­‐test: de kandidaat heeft 20 minuten en kan in die tijd vrij navigeren tussen de verschillende items. Iemand kan dus bij een paar items heel veel oplossingen geven, of bij ieder item slechts een paar.

2.3 Itemontwikkeling

In eerste instantie zijn er 17 items ontwikkeld. Deze zijn voorgelegd aan een aantal testontwikkelaars, en op basis van hun feedback zijn er 8 items geselecteerd. Deze zijn voorgelegd aan een onderzoeksgroep (N = 321). De groep bestond uit alleen hoogopgeleiden (215 HBO; 90 WO) van 16 tot 65 jaar. Van alle antwoorden die werden gegeven, werd eerst gecontroleerd of ze geldig waren. Met andere woorden: gaf het antwoord een overeenkomst aan die in drie vakken voorkwam, en niet in de overige zes? Verder zijn alle antwoorden geanalyseerd die slechts door één persoon gegeven waren. Deze bleken bijna allemaal niet correct. Alle antwoorden die slechts door één persoon werden gegeven zijn daarom niet meegenomen in de analyse. In totaal leverde dit 4751 geldige antwoorden op, waarvan 188 unieke. Dit houdt in dat sommige antwoorden door bijna alle deelnemers gegeven werden, en anderen slechts door een paar mensen.

Omdat het doel is dat de DDT zo divergent mogelijk is, werden er uit de 8 bestaande items 6 geselecteerd met de meeste mogelijke antwoorden. Op deze manier wordt de kans vergroot dat mensen met veel ideeën komen wanneer het item wordt aangeboden.

Vervolgens is per antwoord onderzocht hoe vaak deze voorkwam in de onderzoeksgroep. Aangezien alle antwoorden die door slechts één persoon werden gegeven zijn uitgesloten, was het minimum hier 2. Het maximaal aantal deelnemers dat een antwoord gaf was 207. Door middel van een lineaire transformatie is per antwoord een originaliteitsscore berekend: hoe minder mensen een antwoord hebben gegeven, hoe hoger de score. Deze originaliteitsschaal loopt van 1 tot 10.

 

3. Normering Divergent Denken Test

Bij de DDT gaat het om een normgerichte interpretatie. Dat wil zeggen dat de scores van een kandidaat worden vergeleken met de normpopulatie. De normpopulatie is bij de DDT een representatie van de hoogopgeleide beroepsbevolking van Nederland. In dit hoofdstuk wordt nader beschreven hoe de normering is uitgevoerd en hoe de normgroep is gevormd.

3.1 Normeringsonderzoek

Doelstelling
De DDT is ontwikkeld voor adviessituaties binnen de HRM praktijk. Onder advies worden allerlei vormen van loopbaanbegeleiding, carrièreadvies, beroepskeuzeadvies en coaching verstaan. Alhoewel de DDT geen intelligentie meet, is het wel een prestatietest: met andere woorden, men vult de DDT zo goed mogelijk in.

Om sample of convenience-­‐effecten (Cotan, 2010) te vermijden is daarom een onderzoek gestart met als doel een representatieve afspiegeling van de hoogopgeleide Nederlandse beroepsbevolking te verkrijgen op de kenmerken leeftijd, geslacht, opleidingsniveau en provincie.

Methode van dataverzameling
De data waarover de normering is uitgevoerd, zijn begin 2015 door een onderzoeksbureau Right verzameld door middel van een internetpanel. De werving van dit ISO-­‐gecertificeerde internetpanel geschied met zogenaamd online veldwerk, via de volgende kanalen:

  • Via traditionele dataverzamelingsmethoden
  • Aangekochte adressen
  • Via links op websites
  • Via telefonische werving
  • Via een sneeuwbalmethode onder bestaande leden
  • Via social media

Door deze verschillende methoden in te zetten wordt een zo breed mogelijk publiek aangesproken, wat de representativiteit ten goede komt. Echter, de representativiteit van onderzoek via een online onderzoekspanel kan nadelig beïnvloed worden door selectie-­‐effecten. Zo hebben sommige groepen binnen de bevolking bijvoorbeeld een betere toegang tot internet dan andere. Indien een aselecte steekproef wordt getrokken uit een online panel, dan bestaat de kans dat bepaalde groepen zijn oververtegenwoordigd (bijvoorbeeld jongeren t.o.v. ouderen). Al is het overigens de vraag hoe groot dit effect precies is, gezien het feit dat ongeveer 83% van de huishoudens tegenwoordig een internetverbinding heeft (Bethlehem, 2009).

Het grote voordeel van het gebruik van onderzoekspanels is dat er gecorrigeerd kan worden voor mogelijke vertekeningen. Steekproeven worden namelijk samengesteld op basis van de volgende demografische dimensies: geslacht, leeftijd en regio. Deze samenstelling is gelijk aan de verdeling van de Nederlandse bevolking volgens de gegevens van het CBS. De demografische kenmerken kunnen nog worden uitgebreid met kenmerken zoals inkomen, gezinssamenstelling, etniciteit en opleiding. Maar achteraf kan op deze kenmerken ook worden herwogen om mogelijke vertekeningen te corrigeren. Voor het normeringsonderzoek hebben we gestreefd naar representativiteit op de volgende kenmerken: opleiding (HBO en WO), leeftijd, geslacht en werksituatie.

De representativiteit van onderzoek via een online onderzoekspanel kan verdernadelig beïnvloed worden door zogenaamde “zelfselectieonzuiverheid”. Deze ontstaat doordat respondenten zichzelf hebben geselecteerd (aangemeld) om deel te nemen aan een online panel. Deze onzuiverheid treedt overigens niet alleen op bij online veldwerk,maar bij elke vorm van onderzoek (bijvoorbeeld bij face-­‐ to-­‐face, telefonisch of schriftelijk onderzoek). Deze onzuiverheid is niet alleen inherent aan gebruik van zogenaamde Access Panels (waarbij respondenten worden geselecteerd uit een bestand van mensen die daarvoor toestemming hebben gegeven) maar wordt ook veroorzaakt door het simpele gegeven dat responspercentages niet 100% zijn. Dus zelfs bij een aselecte steekproef uit de Nederlandse bevolking waar mensen huis aan huis worden ondervraagd vindt zelfselectie plaats omdat niet iedereen die wordt benaderd zal deelnemen aan het onderzoek.

Er kunnen ook twijfels ontstaan over de kwaliteit van de data die verkregen is bij een Access Panel. Zo vreest men voor de opkomst van ‘professionele’ respondenten, die meedoen met veel internetvragenlijsten en die alleen meedoen als een beloning wordt aangeboden (Matthijsse et al., 2012), wat de kwaliteit van de data kan beïnvloeden. Zulke ‘professionele’ respondenten, vooral gemotiveerd door de beloning, willen misschien zo snel mogelijk en met de minste moeite de vragenlijst invullen, zeker als ze lid zijn van meerdere panels (van Ossenbruggen et al., 2008). Dit zou naar voren kunnen komen in allerlei vormen van ‘response bias’, dus bijvoorbeeld alleen de extreme antwoorden kiezen, of juist altijd ‘helemaal mee eens’ (‘acquiescence’) antwoorden of steeds hetzelfde antwoord geven (‘straight-­‐lining’). Dit zal de kwaliteit van de data negatief beïnvloeden. Aan de andere kant zijn zulke ‘professionele’ respondenten geoefende invullers van vragenlijsten, wat de betrouwbaarheid van de schalen omhoog zou kunnen brengen (Chang & Krosnick, 2009). Dit zou dus een positief effect op de kwaliteit van de data kunnen hebben.

Mathhijsse et al. (2012) hebben aangetoond dat er inderdaad ‘professionele’ respondenten bestaan – die lid zijn van meerdere panels en vooral gemotiveerd worden door excentrieke beloningen– maar dat kwaliteit van data nauwelijks verschilt van meer vrijwillige respondenten. Er bleek nauwelijks verschil in betrouwbaarheden tussen deze twee groepen en inconsistente verschillen in ‘response bias’.

De mogelijke invloed van zelfselectie op de externe validiteit van online panels is ook onderzocht. Chang en Krosnick (2009) deden dit voor twee panels in de Verenigde Staten. Zij vergeleken gegevens verkregen via telefonische interviews onder een aselecte steekproef met gegevens van een Internetpanel dat gebaseerd was op een (aselecte) kanssteekproef, en een Internetpanel dat bestond uit respondenten die zichzelf hadden aangemeld. Het bleek dat de respondenten die zichzelf hadden aangemeld de beste antwoorden gaven. De telefonische interviews leverden meer data die tekenen van response bias en nondifferentiatie vertoonden, wat leidde tot een slechtere datakwaliteit. De ‘professionele’ respondent bleek juist minder gemakzuchtig. Chang en Krosnick concludeerden dan ook dat Internetdata, mits op de juiste manier verkregen, goede en bruikbare resultaten opleveren en van vergelijkbare kwaliteit zijn als data verkregen via traditionele methoden. Deze conclusie is door meerderen onderzoekers onderstreept (zie bijvoorbeeld Gosling et al., 2004).

Hieruit kunnen we concluderen dat het verkrijgen van de data via een internetpanel een goede manier van dataverzameling is, die de kwaliteit van de normgroepgegevens van de DDT niet nadelig beïnvloed heeft.

Representativiteit
Gezien het gebruiksdoel van de DDT bestond de normgroep uit mensen met HBO-­‐ of WO-­‐niveau. Het gebruik van een online onderzoekspanel heeft ons zoals hierboven beschreven in staat gesteld om een steekproef te gebruiken die representatief is voor de hoogopgeleide Nederlandse beroepsbevolking. Bij het verzamelen van data is er gestreefd naar representativiteit op de volgende kenmerken: leeftijd, geslacht en werksituatie. Er zijn gegevens verzameld van 336 personen. 21 hiervan hadden missende data, wat de N op 305 brengt. De kenmerken van deze personen zijn weergegeven in Tabel 3.1

Tabel 3.1

Kenmerken onderzoeksgroep (N=305)

    N %  
       
Geslacht Man 152 49.8  
  Vrouw 153 50.2
       
Opleidingsniveau HBO 215 70.5
  WO 90 29.5
       
Leeftijdsgroep 1,00 16-­‐24 jaar 15 4.9
  2,00 25-­‐44 jaar 141 46.2
  3,00 44-­‐65 jaar 149 48.9
       
Werksituatie Werkzaam 269 85.4
  Werkloos/werkzoekend 46 14.6
       
Etniciteit autochtoon 265 83.3
  allochtoon 53 16.7
         

3.2 Beschrijving normgroep

In de volgende sectie zullen we kort de kenmerken van de normgroep (N = 305) beschrijven.

De verdeling van mannen en vrouwen over de opleidingsniveaus is gelijk (Chi2 = 0,936 df = 1, p = .333). Wel werden er leeftijdsverschillen tussen mannen en vrouwen gevonden (Chi2 = 7,275 df = 2, p = .026). Er waren meer vrouwen dan verwacht in de leeftijdsgroep 25 tot 44 jaar, en meer mannen in de groep 45 tot 65 jaar. Ook werden er verschillen gevonden in leeftijd tussen de verschillende opleidingsniveaus (Chi2 = 12,325, df = 2, p = .002): Mensen in de leeftijdscategorie 25 t/m 44 jaar waren hoger opgeleid dan verwacht. Mensen in de oudste categorie waren juist lager opgeleid dan verwacht. Mannen en vrouwen waren ongelijk verdeeld over werksituatie (Chi2 = 6,069 df = 1, p = .014): vrouwen waren vaker werkloos dan mannen. De verschillende leeftijds-­‐ en opleidingsgroepen verschilden niet van elkaar in werksituatie.

Beschrijving sectoren in de normgroep
In Tabel 3.2 wordt het aantal respondenten per sector weergegeven. De werksectoren zijn onderverdeeld in twaalf categorieën, gebaseerd op de indeling van het CBS zoals ook gehanteerd door het UWV-­‐werkbedrijf. Elke categorie is onderverdeeld in meerdere subsectoren .

Tabel 3.2

Aantal personen in normgroep per sector

  Sector N %  
       
  Landbouw, bosbouw en visserij 2 0,7  
  Industrie 19 6,2
  Energievoorziening 1 0,3
  Waterbedrijven en afvalbeheer 1 0,3
  Bouwnijverheid 9 3
  Handel 20 6,6
  Vervoer en opslag 10 3,3
  Horeca 6 2
  Informatie en communicatie 23 7,5
  Financiële dienstverlening 16 5,2
  Verhuur en handel van onroerend goed 1 0,3
  Specialistische zakelijke diensten 19 6,2
  Verhuur en overige zakelijke diensten 5 1,6
  Openbaar bestuur en overheidsdiensten 12 3,9
  Onderwijs 41 13,4
  Gezondheids-­‐ en welzijnszorg 61 20
  Cultuur, sport en recreatie 13 4,3
  Overige dienstverlening 27 8,9
  Anders 19 6,2
         

 

Beschrijving allochtonen in de normgroep
In de normgroep waren 41 personen van niet-­‐Nederlandse afkomst. De indeling in etniciteit van de onderzoeksgroep is als volgt:

Tabel 3.3

Etnische achtergrond allochtone deelnemers

  Respondent of een van de ouders geboren in: N  
     
  Turkije 3  
  Europa overig 17
  Indonesië 7
  Azië overig 2
  Suriname 4
  China 2
  Latijns-­‐ en Zuid-­‐Amerika overig 2
  Australië 2
  Nederlandse Antillen / Aruba 1
  Marokko 1
       


Beschrijving van schaalkenmerken in de normgroep
De DDT kent twee schalen: productie (aantal correcte antwoorden) en originaliteit (gemiddelde originaliteit van de antwoorden). Om een beeld te geven van de verdeling van deze schalen in de normgroep, worden in Tabel 3.4 de gemiddelden en standaarddeviaties van de schalen weergegeven. Om te bepalen of de scheefheid en kurtosis substantieel zijn voor zowel productie alsoriginaliteit een Kolmogorov-­‐Smirnovtest uitgevoerd. Deze was significant voor productie. Visuele inspectie liet ook zien dat veel mensen uit de normgroep precies acht antwoorden hadden gegeven, oftewel voor ieder item een. De verwachting is dat dit in een ‘echte’ sample niet het geval zal zijn. Zodra er meer data beschikbaar is zal dan ook een nieuwe normering plaatsvinden. De Kolmogorov-­‐Smirnovtest voor originaliteit gaf aan dat deze schaal normaal verdeeld was.

Tabel 3.4

Gemiddelde ruwe score productie en originaliteit in de normgroep (N=305)

  Schaal M SD Scheefheid (SD) Kurtosis(SD)
           
  Productie 15,34 8,581 0.242 (.14) –.895 (.278)
  Originaliteit 3,08 1,18 0.531 (.14) .858(.278)
           

 3.3 Gebruikte scores en normtabellen

Bij de DDT wordt er gerapporteerd op stenscores. Per schaal worden de ruwe schaalscores omgezet in stenscores. Dit zijn bij benadering normaal verdeelde scores op een schaal die loopt van 1 tot 10. Het theoretisch gemiddelde is 5.5 met een standaarddeviatie van 2, de spreiding van de ware scores is gefixeerd op 2. De schaal is symmetrisch en volgt een normale verdeling. Standaardscores, en dus ook stenscores, geven een beeld van de manier waarop een bepaalde score zich verhoudt tot het gemiddelde van alle scores.

De stenscores worden niet gelijk discreet berekend, maar als intervalscore, en alleen discreet gerapporteerd. De procedure die is gehanteerd bij het omzetten van ruwe scores naar stenscores wordt uitgebreid beschreven in van der Woud (2007), zieBijlage 1. Hieronder zullen wij echter de belangrijkste en de voor de gebruiker meest relevante punten samenvatten.

In Bijlage 2 zijn de normtabellen van de schalen opgenomen. In deze tabellen wordt voor iedere ruwe score de bijbehorende standaardscore, normscore en latente score weergegeven. Ook wordt voor de normscore een betrouwbaarheidsinterval gegeven, en voor de latente score een waarschijnlijkheidinterval.

Beperkingen normscores
In ons geval maken we gebruik van normen gebaseerd op gemiddelden en spreiding. Het voordeel van het gebruik van dit soort scores is dat deze rekening houden met de verdeling van de scores op een bepaalde schaal. Niet elke score komt namelijk even vaak voor: scores rond het gemiddelde komen veel vaker voor dan hele hoge of juist hele lage scores en volgen dus de normale verdeling. Hier wordt rekening mee gehouden door de normscore op basis van het gemiddelde en de standaardafwijking te berekenen. Bij de normale verdeling, en dus ook onze genormeerde scores, bevindt zich namelijk ongeveer 68% van de scores tussen een standaardafwijking onder het gemiddelde en een standaardafwijking boven het gemiddelde. Dit is een groot voordeel ten opzichte van het gebruik van bijvoorbeeld percentielen of decielen: bij percentielen wordt niet rekening gehouden met de verdeling van scores. Een score in het 4e deciel betekent bijvoorbeeld dat 40% van de normgroep dezelfde score heeft of lager, en dat dus 60% een hogere score heeft. Het verschil in scores tussen deciel 4 en deciel 5 zal echter veel kleiner zijn dan het verschil in scores tussen deciel 9 en 10, omdat de scores in het midden van de verdeling veel vaker voorkomen. Het gevaar is dus dat de verschillen in scores aan de uiteinden van de verdeling worden onderschat. Dit gevaar is minder aanwezig bij het gebruik van normen gebaseerd op gemiddelden en spreiding.

Zoals gezegd rapporteren we in de afgeronde latente (= geschatte ware) score als stenscore. Het nadeel van stenscores kan zijn dat het vrij grofmazig is, er zijn immers slechts tien klassen. Echter, bij het bespreken van iemands creativiteit, en zeker in adviessituaties, bieden stenscores genoeg differentiatie: het gaat erom een globaal beeld van iemands persoonlijkheid te scheppen waarbij het gaat om globale verschillen met de normgroep. Het verschil tussen sten 1 en 2 zal bijvoorbeeld in de praktijk niet zoveel uitmaken: het is duidelijk dat deze kandidaat laag scoort. Aangezien de DDT voor adviesdoeleinden bedoeld is, zullen er geen ingrijpende beslissingen genomen worden op basis van iemands score, wat zou pleiten voor een fijnmazigere rapportage.

Tot slot kunnen we zeggen dat stenscores over het algemeen makkelijk te interpreteren zijn. Nadeel kan wel zijn dat ze verward kunnen worden met schoolcijfers. In het rapport wordt echter duidelijk uitgelegd dat dit niet het geval is.

5. Begripsvaliditeit Divergent Denken Test

Zoals in Hoofdstuk 4, Normering al genoemd, is de DDT een vragenlijst met twee schalen die ieder uit een meting bestaan. Dit maakt het moeilijk om onderzoek te doen naar de interne structuur: een factoranalyse is bijvoorbeeld niet mogelijk, evenals een MGM-­‐analyse (Multiple Group Method). Wat wel mogelijk is, is om de twee losse schalen te valideren door middel van soortgenotenonderzoek, en relaties met de achtergrondvariabelen te onderzoeken.

5.1. Soortgenotenonderzoek

De soortgenotentest die hier gebruikt wordt is een variant van de eerdergenoemde alternate uses task (Guilford, 1967). In deze taak wordt de respondent gevraagd om zoveel mogelijk manieren te noemen waarop een baksteen gebruikt kan worden.Het voordeel van onderzoek met deze taak is dat de score hierbij ook bestaat uit productie (hoeveel antwoorden geeft iemand) en originaliteit (hoe vaak komt het antwoord voor in de normgroep).

De onderzoeksgroep is identiek aan de normgroep, zoals beschreven in Hoofdstuk 3, Normering. In Tabel 5.1 worden de resultaten van correlaties tussen de DDT en de Baksteentaak weergegeven.

Tabel 5.1

Correlaties tussen productie en originaliteit van de DDT en de Baksteentaak

    r p
  Productie .33 <.000
  Originaliteit .26 <.000
       

Bovenstaande resultaten bieden sterke ondersteuning voor de validiteit van de DDT. De richtlijnen van Cohen (1988; .10 = klein effect, .30 = gemiddeld effect, .50 groot effect) classificeren dit als een gemiddeld effect. In beschouwing nemend dat de tweetests op veel vlakken van elkaar verschillen (de DDT is figuratief en de Baksteentaak verbaal; de DDT bestaat uit meerdere items en de Baksteentaak slechts uit een open vraag; de DDT is abstract en de Baksteentaak gaat uit van kennis over de wereld), is een correlatie van rond de .3 sterk te noemen.

5.2. Relatie met achtergrondvariabelen

Geslacht
In de literatuur vindt men wisselende resultaten met betrekking tot de rol van geslacht in divergent denken.

Hong, Peng, O’Neil en Wu (2013) vonden dat meisjessignificant meer oplossingen gaven op twee alternate uses taken, terwijl in originaliteit geen verschil was tussen jongens en meisjes. Lin, Hsu, Chen, en Wang (2012) maakten geen onderscheid tussen productie en originaliteit, en vonden dat vrouwen hoger scoorden op een aangepaste versie van de TTCT (Chen, 2006) dan mannen. Dit effect werd ook gevonden door o.a. Kuhn en Holling (2009). Ander onderzoek laat echter geen verschil tussen mannen en vrouwen zien (zie bijvoorbeeld Abraham, Thybusch, Pieritz en Hermann, 2014).

Gezien de gemengde bevindingen is onze hypothese dat vrouwen hoger zullen scoren op productie, en hoger of even hoog op originaliteit. We vonden inderdaad een verschil in productie ten voordele van vrouwen (t = 3,62,p <.000), zoals zichtbaar in Tabel 5.2. Mannen en vrouwen lieten geen significant verschil zien op originaliteit (p=.124).