Support Center

Testdocumentatie

Assessment handleidingen

Handleiding Interessevragenlijst H

De Interessevragenlijst-H is een vragenlijst die in kaart brengt welke interesses een persoon heeft. Deze handleiding gaat in op het begrip interesse en de achtergrond van de vragenlijst.

1. Inleiding

Deze handleiding Interessevragenlijst H gaat in op het begrip interesse en de achtergrond van de vragenlijst. Vervolgens worden de ontwikkeling van deze vragenlijst, de scoringsmethodiek, de betrouwbaarheid en de validiteit weergegeven en toegelicht. Er wordt ook aangegeven hoe deze interessevragenlijst toegepast dient te worden, hoe de resultaten geïnterpreteerd kunnen worden en welke conclusies men hieraan kan verbinden.

Interessevragenlijst H

De Interessevragenlijst-H is een vragenlijst die in kaart brengt welke interesses een persoon heeft. Ixly ontwikkelde de vragenlijst voor het werkveld van Human Resource Management (HRM). In adviessituaties ontstaat er bij het afnemen van de vragenlijst een beeld van de interesses die een persoon heeft en daardoor wordt ook een beeld geschetst in welke beroepsgroepen hij of zijn geïnteresseerd is. Zodoende kan er gerichter worden gezocht naar een passend beroep of passende studie.

De Interessevragenlijst-H is een multi-ipsatieve vragenlijst. Multi-Ipsatief wil in dit geval zeggen dat kandidaten wordt gevraagd voor 4 activiteiten per keer de volgorde aan te geven van minst leuk naar meest leuk. De Interessestest-H is bedoeld voor adviessituaties.

2. Theorie Interessevragenlijst H

De inhoud van dit hoofdstuk is een verkorte en aangepaste versie van het artikel ‘Interesse en Interessemeting’ van T. Luken uit 1996.

2.1 Afbakening van het interessebegrip

De begrippen interesse(n), belangstelling en beroepenvoorkeur worden in de literatuur over beroepskeuze(begeleiding) vaak door elkaar gebruikt. Wel bestaat er een vrij duidelijk onderscheid met de begrippen behoeften en waarden, dat als volgt kan worden geformuleerd:

Interesse is wat men leuk vindt, graag doet, graag weet (bijv. “ik vind het leuk om computerprogramma’s te schrijven”)
Behoefte is wat men nodig heeft (bijv. “ik heb orde in mijn leven en op mijn werkplek nodig om iets te kunnen presteren”)
Waarde is wat men belangrijk vindt, de doelen waarnaar men streeft (bijv. “ik vind het belangrijk dat mensen de beschikking krijgen over veel informatie”)

2.2 Geschiedenis van het interessebegrip

De geschiedenis van de interessemeting start in de jaren twintig in de Verenigde Staten. De tests van Strong (1955) en Kuder (Adkins & Kuder, 1940) worden door alle overige prominente auteurs als de belangrijkste ontwikkelingen gezien op het gebied van Interessevragenlijst.

Strong
De eerste, belangrijke Interessevragenlijst was de Vocational Interest Blank van Strong (SVIB), die in 1927 in de Verenigde Staten werd uitgebracht. Dit was overigens een versie voor mannen. De versie voor vrouwen volgde in 1933. Sinds 1974 is er een versie voor mannen en vrouwen. De SVIB maakt gebruik van zogenaamde heterogene schalen die op empirische wijze zijn samengesteld. Bij deze werkwijze komt het er op neer dat men onderzoekt in hoeverre de interesses van de respondent lijken op de interesses van bepaalde (groepen) beroepsbeoefenaren. De SVIB bestaat uit ongeveer 325 items. Het gaat hierbij om allerlei activiteiten of onderwerpen, zowel op het gebied van beroepen als daarbuiten, waarvan de cliënt moet aangeven of hij ze aantrekkelijk, neutraal of onaantrekkelijk vindt. Bijv. biologie, een carburateur bijstellen, vissen, toneelspeler, bergbeklimmen, een groot feest organiseren, piloot etc.

Strong neemt aan dat de meerderheid van de mensen in een bepaald beroep ongeveer gelijke interesses zullen hebben. Door middel van empirisch onderzoek is hij nagegaan hoe mensen in een groot aantal beroepsgroepen reageren op zijn test. Een willekeurig gegeven uit de enorme hoeveelheid verzamelde informatie is bijvoorbeeld: 59% van de ingenieurs beoordeelt het item “schrijver van technische boeken” positief, terwijl slechts 1% van deze groep het item “veilingmeester” aantrekkelijk vindt. Een respondent die “schrijver van technische boeken” positief beoordeelt, krijgt twee punten op de ingenieursschaal en wie “veilingmeester” negatief beoordeelt, krijgt eveneens 2 punten op de ingenieursschaal. Voor een honderdtal beroepen bestaan dergelijke schalen. Men kan de cliënt dus aan de hand van de uitslag laten zien in hoeverre zijn/haar interessepatroon lijkt op dat van de mensen in elk van die beroepen. Handscoring is nu niet meer mogelijk: een computer is noodzakelijk om de uitgebreide profielen af te kunnen drukken. De SVIB is (in herziene versies) in de VS nog steeds een van de belangrijkste Interessevragenlijsten en wordt nog steeds frequent gebruikt.

Kuder
De tweede belangrijke test was die van Kuder. De Kuder Preference Record (KPR) werd in 1940 in de V.S. uitgebracht. Kuder werkte met een gedwongen keuze systeem. De cliënt moet steeds uit drie alternatieven kiezen welke van de drie hij/zij het aantrekkelijkst èn welk hij/zij het minst aantrekkelijk vindt. Een voorbeelditem van de KPR zou kunnen zijn:

Nieuwe bloemensoorten kweken
Een advertentiecampagne voor bloemisten uitvoeren
Telefonische bestellingen voor een bloemist behandelen

De cliënt moet altijd kiezen, ook als hij of zij alle alternatieven eigenlijk even aantrekkelijk of onaantrekkelijk vindt. Door overwegend activiteiten op het zelfde terrein te kiezen (in het voorbeeld: bloemen) probeerde Kuder zo veel mogelijk storende invloeden uit te schakelen: als het bij alternatief b om auto’s ging en bij c om kleren, weet men niet of een keuze voor de advertentiecampagne of voor de auto’s is, voor de telefonische bestellingen of voor de kleren. Door middel van factoranalyse selecteerde en groepeerde Kuder zijn items tot homogene schalen, d.w.z. schalen met onderling hoog correlerende items.

Ontwikkelingen in Nederland
Het heeft lang geduurd voordat er in Nederland serieuze Interessevragenlijsten op de markt kwamen. De eerste, in 1959, was de Beroepen Interessevragenlijst (BIT), een bewerking door Wiegersma van de Duitse Berufs-Interessen-Test van Irle uit 1955. De tweede was de KPR van Kuder, die door medewerkers van de psychologische dienst van de Hoogovens werd bewerkt voor de Nederlandse situatie en in 1968 beschikbaar kwam.

Er zijn verschillende pogingen gedaan om ook de SVIB voor de Nederlands situatie te bewerken, maar deze hadden pas succes, toen de oorspronkelijke benaderingswijze van Strong (empirische, heterogene schalen) werd verlaten. Dit was door Evers, die in 1979 de ABIV uitbracht. De ABIV lijkt uiterlijk nog wel een beetje op de oorspronkelijke SVIB: er staan niet alleen beroepen en beroepsactiviteiten in, maar ook items die met sport te maken hebben, mensentypen, vrijetijdsbestedingen enz. Ook vindt de beoordeling door de cliënt plaats door vrije keuzen tussen “aantrekkelijk”, “neutraal” en “onaantrekkelijk”, net als bij de SVIB. Evers heeft er echter (achttien) homogene schalen van gemaakt.

Alle drie genoemde tests zijn inmiddels in een nieuwe versie uitgebracht. Bij de KPR is dat de verkorte versie, die deel uitmaakt van de door Kooreman voor de Gemeenschappelijke Dienst ontwikkelde “Morini-testbatterij” (MOtivatie, RIchting en NIveau)

2.3 Theorieën van interesse en interesseontwikkeling

Van de vele theorieën over het interessebegrip worden hieronder de belangrijkste en invloedrijkste theorieën besproken.

Super
D.E. Super begon in het begin van de jaren vijftig theorieën over beroepskeuze te publiceren. Super beschrijft de beroepskeuze als een levenslang ontwikkelingsproces, waarin het zelfconcept (of de persoonlijke constructen, zoals hij het nu liever noemt) een belangrijke rol speelt. Ook in deze theorie worden interesses vaak in één adem genoemd met capaciteiten en persoonlijkheid.

Super maakt een duidelijk onderscheid tussen interesses en capaciteiten als hij het beroepskeuze-ontwikkelingsproces beschrijft en doet dit in een aantal opeenvolgende stadia. Ook geeft hij de duidelijke volgorde aan tussen ontwikkeling van interesses eerst en capaciteiten daarna. Alleen laat Super de ontwikkeling iets eerder starten en bestrijken de stadia bij hem iets bredere leeftijdscategorieën, ook al omdat het stadium van de waardenontwikkeling ontbreekt. Mede gebaseerd op de beschrijving van het ontwikkelingsproces in stadia heeft Super het begrip “beroepskeuzerijpheid” geïntroduceerd.

Nieuwsgierigheid speelt volgens Super (1990) een belangrijk startpunt bij de ontwikkeling van het zelfconcept in het algemeen en de interesses in het bijzonder. Deze nieuwsgierigheid leidt bij het kind (en bij een gezonde ontwikkeling ook later in de loopbaan) tot exploratieve activiteiten. De interesses ontwikkelen zich door de ervaringen die men aldus opdoet: sommige activiteiten bevallen beter dan ander. Ook andere mensen spelen hierbij een rol, zowel via hun mededelingen als via hun rolvoorbeelden.

Gottfredson
Eén van theorieën op het gebied van de beroepskeuze die de vooral de laatste tijd de meeste invloed heeft is zonder twijfel die van L. Gottfredson (1981). Ook in haar theorie nemen het zelfconcept en een indeling van de ontwikkeling van het individu in verschillende stadia een belangrijke plaats in. Voor de beroepskeuze zijn de volgende stadia volgens Gottfredson het belangrijkst:

6 t/m 8 jaar: Oriëntatie vooral op geslachtsrollen (wat zijn mannelijke/vrouwelijke bezigheden), hetgeen resulteert in een voorkeur voor beroepen binnen bepaalde grenzen van seksetypering (mannen-/vrouwenberoepen).
9 t/m 13 jaar: Oriëntatie op sociale klasse en intelligentie; resultaat is een voorkeur voor beroepen binnen bepaalde (prestige-)niveaugrenzen.
Vanaf 14 jaar: Oriëntatie op de eigen interesses, waarden en capaciteiten. Resultaat: voorkeur voor een bepaald werkveld.

Een belangrijk aspect van Gottfredsons theorie is dat het ontwikkelingsproces een proces van inperking van het keuzeveld impliceert. De bij de stadia genoemde grenzen perken het gebied waaruit gekozen kan worden, gaandeweg in. Een tweede belangrijk aspect van de theorie is dat dit proces onomkeerbaar is. Met ander woorden: de eerdere inperkingen zijn definitiever dan de latere. Dit impliceert dat de persoon als dat nodig is makkelijker de voorkeuren laat schieten die ontstaan zijn op grond van de eigen interessen dan die ontstaan zijn uit het klasse-bewustzijn resp. de sekserol.

Lent, Brown en Hackett
De door Lent, Brown en Hacket (1994) gepubliceerde theorie voldoet wellicht nog het best aan de wensen en toetsbaarheid van een theorie. Deze auteurs hebben in de voetsporen van onder meer Bandura en Krumboltz een sociaal-cognitieve theorie van het loopbaanproces opgesteld, waarin de interesse de centrale plaats inneemt. Volgens Lent et al. (1994) zijn het voornamelijk de interesses die bepalen welke doelen men stelt en via deze doelen welke keuzen men gaat maken en realiseren.

De theorie van Lent et al. (1994) is tamelijk expliciet over de vraag hoe interesses ontstaan. Het zijn vooral de volgende twee factoren die het ontstaan van interesses beïnvloeden:

Self-efficacy. Dit begrip is rond 1980 in de Engelstalige beroepskeuzeliteratuur geïntroduceerd en heeft daar sindsdien veel aandacht gekregen. Bandura definieert “self-efficacy” als “de beoordelingen van mensen van hun capaciteiten om handelingen te organiseren en uit te voeren om bepaalde typen prestaties te leveren” (geciteerd door Lent c.s., p. 83, vertaling TL). Het gaat bij self-efficacy dus eigenlijk om het zelfvertrouwen voor specifieke activiteiten, het zelfvertrouwen om specifieke prestaties te kunnen leveren.
De verwachtingen van de uitkomsten: welke resultaten en effecten verwacht men van de activiteiten/prestaties?

Deze self-efficacy en verwachtingen ontwikkelen zich volgens Lent et al. gedurende de jeugd door het uitproberen van activiteiten, de selectieve bekrachtiging en feedback van de sociale omgeving en de voorbeelden van anderen. In de vroege volwassenheid zou een uitgekristalliseerd interessepatroon zijn ontstaan, dat daarna nog maar weinig verandert.

2.4 Homogeen versus heterogeen

Een homogene schaal bestaat uit items die allemaal dezelfde interesse meten. De items van homogene schalen correleren onderling hoog, terwijl ze idealiter met de items van andere schalen laag, niet of negatief correleren. De KPR is al ter sprake geweest als voorbeeld van een Interessevragenlijst, opgebouwd uit homogene schalen. Bijvoorbeeld de schaal Sociaal, die bestaat uit items die allemaal te maken hebben met sociale (beroeps)activiteiten. Uit dit voorbeeld blijkt overigens dat homogeniteit een relatief begrip is. Binnen de schaal Sociaal zou men groepen items kunnen onderscheiden die nòg homogener zijn, bijv. Onderwijs, Verzorging, Verpleging, Maatschappelijk Werk. Hoe smaller, hoe homogener. De Interessevragenlijst-H is een vragenlijst met homogene schalen.

Een heterogene schaal bestaat uit items die inhoudelijk weinig of niets met elkaar te maken hebben, maar die, zoals bij empirisch onderzoek is vastgesteld, door een bepaalde groep beroepsbeoefenaren relatief vaak gekozen worden. Als een cliënt hoog scoort op de schaal “psycholoog”, betekent dit, dat hij/zij vaak items gekozen heeft die gemiddeld ook door psychologen vaak gekozen worden.

Voorbeelden van heterogene schalen in de Nederlandse situatie zijn de L- en de M-schalen van de oude versie van de BIT. Deze schalen geven een indicatie of de interesses meer liggen op het gebied van “lagere” of van de “middelbare en hogere” beroepen.

Heterogene schalen hebben als voordeel, dat ze minder makkelijk door de cliënt doorzien worden. Het is immers niet bij voorbaat zichtbaar tot welke schaal een item behoort (hetgeen bij homogene schalen meestal wel makkelijk te raden is). Daardoor is de cliënt minder in staat bewuste invloed op de testuitslag uit te oefenen. Dit wordt in selectiesituaties dikwijls als voordeel beschouwd.

Interessevragenlijsten op basis van heterogene schalen hebben echter ook belangrijke nadelen. Mogelijk het belangrijkste nadeel, vooral bij keuzebegeleiding, is dat de uitslag geen inzicht geeft in de interessestructuur van de cliënt. Het is namelijk niet zonder meer duidelijk waarom de interesses van de cliënt lijken op een bepaalde groep beroepsbeoefenaren. Cronbach (1961, p. 429) geeft als voorbeeld dat één van de punten waarop medische studenten zich onderscheiden van psychologiestudenten hun hogere score op het item “piloot” is. En wat te denken van dit citaat: “Als je de jongere wilt selecteren die echt in de gezondheidszorg geïnteresseerd is, kun je het beste de persoon eruit pikken met een hoge score op de timmermansschaal”. De gegeven verklaring is dat deze waarschijnlijk niet al te ambitieus is. Om de cliënt inzicht in de eigen interesses te geven is dit echter te omslachtig.

2.5 Ipsatief versus normatief

De Interessevragelijst-H is een (multi-)ipsatieve vragenlijst. Evers (1986) omschrijft een test als ipsatief als de scores onderling afhankelijk zijn. Dit is het geval als men een gedwongen keuze-systeem hanteert. Men kan dan niet op alle dimensies die de test meet hoge of juist lage scores behalen. Ook niet als men een externe norm gebruikt. Dit geldt voor veel in Nederland gebruikte interessevragenlijsten, waaronder ook de Interessevragenlijst-H.

Een leidend argument voor ipsatieve interessevragenlijsten is dat het bij het kiezen van een richting (in tegenstelling tot bij het kiezen van een niveau) vooral gaat om een intrapsychische vergelijking en niet om een interpsychische vergelijking. De cliënt wil weten wat hem of haar het meest interesseert en hoe anderen over diezelfde onderwerpen denken is van veel minder belang. Dit argument wordt ook regelmatig gebruikt om het weglaten van normgroepen te rechtvaardigen.

Bij een normatieve test is de cliënt vrijer. Het bekendste voorbeeld van een normatieve test is de ABIV. Bij elk item kan de cliënt aangeven of hij/zij het item beoordeelt als plezierig, neutraal of onplezierig. Dit noemt men wel een driepuntsschaal of, vernoemd naar de uitvinder, de Likertschaal. Men maakt ook wel gebruik van vijf-puntsschalen of zeven-puntsschalen.

Een nadeel van het vrije-keuzesysteem is dat er soms geen duidelijke uitkomsten zijn, d.w.z. geen enkele interesserichting heeft een score boven het gemiddelde. Dit kan bijvoorbeeld gebeuren bij cliënten die alles negatief of alles “gemiddeld” beoordelen. Veel keuzebegeleiders vinden dit een onplezierig of onvruchtbaar uitgangspunt. Voordeel is dat tests die vanuit dit principe zijn geconstrueerd, een reëler beeld geven van de interesses van de cliënt vergeleken met de normgroep.

3. Constructie en normering Interessevragenlijst H

3.1 De ontstaans- en constructiegeschiedenis

Het ontbrak adviseurs, werkzaam in het veld van studie- en loopbaanadvisering, aan een goede vragenlijst die inzicht gaf in de interesses van een kandidaat. Een dergelijke vragenlijst zou een goede toevoeging voor dit werkveld zijn, aangezien een match tussen interesses en studierichting van grote waarde zou kunnen zijn bij het uiteindelijke succes in studie en baan. Voor Ixly was dit reden om aan de ontwikkeling van de Interessevragenlijst te beginnen.

Een plan werd bedacht om tijdens een grote carrièrebeurs in Utrecht kwalitatieve data te verzamelen over de doelgroep van de beurs: studenten en starters op de arbeidsmarkt. Er werd gevraagd wat de bezoeker studeerde of heeft gestudeerd, en wat die studie zo interessant maakte dat hij of zij die studie gekozen heeft. Na een eerste schifting van de verzamelde antwoorden bleek er een itempool van ongeveer 1000 bruikbare en complete zinnen te zijn. Op basis van de opgegeven studies werden de antwoorden in bredere schalen geplaatst. Voor de studies werd een tweedeling gebruikt van middelbaar en hoger onderwijs om de functionaliteit te verhogen. Dit resulteerde in twee verschillende tests. Voor schalen waar onvoldoende items voor waren verzameld werden items bedacht.

Deze eerste versie werd uitgezet bij een groep respondenten. Op deze data is een exploratieve factoranalyse uitgevoerd, en is het aantal items voor de uiteindelijke versie van de Interessevragenlijst-H teruggebracht tot 154. Twee extra, niet meewegende items, zijn toegevoegd aan de vragenlijst om een multi-ipsatieve verdeling van 4 items per pagina mogelijk te maken. De uiteindelijke factoren en schalen zijn weergegeven in tabel 1.

Tabel 1. De factoren en schalen van de Interessevragenlijst-H

Interessevragenlijst-H
Factoren	Schalen
Alfa richtingen (6)	Artistiek
	Communicatie
	Geschiedenis
	Theologie en wijsbegeerte
	Taal en cultuur
	Muzikaal
Bèta richtingen (7)	Bouwkunde
	Geologie
	Informatica
	Exacte vakken
	Techniek
	Agrarisch
	Biologisch
Gamma richtingen –	Sociaal
Diensten (4)	Gezondheidszorg Dieren
	Gezondheidszorg
	Onderwijs
Gamma richtingen –	Financieel – Economisch
Bestuurlijk Maatschappelijk (5)	Management en Beleid
	Commercieel
	Maatschappelijk Politiek
	Recht
Specifieke interessegebieden (3)	Sport
	Veiligheid
	Toerisme

3.2 Vaststellen normen

Per schaal wordt de (gewogen) ruwe schaalscores omgezet in stenscores. Dit zijn bij benadering normaalverdeelde scores op een schaal die loopt van 1 tot 10. Het theoretisch gemiddelde is 5,5 met een standaarddeviatie van 2. De schalen zijn symmetrisch en normaal verdeeld. Standaardscores, en dus ook stenscores, geven een beeld van hoe een bepaalde score zich verhoudt tot het gemiddelde van alle scores. Hoe men deze stenscores kan interpreteren wordt besproken in hoofdstuk Toepassing en interpretatie. Een voorbeeld van een normtabel is opgenomen in Bijlage 3.

De stenscores worden niet direct discreet maar als intervalscore berekend. Ze worden alleen discreet gerapporteerd. De procedure hoe de ruwe schaalscores in stenscores worden omgezet, wordt beschreven in Van der Woud (2007).

3.3 Duur en voortgang

De kandidaat krijgt in totaal 39 schermen met vier activiteiten per scherm. Kandidaten mogen zelf weten hoe lang zij er over doen om de vragenlijst in te vullen. De gemiddelde invultijd ligt rond de 15 minuten. Het is wenselijk om de vragenlijst in één keer in te vullen. Aan de hand van een voortgangsindicator kan de gebruiker zien hoe ver hij of zij is met invullen.

3.4 Leesbaarheid en toegankelijkheid

De Interessevragenlijst-H is gemaakt op taalniveau B1. Dit geldt voor zowel de instructieteksten en de vragen als voor de rapportage. De vragenlijsten zijn toegankelijk gemaakt voor mensen met een handicap. De teksten kunnen worden voorgelezen door een zogenaamde screen reader. Lettergrootte, contrast en kleuren kunnen in worden aangepast met behulp van (standaard) browserinstellingen. De kandidaat kan er bovendien voor kiezen om de vragen alleen met behulp van een toetsenbord invullen, als het gebruik van een muis moeilijkheden oplevert.

3.5 Minimale systeemeisen en -instellingen

Op het werkstation van de kandidaat dient minimaal een webbrowser te draaien van het type Internet Explorer 6 of nieuwer, Firefox versie 2.5 of hoger, Chrome of Safari versie 3 of hoger. Voor het gebruik van het test is een voortdurende internetverbinding nodig. Alle gegevens worden veilig (versleuteld) over deze verbinding verstuurd. Het beeldscherm dient minimaal 1024 bij 768 pixels te tonen. En de browser moet, volgens de gebruikelijke standaardinstellingen, gebruik van cookies en Javascript toestaan. Verder zijn geen bijzondere maatregelen nodig.

3.6 Rapportage

Na het rangschikken van de activiteiten van de 39 pagina’s vragen krijgt de kandidaat het Rapport Interessevragenlijst te zien. Deze rapportage bestaat uit een korte algemene inleiding over interesses en een grafische weergave van de mate waarin verschillende interessegebieden de kandidaat aanspreken. Een voorbeeldrapport is opgenomen in Bijlage 5.

4. Betrouwbaarheid Interessevragenlijst H

De betrouwbaarheid van een vragenlijst geeft een indicatie van de nauwkeurigheid van het instrument. Het begrip heeft betrekking op de reproduceerbaarheid van de gemeten uitkomsten: in hoeverre komen de resultaten van een meting met het instrument bij een tweede keer (en derde keer, enzovoorts) overeen, of in hoeverre komen de uitkomsten bij een vergelijkbare set items overeen?

De betrouwbaarheid van een vragenlijst kan op verschillende manieren worden bepaald. Zo kan dezelfde vragenlijst voor een tweede maal bij dezelfde persoon afgenomen worden, zodat de resultaten van deze twee metingen met elkaar kunnen worden vergeleken (test-hertest betrouwbaarheid). Ook kunnen de scores op de ene helft van de vragenlijst vergeleken worden met de scores op de andere helft van de vragenlijst (split-half betrouwbaarheid). Het meest gebruikt, en geschikt bij een vragenlijst zoals de Interessevragenlijst-H, is de berekening van de alfa (α-coëfficiënt). Dit is een maat voor interne consistentie (Nunnally, 1978). Bij een α groter dan 0,85 mag men spreken van een redelijk homogene groep items (Green, Salkind & Akey, 2002). Al deze methoden zijn gebaseerd op correlatieberekeningen. Om uitspraken te kunnen doen over de betrouwbaarheid van de Interessevragenlijst-H is de interne consistentie (α) voor iedere schaal berekend. Dit voor de ongewogen normgroep gedaan.

Er zijn α-coëfficiënten berekend voor twee verschillende manieren van afname van de Interessevragenlijst-H. De antwoordendatabase van Ixly bevat 280 respondenten die in een adviessituatie de vragenlijst hebben ingevuld. De database van Werk.nl bevat 62573 respondenten die op eigen initiatief de website hebben bezocht en in een ongecontroleerde situatie de test hebben ingevuld. De betrouwbaarheid van de schalen voor de twee databases staan in tabel 2. Tevens zijn hier de verschillen tussen de gevonden Cronbach’s alfa’s vermeld.

Tabel 2: Betrouwbaarheidsgegevens van Interessevragenlijst-H van verschillende steekproeven.

Schaalnaam	Items	Betrouwbaarheid database werk.nl N=62573	Betrouwbaarheid database toolkit N=280	Verschillen
		Cronbach’s alfa* α	Cronbach’s alfa* α
Gezondheidszorg dieren	6	.839	.852	– .013
Financieel economisch	6	.827	.805	.022
Muzikaal	6	.821	.822	– .001
Agrarisch	7	.812	.821	– .009
Artistiek	6	.801	.791	.010
Informatica	6	.798	.803	– .005
Sport	6	.793	.789	.004
Exacte vakken	7	.777	.772	.005
Techniek	6	.772	.803	– .031
Geschiedenis	6	.763	.782	– .019
Commercieel	7	.760	.798	– .038
Sociaal	6	.752	.760	– .008
Bouwkunde	6	.749	.772	– .023
Geologie	6	.733	.726	.007
Recht	6	.728	.739	– .011
Gezondheidszorg	6	.720	.648	.072
Theologie en Wijsbegeerte	6	.710	.715	– .005
Toerisme	6	.702	.720	– .018
Management en Beleid	6	.694	.606	.088
Taal en Cultuur	7	.669	.625	.044
Communicatie	6	.657	.712	– .055
Onderwijs	6	.657	.710	– .053
Biologisch	6	.646	.608	.038
Veiligheid	6	.619	.696	– .077
Maatschappelijk politiek	6	.603	.606	– .003

* Interne consistentie

Aan de waarden van de interne consistentiemaat Cronbach’s Alfa is te zien dat de schalen van de Interessevragenlijst-H op basis van de itempool van de Ixly database qua betrouwbaarheid vergelijkbaar zijn met de schalen van de Interessevragenlijst-H zoals die is afgenomen op Werk.nl. Het grootste verschil is de schaal Management en Beleid; het kleinste verschil is waargenomen bij de schaal Muzikaal.

De α-coëfficiënten van de schalen verschillen relatief weinig van elkaar. Rekening houdend met het feit dat de Interessevragenlijst-H op Werk.nl in een ongecontroleerde setting is afgenomen, presteert de Interessevragenlijst-H boven verwachting op de interne consistentiemaat Cronbach’s alfa. Verwacht wordt dat bij een nieuwe afname in een gecontroleerde omgeving en met ruime informatie over de achtergrond van de respondenten deze interne consistentieschalen significant verbeteren.

4.1 Vergelijking tussen verschillende afnamen

Een indicatie van de stabiliteit van een test kan worden verkregen door de scores van de twee identieke testen, ingevuld door verschillende respondenten in verschillende settings, met elkaar te vergelijken. In Bijlage 4 zijn de resultaten van de independent samples T-test te zien.

Cohen (1992) beschrijft als volgt hoe effectsizes (ES) geïnterpreteerd kunnen worden: 0.20 is een klein ES, 0.50 is een gemiddeld ES en 0.80 een groot ES. In de tabel in Bijlage 4 is te zien dat er geen enkel verschil tussen de gemiddelden van de twee antwoordendatabases een ES van 0.20 of hoger heeft. Deze uitkomst is een goede indicatie voor de stabiliteit van de Interessevragenlijst-H tussen verschillende afnamen in verschillende settings.

5. Validiteit Interessevragenlijst H

5.1 De schaalstructuur

Een belangrijke indicatie van de begripvaliditeit van de Interessevragenlijst-H zijn de uitkomsten op de MGM (Multipele Group Method). Voor de Interessevragenlijst-H is er een MGM uitgevoerd op een zeer grote dataset (N=62573). De kandidaten in deze groep hebben allemaal de vragenlijst ingevuld op de website van Werk.nl. Over deze groep zijn geen gegevens bekend. De resultaten van de MGM zijn opgenomen in Bijlage 1. In de tabel worden items met andere schalen gecorreleerd. De weergegeven correlaties met de eigen schaal zijn de item-restcorrelaties. Opvallende punten bij deze uitkomsten worden hieronder besproken.

De weergave van de MGM-resultaten wordt verhelderd doordat er van kleuren gebruik is gemaakt. Er zijn drie categorieën met een eigen kleur:

Grijs betekent dat het item het hoogst correleert met zijn eigen schaal en dat deze correlatie bovendien significant verschilt van de correlaties tussen het item en de andere schalen.
Geel betekent dat de gevonden correlatie tussen het item en zijn eigen schaal niet significant verschilt met correlaties tussen hetzelfde item en andere schalen.
Rood betekent dat de gevonden correlatie tussen het item en de eigen schaal significant lager is dan de correlatie tussen het item en een of meerdere andere schalen.

Er is een eerste zeer grote MGM uitgevoerd op de originele 1000 goedgekeurde items. Na de analyse bleken veel items slecht te presteren op de eigen schaal, en op theoretische gronden niet in andere schalen te passen. Na een zeer grote schifting bleven de 154 huidige items over. Deze test is na deze constructie in gebruik genomen en er zijn twee databases beschikbaar waarin data is verzameld. De ene dataverzameling heeft plaatsgevonden op de website van werk.nl. De andere is in een gecontroleerde setting als onderdeel van een adviesgesprek met een consulent afgenomen. In verband met de grote overeenkomsten tussen de betrouwbaarheid van en correlaties tussen de twee databases is er alleen een factoranalyse gedaan over de grote database van werk.nl (n=62573).

Uit de uiteindelijke MGM-analyse blijkt dat er nog slechts enkele items significant hoger correleren met een andere schaal. In totaal correleren 27 van de 154 items significant beter met een andere schaal, maar hebben ook een sterke bijdrage aan de eigen schaal. Alle overige items correleren significant hoger met hun eigen schaal dan met een andere schaal (grijs).

Met de resultaten van de MGM wordt de theoretische indeling empirisch onderbouwd. Slechts enkele items van de Interessevragenlijst-H correleren hoger met een andere schaal dan met de schaal waar hij op basis van de theorie onder ingedeeld is. Dit draagt sterk bij aan de validering van de Interessevragenlijst-H.

6. Toepassing en interpretatie

6.1 Toepassingsmogelijkheden

De Interessevragenlijst-H kan in elke situatie worden ingezet waarbij het van belang is meer te weten te komen over de interesses van een persoon. De vragenlijst kan ingevuld worden door iedereen die deel uit maakt van de Nederlandse beroepsbevolking. De Interessevragenlijst-H is voornamelijk ontwikkeld om ingezet te kunnen worden bij studiekeuze- en loopbaanadvies. Bij een adviessituatie wordt er een beeld verkregen van wat een persoon interesseert. Zodoende kan er gerichter naar een passende opleiding of functie worden gezocht.

Er is een automatische rapportage beschikbaar, waarin een grafische en een tekstuele weergave wordt gecombineerd. Het grafische deel geeft alleen de stenscores op de afzonderlijke werkwaarden weer. Het tekstuele deel geeft naast deze uitkomsten een tekstuele analyse van de resultaten. Een voorbeeldrapport is opgenomen in Bijlage 2.

6.2 Interpretatie van resultaten

Het grafische deel wordt gerapporteerd in stenscores. Deze scores zijn een vorm van standaardscores, wat inhoudt dat zij een beeld geven van hoe een bepaalde score zich verhoudt tot het gemiddelde van alle scores. Deze schaal loopt van 1 tot 10. Stenscores 4, 5, 6 en 7 liggen allemaal binnen 1 standaarddeviatie van het gemiddelde. Stenscore 2, 3 en 8, 9 liggen tussen 1 en 2 standaarddeviatie van het gemiddelde. Stenscore 1 en 10 liggen meer dan 2 standaarddeviaties van het gemiddelde. De gemiddelde score in de normgroep ligt precies op de grens van de vijfde en zesde sten. De percentages die horen bij de afzonderlijke stenscores zijn weergegeven in tabel 3.

Tabel 3: Stenscores met bijbehorende percentages

Sten	Percentage	Cumulatief percentage
1	2,3	2,3
2	4,4	6,7
3	9,2	15,9
4	15,0	30,9
5	19,1	50,0
6	19,1	69,1
7	15,0	84,1
8	9,2	93,3
9	4,4	97,7
10	2,3	100,0

Als men een stenscore van 8 op een bepaalde schaal scoort, betekent dit dat men tussen 1 en 2 standaarddeviaties hoger scoort dan het gemiddelde en dat er nog 6,7% (4,4% + 2,3%) van de personen uit de normering een hogere score hebben behaald. Stenscores moeten vooral niet verward worden met schoolcijfers.