In dit hoofdstuk wordt een clusteranalyse uitgevoerd. De clusteranalyse heeft als doel om de verschillende respondenten op basis van hun behoefte/gedrag qua arbeidsmarktoriëntatie in te delen in een aantal clusters. Naar aanleiding van de clusteranalyse zijn de respondenten ingedeeld naar een cluster, alleen is het nog niet duidelijk hoe de verschillende clusters scoren op de verschillende gedragsvariabelen. Er kan nog geen profiel aan de clusters worden toebedeeld. Voor het geven van een profiel aan de clusters is een goede analyse een discriminantanalyse. De tweede stap is dan ook het uitvoeren van een
discriminantanalyse. Hierbij wordt gebruikt gemaakt van de zelfde gedragsvariabelen bij de clusteranalyse. De discriminantanalyse moet duidelijk maken hoe de verschillende clusters scoren op de
gedragsvariabelen, zodat per cluster een gedragsprofiel kan worden opgesteld. Een gedragsprofiel alleen is niet genoeg. In de volgende stap wordt voor de tweede keer een discriminantanalyse uitgevoerd, deze keer met de overige variabelen. Hierbij wordt gezocht naar passieve variabelen met een discriminerend
vermogen, zodat er per segment een identificatie ontstaat en er een profilering van elk segment kan worden gegeven. In dit hoofdstuk worden de resultaten van de drie analyses weergegeven een profilering van de segmenten weergegeven kan worden. In hoofdstuk zeven wordt dieper ingegaan op de
doelgroepkeuze en in hoofdstuk 8 wordt er een positionering van de segmenten gegegeven. 6.2 Cluster analyse
Malhotra (2004) geeft het volgende stappenplan voor een cluster analyse Stap 1: Probleemformulering
Stap 2: Selecteren van een afstandsmaat Stap 3: Bepalen van een cluster methode Stap 4: Bepalen van het aantal clusters
Stap 5: Interpreteren en profileren van de clusters
Stap 6: De validiteit en de betrouwbaarheid van de clusters vaststellen
Probleemformulering
In deze stap moeten de variabelen worden geselecteerd waar de clustering op gebaseerd zal worden. Hierbij dient rekening te worden gehouden dat de variabelen relevant moeten zijn voor het
onderzoeksprobleem (Malthotra, 2004). In dit onderzoek worden gedragsvariabelen in de clusteranalyse meegenomen. De focus ligt op gedrag aangezien we bij de laatstejaars juridische studenten een bepaald gedrag willen teweeg brengen. Namelijk dat de laatstejaars juridische studenten de producten van MPG daadwerkelijk gaan gebruiken. Hierbij valt te denken aan het Carrière Jaarboek. Daarnaast willen een gedragintentie creëren hierbij valt te denken aan dat de laatstejaars juridische studenten een concreet
voornemen of plan hebben om een bepaald gedrag uit te voeren; het gaan naar de Nationale Carrièrebeurs. De volgende gedragsvariabelen met betrekking tot arbeidsoriëntatie gedrag zijn dan ook in het onderzoek meegenomen.
Gebruik van een student carrièreblad
Bezoeken van een carrièrebeurs/bedrijvendag Gebruik van een universiteit- en/of faculteitsblad Gebruik van een juridisch vakblad.
Lid van studenten-en/of studievereniging. Gebruik van Carrière Jaarboeken.
Gebruik van verschillende bureaus, instanties en personen.
De variabelen met betrekking tot het gedrag geven inzicht hoe de laatstejaars juridische studenten zich oriënteren op de arbeidsmarkt. Hierbij wordt gekeken naar een aantal gedragsvariabelen die betrekking hebben op arbeidsmarktorientatie die hierboven zijn genoemd.
Selecteren van de afstandsmaat
Aangezien het doel van de clustering is dat gelijke juridische studenten met betrekking tot arbeidsmarktoriëntatie gegroepeerd worden. Er dient daarom gemeten te worden in hoeverre de
laatstejaars juridische studenten met elkaar overeenkomen of verschillen van elkaar. Hoe kleiner de afstand tussen de laatstejaars juridische studenten hoe meer de objecten met elkaar gemeen hebben. De afstand tussen de objecten kan op verschillende manieren gemeten worden; Malthotra (2004), noemt de volgende euclidean, city-block en de chebychev afstand. De meest gebruikte manier is de euclidean afstand
(Malthotra,2004). Voor deze afstandsmaat is gekozen omdat euclidean distance is de wortel van de verschillen van objecten in het kwadraat. Deze wordt dan ook in dit onderzoek gebruikt. De euclidean afstand maakt gebruik van de volgende formule: distance(x,y) = { i (xi- yi)2 }½
Bepalen van de clustermethode
Nadat de afstandsmaat is bepaald moet de clustermethode worden gekozen.
De clusteringmethoden kunnen ingedeeld worden naar hiërarchische en non-hiërarchische clustering (Malthotra,2004). Hiërarchische clustering kan worden opgesplitst in agglomerative clustering en divisive clustering. In de marktonderzoek wordt er veel gebruik gemaakt van agglomerative clustering
(Malthotra,2004). Deze methode heeft als uitgangspunt dat elk object als cluster beschouwd wordt..De clusters worden gevormd door de clusters te gaan samenvoegen in steeds groter wordende clusters. Dit proces gaat door tot dat elk object tot een cluster behoort. De divisive clustering, is een methode waarbij alle objecten starten in één groot cluster. De clusters worden opgedeeld in steeds kleiner wordende clusters. Naar aanleiding van bovenstaande wordt in dit onderzoek gebruik gemaakt van agglomerative clustering, aangezien deze een veel gebruikte methode is en kan worden opgesplitst in verschillende methodes. De agglomerative clustering kan weer worden opgesplitst in de volgende methoden; linkage methoden, variance methoden en centroid methoden. De verschillende methoden kunnen naast elkaar gebruikt worden om zo een betrouwbaar mogelijk beeld te krijgen van het aantal clusters.
Non-hiërarchische clustering wordt opgesplitst is een drietal methoden; sequential treshold methode, parallel treshold methode en de optimizing partitioning methode.
Malhotra (2004) adviseert om een combinatie te gebruiken van hiërarchische en non-hiërarchische clustering methoden. In dit onderzoek is dan ook voor een combinatie gekozen. De uitkomsten van het aantal clusters is gebaseerd op between linkage (hiërarchisch) methode en k-means (non- hiërarchisch). Voor de between linkage methode is gekozen, omdat deze methode cluster probeert te produceren met een gelijke variantie en daarnaast reageert het goed op verschillende condities. k-means kan een specifiek aantal clusters creeëren.
Bepalen van het aantal clusters
Er zijn geen harde regels hoeveel clusters er uiteindelijk in een onderzoek moeten overblijven. Malthotra (2004) geef wel een aantal richtlijnen:
1. Theoretische, conceptuele of praktische overwegingen kunnen een bepaald aantal clusters aanbevelen.
2. Bij hiërarchische clustering kan de afstandmaat gebruikt worden als een criteria.
3. Bij non hiërarchische clustering, is de verhouding tussen de within-groep en between groep belangrijk.
Het uitkomsten van het aantal clusters is gebaseerd op de between-groups linkage methode en de uitkomsten van kmeans. Uit de dendogram is af te lezen dat drie clusters het juiste aantal clusters is. Met behulp van de uitkomsten van de kmeans wordt gecontroleerd of dit het juiste aantal clusters is. Bij kmeans wordt aangegeven dat drie of vier clusters het juiste aantal cluster is. De onderlinge afstand is het grootst bij drie clusters 6.481 ( zie bijlage VI), bij vier clusters is de afstand tussen de clusters kleiner 5.568 (zie bijlage VI). Tevens is de omvang van drie clusters gunstiger dan bij vier clusters. Bij drie clusters is er sprake van ongeveer drie even grote clusters (zie bijlage VI). De keuze voor dit onderzoek is gevallen op drie clusters. Hierbij is tevens rekening gehouden met het aantal waarnemingen, die aan dit onderzoek hebben deelgenomen.
Interpreteren en profileren van de clusters
Het interpreteren en profileren van de clusters gebeurt door middel van een discriminant-analyse. In de volgende paragraaf wordt hier verder op ingegaan.
De validiteit en betrouwbaarheid van de clusters vaststellen
De betrouwbaarheid en validiteit wordt gewaarborgd door gebruik te maken van verschillende
clustermethoden. Deze resultaten worden dan met elkaar vergeleleken om te zien om er sprake is van een valide en betrouwbare clusters. Tevens wordt op willekeurige wijze variabele verwijderd. Hierbij worden de resultaten dan weer vergeleken met de complete set variabelen. Zijn er dan geen grote verschillen te ontdekken tussen de clusters dan kunnen we spreken van valide en betrouwbare clusters.
6.3 Discriminantanalyse I
Malhotra (2004) geeft het volgende stappenplan voor een discriminantanalyse Stap 1: probleemformulering
Stap 2: schatten van de discriminant functie coëfficiënt
Stap 3: Vaststellen van de significantie van de discriminant functie Stap 4: Interpreten van de resultaten
Stap 5: Bepalen van de validiteit van de discriminant analyse
Probleemformulering
De eerst stap in de discriminantanalyse is het formuleren van het probleem, identificeren van de doelen, de criteria variabelen en de onafhankelijke variabelen. Hierbij moet de analyse sample en de validation sample worden vastgesteld. De analyse sample wordt gebruikt voor de discriminantfunctie en de validation sample is gereserveerd voor de validatie van de discriminantfunctie.
Schatten van de discriminant functie coëfficiënt
Nadat de analyse sample is geïdentificeerd wordt er over gegaan op het vaststellen van de significantie van de discriminant functie. Hiervoor zijn twee methodes mogelijk; de directe methode en de stapsgewijze discriminant analyse. De directe methode wordt aanbevolen als het gebaseerd is op eerder gedaan onderzoek. Aangezien hieraan vooraf een clusteranalyse is gedaan, is ervoor gekozen deze methode gekozen. Voor een clusteranalyse is gekozen omdat deze analyse de verschillende respodenten in een cluster indeeld. Aangezien naar aanleiding van een clusteranalyse nog niks over het profiel van de clusters gezegd kan worden, is ervoor gekozen om na de clusteranalyse een discriminantanalyse uit te voeren. Vandaar dat in de de variabelen die in de clusteranalyse worden gebruikt ook in de discriminantanalyse gebruikt worden. In figuur 16 zijn de onafhankelijke variabelen weergegeven. Om te kunnen spreken van significantie dient het significantieniveau lager te zijn dan 0.05. In de laatste kolom van figuur 16 is te zien dat de volgende onafhankelijke variabelen significant bijdragen aan de discriminant functie:
Een student carrièreblad vindt men een goed helpen met het vinden van een baan
Een carrièrebeurs/ bedrijvendag vindt men een goed middel om te oriënteren op de arbeidsmarkt Een universiteit- en/of faculteitsblad vindt men een goed middel om te oriënteren op de
arbeidsmarkt
Een juridisch vakblad vindt men een goed middel om te oriënteren op de arbeidsmarkt Het vinden van een baan gaat gemakkelijker als men lid is geweest van een studenten- en/of
studievereniging
Carrièrejaarboeken vind men nuttig voor de oriëntatie op de arbeidsmarkt
Verschillende bureaus, instanties en personen vind men nuttig voor de oriëntatie op de arbeidsmarkt
Tests of Equality of Group Means
Wilks'
Lambda F df1 df2 Sig.
Een student carrièreblad vindt men een goed helpen met het vinden van een baan
,266 503,825 2 365 ,000
Een carrièrebeurs/ bedrijvendag vindt men een goed middel om te oriënteren op de arbeidsmarkt
Een universiteit- en/of faculteitsblad vindt men een goed middel om te oriënteren op de arbeidsmarkt
,266 503,825 2 365 ,000
Een juridisch vakblad vindt men een goed middel om te oriënteren op de arbeidsmarkt
,266 503,825 2 365 ,000
Het vinden van een baan gaat gemakkelijker als men lid is geweest van een studenten- en/of studievereniging
,304 418,186 2 365 ,000
Carrièrejaarboeken vind men nuttig voor de oriëntatie op de arbeidsmarkt
,488 191,527 2 365 ,000
Verschillende bureaus, instanties en personen vind men nuttig voor de oriëntatie op de
arbeidsmarkt
,787 49,401 2 365 ,000
Hoe vaak heeft men de afgelopen 12 maanden
Carp gelezen ,994 1,169 2 365 ,312
Hoe vaak heeft men de afgelopen 12 maanden
Nobiles gelezen ,995 ,936 2 365 ,393
Hoe vaak heeft men de afgelopen 12 maanden
Intermediair gelezen ,993 1,284 2 365 ,278
Hoe vaak heeft men de afgelopen 12 maanden
Memory Magazine gelezen ,998 ,339 2 365 ,713
Hoe vaak heeft men de afgelopen 12 maanden Sum
oriëntatie nieuws gelezen ,999 ,102 2 365 ,903 Hoe vaak heeft men de
afgelopen 12 maanden Sum
gelezen ,995 ,998 2 365 ,370
Figuur 16
Uit de analyse komen twee discriminant functies naar voren. Figuur 17 geeft de discriminant funties weer. In het model is af te lezen in welke mate de functies van elkaar verschillen en hoeveel variantie elke functie van de totale variantie bepaald.
Eigenvalues
Function Eigenvalue % of Variance Cumulative % CorrelationCanonical
1 4,835(a) 78,6 78,6 ,910
2 1,317(a) 21,4 100,0 ,754
a First 2 canonical discriminant functions were used in the analysis.
Figuur 17
De eerste functie bepaalt 78,6% van de totale variantie en de tweede functie 21.4%.
Vaststellen van de significantie van de discriminant functie
Voordat de resultaten geïnterpreteerd kunnen worden, dienen eerst de nulhypothese en de alternatieve hypothese te worden vastgesteld.
H0: De gemiddelden van alle discriminant functies in alle groepen komen overeen H1: De gemiddelden van alle discriminant functies in alle groepen komen niet overeen
Om te kunnen spreken van significantie dient het significantieniveau lager te zijn dan 0.05. Zoals in onderstaande figuur is af te lezen zijn is het significantieniveau van beide functies 0,000. Hieruit kunnen we concluderen dat we de nulhypothese kunnen verwerpen en dat de discriminanten statistisch niet met elkaar overeen komen.
Wilks' Lambda
Test of Function(s) LambdaWilks' Chi-square df Sig.
1 through 2 ,074 937,462 22 ,000
2 ,432 302,445 10 ,000
Interpreteren van de resultaten
Bovenstaande resultaten dienen geïnterpreteerd te worden. Dit gebeurt aan de hand van het onderstaande model.
Structure Matrix
Function
1 2
Carrièrejaarboeken vind men nuttig voor de oriëntatie op de arbeidsmarkt
,423(*) ,372 Verschillende bureaus,
instanties en personen vind men nuttig voor de oriëntatie op de arbeidsmarkt
,221(*) ,164 Hoe vaak heeft men de
afgelopen 12 maanden
Carp gelezen ,033(*) ,031
Hoe vaak heeft men de afgelopen 12 maanden
Memory Magazine gelezen ,018(*) ,015 Een student carrièreblad
vindt men een goed helpen met het vinden van een baan
,656 -,719(*) Een universiteit- en/of
faculteitsblad vindt men een goed middel om te oriënteren op de arbeidsmarkt(a)
,656 -,719(*) Een juridisch vakblad vindt
men een goed middel om te oriënteren op de
arbeidsmarkt(a)
,656 -,719(*) Het vinden van een baan
gaat gemakkelijker als men lid is geweest van een studenten- en/of studievereniging
,606 ,626(*) Een carrièrebeurs/
bedrijvendag vindt men een goed middel om te
oriënteren op de arbeidsmarkt
,410 ,422(*) Hoe vaak heeft men de
afgelopen 12 maanden Sum
gelezen ,015 -,057(*)
Hoe vaak heeft men de afgelopen 12 maanden
Intermediair gelezen -,029 ,048(*) Hoe vaak heeft men de
Hoe vaak heeft men de afgelopen 12 maanden Sum
oriëntatie nieuws gelezen -,005 -,018(*)
Pooled within-groups correlations between discriminating variables and standardized canonical discriminant functions Variables ordered by absolute size of correlation within function.
* Largest absolute correlation between each variable and any discriminant function a This variable not used in the analysis.
Figuur 19
Een carrièrebeurs / bedrijvendag vindt men een goed middel om te oriënteren op de arbeidsmarkt correleert sterk met functie één, tevens correleert functie één hoog op de variabele: carrièrejaarboeken vindt men nuttig voor arbeidsmarktoriëntatie en een student carrièreblad vindt men een goed helpen met het vinden van een baan. We kunnen functie één omschrijven als multimedia arbeidsmarktoriëntatie gedrag. Functie twee scoort positief op de variabelen carrièrebeurs en carrièreboeken, maar scoort hier wel lager op dan functie één. Verder scoort functie twee sterk negatief op carrièrebladen, vakbladen en
faculteitsbladen. Functie twee kan als praktische arbeidsmarktoriëntatie genoemd worden aangezien er wel interesse is in carrièrejaarboeken en beurzen maar geen interesse is in carrièrebladen, faculteitsbladen en vakbladen. In onderstaande figuur zijn de verschillende scores per cluster aan de twee functies toegekend.
Functions at Group Centroids
Function Cluster Number of Case 1 2
1 ,235 -1,155
2 2,978 1,296
3 -3,139 ,956
Unstandardized canonical discriminant functions evaluated at group means
Figuur 20
Cluster één scoort negatief op de functie praktische arbeidsoriëntatiegedrag en positief op de functie multimedia hierbij moet wel vermeld worden dat dit een lage score is. Hieruit kunnen we concluderen dat dit segment enigszins bezig is met arbeidsmarktoriëntatie. We kunnen niet zeggen dat dit segment erg actief is. Er is zeker interesse in arbeidsmarktoriëntatie maar deze groep moet zeker nog aangespoord worden om naar een beurs/bedrijvendag te gaan of het aanvragen van een carrièrejaarboek. Waarschijnlijk zal deze groep actiever zijn als het de student gemakkelijk wordt gemaakt. Cluster twee scoort positief op functie één en positief op functie twee. Hieruit kunnen we concluderen dat deze cluster actief bezig is met arbeidsmarktoriëntatie. Cluster twee is multimedia georiënteerd en tevens praktisch georiënteerd. Cluster drie scoort sterk negatief op de eerste functie en positief op de tweede functie. Hierbij moet wel vermeld
worden dat het lager scoort op functie twee dan cluster twee. Dit cluster is praktisch georiënteerd,
daarentegen leest men geen carrièrebladen, faculteitsbladen of vakbladen en ziet hier ook het nut niet van in voor het vinden van een baan. Er is binnen dit cluster wel interesse in arbeidsmarktoriëntatie, alleen maakt men nog niet gebruik van alle mogelijke producten voor arbeidsmarktoriëntatie. Dit zou in de toekomst veranderd kunnen worden door een gericht marketingbeleid.
Bepalen van de validiteit van de discriminanten
Door middel van het ‘leave-one-out’ principe kan de validiteit van de discirminantanalyse worden vastgesteld. Het leave-one-out principe wil zeggen, dat het model net zo vaak wordt herhaald als het aantalrespondenten en elke keer wordt er één respondent weggelaten. Deze respondent wordt vervolgens aan een cluster toegewezen.
Classification Results(a)
Predicted Group Membership Cluster Number of Case 1 2 3 Total 1 181 0 0 181 2 1 88 0 89 3 0 0 98 98 Count Ungrouped cases 0 31 19 50 1 100,0 ,0 ,0 100,0 2 1,1 98,9 ,0 100,0 3 ,0 ,0 100,0 100,0 Original % Ungrouped cases ,0 62,0 38,0 100,0
a 99,7% of original grouped cases correctly classified.
Figuur 21
Bovenstaande model geeft weer dat 99,7% van de respondenten in de juiste cluster zijn ingedeeld. Dit percentage is zeer hoog. Dit komt door het feit dat hier de variabelen zijn gebruikt die we ook bij de clusteranalyse hebben gebruikt. Het is dus logisch dat er sprake is van een hoog percentage. Bij de tweede discriminantanalyse zal dit percentage waarschijnlijk veel lager uitvallen aangezien dan variabelen worden meegenomen dit niet in de clusteranalyse zijn gebruikt. Hierbij wordt gezocht naar passieve variabelen met een discriminerend vermogen, zodat er per segment een identificatie ontstaat en er een profilering van elk segment kan worden gegeven.
6.4 Discriminantanalyse II
De tweede discriminantanalyse heeft als doel om de segmenten te identificeren en te beschrijven. Bij de tweede discriminantanalyse wordt gebruik gemaakt van de ‘step-wise’ methode. Hierbij zijn drie overige variabelen in meegenomen die niet in de cluster- en discriminatnanalyse I zijn meegenomen. Naast deze drie variabelen zijn er nog meer overige variabelen, aangezien die niet interval of ordinaal geschaald zijn, wat een vereiste is voor de discriminantanalyse, zijn deze niet meegnommen met de
discriminantanalyse II.
Schatten van de discriminant functie coëfficiënt
Tests of Equality of Group Means
Wilks'
Lambda F df1 df2 Sig.
Leeftijd ,994 1,131 2 399 ,324
Wat de verwachte
afstudeerdatum is ,995 ,920 2 399 ,399
Heeft men een beeld van
zijn toekomstige carrière ,999 ,274 2 399 ,760
Figuur 22
Na het uitvoeren van de stapsgewijze discriminantanalyse blijkt dat de geen van de onafhankelijke variabelen significant (<0,050) bijdraagt aan de discriminantie (zie figuur 22).
Uit de analyse komen weer twee disriminantfuncties naar voren. Figuur 23 geeft het discriminantmodel weer. In het model is af te lezen in welke mate de functies van elkaar verschillen en hoevel variantie elke functie van de totale variantie bepaald.
.
Eigenvalues
Function Eigenvalue % of Variance Cumulative % CorrelationCanonical
1 ,010(a) 85,0 85,0 ,099
2 ,002(a) 15,0 100,0 ,042
a First 2 canonical discriminant functions were used in the analysis.
Figuur 23
Vaststellen van de significantie van de discriminant functie
Voordat de resultaten geïnterpreteerd kunnen worden, dienen eerst de nulhypothese en de alternatieve hypothese te worden vastgesteld.
H0: De gemiddelden van alle discriminant functies in alle groepen komen overeen H1: De gemiddelden van alle discriminant functies in alle groepen komen niet overeen
Om te kunnen spreken van significantie dient het significantieniveau lager te zijn dan 0.05. Zoals in onderstaande figuur is af te lezen zijn is het significantieniveau van beide functies hoger ligt dan 0,000. Hieruit kunnen we concluderen dat we de nulhypothese niet kunnen verwerpen en dat de discriminanten statisch met elkaar overeen komen.
Wilks' Lambda
Test of Function(s) LambdaWilks' Chi-square df Sig.
1 through 2 ,989 4,600 6 ,596
2 ,998 ,692 2 ,707
Figuur 24
Doordat de onafhankelijke variabelen niet significant bijdraagt aan de discriminantie kan de analyse niet verder worden uitgewerkt. De uitkomst van discriminantanalyse II is noodzakelijk voor de identificatie van de drie segmenten, aangezien de variabelen niet siginificant zijn is de indentificatie met behulp van
discriminantanalyse II niet mogelijk. Met behulp van de resultaten van het kwalitatieve gedeelte is er enigszins toch een identificatie aan de drie segmenten te geven. In de volgende paragraaf krijgt elk segment