Hoofdstuk 6 Segmentatie
6.2 Discriminantanalyse I
De discriminantanalyse bestaat uit twee analyses. De eerste analyse heeft als doel de ontstane clusters te profileren. Malhotra (1999:564) heeft ook voor deze analyse een stappenplan ontwikkeld. Dit ziet er als volgt uit:
1. Formuleer het probleem;
2. Schat de discriminant functie coëfficiënten;
4. Interpreteer de resultaten;
5. Bepaal de validiteit van de discriminant analyse.
6.2.1 Formuleer het probleem
De eerste stap in de discriminantanalyse is het vaststellen van het doel, de criteriumvariabelen en de onafhankelijke variabelen. Het doel van de analyse kan worden omschreven als het toekennen van een profiel aan de clusters. Hierbij zijn de clusters de criteriumvariabelen en zijn de onafhankelijke variabelen de variabelen waarop de clusteranalyse gebaseerd is.
6.2.2 Schat de discriminant functie coëfficiënten
Er zijn twee methoden waarmee men de discriminant functie coëfficiënten kan schatten. Ten eerste is er de directe methode. Deze methode gaat uit van het principe dat alle variabelen tegelijk worden meegenomen, ongeacht welke bijdrage deze variabelen leveren aan de discriminatie.
Ten tweede is er de stapsgewijze methode. Bij deze methode wordt juist wel gekeken naar het discriminerende vermogen van de variabelen en worden dan ook achtereenvolgend toegevoegd. Deze methode wordt aanbevolen wanneer vanuit vooronderzoek geen kennis over de variabelen aanwezig is.
In dit onderzoek is aan de hand van een clusteranalyse gebruik gemaakt van verschillende variabelen en is dus voorkennis over de variabelen aanwezig. Vandaar ook dat de directe methode toegepast zal worden en zullen dus dezelfde variabelen, als gebruikt zijn bij de clusteranalyse, worden meegenomen in deze analyse.
In figuur 6.1 worden de onafhankelijke variabelen weergegeven die in de analyse zijn meegenomen. Een variabele is pas significant indien het significantieniveau lager is dan 0,05. De laatste kolom van figuur 6.1 laat zien welke onafhankelijke variabelen significant bijdragen een de discriminant functie:
Gebruik van een merknaam; Gebruik van een slagzin;
Nu actief op het gebied van city branding; Men staat positief tegenover city branding; Men vindt city branding relevant;
City branding werkt onderscheidend; Men vindt city branding belangrijk; City branding verbetert het imago; City branding is betrouwbaar;
City branding is gelijk aan product branding; City branding creëert wel associaties.
Tests of Equality of Group Means Wilks' Lambda F df1 df2 Sig. Gebruik van merkelementen ,998 ,311 1 154 ,578
Gebruik van merknaam
,883 20,474 1 154 ,000
Gebruik van website
,998 ,231 1 154 ,631
Gebruik van logo ,999 ,126 1 154 ,723
Gebruik van symbool
1,000 ,006 1 154 ,938
Gebruik van karakter
,983 2,727 1 154 ,101
Gebruik van slagzin
,806 36,962 1 154 ,000
Gebruik van jingle
,993 1,026 1 154 ,313
Nu actief op het gebied
van city branding ,739 54,387 1 154 ,000
Positief tegenover city
branding ,598 103,553 1 154 ,000
City branding is
relevant ,541 130,846 1 154 ,000
City branding werkt
onderscheidend ,749 51,728 1 154 ,000
City branding is
belangrijk ,500 154,160 1 154 ,000
City branding verbetert
het imago ,712 62,357 1 154 ,000
City branding is
betrouwbaar ,810 36,238 1 154 ,000
City branding is gelijk
aan product branding ,944 9,191 1 154 ,003
City branding creëert
wel associaties ,701 65,677 1 154 ,000
Figuur 6.1
Uit de analyse komt één discriminant functie naar voren, die de totale variantie bepaalt. In figuur 6.2 wordt deze functie weergegeven.
Eigenvalues
Function Eigenvalue % of Variance Cumulative %
Canonical Correlation
1 2,671(a) 100,0 100,0 ,853
a First 1 canonical discriminant functions were used in the analysis. Figuur 6.2
6.2.3 Stel de significantie van de discriminant functie vast
Er kunnen nog geen zinnige interpretaties van de resultaten worden gegeven voordat de nulhypothese en de alternatieve hypothese zijn vastgesteld.
H0: de gemiddelden van de clusters komen onderling overeen H1: de gemiddelden van de clusters komen onderling niet overeen
Wanneer het significantieniveau lager is dan 0,05 kan men spreken van significantie. Zoals in onderstaande figuur (figuur 6.3) valt af te lezen, is het significantieniveau van deze functie 0,00.
Wilks' Lambda
Test of Function(s)
Wilks'
Lambda Chi-square df Sig.
1 ,272 189,228 17 ,000
Figuur 6.3
De nulhypothese kan hiermee verworpen worden en kan statistisch worden aangenomen dat de gemiddelden van de clusters onderling niet met elkaar overeenkomen.
6.2.4 Interpreteer de resultaten
Aan de hand van onderstaand model (zie figuur 6.4) kunnen de resultaten uit paragraaf 6.2.3 geïnterpreteerd worden. In dit figuur valt af te lezen in hoeverre de individuele variabelen correleren met de discriminant functie. De dikgedrukte variabelen maken een significant verschil.
Structure Matrix
Function
1
City branding is belangrijk ,612
City branding is relevant ,564
Positief tegenover city branding ,502
City branding creëert wel associaties
,400
City branding verbetert het imago
,389
Nu actief op het gebied van city branding
,364
City branding werkt onderscheidend
,355
Gebruik van slagzin ,300
City branding is betrouwbaar ,297
Gebruik van merknaam ,223
City branding is gelijk aan product branding
,149
Gebruik van karakter ,081
Gebruik van jingle ,050
Gebruik van merkelementen ,027
Gebruik van website -,024
Gebruik van logo -,017
Gebruik van symbool ,004
Pooled within-groups correlations between discriminating variables and standardized canonical discriminant functions
Variables ordered by absolute size of correlation within function. Figuur 6.4
De functie correleert zeer sterk met de variabele dat city branding belangrijk is (0,612). Daarnaast scoren de variabelen city branding is relevant, positief tegenover city branding, city branding creëert wel associaties, city branding verbeter het imago, nu actief op het gebied van city branding, city branding werkt onderscheidend, gebruik van slagzin, city branding is betrouwbaar en tot slot gebruik van merknaam, vrij hoog. Dit zijn allemaal variabelen die een positieve houding ten opzichte van city branding weergeven. Deze functie kan dan ook ‘city branding georiënteerd’ worden genoemd.
Aangezien maar één discriminant functie ontstaan is, zullen beide clusters aan de hand van deze functie een profiel toegekend krijgen.
Door middel van de scores van elk cluster op de functie, is het mogelijk om aan elk cluster een beperkt profiel toe te kennen. In onderstaande figuur (figuur 6.5) valt af te lezen hoe beide clusters scoren op de discriminant functie:
Functions at Group Centroids
Cluster Number of Case Function
city branding georiënteerd
1 1,645
2 -1,603
Unstandardized canonical discriminant functions evaluated at group means Figuur 6.5
Cluster één scoort positief op de city branding georiënteerde functie en het tweede clusters scoort negatief op deze functie.
6.2.5 Bepaal de validiteit van de discriminant analyse
Aan de hand van het ‘leave-one-out’ principe kan de validiteit van de discriminantanalyse worden vastgesteld. Dit principe houdt in dat het discriminant model net zo vaak wordt herhaald als het aantal respondenten, waarbij elke keer een respondent buiten beschouwing wordt gelaten. Vervolgens wordt deze respondent aan een cluster toegewezen. Hoe vaker dit correct gebeurt, hoe meer valide het model is.
Classification Results(b,c)
Predicted Group Membership
Cluster Number of Case 1 2 Total
1 74 3 77 Count 2 0 79 79 1 96,1 3,9 100,0 Original % 2 ,0 100,0 100,0 1 71 6 77 Count 2 1 78 79 1 92,2 7,8 100,0 Cross-validated(a) % 2 1,3 98,7 100,0
a Cross validation is done only for those cases in the analysis. In cross validation, each case is classified by the functions derived from all cases other than that case.
b 98,1% of original grouped cases correctly classified. c 95,5% of cross-validated grouped cases correctly classified. Figuur 6.6
Uit bovenstaand figuur valt af te lezen dat 95,5% van de respondenten aan de hand van dit model in de juiste cluster in ingedeeld. Dit hoge percentage is als volgt te verklaren:
al deze variabelen zijn al eerder gebruikt in de clusteranalyse. Wanneer vervolgens een gedragsprofiel op basis van diezelfde variabelen opgesteld wordt, is het logisch dat een nauwe ‘fit’ ontstaat. De tweede discriminantanalyse, die uitgevoerd zal worden in de volgende paragraaf, zal niet een dergelijk hoog percentage laten zien. Hierbij wordt immers gebruik gemaakt van overige, nog niet eerder gebruikte, variabelen.