• No results found

5. DATAVOORBEREIDING

5.2 METHODOLOGIE VAN FACTORANALYSE

Voor het samenvoegen van de items over aankoopintentie en het ondernemersprofiel wordt gebruik gemaakt van een factoranalyse. Dit is een techniek die de correlatie tussen variabelen met elkaar vergelijkt (Hair et al., 2006). Vervolgens wordt gekeken of de items zijn te verdelen in groepen die intern homogeen zijn, maar onderling sterk van elkaar verschillen. In methodologisch opzicht bestaat de factoranalyse die in deze studie wordt uitgevoerd uit vier fasen. Ten eerste wordt nagegaan of de data voldoende correlatie bevat. Ten tweede wordt de optimale factoroplossing bepaald. Ten derde wordt de factoranalyse geroteerd en geïnterpreteerd. Ten slotte worden de resultaten van de analyse gebruikt om nieuwe variabelen te maken. Deze vier fasen worden in deze paragraaf nader toegelicht.

5.2.1 Testen van correlatie

Bij een factoranalyse vormen de onderliggende dimensies het uitgangpunt van de analyse: de factoren bepalen de data. Hierin verschilt een factoranalyse van een principal component analyse, waarbij de data het uitgangspunt vormen (Hair et al., 2006). Het feit dat de factor het uitgangspunt vormt, betekent ook dat er sprake is van een storingsterm in de vergelijking. Dit maakt de analyse iets gecompliceerder, maar biedt wel de mogelijkheid van statistische toetsing. Bij een factoranalyse wordt een variabele weergegeven zoals in vergelijking (1).

De bijzondere aspecten van merkmanagement 57

           (1)

X = Oorspronkelijke variabele W = Gewicht

F = Factor

Voordat een factoranalyse mag worden uitgevoerd, moet eerst de correlatie tussen de variabelen getoetst worden. Hiervoor worden de Bartlett’s test of sphericity en de Kaiser-Meyer-Olkin measure of sampling adequacy (MSA) gebruikt (Hair et al., 2006). Bartlett’s test onderzoekt de nulhypothese dat de correlatiematrix van de verschillende variabelen gelijk is aan een identiteit. Met andere woorden, de test onderzoekt of er correlatie aanwezig is.

De MSA is een maatstaf van de hoeveelheid correlatie die tussen de betrokken variabelen bestaat. Deze correlatie moet voldoende hoog zijn om een betrouwbare factoranalyse te kunnen uitvoeren. Een MSA van 1 wordt geïnterpreteerd als een perfecte correlatie tussen de betrokken varabelen. Een MSA van 0 duidt op de afwezigheid van welke vorm van correlatie dan ook. Kaiser (1970) stelt dat een MSA van 0,8 vereist is om een factoranalyse te rechtvaardigen. Doorgaans wordt echter aangenomen dat een MSA van 0,7 voldoende is (Hair et al., 2006). om een factoranalyse te rechtvaardigen.Wanneer zowel de Bartlett’s test als de MSA test significante resultaten laten zien, mag een factoranalyse worden uitgevoerd.

5.2.2 Bepaling van optimale factoroplossing

Binnen de factoranalyse zijn er vier methoden beschikbaar die kunnen worden gebruik om tot de bepaling van het optimale aantal factoren te komen. De eerst, een meest gangbare methode is de het latent root criterium (K1), gebaseerd op het werk van Guttman (1954). Deze methode onderzoekt de eigenvalues van de verschillende factoren. De eigenvalue is proportioneel aan de variantie in alle variabelen die wordt verklaard door de factor. De K1 methode selecteert daarbij alleen de factoren met een eigenvalue groter dan 1 (Hair et al., 2006). Immers, een factor met een eigenvalue kleiner dan 1 verklaart minder dan één van de originele variabelen en betekent daarom niets voor de datareductie. Voor de bepaling van het exacte factoraantal is de K1 methode niet geschikt, omdat dit aantal als gevolg van sampling error vrijwel altijd te hoog wordt ingeschat (Zwick & Velicer, 1982). Het resultaat van de K1 methode geeft echter wel een goede indicatie van het maximale aantal factoren dat aan de data kan worden onttrokken (Hayton et al., 2004).

Een tweede selectiemethode is gebaseerd op de variantie die door de totale factoroplossing wordt verklaard. Er wordt hierbij vereist dat de gekozen factoroplossing voldoende van de variante uit de originele variabelen moet verklaren. Het percentage dat hierbij minimaal vereist is, is voor een groot deel afhankelijke van het type onderzoek dat wordt uitgevoerd en het soort informatie dat wordt verzameld. In een sociale studie zoals deze, is een percentage van 60 procent of meer een goede baseline (Hair et al., 2006).

Een derde methode is het scree test van Cattel (1966). Deze test identificeert het aantal factoren dat uit de data kan worden gehaald totdat de unieke variantie de gemeenschappelijke variantie in een factor begint te domineren (Cattel, 1966). Deze test wordt gevat in een grafiek waarop de eigenvalues van de opeenvolgende factoren worden geplot. In deze grafiek moet gezocht worden naar het punt waarop de relatieve afname van de eigenvalues zichtbaar kleiner wordt (Hair et al., 2006). Deze verandering in het plot is duidelijk zichtbaar wanneer er enkele grote en invloedrijke factoren in de data aanwezig zijn. Wanneer alle componenten ongeveer gelijk zijn, is het juiste factoraantal minder eenvoudig uit de scree plot op te maken. Desondanks is de nauwkeurigheid van de methode goed te noemen (Zwick & Velicer, 1982).

Ten slotte kan de optimale factoroplossing bepaald worden aan de hand van Horn’s (1965) parallel analysis. Dit criterium mag gezien worden als een vervanger van het vaak toegepaste K1 criterium, omdat voor sampling error in de data wordt gecorrigeerd. De eigenvalues wordt namelijk niet vergeleken met een benchmark van één, maar met de gemiddelde eigenvalues van een random sample met evenveel variabelen en observaties (Horn, 1965). Doorgaans wordt er gebruik gemaakt van formules om deze random eigenvalues te berekenen. Voorbeelden zijn de vergelijkingen van Lautenschlager (1989) en die van Longman et al. (1989a). Het nadeel van deze formules is dat aparte tabellen vereist zijn voor het bepalen van de parameters. Keeling (2000) heeft de vergelijking van Longman (1989a) verder ontwikkeld, waarbij de aparte tabellen overbodig zijn geworden. Dit maakt de formule van Keeling (2000) het meest aantrekkelijk in zijn gebruik. De formule van Keeling is in zijn toepassing het meest aantrekkelijk.

Bij het bepalen van de optimale factoroplossing in deze studie worden in beginsel alle hier uiteengezette criteria berekend. Echter, veelal geven verschillende criteria verschillende aanbevelingen. Er moet dus per analyse gekeken worden welk criterium de doorslag geeft.

5.2.3 Rotatie van de factoroplossing

Om de interpretatie van de factoroplossing te vergemakkelijken wordt rotatie toegepast (Malthotra, 2004). Bij rotatie wordt de factoroplossing zo gedraaid, dat zoveel mogelijk originele variabelen slechts op één van de gevonden factoren laden (Hair et al., 2006). Met andere woorden, door rotatie wordt het verschil tussen factoren gemaximaliseerd. Hierdoor is het gemakkelijker om een betekenis aan de groepen te geven. Een factoroplossing kan op twee manieren geroteerd worden: orthogonal of oblique. Bij orthogonal rotatie blijft de onafhankelijkheid tussen factoren bestaan. Hierdoor is dit een rotatiemethode die geschikt is bij het ontwikkelen van schalen die in verder onderzoek worden gebruikt. In dit onderzoek lijkt deze orthogonal methode dan ook het meest geschikt. Bij oblique rotation is een andere vorm van roteren. Hierbij wordt de voorwaarde van onafhankelijkheid losgelaten. Het voordeel hiervan is dat er wellicht beter interpreteerbare groepen ontstaan. Het is echter mogelijk dat er overlap in de groepen ontstaat, waardoor het minder geschikt is voor het ontwikkelen van schalen.

5.2.4 Nieuwe variabelen uit de factoroplossing

Het doel van dit onderzoek is om nieuwe variabelen te genereren die in verder onderzoek kunnen worden gebruikt. De groepen die in de factoranalyse zijn geïdentificeerd vormen hiervoor het uitgangspunt. Voordat de nieuwe variabelen uit deze groepen kunnen worden samengesteld, dient eerst de interne consistentie van deze groepen beoordeeld te worden. Voor deze beoordeling wordt gebruik gemaakt van Cronbach’s alfa (Cronbach, 1951). Hierbij is een waarde van 0,7 of hoger wenselijk (Hair et al., 2006). Biais et al. (2005) stellen dat een ondergrens van 0,58 voldoende is.

Met de gevonden factoren als basis, kunnen nieuwe variabelen op twee manieren berekend worden: summated scales en factorscores9. Bij beide methoden wordt voor iedere gevonden factor een nieuwe variabele berekend. Bij summated scales worden hierbij alleen de variabelen in de

9 Hair et al. (2006) noemen naast factorscores en summated scales nog een derde methode. Bij deze derde methode worden de nieuwe variabelen gevonden door voor iedere factor één van de originele variabelen te kiezen. Doorgaans is dit de variabele met de hoogste loading. Dit is een methode die snel en gemakkelijk is te implementeren, maar er kleven nogal wat nadelen aan deze methode. Zo is het onduidelijk wat te doen met meerdere hoge loadings per factor. Daarnaast is er geen reductie van measurement error, omdat er geen variabelen bij elkaar worden gevoegd (Hair et al., 2006). Om deze redenen wordt deze methode daarom niet als serieuze optie in de overweging meegenomen.

De bijzondere aspecten van merkmanagement 59 berekening meegenomen die het hoogst laden op de betreffende factor. De summated scale worden berekend door de variabelen op te tellen of door het gemiddelde te nemen. Bij factorscores worden alle variabelen in de berekening meegenomen. Deze worden berekend aan de hand van vergelijking (1). De loadings doen hierbij dienst als de coëfficiënten (w).

Hoewel summated scales en factorscores veel overeenkomsten vertonen, verschillen zij op een aantal punten. Bij de keuze voor de ene methode boven de andere vormen deze verschillen het uitgangspunt. Hair et al. (2006) geven in hun boek een duidelijk overzicht van de verschillen. In summated scales kunnen verschillende facetten van het betreffende concept worden ondergebracht. De onderzoeker heeft hier zelf de hand in. Daarnaast zijn summated scales generaliseerbaar naar andere studies, waardoor ze uiterst geschikt zijn voor het ontwikkelen van schalen. Een nadeel van deze methode is echter dat niet alle items in de nieuwe variabele worden meegenomen. Daar komt bij dat summated scales niet per definitie volledig onafhankelijk van elkaar zijn. Bij factorscores komen deze twee problemen niet voor. Het nadeel van deze scores schuilt echter in de beperkte generaliseerbaarheid. Aangezien dit laatste voor dit onderzoek geen groot probleem is en onafhankelijkheid van variabelen wel gewenst is, wordt in deze studie de voorkeur gegeven aan een berekening op basis van factorscores.