METHODOLOGIE VAN GLIM

6. KWANTITATIEF ONDERZOEK

6.2 METHODOLOGIE VAN GLIM

6.2.1 Standaard lineaire regressie

Inzicht in de aankoopintentie van de ondernemer staat niet op zichzelf, maar zegt ook iets over de verdeling van de twee verschillende subdoelgroepen. Uit de data komt naar voren dat

procent van de ondervraagden de intentie h

bedrijfsvoering te optimaliseren (aankoopkans > 50%). Deze ondernemers behoren tot de categorie. De overige ondernemers, zo’n 77 procent geeft aan niet naar een adviseur te gaan om de onderneming te ontwikkelen. Dit impliceert dat deze ondernemers alleen advies vragen wanneer zij in nood verkeren. Deze groep wordt daarom als

Aankoopmotivatie

Ten slotte wordt ingegaan op de aankoopmotivatie variabele. Dit is de enige variab

stadium van het onderzoek empirisch getest kan worden. Voor de aankoopmotivatie zijn immers hypotheses verondersteld. In Figuur 17 staan de resultaten voor de gemiddelde ondernemer weergegeven. Uit de figuur komt naar voren dat de aankoopmotivatie van ondernemers om advies te vragen hoofdzakelijk positief georiënteerd is. Uit verdere analyse blijkt dat het verschil tussen de

hulpbehoevenden en ontwikkelaars, is niet significant ( kennen een hoofdzakelijk positieve aankoopmotivatie.

wikkelaars categorie. De resultaten in Figuur

processen van de aankoopmotivatie zoals verwacht overwegend co

Hypothese 2 wordt daarom ook aangenomen. De veronderstelling dat de affectieve processen bij hulpbehoevenden negatiever zijn dan bij ontwikkelaars wordt echter niet significant bevonden (

). Er moet daarom geconcludeerd worden dat de affectieve processen voor beide ondernemersgroepen vergelijkbaar zijn. Hypothese 3 wordt hierbij verworpen.

is de aankoopmotivatie overwegend functioneel georiënteerd (

gevonden dat de ondernemer sterk betrokken bij de keuze van een bedrijfsadviseur ( Hypothese 5 kan daarom worden aangenomen.

Figuur

Aankoopmotivatie om advies te vragen

50%

Standaard lineaire regressie

62%

56%

57%

63%

Inzicht in de aankoopintentie van de ondernemer staat niet op zichzelf, maar zegt ook iets over de verdeling van de twee verschillende subdoelgroepen. Uit de data komt naar voren dat de intentie heeft om advies te vragen om de bedrijfsvoering te optimaliseren (aankoopkans > 50%). Deze ondernemers behoren tot de categorie. De overige ondernemers, zo’n 77 procent geeft aan niet naar een adviseur . Dit impliceert dat deze ondernemers alleen advies vragen wanneer zij in nood verkeren. Deze groep wordt daarom als hulpbehoevenden

Ten slotte wordt ingegaan op de aankoopmotivatie variabele. Dit is de enige variab

stadium van het onderzoek empirisch getest kan worden. Voor de aankoopmotivatie zijn immers staan de resultaten voor de gemiddelde ondernemer weergegeven. Uit de figuur komt naar voren dat de aankoopmotivatie van ondernemers om advies . Uit verdere analyse blijkt dat het verschil tussen de , is niet significant (p = 0,4129). Beide groepen kennen een hoofdzakelijk positieve aankoopmotivatie. Hypothese 1 wordt daarom

Figuur 17 geven verder aan dat de psychologische processen van de aankoopmotivatie zoals verwacht overwegend cognitief zijn

Hypothese 2 wordt daarom ook aangenomen. De veronderstelling dat de affectieve processen bij hulpbehoevenden negatiever zijn dan bij ontwikkelaars wordt echter niet significant bevonden (

worden dat de affectieve processen voor beide ondernemersgroepen vergelijkbaar zijn. Hypothese 3 wordt hierbij verworpen. Conform hypothese 4 is de aankoopmotivatie overwegend functioneel georiënteerd (p = 0,0076). Ten slotte wordt

ondernemer sterk betrokken bij de keuze van een bedrijfsadviseur (

Figuur 17

Aankoopmotivatie om advies te vragen

50%

38%

44%

43%

37%

Inzicht in de aankoopintentie van de ondernemer staat niet op zichzelf, maar zegt ook iets over de verdeling van de twee verschillende subdoelgroepen. Uit de data komt naar voren dat eeft om advies te vragen om de bedrijfsvoering te optimaliseren (aankoopkans > 50%). Deze ondernemers behoren tot de categorie. De overige ondernemers, zo’n 77 procent geeft aan niet naar een adviseur . Dit impliceert dat deze ondernemers alleen advies hulpbehoevenden gekwalificeerd.

Ten slotte wordt ingegaan op de aankoopmotivatie variabele. Dit is de enige variabele die in dit stadium van het onderzoek empirisch getest kan worden. Voor de aankoopmotivatie zijn immers staan de resultaten voor de gemiddelde ondernemer weergegeven. Uit de figuur komt naar voren dat de aankoopmotivatie van ondernemers om advies . Uit verdere analyse blijkt dat het verschil tussen de ). Beide groepen alleen bevestigd de psychologische zijn (p = 0,0002). Hypothese 2 wordt daarom ook aangenomen. De veronderstelling dat de affectieve processen bij hulpbehoevenden negatiever zijn dan bij ontwikkelaars wordt echter niet significant bevonden (p = worden dat de affectieve processen voor beide Conform hypothese 4 ). Ten slotte wordt ondernemer sterk betrokken bij de keuze van een bedrijfsadviseur (p = 0,0001).

Positief

Cognitief

Functioneel Sterk betrokken

De bijzondere aspecten van merkmanagement 65 Meervoudige lineaire regressie is een statistische techniek die wordt gebruikt om een afhankelijke variabele te verklaren met behulp van twee of meer onafhankelijke variabelen (Hair et al., 2006). Een standaard lineair model heeft de vorm zoals is weergegeven in vergelijking (2). De verwachte waarde van is weergegeven in vergelijking (3):

(2)

, ⁽³⁾ Meervoudige lineaire regressie is net als alle andere multivariate technieken geworteld in een viertal statistische aannames:

1. De variabelen en moeten een normale verdeling volgen. Alleen dan kunnen betekenisvolle conclusies uit de resultaten van statistische toetsing worden getrokken. 2. Er moet sprake zijn van een lineaire relatie tussen de verschillende betrokken variabelen.

Immers, alleen lineaire verbanden kunnen in een lineaire regressie worden gemodelleerd. 3. De variantie van de storingsterm moet constant zijn over alle crosssectie eenheden

(ondernemers). Dit betekent dat vergelijking (4) moet gelden.

4. Ten slotte is het vereist dat de storingsterm niet serieel gecorreleerd is: de storingsterm dient tijdsonafhankelijk te zijn. Daar komt nog bij dat de verwachte waarde gelijk moet zijn aan nul. Dit criterium is weergegeven in vergelijking (5).

^{voor alle waarden van j = 1, …, J}

⁽⁴⁾

,

0

(5)

6.2.2 Generalized linear models

Met een standaard lineair regressiemodel kan een veelvoud aan concepten en fenomenen worden gemodelleerd. Echter, niet in alle gevallen kan aan de vier eerder genoemde voorwaarden worden voldaan. Immers, niet alle variabelen zijn normaal verdeeld. Zo ook het te verklaren aankoopgedrag, dat binominaal is verdeel en varieert tussen 0 en 1. Daarnaast hebben niet alle denkbare verbanden een lineaire relatie. Dit betekent dat ook aan het tweede criterium niet onder alle omstandigheden kan worden voldaan. In beide gevallen biedt een generalized linear model (GLIM) uitkomst. Een dergelijke model is een geabstraheerde vorm van het standaard meervoudige lineaire regressiemodel. Met dit model wordt voor mag voor de storingsterm een andere verdeling dan de normale verdeling worden verondersteld. Bovendien kunnen non-lineaire effecten worden gemodelleerd. Een GLIM heeft de vorm zoals in vergelijking (6):

#

, ⁽⁶⁾ In vergelijking (6) is een non-lineaire functie die met behulp van linkfunctie #· lineair gemaakt word. Door het gebruik van een linkfunctie kunnen bovendien verschillende distributies gemodelleerd worden. Er zijn drie populaire linkfuncties:

6. Identity-link: Ey' Z'. Met deze linkfunctie ontstaat een standaard meervoudig lineair model. Wanneer deze linkfunctie wordt gekozen, wordt voor de storingsterm doorgaans een normale verdeling verondersteld

7. Log-link: Ey' e*₊_{. Door deze linkfunctie te gebruiken ontstaat een exponentieel model,} waarbij een poisson verdeling de standaardkeuze is voor de verdeling van de storingsterm. Deze verdeling loopt van 1 tot oneindig een kan alleen hele getallen aannemen. Een dergelijk model wordt daarom gebruikt om aantallen te modelleren.

8.

Logit-link: Ey' e*₊⁄1 e*₊. Een GLIM in combinatie met een dergelijk linkfunctie is een keuzemodel. Voor de storingsterm wordt bij dit model doorgaans als binominale verdeling aangenomen.

6.2.3 Specificatie

In dit onderzoek wordt een GLIM gebruikt om de aankoopintentie van ondernemers te modelleren. Omdat het hier gaat om een keuzemodel, wordt gebruik gemaakt van een model met een logit-link functie. Daarbij wordt verondersteld dat deze ondernemers bij de aankoop slechts twee opties hebben: advies vragen of geen advies vragen. Het keuzemodel dat wordt geschat is daarmee een binominal logit model. In een dergelijk model wordt de aankoopintentie van ondernemers (in nood) gemodelleerd als een functie van het nut dat de ondernemer aan het advies ontleend. Deze nutsfunctie heeft de vorm van vergelijking (7):

/

exp

2

(7)

/

^{= Nut van ondernemer i}

^{= Psychologische eigenschappen van ondernemer i}

Door het gebruik van de eerder geïntroduceerde logit-link functie wordt de vergelijking voor de aankoopintentie verkregen, als een functie van het nut. Het nut van aankoop wordt hierbij gedeeld door het nut van beide opties tezamen. Omdat er slechts twee opties zijn en beide kansen tellen op tot 1, wordt voor de optie van niet kopen geen parameters berekend¹⁰. Immers, wanneer P bekend is, staat de kans van de andere optie vast. Het binominal logit model is weergegeven in vergelijking (8):

3456 _{1 exp2}^exp² (8)

3

= Kans op aankoop

Bij de specificatie van model (8) moet worden besloten hoe de verschillende psychologische eigenschappen van de ondernemer in het model worden opgenomen. Er moet daarbij worden nagegaan hoe de relatie tussen deze eigenschappen en de aankoopintentie redelijkerwijs kan worden verondersteld. Gelet op het gebrek aan onderzoek op dit gebied, is het moeilijk om deze veronderstelling op theorie te baseren. Bij de specificatie van de verschillende relaties speelt het gezond verstand daarom een centrale rol. Door de abstracte aard van de afhankelijke variabelen kan echter niet anders dan een lineair effect tussen de eigenschappen en de aankoopkans worden verondersteld. Dit resulteert in modellen die qua opbouw relatief eenvoudig zijn. Bovendien wordt op deze manier efficiënt omgegaan met vrijheidsgraden. Echter, wanneer één of meer van de verklarende variabelen sterk non-lineair effect heeft, is het denkbaar dat de model fit kan worden verbeterd door deze variabelen als zodanig op te modelleren. Om vast te stellen welke variabelen

De bijzondere aspecten van merkmanagement 67 hiervoor in aanmerking komen en van welk type non-lineaire relatie sprake is, wordt in de data gekeken door middel van smooth splines. Wanneer hierbij duidelijke non-lineaire verbanden worden gevonden, dient te worden afgewogen of de verbetering in de fit in verhouding staat tot het verlies van vrijheidsgraden.

5.2.4 Schatting

Een generalized linear model wordt geschat met behulp van maximum likelihood estimation. Maximum likelihood estimation is een proces waarbij een groot aantal parameterseries in het model wordt uitgeprobeerd¹¹. De resultaten die deze verschillende series geven, worden vergeleken met de werkelijke data. Vervolgens wordt de parameters gekozen die de modelfit maximaliseren. De overeenkomst tussen de modelresultaten en de werkelijke data wordt weergegeven in een likelihood function, zie vergelijking (9):

L 8 39456::;;

<,…,> ?1 @ 39456A^B::;; (9)

Doorgaans wordt in plaats van de likelihood in vergelijking (9) gerekend met het logaritme van de likelihood, vergelijking (10):

LL C ln?39456A 456

<,…,> ln?1 @ 39456A 1 @ 456 (10)

In feite komen de vergelijkingen (9) en (10) op hetzelfde neer. Echter, vergelijking (10) is gemakkelijker in gebruik omdat factoren worden opgeteld in plaats van vermenigvuldigd. Dat is de reden waarom de log-likelihood functie wordt gebruikt. De modelparameters worden gevonden door deze functie te maximaliseren. Naast de log-likelihood zelf, wordt ook vaak gerekend met een deviance. De deviance wordt afgeleid van de log-likelihood aan de hand van formule (11):

Deviance @2LL (11)

De minimumwaarde die de deviance kan aannemen is gelijk aan nul. Een waarde van nul duidt op een perfecte fit van het model. De minimalisatie van de deviance komt daarmee op hetzelfde neer als de maximalisatie van de log-likelihood. Door te zoeken naar de minimumwaarde van de deviance, worden de optimale parameters van een vooraf gespecificeerd model gevonden.

6.2.5 Modelselectie

In de voorgaande paragraaf is de deviance genoemd al methode om de beste parameters voor een gegeven model vast te stellen. Het is echter goed mogelijk dat het vooraf gespecificeerde model niet het enige denkbare alternatief is. Wellicht zijn er meer modellen denkbaar, waarin de psychologische eigenschappen anders worden opgenomen. Zoals al is geïntroduceerd, worden alle verbanden in beginsel als lineair verondersteld, terwijl er eveneens non-lineaire relaties denkbaar zijn. Dit betekent dat er verschillende alternatieve modellen met elkaar moeten worden vergeleken. Bij deze vergelijking is de deviance een bruikbaar middel.

Omdat maximum likelihood estimation gaat om een proces van herhaald uitproberen van parameters, is er altijd het risico dat er een lokaal optimum als beste serie wordt gekozen. De kans op het vinden van een lokaal optimum wordt verminderd door meer verschillende combinaties te proberen.

Om een goede en objectieve vergelijking mogelijk te maken, wordt eerst het null model gespecificeerd. Het null model is het meest eenvoudige model dat denkbaar is: het model dat het gemiddelde van de aankoopintentie als enige onafhankelijke variabele neemt. De verschillende gespecificeerde modelalternatieven worden vervolgens vergeleken met het null model. Daarbij worden de deviances van beide modellen met elkaar vergeleken. Hoe groter het verschil, des te groter is de verbetering ten opzichte van het null model.

Omdat een deviance geen rekening houdt met het aantal parameters in de vergelijking, heeft deze methode de neiging om de modelfit te overschatten. Met een informatiecriterium (IC) wordt wel rekening gehouden met het aantal parameters. Dit maakt een IC tot een nog beter instrument om het beste model te identificeren. Eén van de eerste IC, genaamd Akaike Information Criterion (AIC), is voorgesteld door Akaike (1973). De mathematische vorm van dit IC is weergegeven in vergelijking (12). Sinds zijn introductie zijn ver verschillende verbeteringen op het AIC voorgesteld, waaronder het AICc en het AIC3. Het AICc maakt het AIC geschikt voor situaties waarin de ratio tussen het aantal observaties (n) en het aantal modelvariabelen (K) relatief laag is, zie vergelijking (13)(zie Burnham & Anderson, 2004). Het AIC3 (vergelijking (14)) geeft een hogere straf voor een extra parameter, in vergelijking met het AIC en het AICc. Zie hiervoor Andrews en Currim (2003).

MN @2LL 2O (12)

MNP @2LL 2O ^QQR_BQB, wanneer 4/O T 40 (13)

MN3 @2LL 3O (14)

Een ander, maar verwant criterium is voorgesteld door Schwartz (1978): het Bayesian Information Criterium (BIC). Het BIC is mathematisch weergegeven in vergelijking (15). Het grote verschil met de verschillende vormen van AIC zit in de straf per parameter, die afhankelijk is van (n). Vergelijking (16) is een criterium dat lijkt op de BIC: het Consistent Akaike Information Criterion (CAIC) (Bozdogan, 1987). Bij het CAIC is de straf per parameter (K) eenheden hoger als bij het BIC. In vergelijking met de overige genoemde criteria, geeft het CAIC de hoogste straf per parameter.

WN @2LL ln4 O (15)

MN @2LL Xln4 1YO (16)

In de wetenschappelijke literatuur is uitgebreid onderzoek gedaan naar de bruikbaarheid van de verschillende informatiecriteria (o.a. Lin & Dayton, 1997; Anderson et al., 1998; Andrews & Currim, 2003). Er is daarbij geen overeenstemming over welk informatiecriterium het beste is. Lin en Dayton (1997) hebben in hun studie de toepassing van AIC en CAIC onderzocht. Ze concluderen daarbij dat het CAIC criterium beter presteert, wanneer het gaat om relatief eenvoudige modellen. Anderson et al. (1998) zetten deze conclusie in een ander daglicht. Zij concluderen dat CAIC sterk te neiging heeft om de eenvoudigste modellen uit de set te selecteren. Dit zijn doorgaans modellen die relatief weinig variantie verklaren. Deze auteurs stellen dan ook dat het AIC is te prefereren boven het CAIC.

Burnham en Anderson (2004) zetten het AIC en het BIC tegenover elkaar. In hun literatuuroverzicht stellen deze auteurs dat de betrouwbaarheid van het BIC erg afhankelijk is van de steekproefomvang. Zij concluderen dat BIC pas goed presteert bij grote steekproeven (n > 200). Dit komt omdat het vooraf gespecificeerde doelmodel beter kan worden benaderd wanneer er meer observaties beschikbaar zijn. Omdat het AIC een doelmodel hanteert die afhangt van (n), werkt dit criterium ook bij kleinere steekproeven (Burnham & Anderson, 2004).

De bijzondere aspecten van merkmanagement 69 Andrews en Currim (2003) vergelijken in hun studie het AIC, AIC3, BIC en CAIC met elkaar. Zij vinden daarbij dat het AIC3 criterium superieur is aan de overige IC. Enkele andere auteurs, waaronder Naik et al. (2007) vinden echter dat het AIC en AIC3 criterium een voorkeur hebben voor modellen met relatief veel parameters, waardoor mogelijk een suboptimaal model als beste wordt aangewezen. Dit kan worden verklaart uit het feit dat deze criteria een relatief lage straf per parameter hanteren. Burnham en Anderson (2004) erkennen dit, maar stellen dat deze verkeerde conclusies worden getrokken doordat het AIC wordt gebruikt, terwijl de data vragen om het gebruik van AICc (4/O T 40).

Op basis van de hier gepresenteerde conclusies wordt gesteld dat de keuze van een optimaal informatiecriterium afhangt van de steekproefomvang (n) en het aantal modelparameters (K). Gelet op het geringe aantal observaties dat voor dit onderzoek beschikbaar is, wordt daarom gesteld dat modelselectie op basis van AICc het meest voor de hand ligt.

6.2.6 Interpretatie

In principe wordt voor de interpretatie van de parameters gebruikt gemaakt van de resultaten van één model. Echter, in een situatie waarin meerdere modellen met één of meer dezelfde parameters zijn geschat, ligt het voor de hand om ook meerdere modellen te gebruiken voor de interpretatie. Burnham en Anderson (2004) stellen in dit kader een methode voor multimodel inference voor. Met deze methode worden de geschatte parameters gewogen aan de hand van de informatiecriteria van het model. In dit kader wordt eerst het verschil tussen de AIC(c) van het betreffende model i en de AIC(c) van het beste model berekend (vergelijking (17)). Vervolgens worden de wegingen voor de verschillende modellen berekend aan de hand van vergelijking (18). Wanneer de wegingsfactoren zijn berekend, dienen deze te worden vermenigvuldigd met de parameters van de relevante modellen en vervolgens worden opgeteld. Op deze manier ontstaat een nieuwe parameterset, waarin de informatie van twee of meer modellen is samengebracht.

∆ MN@ MN[ ⁽¹⁷⁾

\ _∑_`^]6@∆_{]6@∆_}^⁄²_⁄₂

_< ⁽¹⁸⁾

Of parameter nu zijn verkregen uit één of uit meerdere modellen, coëfficiënten van een generalized linear model kunnen niet zondermeer geïnterpreteerd worden. Voor het interpreteren van de richting van een effect (positief of negatief), doen zich geen problemen voor. Een negatieve coëfficiënt staat voor een negatief effect, terwijl een positieve coëfficiënt staat voor een positief effect. Waar het misgaat, is bij de interpretatie van de parametergetallen. Immers, bij het gebruik van een logit link leidt een toename één eenheid in X niet tot een toename van β in Y, maar een toename van β in a4X Y 1 @ X Y⁄ . Hier is niet gemakkelijk een betekenisvolle interpretatie aan te geven. Is een interpretatie van deze getallen wel van belang, dan moeten de parameters getransformeerd worden. Dit wordt gedaan door de exponent van de parameters te nemen. De betekenis van de β die zo ontstaat wordt de odds genoemd: de kans op het ene ten opzichte van het andere X Y 1 @ X Y⁄ . Bij een aankoopkeuzemodel, zoals in dit onderzoek, staat de exponent van de parameter dus voor de kans op aankoop ten opzichte van de kans op geen aankoop. Bijkomstig gevolg van deze transformatie is wel, dat de interpretatie van positieve en negatieve effecten iets anders wordt. Het omslagpunt ligt nu bij 1. Parameters tussen 0 en 1 staan voor een negatief effect en parameters groter dan 1 staan voor een positief effect.

In document De merkwaarde van MKB adviseursDe bijzondere aspecten van merkmanagement (pagina 64-70)

METHODOLOGIE VAN GLIM

6. KWANTITATIEF ONDERZOEK

6.2 METHODOLOGIE VAN GLIM

6.2.1 Standaard lineaire regressie

Aankoopmotivatie