• No results found

Hoofdstuk 4 Model

4.2 SCAN*PRO model

Zoals eerder beschreven, maak ik gebruik van een mogelijk model om te komen tot het beantwoorden van de centrale vraag. Dit model is afgeleid van het SCAN*PRO model (o.a. Christen e.a., 1997; Foekens, Leeflang, en Wittink, 1994). Het originele model van Wittink e.a. (1988) bevat eigen en kruislingse merk effecten van promoties en is geschat met winkelniveau data verzorgd door ACNielsen. Het is ontwikkeld voor commerciële doeleinden en het basismodel is gebruikt voor meer dan 3000 verschillende commerciële toepassingen in Noord-Amerika, Europa en Azië. De interessante variabelen in dit onderzoek zijn de logaritmen van de verkopen in stuks en de logaritmen van de prijsindexen (ratio van de actuele ten opzichte van de reguliere prijs) van de verschillende merken op winkelformuleniveau.

4.2.1 Aggregatieniveau

In mijn model is de afhankelijke variabele de logaritme van de verkopen in stuks van een bepaald merk binnen een winkelformule in een gegeven week, afgeleid van het SCAN*PRO model. De verkopen in stuks zijn omgerekend naar consumenten (gebruik) stuks. Bij toepassing van de ‘normale’ stuks kunnen bijvoorbeeld formaten en volume-plusacties niet meegenomen worden wat een vertekend beeld oplevert.

Verschil met het SCAN*PRO model is, dat ik gebruik maak van geaggregeerde winkelformule data in plaats van winkeldata vanwege de beschikbaarheid. Als belangrijke conclusies gemaakt moeten worden over de aard en hoeveelheid van promotie-effecten, genieten de niet geaggregeerde modellen vanuit een statistisch perspectief de voorkeur (o.a. Christen e.a., 1997; Foekens, Leeflang, en Wittink, 1994). Ik heb echter van de (on)afhankelijke variabelen alleen de geaggregeerde winkelformuledata tot mijn beschikking en herleiden van de afhankelijke prijsvariabele op winkelniveau is met deze data niet mogelijk. Aangezien in Nederland het promotiebeleid van verschillende winkelformules landelijk op elkaar is afgestemd en tegelijkertijd plaatsvindt, zal dit weinig problemen opleveren. Daarbij worden de parameters binnen mijn model homogeen tussen winkels verondersteld. Belangrijk is dat, voor een niet lineair model als dit, lineaire aggregatie van data geen bias vormen zolang de aggregatie is beperkt tot units die homogeen zijn in uitingen tot marketing activiteiten (Allenby en Rossi 1991; Christen e.a. 1997).

Mijn model is naast wekelijkse winkelformuledata gebaseerd op merkniveau in plaats van SKU-niveau. Dit kan een verschil maken doordat een consument van SKU kan wisselen als reactie op een prijsverandering. Is het prijseffect vastgesteld op merkniveau, dan wordt deze switch, als de SKU’s van hetzelfde merk zijn, niet opgemerkt terwijl op SKU-niveau dit wel het geval is. De prijselasticiteit is dan ook significant hoger op SKU-SKU-niveau

(Bijmolt, Van Heerde en Pieters, 2005). Aangezien de switch op merkniveau van belang is voor dit onderzoek en niet op SKU-niveau wordt gebruik gemaakt van merkniveaudata. Tenslotte is het model gebaseerd op wekelijkse scannerdata. Prijzen en verkopen fluctueren namelijk in sterke mate. De verkooptoename in de promotieweek wordt deels gecompenseerd door een verkoopafname voor en na de promoties (Van Heerde, Leeflang, en Wittink 2000). Totale verkopen over een langere periode fluctueren derhalve minder dan wekelijkse verkopen doen. Als data geaggregeerd is over tijd dan zullen zulke fluctuaties verloren gaan. Bovendien behoudt het gebruik van wekelijkse data de exacte variatie over tijd omdat promotionele activiteiten niet veranderen binnen een week.

4.2.2 Huishoud versus winkelniveau scanning data

In de onderzoeken naar promoties wordt gebruik gemaakt van 2 soorten data: winkelniveau data en ‘household’ ofwel huishouddata. Winkelniveau data bestaan uit alle verkopen van een of meerdere winkels binnen een tijdsbestek (meestal in weken). De data bestaan uit geaggregeerde verkopen van alle consumenten die winkelen in de betreffende winkel(s). Huishouddata geven informatie over aankopen van individuele huishoudens en geven derhalve meer informatie over aankopen, zoals aankoopreden, dan winkeldata. Deze data zijn daardoor bruikbaarder voor de analyse van reacties van individuen of huishoudens op promoties.

Om de verkopen te verklaren gebruik ik winkelformuleniveau data in plaats van huishouddata. Winkelniveau data zijn in het algemeen representatiever dan huishouddata (Gupta e.a., 1997). Daarnaast beschikken de meeste bedrijven over deze data, waardoor het gebruik van het model adaptief is.

4.2.3 Onafhankelijke variabelen afgeleid van Scan*PRO model

Het SCAN*PRO model bevat als voorspellende variabelen vier gangbare promotionele instrumenten—prijskorting zonder ondersteuning, alleen feature, alleen display, en feature en display ondersteuning—voor het eigen merk en andere merken. Kenmerkend voor promoties is dat ze uit tijdelijke prijskortingen bestaan die worden ondersteund door deze displays en/of feature advertenties. Gebaseerd op eerder onderzoek, kan het betekenisvol zijn om de effecten van deze verschillende typen ondersteuning mee te nemen. Echter, verschillende onderzoekers die deze variabelen hebben meegenomen, rapporteren dat de ondersteuningvariabelen (Gupta 1988: feature-en-display, feature-of-display, en prijskorting; Chiang 1991: feature, display) hoog gecorreleerd zijn omdat ze vaak op hetzelfde moment worden gebruikt. Om dit probleem, wat eveneens in mijn data optrad, op te lossen heb ik de variabelen hergedefinieerd zodat ze niet meer gecorreleerd zijn. Deze aanpassing is eveneens gebruikt door Van Heerde e.a. (2000), Van Heerde, Leeflang, en Wittink (2001, 2004). Een bepaalde (prijs)promotie bestaat in dit model uit een prijskorting met wel of geen ondersteuning, die elkander uitsluiten. De aanpassing in wel of geen ondersteuning is gemaakt omdat in een deel van de winkelformules te weinig datapunten van de verschillende ondersteuningen aanwezig zijn, waardoor de parameters een vertekend beeld zouden geven. Ik pas zoals genoemd de formulering van de ondersteuningscondities aan en definieer twee prijsvariabelen: (1) eigen en kruislingse merkkortingen met ondersteuning; en (2) eigen en kruislingse merkkortingen zonder ondersteuning. Ik specificeer de instrumenten 1 en 2 als log prijsindexen. De reden voor het gebruik van logaritmen is dat hierdoor de parameters geïnterpreteerd kunnen worden als elasticiteiten. Een promotie-elasticiteit meet de procentuele verandering in verkopen veroorzaakt door een stijging van de promotiekorting met één procent. Ik gebruik prijsindexen (ratio van actuele ten opzichte van reguliere prijzen) om alleen de promotionele effecten vast te leggen. De promotieprijseffecten worden dus gescheiden van reguliere prijseffecten. De prijsindexratio is gelijk aan één in niet-promotionele weken en is minder dan één als de actuele (schap) prijs lager is dan de reguliere prijs. Als de normale prijs verandert, dan is de prijsindex relatief gedefinieerd ten opzichte van de nieuwe reguliere prijs (en blijft deze één als alleen de reguliere prijs

verandert) Dus de prijsindex legt alleen de tijdelijke prijskortingen vast. Deze variabele is eveneens gebruikt in ACNielsen’s Scan*Pro model (Wittink e.a. 1988).

De twee prijsvariabelen zijn als volgt gedefinieerd. Voor instrument 1, neem ik, zoals vermeld, de log prijsindexen en vermenigvuldig ze met één voor waarnemingen met prijskorting en ondersteuning (feature en/of display) met een distributie boven de 30%. Met nul worden situaties vermenigvuldigd waarbij geen prijskortingen zijn, of prijskortingen zonder ondersteuning, of prijskortingen met ondersteuning en een distributie minder dan 30%. Instrument 2 is hetzelfde gedefinieerd alleen nu vermenigvuldig ik het prijsindexcijfer met één voor prijskortingen zonder ondersteuning (feature en/of display) en prijskortingen met distributie ondersteuning minder dan 30%. Met nul worden situaties vermenigvuldigd zonder prijskorting of een prijskorting met ondersteuning boven 30% distributie. Ik houd in mijn onderzoek geen rekening met ondersteuning van merken zonder dat er een prijskorting is geweest. Dit komt zeer sporadisch voor in de data en is derhalve niet relevant genoeg om mee te nemen in dit onderzoek. Door het bestuderen van de data heb ik gekozen voor een grens van 30% distributie bij de indeling wel of geen ondersteuning. Een promotie met ondersteuning en minder dan 30% distributie, komt weinig voor in de data. Daarnaast zal onder deze grens de ondersteuning te weinig effect hebben (een kleine lokale actie in plaats van nationale actie) en de resultaten (negatief) beïnvloeden.

De vertraagde eigen en kruislingse merk log prijsindexen voor de twee verschillende condities zijn voor één periode opgenomen (t-1). Zoals eerder besproken is uit verschillende onderzoeken naar voren gekomen dat hoewel niet direct zichtbaar, er weldegelijk een vertraagd effect bestaat dat ontstaat na een promotie, de zogenaamde postpromotie dip maar dat deze pas te zien is na een aantal perioden (Van Heerde, Leeflang en Wittink, 2000). De vertraagde effecten opgenomen in mijn model kunnen deze dip niet weergeven. Extra vertraagde effecten zijn niet opgenomen aangezien dan het maximum aan onafhankelijke variabelen zou worden overschreden. Toekomstig onderzoek kan hiervoor uitkomst bieden.

De voorspellende variabelen reeds beschreven, bestaan uit de eigen marktinstrumenten en de marktinstrumenten van concurrenten. De prijsparameter van het eigen marktinstrument geeft de toename weer in verkopen voor het merk, wat veroorzaakt wordt door een tijdelijke prijsverlaging. Zoals eerder genoemd kan deze verkoopelasticiteit verdeeld worden in merkkeuze, aankoop frequentie, en aankoophoeveelheid elasticiteiten (o.a. Gupta, 1988). Decompositie van dit verkoopeffect komt niet aan de orde in dit onderzoek. Merkswitching kan wel worden berekend door middel van de kruislingse merkeffecten.

4.2.4 Overige onafhankelijke variabelen

Naast de prijsvariabelen met en zonder ondersteuning en de vertraagde effecten zijn er nog een drietal variabelen in het model opgenomen te weten distributie, het aantal winkels en de temperatuur. De onafhankelijke variabelen in het model zijn geaggregeerd over de winkelformules. Zoals eerder beschreven, kunnen door de beperking in de dataset met betrekking tot de relatieve prijsvariabele, de variabelen niet per winkel gedefinieerd worden. De variabele distributie en winkels zijn afzonderlijk opgenomen, doordat er bij interactie van deze twee variabelen multicollineariteit optreedt.

Distributie

De gewogen distributie van een merk per winkelformule kan van week tot week sterk fluctueren en is positief gecorreleerd met de verkopen. Om een vergelijking te kunnen maken tussen de verschillende merken is per merk per winkelformule een variabele distributie meegenomen in de vorm van een multiplier. Hoe hoger de gewogen distributie, hoe hoger het (extra) aantal verkopen. Een distributiemultiplier van 1.2 wil zeggen: een toename 20% aan verkopen ten opzichte van normale verkopen gedurende periode met hogere distributie. Deze multiplier is normaliter groter dan 1 voor het eigen merk en kleiner dan 1 voor de kruislingse multiplier.

Winkels

Over een periode van 124 weken treden er veranderingen op in het ‘supermarktlandschap’. Supermarktformules breiden uit, supermarkten worden overgenomen en anderen sluiten de deuren. Omdat ik met geaggregeerde winkelformules te maken heb, is het noodzakelijk een variabele toe te voegen van het aantal winkels per winkelformule. Deze variabele verschilt per winkelformule maar is gelijk voor de verschillende merken. Er is een positief verband tussen het aantal winkels en de verkopen van een bepaald product. Als het aantal winkels stijgt, stijgen logischerwijs ook de verkopen.

Temperatuur

Bij een product als deosprays kun je te maken krijgen met seizoensinvloeden. Zoals af te lezen in figuur 4.1 is de zomerperiode het seizoen met de hoogste verkopen voor zowel foodkanaal als drogisterijkanaal, en periode 13 (invloed van giftpacks tijdens feestdagen) in het drogisterijkanaal. Aangezien ik mijn onderzoek beperk tot de verschillende foodkanalen is de verkopen van deosprays afhankelijk van de temperatuur in graden. Er is sprake van een positieve correlatie. Een temperatuurvariabele, die gelijk is voor alle winkelformules en merken, is toegevoegd aan mijn model.

0 8000 7000 6000 5000 4000 3000 2000 1000 8 W04001 W04008 W04015 W04022 W04029 W04036 W04043 W04050 W05004 W05011 W05018 W05025 W05032 W05039 W05046 W06001 W0600

TOTAAL DEODORANTS FOOD TOTAAL DEODORANTS DRUG/PERF.

Figuur 4.1 seizoensinvloeden deosprays

Alle variabelen, waaronder de eigen- en kruislingse merkvariabelen onder promotie voorwaarden, zijn multiplicatief opgenomen, zoals in het SCAN*PRO model. Daarnaast ligt de focus in mijn onderzoek bij prijspromoties, wat betekent dat statistische of empirische controle voor alle andere variabelen die het nut van een merk beïnvloeden aangenomen wordt.

4.2.5 Pooling

Zoals eerder beschreven schat ik de modellen met data op geaggregeerd winkelformuleniveau. Om te kijken of ik de winkelformules en/of merken kan samenbrengen tot een gepoold, ofwel gezamenlijk, model maak ik gebruik van de Chow (1960) test voor algemene parameter homogeniteit. De Chow-test wordt in de econometrie gebruikt en is een toets om te kijken of twee subgroepen in een populatie gelijke parameters hebben op hun regressielijnen. Is dit het geval dan kan de data worden gepoold, ofwel samengebracht tot één model. Een gepoolde aanpak verstrekt

efficiëntere parameter voorspellingen, relatief tot het gebruik van marktniveau data die van oudsher gebruikt werden in tijdserie studies (Christen e.a., 1997).

Om te kijken of poolen mogelijk is, heb ik naast de afzonderlijke modellen, gezamenlijke modellen geschat met (1) alle winkelformules en (2) alle merken met homogene wekelijkse effecten. Hierbij vergelijk ik de resultaten van zowel de afzonderlijke winkelformule modellen en een compleet gepoold model over de winkelformules, als van afzonderlijke merkmodellen met een compleet gepoold model over de merken. Ik test de hypothese Ho dat de coëfficiënten tussen groepen variabelen hetzelfde zijn. De uitkomsten van de pooling test, de p-waardes van de Chow test, zijn te zien in tabel 4.1 en tabel 4.2. Deze uitkomsten vergelijk ik met de kritieke waarde van de F-distributie (significantieniveau van 0,05) met 69,400 vrijheidsgraden (=1,39) gepooled over merken (tabel 4.1) en 228,1102 vrijheidsgraden (=1,24) gepooled over supermarktformules (tabel 4.2). Aangezien alle berekende p-waardes groter zijn dan de desbetreffende kritieke waarde, verwerp ik de nul hypothese, wat wil zeggen dat pooling niet is toegestaan. Het is betekenisvol om gescheiden modellen voor de vier merken en elf winkelformules te hebben.

AH C1000 Coop Deen Dekamarkt Edah Hoogvliet Konmar Plus SdB Spar 42,30 17,94 18,71 28,37 45,91 31,14 19,18 13,16 17,52 27,16 30,54

supermarktformules p -Waarde Chow test

tabel 4.1 pooling test merken

Fa Nivea Rexona Sanex 9,34 7,17 9,59 14,86

p -Waarde Chow test Merken

tabel 4.2 pooling test winkelformules