• No results found

Corrigeren voor heterogeniteit : een analyse betreft de procycliciteit van innovaties

N/A
N/A
Protected

Academic year: 2021

Share "Corrigeren voor heterogeniteit : een analyse betreft de procycliciteit van innovaties"

Copied!
24
0
0

Bezig met laden.... (Bekijk nu de volledige tekst)

Hele tekst

(1)

Corrigeren voor heterogeniteit

Een analyse betreft de procycliciteit van innovaties

Bachelor Scriptie Econometrie Sofie L¨ohr

11038926 22 December 2017

Begeleider: Dhr. dr. J.C.M. van Ophem Samenvatting

In dit onderzoek wordt geanalyseerd welk effect schatten per bedrijfstak heeft op de procy-cliciteit van innovaties en patenten. Door per bedrijfstak te schatten wordt er gecorrigeerd voor heterogeniteit en kunnen de effecten binnen verschillende bedrijfstakken goed vergeleken worden. Hiervoor is het model van Fabrizio en Tsolmon (2014) als uitgangspunt gebruikt. Het aantal aangevraagde patenten blijkt procyclisch in de zes grootste bedrijfstakken. Daar-naast is gebleken dat er veel variatie zit in de resultaten van de verschillende bedrijfstakken, waardoor het beter is om de bedrijfstakken niet samen te nemen.

(2)

Verklaring eigen werk

Hierbij verklaar ik, Sofie L¨ohr, dat ik deze scriptie zelf geschreven heb en dat ik de volledige verantwoordelijkheid op me neem voor de inhoud ervan. Ik bevestig dat de tekst en het werk dat in deze scriptie gepresenteerd wordt origineel is en dat ik geen gebruik heb gemaakt van andere bronnen dan die welke in de tekst en in de referenties worden genoemd.De Faculteit Economie en Bedrijfskunde is alleen verantwoordelijk voor de begeleiding tot het inleveren van de scriptie, niet voor de inhoud.

(3)

Contents

1 Inleiding 3 2 Economische achtergrond 5 2.1 Schattingsmethodes in de literatuur . . . 5 2.2 Heterogeniteit . . . 7 2.3 Procycliciteit . . . 9 3 Onderzoeksmethode 12 3.1 Model . . . 12 3.2 Schattingsmethode . . . 13 3.3 Data verwerking . . . 13 3.4 Beschrijvende Statistiek . . . 15 4 Resultaten en analyse 16 4.1 Complete model . . . 16

4.2 Schattingen per bedrijfstak . . . 17

4.3 Industry Output . . . 19

4.4 Verschillen tussen bedrijfstakken . . . 20

4.5 Beperkingen . . . 21

5 Conclusie 22

(4)

1

Inleiding

Innovatie is belangrijk voor de groei van de economie. Het is derhalve van belang dat er wordt ge¨ınvesteerd in Research and Development (R&D), zodat hier innovaties uit voort kunnen vloeien. Door een patent aan te vragen op de innovatie wordt de dreiging van imitatie kleiner en kan er meer winst gegenereerd worden. Er zit dus een positieve relatie tussen het aanvragen van patenten en R&D-uitgaven. Wanneer er hogere R&D-investeringen gedaan worden, is de verwachting dat hier meer innovaties uit voortvloeien en daarmee meer patenten worden aangevraagd. Deze relatie is meerdere malen empirisch onderzocht (Pakes & Griliches, 1980; Bound, Cummins, Griliches, Hall, Jaffe 1984; Hausman, Hall & Griliches, 1984; Jaffe, 1986) en blijkt inderdaad positief en significant. Dit resultaat is van belang voor het maken van investeringsbeslissingen in de toekomst. De relatie tussen R&D-uitgaven en het aantal patenten blijkt echter anders te zijn voor verschillende bedrijfstakken (Meliciani, 2000).

Hausman, Hall en Griliches (1984) hebben het causale verband tussen R&D-investeringen en patenten onderzocht. Deze relatie is zoals verwacht positief in de onderzochte periode van zeven jaar. Fabrizio en Tsolmon (2014) hebben zich niet alleen op de relatie tussen investeringen en patenten gefocust, maar hebben eveneens de cycliciteit van R&D-investeringen en innovaties gemeten. Beide onderzoeken (Hausman et al., 1984; Fabrizio & Tsolmon, 2014) hebben middels verschillende manieren gecorrigeerd voor heterogeniteit. Hausman et al. (1984) hebben een dummy-variabele aan het model toegevoegd die voor een aantal bedrijfstakken 1 is en Fabrizio en Tsolmon (2014) nemen de industry output en een aantal bedrijfstakspecifieke variabelen op in hun model. De gebruikte dataset in het onder-zoek van Fabrizio en Tsolmon (2014) bevat data over de periode 1975 tot 2002, een grotere dataset dan gebruikt is in het onderzoek van Hausman et al. (2014). Deze beide onderzoeken hebben, om meer heterogeniteit in het model te brengen, enkel rekening gehouden met bedrijf-stakspecifieke effecten terwijl Meliciani (2000) haar model voor elke bedrijfstak apart geschat heeft. Uit de vijftien schattingen van Meliciani (2000) komt naar voren dat de relatie tussen R&D-uitgaven en het aantal aangevraagde patenten zeer verschilt per bedrijfstak. Derhalve

(5)

is in dit paper het onderzoek van Fabrizio en Tsolmon (2014) als uitgangspunt gebruikt om de cycliciteit van patenten te onderzoeken op de methode ge¨ıntroduceerd door Meliciani (2000), zodat er meer gecorrigeerd is voor verschillen tussen bedrijfstakken. Er is onderzocht welk effect extra corrigeren voor heterogeniteit, door middel van schattingen per bedrijfstak, heeft op de cycliciteit van het aantal aangevraagde patenten.

Het paper is als volgt opgebouwd: in hoofdstuk 2 zijn verschillende methodes en theo-rie¨en besproken die van belang zijn om de relatie tussen R&D-investeringen en patenten te kwantificeren. In hoofdstuk 3 is beschreven welk model voor dit onderzoek is gebruikt, wat de gebruikte schattingsmethode is, hoe de data verkregen zijn en aan het eind van dit hoofdstuk staat de beschrijvende statistiek. In hoofdstuk 4 zijn de resultaten besproken en geanalyseerd en ten slotte staat in hoofdstuk 5 de conclusie.

(6)

2

Economische achtergrond

In dit hoofdstuk zijn de relevante artikelen besproken met betrekking tot de totstandkoming van het gebruikte methode in dit onderzoek. Aan de hand van de besproken papers is een hypothese gesteld die getoetst wordt in de volgende hoofdstukken.

2.1 Schattingsmethodes in de literatuur

Om het causale verband tussen R&D-investeringen en patenten te kwantificeren hebben Pakes en Griliches (1980) een model geschat dat in later onderzoek als basis gebruikt is (Hausman et al., 1984). Pakes en Griliches (1980) hebben een log-logmodel gebruikt, met als te verk-laren variabele de natuurlijke logaritme van het aantal aangevraagde patenten (Pit). Voor de

verklarende variabelen hebben de onderzoekers zes vertragingen van de natuurlijke logaritmen van R&D-uitgaven (Rit) opgenomen. Het model luidt:

ln(Pit) =P5j=0βjlnRit−j+ µit

De data beslaan acht jaar en 121 verschillende bedrijven. Het model is op twee manieren geschat, namelijk met de between- en withinschattingsmethode. Een betweenschatting neemt van elke variabele het gemiddelde van elk individu i over een tijdsperiode T en gebruikt deze gemiddelden als variabelen (Cameron & Trivedi, 2005). Op deze manier kan de trend over de jaren geschat worden. In het lineaire geval is het algemene model dat gebruikt wordt bij een betweenschatting als volgt gedefinieerd:

¯

yi = αi+ ¯x0iβ + ¯εi

Hierbij is yi de te verklaren variabele, xi een vector van de verklarende variabelen, εi de

storingsterm en αi de onopgemerkte heterogeniteit. ¯yi, ¯xi en ¯εi zijn de gemiddelden van deze

variabelen van individu i over tijdsperiode T. Door aan te nemen dat de covariantie tussen de storingsterm en de verklarende variabelen nul is, kan de onopgemerkte heterogeniteit (αi) nul

(7)

een withinschatting, ook wel fixed effects-schatting, wordt gedaan, worden de waardes in afwijking van het gemiddelde genomen (Cameron & Trivedi, 2005). Het model luidt dan:

yit− ¯yi = (αi− αi) + (xit− ¯xi)0β + (εit− ¯εit)

Hierbij zijn ¯yi, ¯xi en ¯εi wederom de gemiddelden van individu i over tijdsperiode T. De term

(αi − αi) valt weg, waarmee het heterogeniteitsprobleem is opgelost. Op deze manier kan,

in tegenstelling tot bij de betweenschatting, αi correleren met de verklarende variabelen. In

de praktijk correleert αi vrijwel alijd met de verklarende variabelen dus volstaat een

with-inschatting beter, wanneer er gecorrigeerd moet worden voor onopgemerkte heterogeniteit. Beide schattingen worden gedaan aan de hand van de kleinstekwadratenmethode. Uit de withinschatting, op grond van een longitudinale-analyse, volgde dat de jaarlijkse fluctuaties van patenten nauwelijks verklaard kunnen worden uit de zes R&D-variabelen aangezien de adjusted R-squared laag is (0.33). In de afwijking van de trend zit dus veel stochastiek. De betweenrelatie daarentegen is sterker ( ¯R2 = 0.69). Derhalve zit er een duidelijke trend in de

relatie tussen R&D-investeringen en patenten. Pakes en Griliches (1980) hebben echter het feit dat de te verklaren variabele, het aantal aangevraagde patenten, een count is, genegeerd. Het onderzoek van Hausman et al. (1984) is een vervolg op het onderzoek van Pakes en Griliches (1980). In het onderzoek van Hausman et al. (1984) is de relatie tussen R&D-uitgaven en het aantal aangevraagde patenten gemodelleerd aan de hand van een Poisson-model. Op deze manier wordt er rekening gehouden met het feit dat het aantal angevraagde patenten een count is aangezien het Poissonmodel het benchmarkmodel is voor countdata. Net zoals bij Pakes en Griliches (1980) wordt ook hier aangenomen dat er een bedrijfsspecifieke onopgemerkte heterogeniteit is (αi). Om dit op te lossen gebruiken Hausman et al. (1984) een

fixed of random effectsmodel. De withinschatting besproken in de vorige alinea is hetzelfde als een fixed effectsschatting. Omdat er bij het random effectsmodel, net zoals bij de be-tweenschatting, sterkere aannames gedaan moeten worden, volstaat een fixed effectsschatting beter. Hausman et al. (1984) hebben het fixed effectsmodel gebruikt in combinatie met een Poissonmodel. Doordat het model niet meer met OLS geschat wordt maar met de maximum

(8)

likelihoodschattingsmethode, is de fixed effectsschattingsmethode bij een Poissonmodel ver-schillend van de fixed effectsschatting bij de kleinstekwadratenmethode. Een Poissonverdeling met onopgemerkte heterogeniteit is als volgt gedefinieerd:

f (Pit|Xit) = αiλ

Pit it

Pit! e

−αiλit

Hierbij is Pit het aantal aangevraagde patenten van bedrijf i=1,...,N in periode t=1,...,T en

αi de bedrijfsspecifieke onopgemerkte heterogeniteit. λit is de verwachting van het aantal

aangevraagde patenten: λit = E(Pit|Xit) = eXitβ met Xit de verklarende variabelen. Voor

de fixed effects Poissonschatting moet αi evenals β geschat worden (Winkelmann, 2008). De

loglikelihood functie van bedrijf i voor het Poissonmodel luidt:

`i(αi, β) = −αiPTt=1λit+ ln(αiPTt=1Pit) +PTt=1Pitln(λit) −PTt=1ln(Pit!)

Aan de hand van deze loglikelihoodfunctie is maximum likelihoodschatter voor αi berekend:

ˆ αi= λy¯¯ii.

Door deze ˆαi weer terug in te vullen in de loglikelihoodfunctie hierboven wordt de

loglikeli-hoodfunctie die niet meer van αiafhangt verkregen. Dit is de concentrated loglikelihoodfunctie

(Winkelmann, 2008):

`ci(β) = constante +PN

i=1{

PT

t=1Pitln(λit) −PTt=1Pitln(PTt=1λit)}

Waarbij de constante alle termen die niet van β afhangen bevat. Middels de concentrated loglikelihoodfunctie kan β geschat worden terwijl er gecorrigeerd is voor bedrijfsspecifieke effecten.

2.2 Heterogeniteit

Pakes en Griliches (1980) verklaren het aantal aangevraagde patenten uitsluitend uit ver-traagde variabelen van R&D-uitgaven. Naast dat Hausman et al. (1984) ten opzichte van Pakes en Griliches (1980) een geschiktere schatting introduceren voor panelcountdata, hebben ze ook bedrijfsspecifieke variabelen toegevoegd. De bedrijfsspecifieke variabelen zorgen ervoor

(9)

dat er meer gecorrigeerd is voor heterogeniteit in de analyse. Hausman et al. (1984) hebben als bedrijfsspecifieke variabelen een dummy toegevoegd voor de zogenoemde scientific sector en een variabele genaamd log book value. Daarnaast hebben de onderzoekers een kruisterm tussen tijd en R&D toegevoegd, zodat er gecorrigeerd wordt voor een trend in de tijd. On-der de scientific sector valt een aantal bedrijfstakken, te weten: de medische, chemische en computerindustrie. Tevens zijn de sectoren scientific instruments en electrical equipment in-dustries bij de scientific sector gevoegd. Omdat deze bedrijfstakken erg onderzoeksintensief zijn, is de verwachting dat de relatie tussen R&D-uitgaven en het aantal aangevraagde paten-ten in deze bedrijfstakken sterker is dan in andere bedrijfstakken. De variabele log book value is toegevoegd om een schatting van de grootte van het bedrijf mee te nemen in de analyse middels de boekwaarde van het bedrijf. Deze boekwaarde is gecorrigeerd voor inflatie en er is een natuurlijke logaritme van genomen. De dummyvariabele en de variabele log book value hebben beide een sterk positief significant effect op het verwachte aantal patenten dat aangevraagd wordt. Verder blijkt dat de vertraagde variabelen van Pakes en Griliches (1980) in dit model overbodig zijn. Daarnaast is geconcludeerd dat er een negatieve trend zichtbaar is in de relatie tussen R&D-investeringen en patenten, door de significante negatieve co¨effici¨ent van de kruisterm. De relatie is niet constant maar dalend over de tijd.

Door voor elke bedrijfstak apart te schatten heeft Meliciani (2000) nog meer gecorrigeerd voor heterogeniteit. De onderzoekster heeft eveneens de relatie tussen patenten en R&D-uitgaven onderzocht, maar zij heeft voornamelijk geanalyseerd of deze relatie verschilt per bedrijfstak. Onder andere het onderzoek van Hausman et al. (1984) is hiervoor als uit-gangspunt gebruikt. De te verklaren variabele is het aantal aangevraagde patenten per bedrijf en de verklarende variabelen zijn een vertraagde variabele voor R&D- en investeringsuitgaven en een variabele voor de trend in de tijd. De analyse wordt voor elk van de vijftien bedrijf-stakken apart uitgevoerd, waardoor het effect per sector goed te vergelijken is. In nagenoeg iedere sector hebben R&D-uitgaven een positief effect op het aantal patenten en in bijna elke sector is dit effect significant. De elasticiteiten vari¨eren van 0.118 tot 0.558. De hoogste elas-ticiteiten zijn gevonden in de sectoren radio-, tv- en communicatieapparatuur, medicijnen,

(10)

niet-metalen delfstoffen en bedrijfs- en computerapparatuur (Meliciani, 2000). Deze bedrijf-stakken komen in zekere zin overeen met de scientific sector dummy gebruikt door Hausman et al. (1984). Uit deze twee analyses kan geconcludeerd worden dat de relatie tussen R&D-uitgaven en patenten verschilt per bedrijfstak en dat het hierom nodig is om extra te corrigeren voor heterogeniteit.

2.3 Procycliciteit

Schumpeter (1939) heeft zich gefocust op de cycliciteit van R&D-investeringen. Aan de hand van economische theorie voorspelt hij dat R&D-investeringen countercyclisch zijn. Bedrijven zullen investeren in innovaties in periodes van recessie, zodat de opportunity costs laag zijn. Uit later empirisch onderzoek blijkt echter dat R&D-investeringen procyclisch zijn (Barlevy, 2007; Fabrizio en Tsolmon, 2014).

Zo blijkt uit het onderzoek van Barlevy (2007) de procycliciteit van R&D-investeringen. Ondanks de lage opportunity costs, is het voor bedrijven niet voordelig om te investeren in periodes van recessie. Door imitatie wordt er alleen winst gemaakt op korte termijn en zullen investeringen uitgesteld worden naar periodes van economische bloei.

Fabrizio en Tsolmon (2014) breiden het onderzoek van Barlevy uit door meer heterogen-iteit toe te voegen aan de hand van bedrijfstak specifieke variabelen en ze veronderstellen, in tegenstelling tot Barlevy (2007), dat R&D-investeringen en de introductie van een innovatie niet op hetzelfde moment plaatsvinden. Volgens Fabrizio en Tsolmon (2014) kunnen de tim-ing van R&D-investertim-ingen en de introductie van een innovatie beschouwd worden als twee aparte strategische beslissingen. Hoewel deze beslissingen apart beschouwd kunnen worden, hebben ze nog wel met elkaar te maken. Hier houden Fabrizio en Tsolmon (2014) echter geen rekening mee, aangezien ze beide beslissingen apart modelleren en schatten zonder het model voor patenten en het model voor R&D-uitgaven enigzins met elkaar in verband te brengen. De onderzoekers hebben zodoende enerzijds innovatie en patenten en anderzijds R&D-investeringen apart geschat. Aan de hand van deze scheiding hebben Fabrizio en Tsol-mon (2014) het onderzoek van Barlevy (2007) uitgebreid. In het vervolg is er alleen gefocust

(11)

op het deel over innovatie en patenten, waarbij een innovatie wordt gemeten door het aan-vragen van een patent. Wanneer er een patent wordt aangevraagd duidt dit namelijk op een stap dichter bij commercialisatie (Fabrizio & Tsolmon, 2014).

Om meer heterogeniteit op te nemen in het model, stellen Fabrizio en Tsolmon (2014) dat de mate van patentbescherming en de mate van veroudering van een innovatie effect hebben op de procycliciteit van een innovatie. Deze variabelen worden gemeten per bedri-jfstak en zo wordt er gecorrigeerd voor heterogeniteit binnen de dataset. De invloed van patentbescherming en veroudering op een innovatie is gemakkelijk te verklaren aan de hand van economische theorie. Door de dreiging van imitatie kan de mate van patentbescherming invloed hebben op het introduceren van een innovatie. Bij zwakke patentbescherming en daarmee een grotere dreiging van imitatie, zal een bedrijf de introductie van een innovatie uitstellen tot een periode van economische bloei om een zo hoog mogelijke winst te genereren. Wanneer de mate van veroudering sterk is, zal een innovatie snel na introductie minder winst geven. Een bedrijf zal dus de innovatie introduceren tijdens economische bloei om de winst te maximaliseren. In beide gevallen zullen innovaties procyclisch zijn. Naast de variabelen patentbescherming en veroudering van de innovatie is er ook nog een variabele external fi-nance, maar deze variabele is in deze analyse buiten beschouwing gelaten. Aan de hand van de kruistermen tussen industry output en de bedrijfstakspecifieke variabelen is de mate van procycliciteit gemeten. Gebaseerd op het model van Barlevy (2007), luidt het model van Fabrizio en Tsolmon (2014):

E(Pkt|RDkt−1, RDkt−2, Xit, Mkt−1) =

exp(β1RDkt−1+ β2RDkt−2+ β3Xit+ β4Mkt−1+ β5XitP atef fi+ β6XitObsi+ τt+ µk)

Hierbij is Pkt het aantal aangevraagde patenten door bedrijf k in jaar t, Xit een natuurlijk

logaritme van industry output in bedrijfstak i, RDkt−1 de natuurlijke logaritme van de

R&D-uitgaven van bedrijf k, Mkt−1firm level controls van bedrijf k en τten µk respectievelijk

jaar-en bedrijfsfixed effectjaar-en. Obsi staat voor obsoloscense, oftewel de mate van veroudering en

(12)

De schatting is gedaan aan de hand van de maximum likelihoodmethode met QML-eigenschap. Op deze manier zijn, mits het gemiddelde goed gespecificeerd is, de schatters ook bij misspec-ificatie van de verdeling consistent (Winkelmann, 2008). De dataset bevat 4.029 bedrijven in 101 bedrijfstakken over de periode van 1975 tot 2002. De kruistermen voor patentbescherming en de mate van veroudering van een innovatie zijn naar verwachting negatief en daarmee wor-den de veronderstellingen van Fabrizio en Tsolmon (2014) ondersteund.

Naar verwachting is de relatie tussen R&D-investeringen en patenten positief zoals in de besproken papers en is het introduceren van innovaties procyclisch (Fabrizio en Tsolmon, 2014). Uit de onderzoeken van Hausman et al. (1984), Meliciani (2000) en Fabrizio en Tsolmon (2014) is gebleken dat het nodig is om bedrijfstak- of bedrijfsspecifieke variabelen op te nemen in een analyse om te corrigeren voor heterogeniteit. Om op basis van het model en de dataset van Fabrizio en Tsolmon (2014) nog meer te corrigeren voor heterogeniteit, is een aanpassing op dit model geschat over verschillende bedrijfstakken zoals ge¨ıntroduceerd door Meliciani (2000).

(13)

3

Onderzoeksmethode

In dit hoofdstuk is de methode om de relatie tussen patenten en R&D-investeringen te onder-zoeken besproken. Daarnaast is behandeld hoe de uiteindelijke dataset verkregen is en is de beschrijvende statistiek toegelicht.

3.1 Model

Het uitgangspunt in deze analyse is het model gebruikt door Fabrizio en Tsolmon (2014). Hierop zijn een aantal aanpassingen gedaan op basis van de besproken literatuur. De schatting is gedaan aan de hand van de volgende vergelijking:

E(Pkt|RDkt−1, RDkt−2, Xit, Mkt−1) =

exp(β1RDkt−1+ β2RDkt−2+ β3Xit+ β4Mkt−1+ β5XitP atef fi+ β6XitObsi+ δt+ µk)

In het onderzoek van Fabrizio en Tsolmon (2014) worden twee vertraagde variabelen van R&D-uitgaven (RDkt−1 en RDkt−2) toegevoegd. Dit is in overeenstemming met de theorie

van Meliciani (2000), die veronderstelt dat het gemiddeld 19 maanden duurt voor er een patent wordt aangevraagd na een R&D-investering. De variabele voor jaarlijkse industry out-put (Xit) en de vertraagde variabele voor bedrijfsspecifieke eigenschappen (Mkt−1), zijn beide

meegenomen in de analyse om te corrigeren voor vraagschokken in de conjunctuur en hetero-geniteit. De vector voor bedrijfsspecifieke eigenschappen (Mkt), gedefinieerd door Fabrizio en

Tsolmon (2014), bestaat uit de natuurlijke logaritmen van de omzet (sales), het aantal werkne-mers (employment ) en de assets (PPE in het onderzoek van Fabrizio en Tsolmon (2014)) van het bedrijf. De kruistermen zijn in het model van Fabrizio en Tsolmon (2014) opgenomen om de invloed van veroudering en patentbescherming op de cycliciteit van patenten en R&D-investeringen te meten. Voor alle variabelen in het model is een likelihoodratiotest gedaan. Deze test ondersteund enkel het weglaten van de variabele voor het aantal werknemers uit het model. Verder zullen de besproken variabelen allemaal opgenomen worden in het model. Fabrizio en Tsolmon (2014) gebruiken jaarfixed effects om te corrigeren voor tijdseffecten. Gezien het lage aantal waarnemingen in sommige datasets is het in dit onderzoek echter een

(14)

betere optie om te corrigeren voor tijdseffecten door middel van een tijdstrend (δt). Door in

plaats van de jaarfixed effects een tijdstrend op te nemen in het model kan tevens de trend over de jaren heen goed gemeten worden. Er wordt nog wel gecorrigeerd voor onopgemerkte heterogeniteit over de verschillende bedrijven door de bedrijfsfixed effects (µk).

3.2 Schattingsmethode

Net als in het onderzoek van Meliciani (2000), is bovenstaand model voor elke bedrijfstak apart geschat, zodat er rekening gehouden wordt met verschillende effecten in verschillende bedrijfstakken. Omdat het fixed effects Poissonmodel goede schattingen gaf in de analyse van Fabrizio en Tsolmon (2014), is deze methode ook in dit onderzoek gebruikt. Verder wordt eveneens de maximum likelihoodschattingsmethode met QML-eigenschap gebruikt, zodat de schatters consistent zijn, ookal is het model misgespecificeerd (Winkelmann, 2008). Op deze manier zijn de standaardfouten robuust.

3.3 Data verwerking

Het uiteindelijke model wordt geschat op de dataset die gebruikt is door Fabrizio en Tsolmon (2014), afkomstig uit het data-archief van The Review of Economics and Statistcs. Fabrizio en Tsolmon (2014) hebben data uit vier verschillende bronnen samengevoegd, om zo een zo compleet mogelijke dataset te verkrijgen. Om te beginnen hebben de onderzoekers de patent data van NBER (Hall, Jaffe, Trajtenberg, 2001) gekoppeld aan de bedrijfsidentificatiecode van Compustat (gvkey). Door databeschikbaarheid beslaan de data alleen de Manufacturing Industry. Hierna hebben Fabrizio en Tsolmon (2014) de verklarende variabelen vanuit NBER Manufacturing and Productivity data (Bartelsman & Gray, 1996) en Compustat gekoppeld aan elk bedrijf met behulp van de bedrijfsidentificatiecode (gvkey). De missing values van de verklarende variabelen PPE, sales, R&D-uitgaven en employment zijn vervangen door nul. Voor de bedrijven met minimaal ´e´en patentaanvraag in alle aanwezige jaren, zijn de missing values van het aantal patenten in de overige jaren eveneens op nul gesteld. De rest van de missing values voor de verklarende variabelen zijn verwijderd. Ten slotte hebben

(15)

Fabrizio en Tsolmon (2014) de observaties voor bedrijven met in de hele dataset geen enkele patentaanvraag of met maar ´e´en firm-year observatie, verwijderd uit de dataset. Het aantal overgebleven firm-year observaties is 48477 in de periode van 1975 tot 2002.

In dit onderzoek zijn dezelfde stappen gevolgd als bij de dataverwerking van Fabrizio en Tsolmon (2014), maar met een paar aanpassingen. In tegenstelling tot de data van Fabrizio en Tsolmon, zijn in dit onderzoek de missing values van de verklarende variabelen niet op nul gesteld maar verwijderd. Daarnaast blijkt dat alle waargenomen waardes voor het aantal aangevraagde patenten vanuit de dataset van NBER groter zijn dan nul. Hierdoor kan een missing value van het aantal aangevraagde patenten twee dingen betekenen: het bedrijf heeft geen patent aangevraagd in dat jaar of het bedrijf heeft wel een patent aangevraagd, maar dit is niet opgenomen in het bestand van NBER. Om wel de jaren waarin niet gepatenteerd is mee te nemen in het onderzoek zijn ter vergemakkelijking deze missing values op nul gesteld, evenals in het onderzoek van Fabrizio en Tsolmon (2014). Dit is alleen gedaan voor bedrijven met minimaal ´e´en patentaanvraag in alle aanwezige jaren. Na het verwijderen van de bedri-jven met geen patent aanvraag of maar ´e´en firm-year observatie blijven er 34834 firm-year observaties over, verdeeld over 3058 bedrijven.

In de dataset van Fabrizio en Tsolmon (2014) zitten 101 bedrijfstakken in de manufactur-ing industry. De bedrijven zijn onderverdeeld in bedrijfstakken gebaseerd op hun driecijferige SIC-code. Om het aantal bedrijfstakken te verlagen, zijn de bedrijven in deze analyse on-derverdeeld gebaseerd op de eerste twee cijfers van de SIC-code. Het overgebleven aantal bedrijfstakken is twintig. Dit is bovendien het aantal regressies dat uitgevoerd is.

De waardes voor de industry output zijn in het onderzoek van Fabrizio en Tsolmon (2014) per bedrijfstak gedefinieerd. Wanneer er apart geschat wordt voor elke bedrijfstak kan dit voor problemen zorgen, aangezien de waardes per bedrijfstak gelijk zijn. Doordat de bedrijfstakken in het onderzoek van Fabrizio en Tsolmon (2014) gedefinieerd zijn door de SIC3-code en in dit onderzoek de SIC2-code is gebruikt, zal er toch variatie zitten in de waardes van industry output binnen de bedrijfstakken.

(16)

3.4 Beschrijvende Statistiek

In tabel 1 staat de beschrijvende statistiek voor dit onderzoek.

Table 1: Beschrijvende Statistiek

De mate van patentbescherming loopt van 0.05 tot 0.82. Dit staat voor respectievelijk 5% en 82%. Er zit derhalve een groot verschil in de mate van patentbescherming per industrie. De mate van veroudering ligt tussen 1.56 en 4 met een gemiddelde van 2.87. Een waarde van 3 staat voor matige veroudering (Fabrizio & Tsolmon, 2014). De waardes van de rest van de variabelen worden niet toegelicht.

20 Food and Kindred Products 30 Rubber and Miscellaneous Plastics Products

21 Tobacco Products 31 Leather and Leather Products

22 Textile Mill Products 32 Stone, Clay and Glass Products 23 Apparel and Other Textile Products 33 Primary Metal Industries 24 Lumber and Wood Products 34 Fabricated Metal Products 25 Furniture and Fixtures 35 Industrial Machinery and Equipment 26 Paper and Allied Products 36 Electronic and Other Electric Equipment 27 Printing and Publishing 37 Transportation Equipment

28 Chemical and Allied Products 38 Instruments and Related Products 29 Petroleum and Coal Products 39 Miscellaneous Manufacturing Industries

(17)

4

Resultaten en analyse

De onderzoeksmethode die besproken is in het vorige hoofdstuk, is gebruikt om de cycliciteit van patenten te meten. De uitkomsten van deze schatting zijn in dit hoofdstuk besproken. De bedrijfstakken zijn in drie groepen opgedeeld aangezien het aantal observaties sterk verschilt per bedrijfstak.

4.1 Complete model

Table 3: Resultaten van het complete model Om te beginnen schatten we het model

voor de complete dataset. Hoewel niet alle co¨effici¨enten significant zijn, zijn de tekens van de co¨effici¨enten bijna alle-maal zoals verwacht. Een positieve re-latie tussen patenten en R&D-uitgaven (Pakes & Griliches, 1980; Hausman et al., 1984), een positieve co¨effici¨ent van de industry output, wat procycliciteit im-pliceert (Fabrizio & Tsolmon, 2014), een negatieve co¨effici¨ent van de kruisterm met patentbescherming (Fabrizio & Tsolmon, 2014) en een negatieve trend, wat im-pliceert dat het aantal patentaanvragen met de jaren afneemt (Hausman et al., 1984). Alleen de co¨effici¨ent van de kruis-term met veroudering is niet zoals voor-speld, maar deze is ook niet-significant dus hier worden geen conclusies aan verbon-den.

(18)

4.2 Schattingen per bedrijfstak

De bedrijfstakken zijn opgedeeld in drie groepen: bedrijfstakken met meer dan 100 bedrijven in de dataset, tussen de 45 en 100 bedrijven in de dataset en minder dan 45 bedrijven in de dataset. Deze verschillende groepen worden apart behandeld aangezien de verschillen in het aantal observaties effect hebben op de resultaten.

Table 4: Resultaten van de schattingen met meer dan honderd bedrijven in de dataset

Ten eerste worden de bedrijfstakken met de meeste observaties besproken. Hier zitten bedrijfstakken in met meer dan honderd bedrijven. De relatie tussen R&D-uitgaven en paten-ten is positief en significant, wat overeenstemt met de besproken theorie (Pakes & Griliches, 1980; Hausman et al., 1984), in de sectoren Chemical & Allied Products (SIC2=28), Fab-ricated Metal Products (SIC2=34) en in de sector Transportation Equipment (SIC2=37). Deze bedrijfstakken komen in zekere zin overeen met de bedrijfstakken uit de scientific sector

(19)

dummy van Hausman et al. (1984) en de bedrijfstakken die in het onderzoek van Meliciani (2000) de hoogste uitkomsten hadden. Ook de natuurlijke logaritme van de omzet is, eve-nals in het onderzoek van Fabrizio en Tsolmon (2014), vaak positief en significant. De enige significante trend in de schattingen is negatief, overeenkomstig met de bevindingen van Haus-man et al. (1984). De kruistermen zijn allebei vrij volatiel en de enige bedrijfstak waarin de kruistermen significant zijn betreft de bedrijfstak Instruments & Related Products.

Table 5: Resultaten van de schattingen met tussen de 45 en 100 bedrijven in de dataset

In tabel 5 staan de resultaten voor de bedrijfstakken met tussen de 45 en 100 bedrijven in de dataset. De geschatte co¨effici¨ent voor de vertraagde variabele van R&D-uitgaven is bijna overal positief en significant. Ook voor deze bedrijfstakken zijn de co¨effici¨enten van de kruistermen erg volatiel.

(20)

Table 6: Resultaten van de schattingen met minder dan 45 bedrijven in de dataset

Hierboven zijn de schattingen te zien van de dataset met minder dan 45 bedrijven in de dataset. Het aantal observaties in deze bedrijfstakken is laag, waardoor de uitkomsten onbetrouwbaar zijn. Zoals te zien is in het figuur, verschillen de uitkomsten erg per schatting en komen de tekens van de co¨effici¨enten vaak niet overeen met de voorspellingen aan de hand van de literatuur. Door collineariteit zijn er bij sommige schattingen verklarende variabelen niet opgenomen, waardoor het nog moeilijker is om de resultaten te vergelijken.

4.3 Industry Output

Opvallend is dat bij de analyses van Fabrizio en Tsolmon (2014) bij elke schatting de variabele industry output significant is, terwijl dit nauwelijks het geval is in dit onderzoek. Daarnaast zijn de co¨effici¨enten van industry output en de kruistermen erg volatiel, aangezien deze enorm fluctueren. Er kunnen dus nauwelijks conclussies getrokken worden uit deze resultaten met betrekking tot de procycliciteit. Bovendien is de cycliciteit moeilijk af te lezen aan de geschatte co¨effici¨enten, omdat de variabele industry output drie keer voorkomt in het model vanwege de kruistermen. Daarom is het marginale effect van industry output berekend. Deze marginale effecten per bedrijfstak staan in tabel 7.

(21)

Table 7: Marginale effecten industry output De waardes voor het marginale effect zijn

nog steeds lang niet allemaal significant maar wel een stuk minder volatiel. Voor alle bedri-jfstakken met meer dan honderd waarnemin-gen is het aantal aangevraagde patenten pro-cyclisch, zoals in het onderzoek van Fabrizio en Tsolmon (2014). De geschatte waardes vari¨eren voor deze bedrijfstakken nog wel van 0.046 tot 0.972. De procycliciteit is dus niet constant over de verschillende bedri-jfstakken. Voor de tweede groep bedrijf-stakken zijn de marginale effecten minder zoals verwacht. Dit komt wellicht door het lagere aantal waarnemingen in deze bedrijfs-takken.

4.4 Verschillen tussen bedrijfstakken

Ondanks dat het marginale effect van industry output minder volatiel is dan de co¨effici¨enten uit de oorspronkelijke regressies, zit er nog wel variatie in het marginale effect van industry output tussen verschillende bedrijfstakken. Daarnaast is aan de resultaten in de tabellen 4 en 5 te zien dat de uitkomsten per bedrijfstak voor de overige variabelen erg verschillen. In zeven van de elf bedrijfstakken is de geschatte co¨effici¨ent van minimaal ´e´en van de vertraagde R&D-variabelen significant op een 5% level, maar deze co¨effici¨enten vari¨eren wel van 0.188 tot 0.954. De invloed van R&D-uitgaven op het aantal aangevraagde patenten varieert derhalve nogal over de verschillende bedrijfstakken. De rest van de geschatte co¨effici¨enten verschillen eveneens erg per bedrijfstak.

Deze uiteenlopende uitkomsten in de bedrijfstakken bevestigen de verwachting omtrent verschillen tussen de bedrijfstakken. Om te toetsen of de uitkomsten inderdaad significant

(22)

afwijken van de resultaten van het complete model is de likelihoodratiotest gebruikt. Onder de nulhypothese worden de geschatte co¨effici¨enten uit de apart geschatte modellen gelijk verondersteld aan de geschatte co¨effici¨enten van het model met de complete dataset. Onder H0 zijn er dus geen verschillende effecten tussen de bedrijfstakken. De loglikelihood van het

complete model is −121171.17 en voor de samengestelde loglikelihood zijn de waardes van de loglikelihood per bedrijfstak gesommeerd, waaruit een loglikelihood van −114741.86 kwam. De likelihoodratio LR = 12858.62 volgt een chi-kwadraatverdeling met acht vrijheidsgraden. De nulhypothese wordt verworpen dus er is voldoende statistisch bewijs dat er een significant verschil zit in de geschatte co¨effici¨enten van de apart geschatte modellen ten opzichte van de geschatte co¨effici¨enten van het complete model. Hieruit volgt dat het beter is om de modellen apart te schatten voor elke bedrijfstak, dan om ze samen te voegen in ´e´en model.

4.5 Beperkingen

Een belemmering in dit onderzoek is het aantal waarnemingen. In negen van de twintig bedrijfstakken zaten minder dan 45 bedrijven in de dataset. Alhoewel er veel co¨effici¨enten alsnog significant zijn, zijn deze bedrijfstakken buiten beschouwing gelaten, omdat deze re-sultaten niet gegeneraliseerd kunnen worden voor de gehele bedrijfstak. Hierdoor zijn er voor elf bedrijfstakken conclusies te trekken terwijl er twintig schattingen zijn gedaan.

(23)

5

Conclusie

Er is onderzocht welke invloed extra corrigeren voor heterogeniteit, door middel van schattin-gen per bedrijfstak, heeft op de cycliciteit van het aantal aangevraagde patenten. Om deze cycliciteit te meten wordt voornamelijk gekeken naar de geschatte co¨effici¨ent van industry output. Deze co¨effici¨ent was in elke analyse van Fabrizio en Tsolmon (2014) significant en positief, maar is na het splitsen van bedrijfstakken in bijna iedere bedrijfstak niet-significant. Bovendien is de co¨effici¨ent over het algemeen erg volatiel. Hetzelfde geldt voor de kruistermen met patentbescherming en veroudering. De kruistermen en de variabele industry output zijn echter de belangrijkste variabelen om de cycliciteit van het aantal aangevraagde patenten te meten. Door het gecombineerde effect van deze drie variabelen te berekenen, het marginale effect van industry output, kunnen er wel conclusies getrokken worden met betrekking tot de procycliciteit van innovaties. De marginale effecten van de zes grootste bedrijfstakken zijn allemaal positief en minder volatiel dan in de originele schattingen. Het aantal aangevraagde patenten is in deze bedrijfstakken dus procyclisch, zoals in het onderzoek van Fabrizio en Tsolmon (2014). Toch zit er nog variatie in de waardes van het marginale effect, wat betekent dat de procycliciteit varieert per bedrijfstak. Bovendien lopen de geschatte co¨effici¨enten van de rest van de variabelen eveneens erg uiteen. Er zit dus veel verschil tussen de bedrijfstakken. Naar aanleiding van een likelihoodratiotest is geconcludeerd dat de geschatte co¨effici¨enten van het complete model en de losse modellen significant van elkaar verschillen. Dit betekent dat het van belang is om het model voor de verschillende bedrijfstakken apart te schatten om extra te corrigieren voor heterogeniteit. Een tekortkoming in deze analyse is het lage aantal bedrijven in sommige bedrijfstakken. Hierdoor zijn de uitkomsten van negen van de twintig bedrijfstakken in de dataset niet meegenomen, omdat de resultaten niet betrouwbaar genoeg zijn.

Concluderend blijkt innovatie in de grootste bedrijfstakken procyclisch. Er zit wel variatie tussen verschillende bedrijfstakken, waardoor er genoeg reden is om aan te nemen dat het beter is om extra te corrigeren voor heterogeniteit door voor elke bedrijfstak apart te schatten.

(24)

Bibliografie

Barlevy, G. (2007). On the cyclicality of research and development. The American Economic Review, 97 (4), 1131-1164.

Bartelsman, E. J. & Gray, W. B. (1996). The NBER Manufacturing Productivity Database. NBER Working Paper No. 205

Bound, J., Cummins, C., Griliches, Z., Hall, B. H., Jaffe, A. (1984). Who does R&D and who patents, NBER Working Paper No. 908

Cameron, A. C., Trivedi, P. K. (2005). Micoeconometrics: Methods and Applications. New York, United Stated: Cambridge University Press

Fabrizio, K. & Tsolmon, U. (2014). An empirical examination of the procyclicality of RD investment and innovation. The Review of Economics and Statistics, 96 (4), 662-675.

Hausman, J., Hall, B. H., Griliches, Z. (1984). Econometric models for count data with an application to the patents-R&D relationship. Econometrica, 52 (4), 909-938.

Hall, B. H., Jaffe, A. B., Trajtenberg, M. (2001). The NBER Patent Citation Data File: Lessons, Insights and Methodological Tools. NBER Working Paper No 8498

Jaffe, A. B. (1986). Technological opportunity and spillovers of R&D: evidence from firms’ patents, profits, and market value. The American Economic Review (76), 984-1001

Meliciani, V. (2000). The relationship between R&D, investment and patents: a panel data analysis. Applied Economics, 32 (11), 1429-1437.

Pakes, A. & Griliches, Z. (1980). Patents and R&D at firm level: A first report. Eco-nomics Letters, 5, 377-381.

Schumpeter, J. (1939). Business Cycles: a Theoretical, Historical and Statistical Analysis of the Capitalist Process. New York, United States: McGraw-Hill.

Referenties

GERELATEERDE DOCUMENTEN

De belangrijkste bevindingen van deze studie waren: (a) de release van cTnT (en cTnI) uit metabool geïnhibeerde cardiomyocyten is geassocieerd met irreversibele celschade, (b) cTnT

Grote grazers kunnen op een directe manier, bijvoorbeeld door begrazing, maar ook op een indirecte manier, bijvoorbeeld door slechts aanwezig te zijn, invloed hebben

“Daarom” en “Omdat ik het zeg” zijn afhankelijkheidsbevorderende redenen zonder normatieve strekking, en dat is buitengewoon treffend onder woorden gebracht in de gevleugelde

Meer informatie over de voorbereiding van een kind of tiener voor een operatie vindt u in de brochures 'Operatie van uw kind, hoe bereiden u en uw kind zich voor?’ en ‘Goed

De verwachte toename van het aantal aanmeldingen ten gevolge van de inzet van straatcoaches (Gemeente Rheden, 2011, p.2) is top op heden nog niet merkbaar, maar het is niet

patronen van hoge en lage vegetatie binnen één plantengemeenschap (micropatronen). In veel onderzoeken is alleen soortdiversiteit en —abundantie gemeten over gehele terreinen.

De figuur laat zien dat vrouwen in een baan van minder dan 23 uur – een kleinere baan – ge- middeld graag wat meer zouden willen werken; gemiddeld bevinden zij zich boven de

De variabelen die in dit onderzoek zijn onderzocht suggereren dat segmenten voor Filippo op basis van een combinatie van leeftijd, geslacht, behoeften en levensstijl kunnen