• No results found

Durbin-Wu-Hausman toets onder heteroscedasticiteit

N/A
N/A
Protected

Academic year: 2021

Share "Durbin-Wu-Hausman toets onder heteroscedasticiteit"

Copied!
23
0
0

Bezig met laden.... (Bekijk nu de volledige tekst)

Hele tekst

(1)

Durbin-Wu-Hausman toets onder

heteroscedasticiteit

Auteur: Rozemarijn Veldhuis

Begeleider: Milan Pleus

Bachelorscriptie Econometrie

Faculteit Economie & Bedrijfskunde

Juni, 2014

Abstract De Durbin-Wu-Hausman toets wordt gebruikt om te onderzoeken of regressoren endogeen zijn met betrekking tot de storingsterm. Wanneer heteroscedasticiteit aanwezig is in het model, wordt de Gegeneraliseerde Methode der Momenten (GMM) toegepast. In deze scriptie wordt de meest gebruikte implementatie van de Hausman-toets, met de OLS- en de

IV-schatter, uitgebreid. Er worden versies met GMM-, GLS-, en OLS- vs IV-schatters met een geschatte covariantiematrix op basis van de OLS-residuen en een functie van

heteroscedasticiteit opgesteld. Onder heteroscedasticiteit blijkt de Hausman toets waarin de GMM- en de OLS-schatter zijn geïmplementeerd goed te werken. Ook de Hausman toets met de geschatte covariantiematrix op basis van een heteroscedastische functie is geschikt. Met een Monte Carlo simulatie wordt de prestatie van de Durbin-Wu-Hausman-toets bestudeerd.

(2)

2

Inhoudsopgave

1. Inleiding………..

3

2. Theorie

………...

4

2.1 IV en GMM toepassen

..………

4

2.1.1 Het model en de aannames

………...

4

2.1.2 Gegeneraliseerde methode der momenten (GMM)

.…………..

4

2.2 De Hausman toets en probleem bij heteroscedasticiteit

.…………..

6

2.2.1 De Hausman toets

………... 6

2.2.2 De Hausman toets in GMM

……….. 7

2.2.3 Probleem bij heteroscedastische storingstermen

………... 7

3. Opzet onderzoek………... 9

3.1 Functie heteroscedasticiteit

………. 10

3.2 De concentratieparameter

………... 11

3.3 Toepassen van de Hausman toets

……… 13

4. Resultaten………. 14

4.1 Betrouwbaarheidsinterval

………... 14

4.2 Analyse

………. 15

5. Conclusie

………... 17

Bibliografie

……… 18

Bijlagen

I. Tabellen met betrouwbaarheidsintervallen II. Programma in Matlab

(3)

3

1. Inleiding

Een veelgebruikte methode om onbekende parameters in een lineair model te schatten is de ‘Ordinary Least Squares’ (OLS) methode. Echter is de OLS-schatter niet altijd geschikt, bijvoorbeeld wanneer één of meerdere regressoren endogeen zijn ten opzichte van de storingsterm. In het geval er endogene regressoren in het model zijn opgenomen kan IV of GMM toegepast worden. Daarvoor moeten instrumenten beschikbaar zijn. De Durbin-Wu-Hausman toets1, ook bekend als de Hausman toets, is de meest gebruikte manier om te onderzoeken of regressoren endogeen zijn met betrekking tot de storingsterm. In de meest populaire implementatie van de Hausman toets wordt de OLS-schatter vergeleken met de IV-schatter om alle regressoren op exogeniteit te toetsen. Hahn et al. (2011) merken op dat er geen standaardaanpassing van de Hausman toets bestaat in het geval van heteroscedastische storingen.

In deze scriptie wordt onderzocht of de Hausman toets kan worden uitgebreid naar GMM, in het geval van heteroscedastische storingen. Kan de Hausman toets zodanig worden aangepast, zodat de GMM-schatter en GLS-schatter kunnen worden geïmplementeerd? Daarnaast wordt gekeken hoe de Hausman toets presteert wanneer Var(β̂IV− β̂OLS)

consistent geschat wordt onder heteroscedasticiteit. Het gedrag van de verschillende toetsen in kleine steekproef wordt onderzocht door middel van Monte Carlosimulatie.

Het verslag begint met een theoretisch kader in paragraaf 2. In het eerste gedeelte hiervan wordt het model opgesteld en het toepassen van IV en GMM besproken. Vervolgens worden de Hausman toets en het probleem van de Hausman toets bij heteroscedastische storingstermen behandeld in het tweede gedeelte van paragraaf 2. Daarna wordt in paragraaf 3 de opzet van het onderzoek beschreven. In paragraaf 4 worden de resultaten van de Monte Carlosimulatie besproken. Ten slotte volgt de conclusie waarbij een terugkoppeling plaatsvindt naar de twee onderzoeksvragen.

1 De Durbin-Wu-Hausman toets is geassocieerd met vier verschillende papers: Durbin (1954), Wu (1973, 1974)

(4)

4

2. Theorie

2.1 IV en GMM toepassen

2.1.1 Het model en de aannames

Het lineair regressiemodel dat wordt geschat is

𝑦 = 𝑋𝛽 + 𝜀, 𝐸[𝜀𝜀′] = Ω (2.1)

Hierbij is 𝑋 een N × K regressor matrix, waarbij N staat voor het aantal waarnemingen en K het aantal regressoren weergeeft. De covariantiematrix Ω is N × N. Onder homoscedasticiteit zijn de storingen onafhankelijk en identiek verdeeld (i.i.d.) met 𝜀 ~ (0, σ2I

N). 𝛽 is een kolomvector met dimensie K. Er geldt 𝑟𝑎𝑛𝑔(𝑋) = 𝐾.

Daarnaast is er een instrumentenmatrix Z, met Z als N × L matrix, zodanig dat geldt: 𝐸[𝑧𝑖 𝜀𝑖] = 0, 𝑟𝑎𝑛𝑔 (𝑍) = 𝐿 en 𝑟𝑎𝑛𝑔(𝑍𝑋) = 𝐾 (2.2) De matrices X en Z kunnen gemeenschappelijke kolomvectoren hebben. Er wordt daarom gebruikgemaakt van de volgende notatie:

𝑋 = [𝑌 𝑍1] en 𝑍 = [𝑍1 𝑍2], (2.3)

waarbij Y mogelijk endogene variabelen bevat.

De gereduceerde vorm vergelijking geeft de relatie tussen de regressoren en de instrumenten weer. In matrixvorm is de gereduceerde vorm vergelijking gelijk aan

𝑋 = 𝑍Π + 𝜎𝑣𝑣 met 𝑣 = 𝜌𝜀 + (1 − 𝜌2)1/2𝜉 (2.4) Er wordt verondersteld dat 𝑣 𝑒𝑛 𝜉 i.i.d. verdeeld zijn. 𝜌 geeft de correlatie weer tussen de regressoren en de instrumenten.

2.1.2 Gegeneraliseerde methode der momenten (GMM)

De GMM-schatter van Hansen (1982) is een schattingstechniek in de statistiek die

gebruikmaakt van de momenten van de steekproef om de overeenkomstige momenten in de populatie te schatten. De momentcondities worden geformuleerd als E[gi(β)] = 0, waarbij gi(β) een functie van de modelparameters en data is. De OLS- en IV-schatter zijn speciale gevallen van GMM2.

De OLS-schatter van het lineaire regressiemodel (2.1) is

𝛽̂𝑂𝐿𝑆 = (𝑋𝑋)−1𝑋′𝑦 (2.5)

2 De OLS-, IV-, GMM- en GLS-schatter worden afgeleid zoals beschreven staat in “Econometric Methods with

(5)

5

De variantie van de OLS-schatter is

𝑉𝑎𝑟(𝛽̂𝑂𝐿𝑆) = 𝜎2(𝑋𝑋)−1 (2.6)

Wanneer σ2 niet bekend is, kan deze geschat worden met

𝑠

𝑂𝐿𝑆2

=

𝜀𝑂𝐿𝑆′𝜀𝑂𝐿𝑆

𝑁−𝐾 . (2.7)

De OLS-residuen kunnen afgeleid worden naar

𝜀̂𝑂𝐿𝑆 = 𝑦 − 𝑋𝛽̂𝑂𝐿𝑆. (2.8)

De OLS-schatter is niet consistent, wanneer er één of meerdere regressoren correleren met de storingsterm. Om dit probleem te verhelpen kan IV worden toegepast. Het toepassen van IV zorgt voor een consistente schatter, maar gaat samen met een verlies in efficiëntie.

De IV-schatter van het model (2.1) is

𝛽̂𝐼𝑉 = (𝑋𝑃𝑧𝑋)−1𝑋′𝑃𝑧 𝑦, (2.9)

waarin 𝑃𝑧 = 𝑍(𝑍𝑍)−1𝑍′ de projectiematrix is. De IV-residuen worden weergegeven met

𝜀̂𝐼𝑉 = 𝑦 − 𝑋𝛽̂𝐼𝑉. (2.10)

De variantie van de IV-schatter is gelijk aan

Var(𝛽̂𝐼𝑉) = 𝜎̂𝐼𝑉2(𝑋′𝑃𝑧𝑋)−1 met

𝜎̂

𝐼𝑉 2

=

𝜀̂𝐼𝑉′𝜀̂𝐼𝑉

𝑁 . (2.11)

Bij aanwezigheid van heteroscedasticiteit is de IV-schatter consistent, maar inefficiënt. Het is in dat geval zinvol om de robuuste variant van de covariantiematrix voor de IV-schatter toe te passen. Dit zorgt voor een efficiëntere schatter. Voor de IV-schatter met robuuste variantie (𝛽̂𝑅𝐼𝑉) geldt:

𝛽̂𝑅𝐼𝑉 = 𝛽̂𝐼𝑉 = (𝑋′𝑃𝑧𝑋)−1𝑋′𝑃𝑧 𝑦, (2.12) en

𝑉𝑎𝑟(𝛽̂𝑅𝐼𝑉) = (𝑋′𝑃𝑧𝑋)−1𝑋′𝑍(𝑍′𝑍)−1𝑊(𝑍𝑍)−1𝑍′𝑋(𝑋′𝑃𝑧𝑋)−1 (2.13)

met 𝑊̂ = 𝑍′𝛺̂𝑍 (2.14)

De gewichtenmatrix W wordt geschat, met covariantiematrix Ω̂. De IV-residuen worden gebruikt om Ω̂ op te stellen.

Naast het gebruik van robuuste standaardfouten kan GMM worden toegepast om een efficiëntere schatter te krijgen wanneer de storingen heteroscedastisch zijn. Bij afwezigheid van heteroscedasticiteit geeft IV een betere schatter dan GMM.

Met behulp van de residuen van de IV-schatter kan met een volgende stap de GMM-schatter worden bepaald:

𝛽̂𝐺𝑀𝑀 = (𝑋′𝑍𝑊−1𝑍′𝑋)−1𝑋′𝑍𝑊−1𝑍′𝑦, (2.15)

(6)

6

waarbij W er zo uit zie als in (2.14).

Bij aanwezigheid van heteroscedasticiteit in het model is OLS niet langer de beste lineaire zuivere schatter. Wanneer de vorm van heteroscedasticiteit bekend is, kan

‘Generalized Least Squares’ (GLS)-schatting gebruikt worden. Aangenomen wordt dat de storingen εi en εj niet met elkaar correleren, maar de storingen zijn heteroscedastisch met var(εi) = σi2. De aanname dat Ω = 𝜎2𝐼𝑁 komt onder heteroscedasticiteit te vervallen. De GLS-schatter is

𝛽̂𝐺𝐿𝑆 = (𝑋′𝛺−1𝑋)−1𝑋′𝛺−1𝑦 (2.17)

Met bijbehorende variantie:

𝑉𝑎𝑟(𝛽̂𝐺𝐿𝑆) = 𝜎2(𝑋′𝛺−1𝑋)−1 (2.18)

2.2 De Hausman toets en probleem bij heteroscedasticiteit

2.2.1 De Hausman toets

De Hausman toets wordt gebruikt om te toetsen of er correlatie aanwezig is tussen de regressor en de storingsterm. Mocht dit het geval zijn, dan is er sprake van endogeniteit. De meest bekende implementatie van het Hausman principe is gebaseerd op de OLS- en IV-schatters. De Hausman toets vergelijkt de OLS- en de IV-schatter met elkaar. Wanneer de regressoren endogeen zijn, verwachten we dat de twee schatters verder uit elkaar liggen. Wanneer het verschil groot genoeg is, moet de IV-schatter gebruikt worden.

De Hausman toetsgrootheid is gedefinieerd als:

H = (𝛽̂𝐼𝑉− 𝛽̂𝑂𝐿𝑆)[𝑉𝑎𝑟(𝛽̂𝐼𝑉− 𝛽̂𝑂𝐿𝑆)]+(𝛽̂

𝐼𝑉− 𝛽̂𝑂𝐿𝑆) 𝑑

→ 𝜒2(𝑔), (2.19)

waarbij 𝑔 staat voor het aantal endogene regressoren onder de alternatieve hypothese en met ‘+’ wordt de gegeneraliseerde inverse weergegeven.

Met bijbehorende hypotheses:

H0: 𝐸[𝑥𝑖𝜀𝑖] = 0 vs H1: 𝐸[𝑥𝑖𝜀𝑖] ≠ 0. (2.20) Wanneer de nulhypothese waar is, zijn OLS en IV beide consistent. In dat geval moet de meest efficiënte schatter gebruikt worden en dat is de OLS-schatter. Onder de alternatieve hypothese is de OLS-schatter niet consistent en moet de IV-schatter worden gebruikt.

(7)

7

2.2.2 De Hausman toets in GMM

Baum, Schaffer en Stillman (2003) bespreken de Hausman toets in de context van GMM. Wanneer de storingen heteroscedastisch zijn, is de IV-schatter consistent, maar niet efficiënt. Een oplossing hiervoor is het toepassen van GMM. De GMM-schatter is een vervolgstap op de IV-schatter en gebruikt daarbij de residuen van IV. Ook het gebruik van robuuste

standaardfouten kan voor een efficiëntere schatter zorgen, zoals eerder genoemd (2.13). Onder homoscedasticiteit is de Hausman toetsgrootheid asymptotisch verdeeld met het aantal vrijheidsgraden gelijk aan Min[L0 - L1, 𝑔]. L0 is gedefinieerd als het totaal aantal instrumenten onder de nulhypothese. L1 staat voor het aantal instrumenten onder de alternatieve hypothese.

Het aantal vrijheidsgraden onder heteroscedasticiteit is gelijk aan L0 - L1 onder de voorwaarde dat L0 - L1 ≤ 𝑔. Wanneer er niet aan deze voorwaarde wordt voldaan, is het aantal vrijheidsgraden onbekend en is de Hausman toets niet toepasbaar3. Dit probleem is niet van toepassing, omdat geldt L0 - L1 = 𝑔.

2.2.3 Probleem bij heteroscedastische storingstermen

De term 𝑉𝑎𝑟(𝛽̂𝐼𝑉− 𝛽̂𝑂𝐿𝑆) in (2.17) is niet bekend, maar kan onder homoscedasticiteit consistent geschat worden met

𝑉𝑎𝑟̂ (𝛽̂𝐼𝑉) − 𝑉𝑎𝑟̂ (𝛽̂𝑂𝐿𝑆) (2.21) volgt uit onderstaand bewijs. In het geval van heteroscedastische storingstermen is (2.21) geen consistente schatter voor 𝑉𝑎𝑟(𝛽̂𝐼𝑉− 𝛽̂𝑂𝐿𝑆). Met ‘I.’ wordt de schatter onder

homoscedasticiteit weergegeven, ‘II.’ staat voor de schatter onder heteroscedasticiteit.

𝑉𝑎𝑟(𝛽̂𝐼𝑉− 𝛽̂𝑂𝐿𝑆|𝑋, 𝑍) = 𝑉𝑎𝑟(𝛽̂𝐼𝑉|𝑋, 𝑍) + 𝑉𝑎𝑟(𝛽̂𝑂𝐿𝑆|𝑋) − 𝐶𝑜𝑣(𝛽̂𝐼𝑉, 𝛽̂𝑂𝐿𝑆) − 𝐶𝑜𝑣(𝛽̂𝑂𝐿𝑆, 𝛽̂𝐼𝑉) (2.22) 𝑉𝑎𝑟(𝛽̂𝑂𝐿𝑆|𝑋) = 𝐸 [(𝛽̂𝑂𝐿𝑆− 𝛽)(𝛽̂𝑂𝐿𝑆− 𝛽) |𝑋] = (𝑋′𝑋)−1𝑋′𝐸[𝜀𝜀′|𝑋]𝑋(𝑋𝑋)−1 = 𝜎2(𝑋𝑋)−1 I. = (𝑋′𝑋)−1𝑋′Ω𝑋(𝑋′𝑋)−1 II. 𝑉𝑎𝑟(𝛽̂𝐼𝑉|𝑋, 𝑍) = 𝐸 [(𝛽̂𝐼𝑉− 𝛽)(𝛽̂𝐼𝑉− 𝛽) |𝑋, 𝑍] = (𝑋′𝑃𝑧𝑋)−1𝑋′𝑃𝑧𝐸[𝜀𝜀|𝑋, 𝑍]𝑃𝑧𝑋(𝑋𝑃𝑧𝑋)−1 = 𝜎2(𝑋𝑃𝑧𝑋)−1 I.

(8)

8 = (𝑋𝑃𝑧𝑋)−1𝑋′𝑃𝑧Ω𝑋(𝑋𝑋)−1 II. 𝐶𝑜𝑣(𝛽̂𝐼𝑉, 𝛽̂𝑂𝐿𝑆|𝑋, 𝑍) = 𝐸 [(𝛽̂𝐼𝑉− 𝛽)(𝛽̂𝑂𝐿𝑆− 𝛽) |𝑋, 𝑍] = (𝑋′𝑃𝑧𝑋)−1𝑋′𝑃𝑧𝐸[𝜀𝜀|𝑋, 𝑍]𝑋(𝑋𝑋)−1 = 𝜎2(𝑋𝑋)−1 I. = (𝑋𝑃𝑧𝑋)−1𝑋′𝑃𝑧Ω𝑋(𝑋𝑋)−1 II. 𝐶𝑜𝑣(𝛽̂𝑂𝐿𝑆, 𝛽̂𝐼𝑉|𝑋, 𝑍) = 𝐸 [(𝛽̂𝑂𝐿𝑆− 𝛽)(𝛽̂𝐼𝑉− 𝛽) |𝑋, 𝑍] = (𝑋𝑋)−1 𝑋′𝐸[𝜀𝜀′|𝑋, 𝑍]𝑃𝑧𝑋(𝑋′𝑃𝑧𝑋)−1 = 𝜎2(𝑋𝑋)−1 I. = (𝑋𝑋)−1 𝑋′Ω𝑃𝑧𝑋(𝑋′𝑃𝑧𝑋)−1 II.

Zo volgt onder homoscedasticiteit dat

𝑉𝑎𝑟(𝛽̂𝐼𝑉− 𝛽̂𝑂𝐿𝑆|𝑋, 𝑍) = 𝜎2(𝑋𝑃𝑧𝑋)−1 + 𝜎2(𝑋𝑋)−1 − 2𝜎2(𝑋𝑋)−1 = 𝜎2(𝑋𝑃

𝑧𝑋)−1 − 𝜎2(𝑋𝑋)−1 = 𝑉𝑎𝑟̂ (𝛽̂𝐼𝑉|𝑋, 𝑍) − 𝑉𝑎𝑟̂ (𝛽̂𝑂𝐿𝑆|𝑋)

Uit bovenstaand bewijs volgt dat de onbekende term 𝑉𝑎𝑟(𝛽̂𝐼𝑉− 𝛽̂𝑂𝐿𝑆|𝑋, 𝑍) in de Hausman toetsgrootheid in het geval van homoscedastische storingstermen consistent geschat kan worden met de bekende termen 𝑉𝑎𝑟̂ (𝛽̂𝐼𝑉) en 𝑉𝑎𝑟̂ (𝛽̂𝑂𝐿𝑆).

Daarentegen kan 𝑉𝑎𝑟(𝛽̂𝐼𝑉− 𝛽̂𝑂𝐿𝑆|𝑋, 𝑍) in het geval van heteroscedastische storingstermen niet consistent geschat worden met 𝑉𝑎𝑟̂ (𝛽̂𝐼𝑉) en 𝑉𝑎𝑟̂ (𝛽̂𝑂𝐿𝑆). Onder heteroscedasticiteit volgt namelijk dat

𝑉𝑎𝑟(𝛽̂𝐼𝑉 − 𝛽̂𝑂𝐿𝑆|𝑋, 𝑍) = (𝑋𝑃𝑧𝑋)−1𝑋𝑃𝑧Ω𝑃𝑧𝑋(𝑋𝑃𝑧𝑋)−1+ (𝑋′𝑋)−1𝑋′Ω𝑋(𝑋′𝑋)−1

− (𝑋𝑃𝑧𝑋)−1𝑋′𝑃𝑧Ω𝑋(𝑋𝑋)−1− (𝑋𝑋)−1𝑋′Ω𝑃𝑧𝑋(𝑋′𝑃𝑧𝑋)−1.

Het is mogelijk om onder heteroscedasticiteit een niet-consistente schatter te gebruiken. Een andere mogelijkheid is om de consistente schatter voor 𝑉𝑎𝑟(𝛽̂𝐼𝑉− 𝛽̂𝑂𝐿𝑆|𝑋, 𝑍) toe te passen. Daarbij moet een keuze worden gemaakt voor het opstellen van de covariantiematrix Ω.

(9)

9

3. Opzet onderzoek

De data voor het onderzoek wordt gegenereerd door middel van Monte Carlosimulatie. Er worden 10.000 replicaties van de simulatie uitgevoerd. De Hausman toets wordt beoordeeld bij verschillende maten van heteroscedasticiteit (variërende 𝜃) en bij bepaalde waardes van de concentratieparameter 𝜇2. De concentratieparameter geeft weer in hoeverre de instrumenten gecorreleerd zijn met de regressoren. Het nominale significantieniveau 𝛼 wordt op 5% gesteld.

X bestaat uit één regressor en een constante. Naast de constante zijn er drie externe instrumenten beschikbaar, weergegeven met 𝐿𝑒𝑥𝑡. Er is sprake van overidentificatie, want

𝐿𝑒𝑥𝑡− 𝑔 = 3 − 1 = 2. (3.1)

De mate van overidentificatie is gelijk aan twee.

Het model is

𝑦 = 𝛽0𝜄 + 𝛽1𝑋1+ 𝜀, met 𝑁 = 40 𝑒𝑛 𝐿 = 4. (3.2) Er wordt ingesteld dat 𝛽0 = 0 en 𝛽1 = 1.

De gereduceerde vorm vergelijking voor 𝑋1:

𝑋1 = 𝑍Π + 𝜎𝑣𝑣 met 𝑣 = 𝜌𝜀 + (1 − 𝜌2)1/2𝜉 (3.3)

Onder de nulhypothese van exogeniteit van 𝑋1 met betrekking tot de storingsterm (zie 2.20) is 𝜌 gelijk aan 0. In de Monte Carlosimulatie wordt enkel onder de nulhypothese getoetst.

(10)

10

3.1 Functie heteroscedasticiteit

Er wordt een functie 𝑓(𝑧, θ) gemaakt om de heteroscedasticiteit, die afhangt van de

instrumenten, vast te leggen. Het opstellen van deze functie is gebaseerd op de manier waarop Kiviet en Feng (2012) dat hebben gedaan. Een realistisch patroon voor de heteroscedasticiteit in cross-sectie modellen is zodanig dat 𝜎𝑖 een lognormale verdeling volgt. De mate van heteroscedasticiteit wordt vastgelegd door middel van θ.

De waarde van θ ligt tussen 0 en oneindig. Wanneer θ gelijk is aan 0, is er sprake van homoscedastische storingstermen: storingstermen hebben in dat geval een gelijke variantie van 1. Naarmate θ toeneemt, neemt ook de mate van heteroscedasticiteit toe. Bij θ ≥ 1 is er sprake van een zekere mate van heteroscedasticiteit. 4

De diagonaalelementen van de covariantiematrix onder heteroscedasticiteit worden weergegeven met Ω𝑖𝑖. Er geldt

Ω𝑖𝑖 = 𝜎𝑖.

Het opstellen van de heteroscedastische functie, zodanig dat 𝜎𝑖 een lognormale verdeling heeft: 𝜎𝑖 = 𝑒𝑓𝑖(𝑧𝑖,𝜃) (3.4) met 𝑓(𝑧, 𝜃) = −1 2𝜃 2+ 𝜃(𝑧1+𝑧2+𝑧3) 3 . (3.5)

Aan beide kanten van (3.4) wordt voor N waarnemingen het logaritme genomen: log [

𝜎̂1 ⋮ 𝜎̂𝑁

] = 𝑓(𝑧, 𝜃) + 𝑢. (3.6)

Ten slotte volgt hieruit:

𝜎𝑖 = √exp (− 𝜃2 2 + 𝜃 3(𝑧𝑖1+ 𝑧𝑖2+ 𝑧𝑖3). (3.7)

(11)

11

3.2 De concentratieparameter

Voor de instrumenten moet gelden dat deze relevant en valide zijn. Met valide wordt bedoeld dat de instrumenten niet correleren met de storingsterm. Relevant betekent dat de

instrumenten in zekere mate gecorreleerd zijn met de regressoren. De mate van correlatie van de instrumenten en de regressoren, oftewel de sterkte van de instrumenten, wordt vastgelegd door middel van de concentratieparameter, 𝜇2.

De concentratieparameter is gedefinieerd als: 𝜇2 = Π′𝑍′𝑍Π

𝜎𝑣2 . (3.8) De interpretatie van de concentratieparameter μ2 in termen van de ‘First-Stage’

F-toetsgrootheid wordt beschreven door Stock, Wright en Yogo (2002). De F-toets test of de coëfficiënten van de instrumenten significant verschillen van 0 (Π = 0) in model (2.4). Stock, Wright en Yogo (2002) leiden af dat

𝐸[𝐹 ] − 1 = 𝜇2

𝐿𝑒𝑥𝑡 , (3.9)

wanneer de steekproef groot genoeg is.

Het definiëren van een zwak instrument wordt op dezelfde wijze gedaan als in Stock, Wright en Yogo (2002). Een instrument wordt als zwak beschouwd, wanneer de relatieve

onzuiverheid van de TSLS-schatter5 groter is dan 10%.6 De drempelwaarde van 𝜇

2

𝐿𝑒𝑥𝑡 ligt voor zwakke instrumenten op 3, 71 bij drie externe instrumenten. Wanneer 𝜇

2

𝐿𝑒𝑥𝑡 kleiner is dan 3, 71, dan zijn de instrumenten zwak. Dit komt overeen met een F-toetsgrootheid: 𝐹 < 9,08 bij een nominaal significantieniveau van 5%.7 Bij drie externe instrumenten ligt 𝜇2 tussen 0 en 11,13 voor zwakke instrumenten. Wanneer 𝜇2 groter is dan 11,13, is er sprake van sterke instrumenten.

5 TSLS-schatter staat voor ‘Two Stage Least Square’-schatter. Hieronder vallen de IV- en de GMM-schatter. 6 “De relatieve onzuiverheid van TSLS is de onzuiverheid gerelateerd aan de inconsistentie van OLS:

𝐸[𝛽𝑇𝑆𝐿𝑆−𝛽)

𝑝𝑙𝑖𝑚(𝛽𝑂𝐿𝑆−𝛽).” Stock, Wright and Yogo (2002): A survey of weak instruments and weak identification in

generalized method of moments, pagina 521-522.

(12)

12

De coëfficiënten van de instrumenten, weergegeven met Π, in (3.2) worden bepaald aan de hand van een vastgelegde waarde van de concentratieparameter 𝜇2. Uit de definitie van de concentratieparameter (3.8) kan Π worden opgelost.

De constante wordt bij het opstellen van de concentratieparameter buiten beschouwing gelaten. Er wordt daarom voor gekozen om het aantal externe instrumenten te gebruiken.

Aangenomen wordt dat 𝜋1 = 𝜋2 = 𝜋3 = 𝜋.

Verder is gegeven 𝑉𝑎𝑟(𝑥𝑖) = 𝜋12+ 𝜋22+ 𝜋32 + 𝜎𝑣2 = 1. Hieruit volgt 𝜎𝑣2 = 1 − 𝜋

12− 𝜋22− 𝜋32 = 1 − 𝐿𝑒𝑥𝑡𝜋2. Zo kan 𝜇2 worden herleid tot

𝜇2 =Π′𝑍′𝑍Π 𝜎𝑣2 = 𝑁 Π′Π 𝜎𝑣2 = 𝑁 (𝜋12+ 𝜋22 + 𝜋32) 𝜎𝑣2 = 𝑁𝐿𝑒𝑥𝑡𝜋2 1 − 𝐿𝑒𝑥𝑡𝜋2 . (3.10)

Om de concentratieparameter in termen van de F-toetsgrootheid te kunnen interpreteren (3.9) moet een correctie gedaan worden voor het aantal instrumenten. Dit wordt gedaan door μ2 te delen door het aantal externe instrumenten:

μ̃2 = μ2 Lext =

Nπ2

1−Lextπ2 (3.11)

Hierbij is 𝜇̃2 de gecorrigeerde concentratieparameter. Ten slotte kan

𝜋

hieruit worden opgelost:

𝜋 = ±√

𝜇̃2

𝑁 + 𝐿𝑒𝑥𝑡𝜇̃2

(13)

13

3.3 Toepassen van de Hausman toets

De OLS-, IV-, GMM- en GLS-schatter, met bijbehorende varianties, worden

geprogrammeerd en gebruikt om de verschillende versies van de Hausman toets op te stellen. Eerst wordt de meest bekende implementatie van de Hausman toets met de OLS-schatter en de IV-schatter geprogrammeerd (DWH1). Daarna volgt een aanpassing met de robuuste variantieschatter in plaats van de standaard variantieschatter van de IV-schatter (DWH2). Vervolgens wordt de Hausman toets aangepast naar een versie met de GMM-schatter en de OLS-schatter (DWH3) en een versie met de GMM-schatter en de GLS-schatter (DWH4). Ten slotte wordt bekeken hoe de Hausman toets presteert wanneer de term Var(β̂IV− β̂OLS) consistent geschat wordt met enerzijds een covariantiematrix die bestaat uit de geschatte OLS-residuen (DWH5) en anderzijds een covariantiematrix die is opgesteld als een functie van heteroscedasticiteit (3.6) (DWH6).

De verschillende implementaties van de Hausman toetsen worden onderzocht bij de waarden: 𝜇2 = {5, 10, 30},

𝜃 = {0, 0.5, 1}, 𝜌 = 0.

(14)

14

4. Resultaten

In de vorige sectie is de opzet van het onderzoek beschreven. Met behulp van een Monte Carlosimulatie is de werking van meerdere aangepaste implementaties van de Hausman toets onderzocht. In dit hoofdstuk worden de resultaten hiervan besproken. De resultaten worden geïllustreerd met behulp van de tabellen 1, 2 en 3.

De verschillende implementaties van de Hausman toets worden weergegeven met 𝐷𝑊𝐻𝑖 met 𝑖 = 1,2,3,4,5,6. Hieronder volgt een overzicht waarin per toets wordt weergegeven welke schatters met elkaar worden vergeleken.

𝐷𝑊𝐻1: 𝛽𝐼𝑉 𝑣𝑠 𝛽𝑂𝐿𝑆 𝐷𝑊𝐻2: 𝛽𝑅𝐼𝑉 𝑣𝑠 𝛽𝑂𝐿𝑆 𝐷𝑊𝐻3: 𝛽𝐺𝑀𝑀 𝑣𝑠 𝛽𝑂𝐿𝑆 𝐷𝑊𝐻4: 𝛽𝐺𝑀𝑀 𝑣𝑠 𝛽𝐺𝐿𝑆 𝐷𝑊𝐻5: 𝛽𝐼𝑉 𝑣𝑠 𝛽𝑂𝐿𝑆 𝑚𝑒𝑡 Ω 𝑏𝑒𝑠𝑡𝑎𝑎𝑛𝑑𝑒 𝑢𝑖𝑡 𝑂𝐿𝑆 − 𝑟𝑒𝑠𝑖𝑑𝑢𝑒𝑛 𝐷𝑊𝐻6: 𝛽𝐼𝑉 𝑣𝑠 𝛽𝑂𝐿𝑆 𝑚𝑒𝑡 𝛺 𝑜𝑝 𝑏𝑎𝑠𝑖𝑠 𝑣𝑎𝑛 ℎ𝑒𝑡𝑒𝑟𝑜𝑠𝑐𝑒𝑑𝑎𝑠𝑡𝑖𝑠𝑐ℎ𝑒 𝑓𝑢𝑛𝑐𝑡𝑖𝑒 𝑓(𝑧, 𝜃)

4.1 Betrouwbaarheidsinterval

De resultaten van de verschillende versies van de Hausman toets worden vergeleken met het nominale significantieniveau van α = 5%. Er wordt een betrouwbaarheidsinterval met een nauwkeurigheid van 99,75% opgesteld op dezelfde wijze als Kiviet en Pleus (2011):

BBI = [𝑃̂ − 3 ∗ 𝑠𝑡𝑎𝑛𝑑𝑎𝑎𝑟𝑑𝑓𝑜𝑢𝑡 𝑃̂; 𝑃̂ + 3 ∗ 𝑠𝑡𝑎𝑛𝑑𝑎𝑎𝑟𝑑𝑓𝑜𝑢𝑡 𝑃̂].

Hierin is 𝑃̂ de uitkomst van de toets, het actuele significantieniveau. Per toetsuitkomst 𝑃̂ wordt gekeken of de waarde van het nominale significantieniveau (𝛼 = 0,05) in het

betrouwbaarheidsinterval ligt. Wanneer dit niet zo is, wijkt het actuele significantieniveau van de toets significant af van het nominale significantieniveau. Dit wordt in de tabellen 1, 2 en 3 aangegeven met ‘*’.

De standaardfout wordt berekend met de uitkomst van de toets (𝑃̂) en het aantal replicaties van de simulatie (R).

𝑠𝑡𝑎𝑛𝑑𝑎𝑎𝑟𝑑𝑓𝑜𝑢𝑡 = √ 𝑃̂(1− 𝑃̂)

(15)

15

De standaardfout wordt in de tabellen 1, 2 en 3 cursief weergegeven onder de bijbehorende toetsuitkomst.

4.2 Analyse

De uitkomsten van de Hausman toetsen zijn voor drie verschillende instrumentensterktes onderzocht, namelijk: 𝜇2 = 30, 𝜇2 = 10 en 𝜇2 = 5 . Zie tabel 1, 2 en 3.

Uit tabel 1 valt af te lezen dat de standaard implementatie van de Hausman toets goed presteert onder homoscedasticiteit en bij het toepassen van sterke instrumenten (DWH1 = 0,0557). Wanneer de mate van heteroscedasticiteit toeneemt, is DWH1 geen geldige toets. De actuele significantieniveaus verschillen significant van het nominale significantieniveau (tabel 1, DWH1 = 0,0578; DWH1 = 0,0645). Naarmate de sterkte van de instrumenten afneemt, neemt de prestatie van de standaard Hausman toets (DWH1) ook aanzienlijk af (zie tabel 2 en 3).

Bij het gebruik van sterkte instrumenten wijken de actuele significantieniveaus van de toetsen DWH3 en DWH6 niet significant af van het nominale significantieniveau onder heteroscedasticiteit (tabel 2, DWH3 = 0,0553; DWH6 = 0,0448). Echter presteren beide toetsen slecht in het geval van homoscedastische storingstermen (DWH3 = 0,0936; DWH6 = 0,0970).

Tabel 1: Actuele verwerpingskans van de Hausman toetsen bij sterke instrumenten (𝜇2 = 30).

θ 𝑫𝑾𝑯𝟏 𝑫𝑾𝑯𝟐 𝑫𝑾𝑯𝟑 𝑫𝑾𝑯𝟒 𝑫𝑾𝑯𝟓 𝑫𝑾𝑯𝟔 0 0,0557 0,0334* 0,0936* 0,0621* 0,0665* 0,0970* 0,0023 0,0018 0,0029 0,0024 0,0025 0,0030 0.5 0,0578* 0,0241* 0,0813* 0,0638* 0,0579* 0,0762* 0,0023 0,0015 0,0027 0,0024 0,0023 0,0027 1 0,0645* 0,0072* 0,0553 0,0686* 0,0432* 0,0448 0,0025 0,0008 0,0023 0,0025 0,0020 0,0021

Bij het gebruik van milde instrumenten is DWH2 een geldige toets voor een mate van de heteroscedasticiteit van 𝜃 = 0.5 (tabel 2, DWH2 = 0,0475). Voor meer heteroscedastische storingstermen, 𝜃 = 1, presteert DWH3 goed. (tabel 2, DWH3 = 0,0503).

(16)

16 Tabel 2: Actuele verwerpingskans van de Hausman toetsen bij milde instrumenten (𝜇2= 10).

θ 𝑫𝑾𝑯𝟏 𝑫𝑾𝑯𝟐 𝑫𝑾𝑯𝟑 𝑫𝑾𝑯𝟒 𝑫𝑾𝑯𝟓 𝑫𝑾𝑯𝟔 0 0,0333* 0,0589* 0,0842* 0,0711* 0,0269* 0,0760* 0,0018 0,0024 0,0028 0,0026 0,0016 0,0026 0.5 0,0359* 0,0475 0,0745* 0,0717* 0,0237* 0,0579* 0,0019 0,0021 0,0026 0,0026 0,0015 0,0023 1 0,0435* 0,0282* 0,0503 0,0790* 0,0153* 0,0371* 0,0020 0,0017 0,0022 0,0027 0,0012 0,0019

Bij het gebruik van zwakke instrumenten is DWH6 de enige geldige toets voor 𝜃 = 0.5 (tabel 3, DWH6 = 0,0522). Echter presteert DWH6 niet goed bij het gebruik van milde instrumenten.

Tabel 3: Actuele verwerpingskans van de Hausman toetsen bij zwakke instrumenten (𝜇2 = 5).

θ 𝑫𝑾𝑯𝟏 𝑫𝑾𝑯𝟐 𝑫𝑾𝑯𝟑 𝑫𝑾𝑯𝟒 𝑫𝑾𝑯𝟓 𝑫𝑾𝑯𝟔 0 0,0196* 0,0806* 0,0810* 0,0681* 0,0037* 0,0633* 0,0014 0,0027 0,0027 0,0025 0,0006 0,0024 0.5 0,0222* 0,0738* 0,0748* 0,0708* 0,0028* 0,0522 0,0015 0,0026 0,0026 0,0026 0,0005 0,0022 1 0,0283* 0,0607* 0,0628* 0,0755* 0,0017* 0,0366* 0,0017 0,0024 0,0024 0,0026 0,0004 0,0019

(17)

17

5. Conclusie

Onderzocht is of de Hausman toets kan worden uitgebreid naar GMM bij aanwezigheid van heteroscedastische storingen. Voor verschillende instrumentensterktes en maten van

heteroscedasticiteit is bekeken hoe de Hausman toetsen presteren. Het blijkt dat de versie van de Hausman toets, waarin de GMM- en de OLS-schatter met elkaar worden vergeleken goed presteert onder heteroscedasticiteit. Voorwaarde is wel dat er sterke instrumenten beschikbaar moeten zijn. Dat geldt ook voor de Hausman toets waarin de OLS- en de IV-schatter met elkaar worden vergeleken.

Verder is onderzocht hoe de Hausman toets presteert wanneer Var(β̂IV− β̂OLS) consistent geschat wordt onder heteroscedasticiteit. Hiervoor is een geschatte

covariantiematrix opgesteld op basis van de OLS-residuen en op basis van een heteroscedastische functie die afhangt van de instrumenten. De implementatie van de Hausman toets op basis van de heteroscedastische functie lijkt geschikt. Daarentegen werkt de op de OLS-residuen gebaseerde versie van de Hausman toets niet goed.

Conclusie is dat de standaard Hausman toets geschikt is onder homoscedasticiteit, terwijl de Hausman toets waarin de GMM- en de OLS-schatter geïmplementeerd zijn, een goedwerkende toets is onder heteroscedasticiteit. Ook de Hausman toets met de geschatte covariantiematrix op basis van een heteroscedastische functie werkt goed bij het gebruik van sterke instrumenten. Om te beslissen welke versie van de Hausman toets moet worden toegepast, dient daarom eerst bepaald te worden of er heteroscedasticiteit in het model aanwezig is. Dit kan bijvoorbeeld met de White toets8.

Voor verder onderzoek kan de prestatie van de verschillende Hausman toetsen onder de alternatieve hypothese worden bestudeerd. Dat is in het geval dat de regressoren endogeen zijn met betrekking tot de storingsterm.

8 White (1980) heeft de meest gebruikte toets ontwikkeld die test op de aanwezigheid van heteroscedasticiteit in

(18)

18

Bibliografie

|1| Baum, C.F., Schaffer, M.E., Stillman, S. (2003). Instrumental Variables and GMM: Estimation and testing, The Stata Journal, 3(1), 1–31.

|2| Durbin, J. (1954). Errors in variables. Review of the International Statistical Institute, 22(1), 23-32.

|3| Hahn, J., Ham, J.C., Moon, H.R. (2011). The Hausman test and weak instruments,

Journal of Econometrics, 160(2), 289-299.

|4| Hansen, L. P. (1982). Large sample properties of generalized method of moments estimators. Econometrica: Journal of the Econometric Society, 50(4), 1029-1054.

|5| Hausman, J. A. (1978). Specification tests in econometrics. Econometrica: Journal of

the Econometric Society, 46(6), 1251-1271.

|6| Hausman, J.A., Taylor, W.E. (1981). A generalized specification test. Economics

Letters, 8(3), 239-245.

|7| Hayashi,F. (2000). Econometrics. Princeton, NJ: Princeton University Press.

|8| Heij, C., De Boer, P., Franses, P.H., Kloek, T., Van Dijk, H.K.. (2004). Econometric methods with applications in business and economics. New York, NY: Oxford University Press Inc.

|9| Kiviet, J.F., Feng, Q. (2012). Exploiting strong instruments unduly neglected by standard GMM. Paper presented at International Symposium on Ecconometric Theory and Applications (SETA 2012), Shanghai, China.

|10| Newey, W. (1985). Generalized method of moments specification testing. Journal of

(19)

19

|11| Stock, J.H., Wright, J.H., Yogo, M. (2002). A survey of weak instruments and weak identification in generalized method of moments. Journal of Business & Economic Statistics, 20(4), 518-529.

|12| White, H. (1980). A heteroskedasticity-consistent covariance matrix estimator and a direct test for heteroskedasticity. Econometrica, 48(4), 817–838.

|13| Wu, D.-M. (1973). Alternative tests of independence between stochastic regressors and disturbances. Econometrica, 41(4), 733-750.

|14| Wu, D.-M. (1974). Alternative tests of independence between stochastic regressors and disturbances: Finite sample results. Econometrica, 42(3), 529-546.

(20)

20

Bijlagen

I.

Tabellen met betrouwbaarheidsintervallen

Tabel 1b: Actuele verwerpingskansen van de verschillende Hausman toetsen bij sterke instrumenten (𝝁𝟐= 𝟑𝟎) θ DWH DWH2 DWH3 DWH4 DWH5 DWH6 0 0,0557 0,0334 0,0936 0,0621 0,0665 0,0970 0,0023 0,0018 0,0029 0,0024 0,0025 0,0030 0,0488 0,0280 0,0849 0,0549 0,0590 0,0881 0,0626 0,0388 0,1023 0,0693 0,0740 0,1059 0.5 0,0578 0,0241 0,0813 0,0638 0,0579 0,0762 0,0023 0,0015 0,0027 0,0024 0,0023 0,0027 0,0508 0,0195 0,0731 0,0565 0,0509 0,0682 0,0648 0,0287 0,0895 0,0711 0,0649 0,0842 1 0,0645 0,0072 0,0553 0,0686 0,0432 0,0448 0,0025 0,0008 0,0023 0,0025 0,0020 0,0021 0,0571 0,0047 0,0484 0,0610 0,0371 0,0386 0,0719 0,0097 0,0622 0,0762 0,0493 0,0510

Tabel 2b: Actuele verwerpingskansen van de verschillende Hausman toetsen bij milde instrumenten (𝝁𝟐= 𝟏𝟎) θ DWH DWH2 DWH3 DWH4 DWH5 DWH6 0 0,0333 0,0589 0,0842 0,0711 0,0269 0,0760 0,0018 0,0024 0,0028 0,0026 0,0016 0,0026 0,0279 0,0518 0,0759 0,0634 0,0220 0,0681 0,0387 0,0660 0,0925 0,0788 0,0318 0,0839 0.5 0,0359 0,0475 0,0745 0,0717 0,0237 0,0579 0,0019 0,0021 0,0026 0,0026 0,0015 0,0023 0,0303 0,0411 0,0666 0,0640 0,0191 0,0509 0,0415 0,0539 0,0824 0,0794 0,0283 0,0649 1 0,0435 0,0282 0,0503 0,0790 0,0153 0,0371 0,0020 0,0017 0,0022 0,0027 0,0012 0,0019 0,0374 0,0232 0,0437 0,0709 0,0116 0,0314 0,0496 0,0332 0,0569 0,0871 0,0190 0,0428

Tabel 3b: Actuele verwerpingskansen van de verschillende Hausman toetsen bij sterke instrumenten (𝝁𝟐= 𝟓) θ DWH DWH2 DWH3 DWH4 DWH5 DWH6 0 0,0196 0,0806 0,0810 0,0681 0,0037 0,0633 0,0014 0,0027 0,0027 0,0025 0,0006 0,0024 0,0154 0,0724 0,0728 0,0605 0,0019 0,0560 0,0238 0,0888 0,0892 0,0757 0,0055 0,0706 0.5 0,0222 0,0738 0,0748 0,0708 0,0028 0,0522 0,0015 0,0026 0,0026 0,0026 0,0005 0,0022 0,0178 0,0660 0,0669 0,0631 0,0012 0,0455 0,0266 0,0816 0,0827 0,0785 0,0044 0,0589 1 0,0283 0,0607 0,0628 0,0755 0,0017 0,0366 0,0017 0,0024 0,0024 0,0026 0,0004 0,0019 0,0233 0,0535 0,0555 0,0676 0,0005 0,0310 0,0333 0,0679 0,0701 0,0834 0,0029 0,0422

(21)

21

II.

Programma in Matlab

% Simpel programma met vier instrumenten, waaronder de constante % Model:

% y = beta0*cons + x*beta1 + sigeps*epsilon, cons is een vector enen % x = pi0*cons + pi1*z1 + pi2*z2 + pi3*z3 + sigv*v

% v = sigxi*xi + rho*eps

clear; clc; % Leegmaken geheugen

startseed=20120302; % Kiezen van een seed

startrandom = RandStream('mcg16807', 'Seed', startseed); % Seed invullen

RandStream.setGlobalStream(startrandom); R = 10000; % Aantal Monte Carlo replicaties

N = 40; % Aantal waarnemingen

K = 2; % Aantal regressoren, waarvan 1 constante

L = 4; % Aantal instrumenten % Design parameters

rhoxe = 0; % Mate van endogeniteit, correlatie tussen x en epsilon

mu2 = 30; % Concentratie-parameter (sterkte instrumenten, mu2corr van 0 tot oneindig. instrument zwak mu2corr tussen 0 en 10 --> mu2 tussen 0 en 30)

theta = 0; % Mate heteroscedasticiteit, als theta=0 dan homoscedastisch, dichter bij 1 meer heterosc.

cons = ones(N,1); % Maak een Nx1 vector van enen % DGP parameters

beta0 = 0; % Constante zetten we op nul

beta1 = 1; % We kiezen beta1 op 1

beta = [beta0;beta1]; % De parameter-vector

pi0 = 0; % De constante in de gereduceerde vorm zetten we ook op nul

pi1 = sqrt(mu2/(N+mu2*(L-1))); % pi'tjes maken aan de hand van concentratieparameter

pi2 = pi1; pi3 = pi2;

sigv = sqrt(1-pi1^2-pi2^2-pi3^2); % Hierdoor krijgen we dat de variantie van x gelijk is aan 1

rho = rhoxe/sigv; % Omdat we hebben gekozen dat de varianties van x en epsilon gelijk zijn aan 1

sigxi = sqrt(1-rho^2); % Variantie van v is gelijk aan 1 % Definieer lege matrices waarin we resultaten opslaan

ResBOLS = zeros(R,2); % Opslaan OLS-schatters

ResBIV = zeros(R,2); % Opslaan IV-schatters

ResBGMM = zeros(R,2); % Opslaan GMM-schatters

ResBGLS = zeros(R,2); % Opslaan GLS-schatters

ResDWH = zeros(R,1); % Opslaan DWH uitkomst

ResDWH2 = zeros(R,1); % Opslaan DWH Robuuste IV vs OLS uitkomst

ResDWH3 = zeros(R,1); % Opslaan DWH GMM vs OLS uitkomst

ResDWH4 = zeros(R,1); % Opslaan DWH GMM vs GLS uitkomst

ResDWH5 = zeros(R,1); % Opslaan DWH heterosc. omega = resols

ResDWH6 = zeros(R,1); % Opslaan DWH heterosc. omega = heterosc functie %Begin simulatie

i = 0;

while i < R; % Kan ook met "for loop", herhaling gaat door tot i = R

i = i + 1; % Anders gaat de simulatie oneindig lang door omdat i altijd kleiner zal blijven dan R

(22)

22

%Aanmaken van de data

%Generate data

eps = randn(N,1); % epsilon

xi = randn(N,1); % xi

z1 = randn(N,1); % instrumenten

z2= randn(N,1); z3 = randn(N,1);

v = sigxi*xi + rho*eps;

x = pi0*cons + pi1*z1 + pi2*z2 + pi3*z3 + sigv*v;

sigeps = sqrt(exp(-(1/2)*theta*theta+(theta/3)*(z1+z2+z3))); % Functie heteroscedasticiteit: Varianties van epsilon hangen af van instrumenten, heteroscedastische storingen

y = beta0*cons + beta1*x + sigeps.*eps; % uiteindelijk maken we y voor de replicatie

% Nu hebben we een volledige dataset en kunnen we schatters en

% toetsgrootheden vinden.

X = [cons x]; % Volledige set van regressoren, de constante doet ook mee

Z = [cons z1 z2 z3]; % Volledige set van instrumenten

PzX = Z/(Z'*Z)*Z'*X; % Projecteren van X op ruimte Z, nodig voor IV-schatter

% OLS schatter

bols = (X'*X)\X'*y; %

ResBOLS(i,:) = bols'; % Opslaan van de OLS-schatter van deze replicatie

% IV schatter

biv = (PzX'*PzX)\PzX'*y;

ResBIV(i,:) = biv'; % Opslaan IV-schatter

% GMM schatter resiv = y - X*biv; resiv2 = resiv.*resiv; omega = diag(resiv2); S = (Z'*omega*Z);

W = S\eye(L); % Gewichtenmatrix W nodig voor GMM schatter

bgmm = (X'*Z*W*Z'*X)\(X'*Z*W*Z'*y);

ResBGMM(i,:) = bgmm'; % Opslaan GMM-schatter

% GLS schatter

resols = y - X*bols; %Vinden van OLS-residuen

resols2 = resols.*resols;

logresols2 = log(resols2); %Pas nodig voor DWH toets met functie heterosc.

gamhat = (Z'*Z)\Z'*logresols2; %logresols2 is de afhankelijke variabele, regressoren Z

omvec = exp(Z*gamhat); % hi = exp(gi)

omega2 = diag(omvec); W2 = omega2\eye(N);

%V = diag(resols2)\eye(N); % ???

bgls = (X'*W2*X)\(X'*W2*y);

ResBGLS(i,:) = bgls'; % Opslaan GLS-schatter

% Durbin-Wu-Hausman toets

s2ols = resols'*resols/(N-K); %Schatten van de variantie van epsilon ols

resiv = y - X*biv; % Vinden van IV-residuen

s2iv = resiv'*resiv/(N); % Schatten van de variantie van epsilon iv

(23)

23

VarIV = s2iv*((PzX'*PzX)\eye(K)); vecC = biv - bols;

DWH = vecC'*pinv(VarIV-VarOLS)*vecC; ResDWH(i) = DWH > chi2inv(0.95,1);

% DWH-toets Robuuste IV vs OLS

VarRIV =

((PzX'*PzX)\(X'*Z))*((Z'*Z)\S)*((Z'*Z)\(Z'*X))*((PzX'*PzX)\eye(K)); vecC2 = biv - bols;

DWH2 = vecC2'*pinv(VarRIV-VarOLS)*vecC2; ResDWH2(i) = DWH2 > chi2inv(0.95,1); % DWH-toets GMM vs OLS VarGMM = (X'*Z*W*Z'*X)\eye(K); vecC3 = bgmm - bols; DWH3 = vecC3'*pinv(VarGMM-VarOLS)*vecC3; ResDWH3(i) = DWH3 > chi2inv(0.95,1); % DWH-toets GMM vs GLS VarGLS = ((X'*W2*X)\eye(K)); vecC4 = bgmm - bgls; DWH4 = vecC4'*pinv(VarGMM-VarGLS)*vecC4; ResDWH4(i) = DWH4 > chi2inv(0.95,1);

% DWH-toets 5 IV vs OLS (omega = resols)

omega3 = diag(resols2); h1 = (PzX'*PzX)\PzX'*omega3*PzX*(PzX'*PzX)\eye(K); %Var(Biv) h2 = (X'*X)\(X'*omega3*X)*(X'*X)\eye(K); %V(Bols) h3 = (PzX'*PzX)*PzX'*omega3*X*(X'*X)\eye(K); %Cov(Biv,Bols) h4 = ((X'*X)\X'*omega3'*PzX)*(PzX'*PzX)\eye(K); %Cov(Bols,Biv) DWH5 = vecC'*pinv(h1+h2-h3-h4)*vecC; ResDWH5(i) = DWH5 > chi2inv(0.95,1);

% DWH-toets 6 IV vs OLS (omega = functie heterosc. = W2 ipv omega2)

h5 = (PzX'*PzX)\PzX'*W2*PzX*(PzX'*PzX)\eye(K); %Var(Biv) h6 = (X'*X)\(X'*W2*X)*(X'*X)\eye(K); %V(Bols) h7 = (PzX'*PzX)\PzX'*W2*X*(X'*X)\eye(K); %Cov(Biv,Bols) h8 = (X'*X)\X'*W2*PzX*(PzX'*PzX)\eye(K); %Cov(Bols,Biv) DWH6 = vecC'*pinv(h5+h6-h7-h8)*vecC; ResDWH6(i) = DWH6 > chi2inv(0.95,1); end

mean(ResBOLS) % Monte Carlo schatter van de verwachting van de ols-schatter

mean(ResBIV) % Monte Carlo schatter van de verwachting van de iv-schatter

mean(ResBGMM) % Monte Carlo schatter van de verwachting van de bgmm-schatter

mean(ResBGLS) %Monte Carlo schatter van de verwachting van de bgls-schatter

mean(ResDWH) % Monte Carlo schatter van het actuele significantieniveau, bij een nominaal significantieniveau van 5%

mean(ResDWH2) % "

mean(ResDWH3) % "

mean(ResDWH4) % "

mean(ResDWH5) % "

Referenties

GERELATEERDE DOCUMENTEN

[r]

Conclusion: In this retrospective study on pediatric auto-immune uveitis, high dose MTX was associated with a shorter time to remission on medication as compared to low

This proposed engagement strategy is built upon the theoretical framework established in two areas of inquiry: aging, health and social engagement, which within its bounds also

The FNFN are seeking governance reform for primarily two reasons: to address the novel and intensely local environmental impacts of shale gas development that threaten their

The vocabulary of suicidology and suicide prevention reveals its rationalist premises and positivist assumptions. For example, we routinely speak about evidence-based practices,

involve an incremental build-up of oligomers; instead, oligomerization to species containing 12 –15 aluminum atoms happens within a minute, with slower aggregation to higher

This project examines the nature of story sharing, both the telling and listening, and why story should be used to create powerful learning experiences.. After reviewing a variety of

The aim of the current study was to update information about the performance of SLNB in The Netherlands in clinical stage IB–II melanoma after implementation of the seventh edition