• No results found

Heckmans tweestapsmethode en misspecificatie van de verdeling van de storingstermen : een Monte-Carloanalyse van verschillende semiparametrische schattingstechnieken

N/A
N/A
Protected

Academic year: 2021

Share "Heckmans tweestapsmethode en misspecificatie van de verdeling van de storingstermen : een Monte-Carloanalyse van verschillende semiparametrische schattingstechnieken"

Copied!
27
0
0

Bezig met laden.... (Bekijk nu de volledige tekst)

Hele tekst

(1)

Faculteit Economie en Bedrijfskunde, Amsterdam School of Economics Bachelorscriptie

Heckmans tweestapsmethode en misspecificatie van

de verdeling van de storingstermen

Een Monte-Carloanalyse van verschillende semiparametrische schattingstechnieken

Tom Meurs 10358951 Dr. J.C.M. van Ophem Afstudeerseminar econometrie 5 december 2016 Blok 1 en 2 van 2016-2017 Universiteit van Amsterdam

(2)

Verklaring eigen werk

Hierbij verklaar ik, Tom Meurs, dat ik deze scriptie zelf geschreven heb en dat ik de volledige verantwoordelijkheid op me neem voor de inhoud ervan.

Ik bevestig dat de tekst en het werk dat in deze scriptie gepresenteerd wordt origineel is en dat ik geen gebruik heb gemaakt van andere bronnen dan die welke in de tekst en in de referenties worden genoemd.

De Faculteit Economie en Bedrijfskunde is alleen verantwoordelijk voor de begelei-ding tot het inleveren van de scriptie, niet voor de inhoud.

(3)

Samenvatting

Heckmans tweestapsmethode is een belangrijke methode binnen de klasse se-lectiemodellen. Deze methode leidt tot inconsistente schatters bij misspecificatie van de verdeling van de storingstermen. Verschillende semiparametrische tech-nieken zijn bedacht om hiervoor te corrigeren. In dit onderzoek zijn daar drie van vergeleken met die van Heckman met een Monte-Carloanalyse: de methoden van Cosslett (1991), Newey (1999) en Gallant en Nychka (1987). Cosslett verbe-tert de tweede stap van de Heckmanmethode door de correctieterm te benaderen met dummy’s en Newey benadert de correctieterm met polynomen. Gallant en Nychka hebben een methode bedacht om een verdeling te benaderen met een Hermite-series. Dat wordt in dit onderzoek in de eerste stap gedaan. Schat-tingen met OLS, Heckmans methode (PH), probit met Cossletts methode (PC), probit met Newey’s methode (PN), methode van Gallant en Nychka met Cos-slett (NC) en methode van Gallant en Nychka met Newey (NN) werden gemaakt. Storingstermen kwamen uit verschillende verdelingen en verschillende correlaties tussen storingstermen in de twee stappen werden geschat. PH, PC en NC ga-ven de meest robuuste schattingsresultaten. PN en NN gaga-ven daarna de meeste robuuste schattingsresultaten. OLS gaf de minst robuuste schattingsresultaten. Correlaties lijken geen effect te hebben op de robuustheid van schattingsresultaten bij de verschillende methoden. Er wordt geconcludeerd dat Heckman en Cosslett de meest robuuste schattingen leveren bij misspecificatie van de storingstermen bij de onderzochte verdelingen. Daarnaast is er waarschijnlijk geen verschil tus-sen de robuustheid van de schatters van probit en de methode van Gallant en Nychka in de eerste stap.

(4)

Inhoudsopgave

1 Inleiding 2

2 Verschillende schattingsmethoden van selectiebias 3

2.1 De tweestapsmethode van Heckman . . . 4

2.2 Semiparametrische schattingstechnieken . . . 6

2.2.1 Cossletts methode . . . 6

2.2.2 Newey’s methode . . . 7

2.2.3 Gallant en Nychka’s methode . . . 7 3 Monte-Carloanalyse van semiparametrische schattingstechnieken 9

4 Analyse en resultaten 11

5 Conclusie 21

(5)

1

Inleiding

Bij de afgelopen presidentsverkiezingen in de Verenigde Staten voorspelden bijna alle opinieonderzoeken dat Hillary Clinton tot president zou worden gekozen. Uiteindelijk won Donald Trump. Bij het opinieonderzoek waren de Trump-stemmers blijkbaar on-dervertegenwoordigd. Zie hier het probleem van selectie-bias. Bepalend voor de juiste uitkomst van een steekproefonderzoek is of je kunt bepalen in hoeverre een steekproef overeenstemt met de werkelijke populatie.

In de econometrie zijn er modellen bedacht om te corrigeren voor aselecte steek-proeven. Eerst waren die gebaseerd op de zogeheten maximum likehood. Het berekenen hiervan was echter erg tijdrovend (Puhani, 2000). Heckman (1977, p.153) bedacht een tweestapsmethode waarmee de bias van het nemen van een verkeerde steekproef op een eenvoudiger manier gemodelleerd kan worden. Zijn tweestapsmethode werkte sneller en bleek valide resultaten op te leveren, waardoor deze snel populair werd. Toch waren de problemen met het corrigeren van selectiebias hiermee niet uit de wereld.

Een van de kritieken van Heckmans tweestapsmethode is dat de storingstermen in het model van Heckman bivariaat normaal verdeeld moeten zijn, anders levert de methode inconsistente schatters op (Newey, 1999, p.217). Omdat van zo’n verdeling lang niet altijd sprake is, zijn onderzoekers nieuwe, semiparametrische schattingstech-nieken gaan ontwikkelen. De basis bleef de tweestapsmethode van Heckman, maar men ontwikkelde nieuwe oplossingen voor storingstermen die niet bivariaat normaal verdeeld zijn.

Twee van deze semiparametrische methoden zijn bedacht door Cosslett (1991) en Newey (2009). Cosslett benadert de correctieterm in de tweede stap van de methode van Heckman door middel van dummy’s. Newey doet hetzelfde door middel van poly-nomen.

(6)

Weer een andere semiparametrische methode is afgeleid van de methode van Gal-lant en Nychka (1987). Zij hebben een algemene manier gevonden om een verdeling te benaderen door middel van een Hermite-series. Van Der Klaauw en Koning (2003) lieten zien dat deze benadering ook gebruikt kan worden in de tweestapsmethode van Heckman. Zij benaderen daar de bivariate verdeling van de storingstermen met de Hermite-series en laten zien dat ze dan robuuste schatters krijgen. Het gebruik van deze methode is rekentechnisch gezien wel ingewikkeld en wordt daarom in de praktijk nog niet veel gebruikt. Met de komst van steeds krachtiger computers kan daar veran-dering in komen.

In deze paper wordt onderzocht in hoeverre de methoden van Cosslett (1991), Newey (2009) en Gallant en Nychka (1987) robuuste schattingsresultaten opleveren ten opzichte van de methode van Heckman (1977).

Hiertoe ga ik eerst nader in op de ontwikkeling van de verschillende technieken van selectiemodellen (hoofdstuk 2). In het derde hoofdstuk gaan ik in op de manier waarop ik de verschillende methoden met elkaar ga vergelijken. Dat doe ik met behulp van de zogeheten Monte-Carloanalyse. In hoofdstuk 4 presenteer ik de resultaten van deze analyse. Dat doe ik aan de hand van een tabel, waaruit de lezer eenvoudig kan opmaken in hoeverre geschatte parameters afwijken van werkelijke parameters. Ten slotte wordt in het vijfde hoofdstuk geconcludeerd welke modellen de meest robuuste resultaten opleveren voor verschillende verdelingen.

2

Verschillende schattingsmethoden van selectiebias

Volgens Heckman (1977) zijn er twee stoorten problemen rondom steekproefselectie: 1) een deel van de proefpersonen kan of wil niet meedoen en 2) de onderzoeker selecteert slecht een deel van de data voor zijn onderzoek. Beide vormen van steekproefselectie

(7)

kunnen leiden het niet kunnen trekken van conclusies die geldig zijn voor de te onder-zoeken populatie.

De meest uitgebreide methode om steekproeven te corrigeren voor deze selectie-bais is die van Full Information Maximum Likelihood (FIML). Daarbij wordt een vol-ledige likelihoodfunctie opgesteld van de selectie en uitkomstvergelijking en gemaxima-liseerd. Dat is een tijdrovende methode en de likelihoodfunctie is niet altijd globaal concaaf (Hall, 2002). Heckman (1977) bedacht daarom een manier om selectiemodellen sneller op te kunnen lossen. Dit vormde de opmaat voor een nieuw onderzoeksveld. De methodiek van Heckman werkte weliswaar snel, maar leverde niet altijd bevredigende resultaten op. Sindsdien zijn er verbeteringen en afgeleide methoden bedacht. in dit hoofdstuk zet ik uiteen welke methoden dat zijn en welke voor- en nadelen eraan worden toegeschreven.

2.1 De tweestapsmethode van Heckman

Het volgende model beschrijft het selectieprobleem (Puhani, 2000, p.54):

y1i∗ = x01iβ1+ v1i (1)

y2i∗ = x02iβ2+ v2i (2)

y1i= y∗1i , als y2i∗ > 0 (3)

y1i= 0 , als y2i∗ ≤ 0 (4)

Waarbij y∗1i de uitkomstvergelijking voorstelt (1) en y2i∗ de selectievergelijking (2). Ver-der wordt ervan uitgegaan dat v1 en v2 bivariaat normaal verdeeld zijn:

  v1 v2  ∼ N     0 0  ,   σ12 ρσ1 ρσ1 1     (5)

(8)

Gegeven deze assumpties liet Heckman (1977, p.156) zien dat je de conditionele ver-wachting van y1i∗ kan omschrijven naar:

E(y1i∗|x1i, y2i∗ > 0) = x1iβ1+ ρσ1

φ(−(x02iβ2/σ2))

1 − Φ(−(x02iβ2/σ2))

(6) En stelde vervolgens voor om de zogenoemde inverse Mill’s ratio λ te schatten:

λ(x02iβ2/σ2) =

φ(−(x02iβ2/σ2))

1 − Φ(−(x02iβ2/σ2))

(7) De ˆλ wordt geschat door middel van een probitmodel en deze wordt vervolgens toege-voegd aan de eerste regressievergelijking (1):

y1i= x01iβ1+ ρσ1λ(xˆ 02iβˆ2/σ2) + v1i∗ (8)

Met

v∗1i= v1i− ρσ1ˆλ(x02iβˆ2/σ2) (9)

Kortom, Heckman (1977) lost het selectieprobleem op door de bias in eerste regressiever-gelijking (1) als een omitted variable bias te beschouwen. Zolang v1i∗ in (8) onafhankelijk is van λ en v2i in (2) normaal verdeeld is, is Heckmans tweestapsmethode consistent

(Puhani, 2000, p.55). Omdat v1∗ echter heteroskedastisch is, zijn de schattingen niet effici¨ent (Heckman, 1977; Puhani, 2000). Heckman stelde daarom voor zijn schatters als startwaarden te gebruiken, wanneer de FIML (6) met nummerieke technieken zo-als Gauss-Newton opgelost kunnen worden. De tweestapsmethode van Heckman bleek praktisch toepasbaar, vanwege de relatieve eenvoud, en leverde doorgaans redelijke ade-quate inzichten op. Zo werd de methode de standaardmanier om selectiemodellen te schatten (Puhani, 2000).

Er zijn echter ook nadelen aan verbonden (Puhani, 2000). Ten eerste geeft de originele methode van Heckman alleen bij bivariaat normaal verdeelde storingstermen consistente schatters (Manski, 1989). Wanneer de storingstermen anders zijn verdeeld,

(9)

worden de schatters inconsistent. Ten tweede zijn er problemen met identificatie als er voor zowel het selectiemechanisme (2) als de uitkomstvergelijking (1) dezelfde ver-klarende variabelen worden gebruikt (Nawata, 1993). Ten derde legt de methode geen restrictie op van | ρ |< 1, waar in het onderliggende model wel vanuit wordt gegaan (Hall, 2002). Volgens Hall wordt deze restrictie in de praktijk vaak geschonden. In deze paper staat alleen de misspecificatie van de verdelingen van de storingstermen centraal.

2.2 Semiparametrische schattingstechnieken

Verschillende auteurs hebben getracht nieuwe, semi- of niet-parametrische methoden te ontwikkelen om misspecificatie van de verdelingen van de storingstermen te voorkomen (Cosslett, 1991; Gallant & Nychka, 1987; Newey, 2009). Hier worden drie van die technieken besproken: de methode van Cosslett (1991), die gebruik maakt van dummy’s. De methode van Newey (2009) maakt gebruik van polynomen. En de methode van Gallant en Nychka (1987), maar dan gebruikt binnen Heckmans tweestapsmethode. Gallant en Nychka vonden een manier om een verdeling te benaderen, en dat gebruiken we hier om de verdeling van de storingstermen in de eerste stap te benaderen.

2.2.1 Cossletts methode

Cosslett (1991) gaat uit van de tweestapsmethode van Heckman. De tweede stap pakt hij echter anders aan. In deze stap gebruikt hij als correctieterm niet de inverse Mill’s ratio, maar dummy’s. In de eerste stap schat wordt ˆβ2 geschat met probit. In de

tweede stap deelt hij x02iβ2 in M secties. Vervolgens verdeelt hij alle waarnemingen op

basis van hun waarde in een sectie. En dan maakt hij elke sectie een dummy D. De M dummy’s worden tot slot aan de regressievergelijking toegevoegd:

y1i= x01iβ1+ M

X

m=1

(10)

Waarbij nu v1i∗ = v1i− M X m=1 bmDim(x02iβˆ2) (11)

Cosslett (1991, p.182) laat zien dat zijn methode consistente schatters ˆβ1 geeft zolang de

hoeveelheid dummy’s oploopt met de hoeveelheid waarnemingen en zolang ˆβ2 consistent

geschat wordt. v1i∗ mag dan dus een andere verdeling hebben.

2.2.2 Newey’s methode

Net zoals Cosslett (1991) gaat ook Newey uit van de tweestapsmethode van Heckman. In de eerste stap schat hij ook ˆβ2 met probit. In de tweede stap benadert hij de

correctieterm echter niet met de inverse Mill’s ratio of dummy’s, maar met polynomen (Newey, 2009): y1i= x01iβ1+ K X k=1 ηkρk(x02iβˆ2) + v1i∗ (12) Met v∗1i= v1i− K X k=1 ηkρk(x02iβˆ2) (13)

Hierbij zijn ηk parameters en ρk(x02iβˆ2) = τk(x02iβˆ2) k−1

met τk(x02iβˆ2) = 2Φ(x02iβˆ2) − 1. K

staat voor de graad van de polynomen die gebruikt worden om de correctieterm mee te schatten. Zie voor verdere uitleg Hussinger (2008) en Newey (2009). Newey (2009) laat zien dat zijn methode consistente schatters geeft zolang de graad van de polynomen oploopt met de hoeveelheid waarnemingen en zolang ˆβ2 consistent geschat wordt. v1i

mag dan net zoals bij Cossletts methode een andere verdeling hebben.

2.2.3 Gallant en Nychka’s methode

Zowel in de methode van Cosslett als Newey wordt ˆβ2 geschat met probit. Dat is

(11)

schattings-techniek voor gebruikt kunnen worden als we verwachten dat de storingstermen in de eerste stap ook niet normaal verdeeld zijn. Een methode die gebruikt kan worden is af-geleid van de methode van Gallant en Nychka (1987). Zij benaderen de storingstermen met Hermite-series. De algemene manier om de verdeling van de storingstermen dan te benaderen is:

h() = PK2( − τ )φ2(|τ, 4) (14) Waarbij PK(·) een polynoom is van graad K, en 4 een diagonaalmatrix (Gallant &

Nychka, 1987). De verdelingsfunctie h(·) hoort dan tot de klasse Hk verdelingsfuncties.

De eigenschappen van deze verdelingsfuncties staan beschreven in Gallant en Nych-ka (1987). De meeste empirisch gebruikte verdelingen horen bij de Hk klasse (Van

Der Klaauw & Koning, 2003), zoals de t-verdeling en chi-kwadraat verdeling. Alleen heel uitzonderlijke verdelingen horen niet bij de Hk klasse. Bijvoorbeeld de

Cauchy-verdeling, omdat die geen momenten heeft.

De methode van Gallant en Nychka kan in het tweestapsmodel van Heckman ge-bruikt worden, in zowel de eerste stap als simultaan in beide stappen (Van Der Klaauw & Koning, 2003). Ik heb ervoor gekozen om de methode slechts in de eerste stap te gebruiken. In de tweede stap gebruik ik dan de methode van Cosslett of Newey. De reden hiervoor is als we niet willen opleggen dat in de eerste stap de storingstermen normaal verdeeld zijn, we dan ook niet willen opleggen dat ze dat in de tweede stap wel zijn.

Als de genoemde methoden theoretisch met elkaar vergeleken worden, kunnen er een aantal verwachtingen uitgesproken worden. Zo zal, bij de verdelingen die afwij-ken van de normale verdeling, de methode van Gallant en Nychka in de eerste stap van Heckmans methode consistente schattingen opleveren dan probit, onder algemene veronderstellingen. In de tweede stap zullen de methoden van Cosslett en Newey ro-buustere schattingen opleveren dan de inverse Mill’s ratio van Heckman. Er wordt geen

(12)

verschil verwacht in de uikomsten van de schattingen tussen de methoden van Cosslett en Newey. In het volgende hoofdstuk wordt omschreven hoe de simulatie is uitgevoerd.

3

Monte-Carloanalyse van semiparametrische

schattingstech-nieken

Om te bepalen hoe goed de verschillende methoden werken om te corrigeren voor selectie-bias heb ik een Monte-Carloanalyse uitgevoerd. Deze is met behulp van R (Versie 3.2.1) toegepast op zes modellen: OLS, Heckmans tweestapmethode (PH), pro-bit met Newey (PN) of Cosslett (PC) en Gallant en Nychka gevolgd door Newey (NN) of Cosslett (NC). Voorafgaand hieraan is data gegenereerd (DGP). Hierna worden de parameters met de zes modellen geschat. Daarna presenteer ik de resultaten in tabel-len. Daaruit valt op te maken hoe robuust de schattingen zijn. Tot slot vergelijk ik de resultaten van de verschillende methoden met elkaar.

Het basis model dat hier gebruikt wordt is:

y1 = α0+ α1x + α2z + u (15)

y2∗ = β0+ β1x + β2q + v∗ (16)

Hierbij zijn x, q en z drie vectoren met daarin 1000 getallen getrokken uit een N(0,1)-verdeling. De volgende startwaarden zijn gebruikt: α1=2, α2=5, β1=2, β2 = 1. Verder

is

v∗ = ρu +  (17)

Daarbij geldt voor de waarnemingen y1i> 0 dat y2i = y2i∗ en v = v

. In vergelijking 17

worden verschillende parameters geprobeerd voor ρ en verschillende verdelingen voor u en . Voor ρ worden vier verschillende waarden gebruikt: 0, 0.3, 0.7 en 0.95. En u en  zijn in combinatie uit verschillende verdelingen getrokken: standaardnormaal,

(13)

logistisch, Cauchy, uniform(-1,1) of bimodaal verdeeld. Deze verdelingen heb ik gekozen omdat: voor de standaardnormaal de meeste afleidingen uit het vorige hoofdstuk zijn gemaakt en zou daarom robuuste schattingen voor alle methoden moeten geven. De logistische verdeling heeft dikkere staarten dan de standaardnormaal verdeling. Dit leidt tot meer uitbijters, waardoor verwacht wordt dat semiparametrische technieken het beter doen dan probit en Heckman. De Cauchy verdeling is een uitzonderlijke verdeling omdat het geen momenten heeft. Het heeft nog dikkere staarten dan de logistische verdeling. Dit zorgt voor nog meer uitbijters, waardoor schatters met nog meer bias worden verwacht. Omdat deze verdelingen nog unimodaal zijn, worden ook twee niet-unimodale verdelingen onderzocht: een uniforme verdeling en een bimodale verdeling. De bimodale verdeling wordt geschat door een getal met 50 procent te trekken uit N(0,1) verdeling en met 50 procent uit een N(5,1) verdeling. Verwacht wordt dat bij deze twee verdelingen alle methoden met gebiased schatten. Ten slotte worden twee verschillende verdelingen voor u en  gecombineerd, om te onderzoeken of dat ook abnormale resultaten geeft. Het combineren van twee verdelingen levert vaak een onbekende nieuwe verdeling op. Een combinatie met u logistisch verdeeld en  Cauchy verdeeld en een combinatie waarbij u logistisch verdeeld is en  uniform(-1,1) verdeeld.

In de eerste stap worden α0, α1 en α2 geschat met probit en Hermite-series met

als orde van de polynomen 3. Hoewel een hogere orde van polynomen zorgt voor een betere benadering van de verdeling door de Hermite-series, zou orde drie of vier al een kwalitatief goede benadering van de verdeling moeten geven, aldus van Ophem (2001, p.8). Vervolgens wordt in de tweede stap ˆα1x + ˆα2z gebruikt om de inverse Mill’s

ratio λ, de M=25 dummy’s van Cosslett of Newey’s k=3 polynomen uit te rekenen zoals omschreven in het vorige hoofdstuk. Dan wordt de tweede regressie geschat met OLS voor de waarnemingen waarbij y1 > 0. Daarbij wordt λ (zie 18), de 25 dummy’s

(14)

van Cosslett (zie 19) en de 3 polnomen van Newey (zie 20) als verklarende variabelen meegenomen: y2 = β0+ β1x + β2q + ˆλσ + v (18) y2 = β0+ β1x + β2q + 25 X m=1 bmDim+ v (19) y2 = β0+ β1x + β2q + 3 X k=1 ηkρk+ v (20)

Op deze manier verkrijgen we schatters voor ˆα1, ˆα2, ˆβ1, ˆβ2, λ, Dˆim en ˆηk. Dit proces

wordt 1000 keer gerepliceerd.

4

Analyse en resultaten

In dit hoofdstuk presenteer ik de resultaten van de Monte-Carloanalyse. Ten eerste presenteer ik de geschatte alfa’s en beta’s uit de twee regressievergelijkingen (12 en 13). Vervolgens bekijk ik in hoeverre de polynomen van Newey en de dummy’s van Cosslett significant iets toevoegen aan de regressie. Dit doe ik door gebruik te maken van een likelihood-ratiotoets. Tot slot bespreek ik wat mogelijke hiaten zijn in dit onderzoek.

De geschatte alfa’s en beta’s staan in tabel 1 tot en met 7 voor de verschillende verdelingen. Bij de alfa’s moet gekeken worden naar de verhouding, omdat de variantie niet gelijk is aan 1. Die verhouding is α1 : α2 = 2 : 5. In tabel 1 zijn de resultaten bij

een normaal verdeelde storingsterm in zowel stap 1 als 2 weergegeven. De resultaten lijken zuiver, behalve voor OLS bij een ρ van 0.3, 0.7 en 0.95 en voor bij tweede stap Newey, zowel bij eerste stap probit als eerste stap de methode van Gallant en Nychka bij een ρ van 0.7 en 0.95. In de eerste stap zijn de resultaten van alle technieken onzuiver, maar wel allemaal binnen 95% betrouwbaarheidsinterval van de werkelijke waarde.

In tabel 2 is een logistische verdeling gebruikt. In stap 1 hebben de alfa’s ongeveer een verhouding van 2:5, dus het lijkt erop dat de alfa’s zuiver zijn geschat. Alleen voor

(15)

hogere ρ’s wijken de waarden van de beta’s iets af van de werkelijke waarden. Newey in de tweede stap en OLS geven schattingen die verder afliggen van de werkelijke waarden dan de andere methoden, net zoals bij de standaardnormaalverdeling.

In tabel 3 is een Cauchy verdeling gebruikt. Gezien 2.5 ∗ 0.58 = 1.48, lijken de alfa’s verhoudingsgewijs zuiver geschat. De beta’s zijn echter wel onzuiver geschat, voor alle gebruikte ρ’s.

In tabel 4 staan de resultaten van de schattingen uit de uniforme(-1,1)-verdeling. Gezien 3.5 ∗ 2.5 = 8.75, lijken de schattingen van alfa’s verhoudingsgewijs zuiver ge-schat. Ook de schattingen voor de beta’s lijken zuiver voor alle methoden en alle ρ’s.

In tabel 5 staan de resultaten van de schattingen uit de bimodale-verdeling. 0.75 ∗ 2.5 = 1.875, dus de verhouding bij de alfa’s lijken zuiver. De schatters voor de beta’s lijken ook zuiver voor alle ρ’s.

In tabel 6 staan de resultaten voor de in de eerste stap logistisch verdeelde sto-ringsterm en de in de tweede stap uniform(-1,1) verdeelde stosto-ringsterm. De alfa’s zijn op dezelfde manier geschat als bij tabel 2, en staan daarom dezelfde alfa’s: verhou-dingsgewijs lijken de alfa’s zuiver. Bij de beta’s lijken de methoden ook consistent, al zitten OLS en Newey iets verder van de werkelijke waarde dan de andere methoden.

In tabel 7 staan de resultaten voor in de eerste stap logistisch verdeelde storings-term en in de tweede stap Cauchy verdeelde storingsstorings-term. Net zoals bij tabel 6 en 2 zijn de schattingen gebaseerd op storingsterm die logistisch is verdeeld. De schattingen zijn dan ook vrijwel hetzelfde. De beta’s zijn echter onzuiver voor alle methoden.

(16)

ρ OLS PH PC PN NC NN 0 αˆ1 - 2.04(0.21) 2.04(0.21) 2.04(0.21) 2.04(0.21) 2.04(0.21) ˆ α2 - 5.11(0.46) 5.11(0.46) 5.11(0.46) 5.08(0.46) 5.08(0.46) ˆ β1 2.00(0.06) 2.00(0.06) 2.00(0.06) 2.00(0.06) 2.00(0.06) 2.00(0.06) ˆ β2 1.00(0.05) 1.00(0.05) 1.00(0.06) 1.00(0.05) 1.00(0.06) 1.00(0.05) 0.3 αˆ1 - 2.04(0.21) 2.04(0.21) 2.04(0.21) 2.04(0.21) 2.04(0.21) ˆ α2 - 5.11(0.46) 5.11(0.46) 5.11(0.46) 5.08(0.46) 5.08(0.46) ˆ β1 1.98(0.06) 2.00(0.06) 2.00(0.06) 2.00(0.06) 2.00(0.06) 2.00(0.06) ˆ β2 1.00(0.06) 1.00(0.06) 1.00(0.06) 1.00(0.06) 1.00(0.06) 1.00(0.06) 0.7 αˆ1 - 2.04(0.21) 2.04(0.21) 2.04(0.21) 2.04(0.21) 2.04(0.21) ˆ α2 - 5.11(0.46) 5.11(0.46) 5.11(0.46) 5.08(0.46) 5.08(0.46) ˆ β1 1.96(0.07) 2.00(0.07) 2.00(0.07) 1.99(0.07) 2.00(0.07) 1.99(0.07) ˆ β2 1.00(0.07) 1.00(0.06) 1.00(0.07) 1.00(0.07) 1.00(0.07) 1.00(0.07) 0.95 αˆ1 - 2.04(0.21) 2.04(0.21) 2.04(0.21) 2.04(0.21) 2.04(0.21) ˆ α2 - 5.11(0.46) 5.11(0.46) 5.11(0.46) 5.08(0.46) 5.08(0.46) ˆ β1 1.95(0.08) 2.00(0.08) 2.00(0.08) 1.99(0.08) 2.00(0.08) 1.99(0.08) ˆ β2 1.00(0.07) 1.00(0.07) 1.00(0.08) 1.00(0.07) 1.00(0.08) 1.00(0.07)

Tabel 1: Schattingen voor alfa’s en beta’s voor verschillende ρ’s en methoden bij stan-daardnormaal verdeelde storingstermen u en 

(17)

ρ OLS PH PC PN NC NN 0 αˆ1 - 1.11(0.1) 1.11(0.1) 1.11(0.1) 1.12(0.11) 1.12(0.11) ˆ α2 - 2.77(0.2) 2.77(0.2) 2.77(0.2) 2.78(0.21) 2.78(0.21) ˆ β1 2.00(0.09) 2.00(0.1) 2.00(0.1) 2.00(0.1) 2.00(0.1) 2.00(0.1) ˆ β2 0.99(0.09) 0.99(0.09) 1.00(0.09) 0.99(0.09) 1.00(0.09) 0.99(0.09) 0.3 αˆ1 - 1.11(0.1) 1.11(0.1) 1.11(0.1) 1.12(0.11) 1.12(0.11) ˆ α2 - 2.77(0.2) 2.77(0.2) 2.77(0.2) 2.78(0.21) 2.78(0.21) ˆ β1 1.96(0.1) 2.01(0.1) 2.01(0.11) 1.99(0.1) 2.01(0.11) 1.98(0.1) ˆ β2 1.00(0.09) 1.00(0.09) 1.00(0.1) 1.00(0.09) 1.00(0.1) 1.00(0.1) 0.7 αˆ1 - 1.11(0.1) 1.11(0.1) 1.11(0.1) 1.12(0.11) 1.12(0.11) ˆ α2 - 2.77(0.2) 2.77(0.2) 2.77(0.2) 2.78(0.21) 2.78(0.21) ˆ β1 1.90(0.12) 2.01(0.12) 2.01(0.12) 1.97(0.12) 2.01(0.13) 1.95(0.12) ˆ β2 1.00(0.11) 1.00(0.11) 1.00(0.11) 1.00(0.11) 1.00(0.11) 1.00(0.11) 0.95 αˆ1 - 1.11(0.1) 1.11(0.1) 1.11(0.1) 1.12(0.11) 1.12(0.11) ˆ α2 - 2.77(0.2) 2.77(0.2) 2.77(0.2) 2.78(0.21) 2.78(0.21) ˆ β1 1.87(0.13) 2.01(0.13) 2.01(0.14) 1.96(0.14) 2.01(0.14) 1.93(0.14) ˆ β2 1.00(0.12) 1.00(0.12) 1.00(0.12) 1.00(0.12) 1.00(0.12) 1.00(0.12)

Tabel 2: Schattingen voor alfa’s en beta’s voor verschillende ρ’s en methoden bij logis-tisch verdeelde storingstermen u en 

(18)

ρ OLS PH PC PN NC NN 0 αˆ1 - 0.59(0.07) 0.59(0.07) 0.59(0.07) 0.58(0.07) 0.58(0.07) ˆ α2 - 1.48(0.12) 1.48(0.12) 1.48(0.12) 1.45(0.14) 1.45(0.14) ˆ β1 0.85(18.93) 0.92(17.53) 1.07(17.72) 0.84(20.04) 1.04(18.82) 0.92(19.79) ˆ β2 0.66(21.59) 0.64(21.54) 0.65(20.17) 0.66(21.96) 0.75(20.02) 0.64(21.82) 0.3 αˆ1 - 0.59(0.07) 0.59(0.07) 0.59(0.07) 0.58(0.07) 0.58(0.07) ˆ α2 - 1.48(0.12) 1.48(0.12) 1.48(0.12) 1.45(0.14) 1.45(0.14) ˆ β1 -0.71(26.83) 1.01(19.37) 0.88(18.72) -0.83(28.84) 1.02(19.97) -0.86(29.38) ˆ β2 -0.20(26.58) -0.27(27.17) 0.21(21.8) -0.30(28.23) 0.18(21.93) -0.23(26.73) 0.7 αˆ1 - 0.59(0.07) 0.59(0.07) 0.59(0.07) 0.58(0.07) 0.58(0.07) ˆ α2 - 1.48(0.12) 1.48(0.12) 1.48(0.12) 1.45(0.14) 1.45(0.14) ˆ β1 -2.80(48.23) 1.13(26.19) 0.63(22.84) -3.04(52.43) 1.00(24.66) -3.25(54.4) ˆ β2 -1.35(42.45) -1.48(44.56) -0.36(28.53) -1.59(47.14) -0.58(29.51) -1.39(42.45) 0.95 αˆ1 - 0.59(0.07) 0.59(0.07) 0.59(0.07) 0.58(0.07) 0.58(0.07) ˆ α2 - 1.48(0.12) 1.48(0.12) 1.48(0.12) 1.45(0.14) 1.45(0.14) ˆ β1 -4.11(63.11) 1.20(31.74) 0.48(26.47) -4.43(68.74) 0.98(28.74) -4.73(71.57) ˆ β2 -2.07(54.18) -2.23(57.24) -0.72(34.2) -2.04(60.81) -1.06(35.76) -2.11(54.11)

Tabel 3: Schattingen voor alfa’s en beta’s voor verschillende ρ’s en methoden bij Cauchy verdeelde storingstermen u en 

(19)

ρ OLS PH PC PN NC NN 0 αˆ1 - 3.66(0.4) 3.66(0.4) 3.66(0.4) 3.57(0.39) 3.57(0.39) ˆ α2 - 9.15(0.96) 9.15(0.96) 9.15(0.96) 8.91(0.91) 8.91(0.91) ˆ β1 2.00(0.04) 2.00(0.04) 2.00(0.04) 2.00(0.04) 2.00(0.04) 2.00(0.04) ˆ β2 1.00(0.04) 1.00(0.04) 1.00(0.04) 1.00(0.04) 1.00(0.04) 1.00(0.04) 0.3 αˆ1 - 3.66(0.4) 3.66(0.4) 3.66(0.4) 3.57(0.39) 3.57(0.39) ˆ α2 - 9.15(0.96) 9.15(0.96) 9.15(0.96) 8.91(0.91) 8.91(0.91) ˆ β1 2.00(0.04) 2.00(0.04) 2.00(0.05) 2.00(0.04) 2.00(0.05) 2.00(0.04) ˆ β2 1.00(0.04) 1.00(0.04) 1.00(0.04) 1.00(0.04) 1.00(0.04) 1.00(0.04) 0.7 αˆ1 - 3.66(0.4) 3.66(0.4) 3.66(0.4) 3.57(0.39) 3.57(0.39) ˆ α2 - 9.15(0.96) 9.15(0.96) 9.15(0.96) 8.91(0.91) 8.91(0.91) ˆ β1 1.99(0.05) 2.00(0.05) 2.00(0.05) 2.00(0.05) 2.00(0.05) 2.00(0.05) ˆ β2 1.00(0.05) 1.00(0.05) 1.00(0.05) 1.00(0.05) 1.00(0.05) 1.00(0.05) 0.95 αˆ1 - 3.66(0.4) 3.66(0.4) 3.66(0.4) 3.57(0.39) 3.57(0.39) ˆ α2 - 9.15(0.96) 9.15(0.96) 9.15(0.96) 8.91(0.91) 8.91(0.91) ˆ β1 1.99(0.05) 2.00(0.05) 2.00(0.06) 2.00(0.05) 2.01(0.06) 2.00(0.05) ˆ β2 1.00(0.05) 1.00(0.05) 1.00(0.05) 1.00(0.05) 1.00(0.05) 1.00(0.05)

Tabel 4: Schattingen voor alfa’s en beta’s voor verschillende ρ’s en methoden bij uniform(-1,1) verdeelde storingstermen u en 

(20)

ρ OLS PH PC PN NC NN 0 αˆ1 - 0.74(0.06) 0.74(0.06) 0.74(0.06) 0.73(0.07) 0.73(0.07) ˆ α2 - 1.85(0.09) 1.85(0.09) 1.85(0.09) 1.84(0.11) 1.84(0.11) ˆ β1 2.00(0.12) 2.00(0.12) 2.00(0.13) 2.00(0.12) 1.99(0.13) 2.00(0.12) ˆ β2 1.00(0.12) 1.00(0.12) 1.00(0.13) 1.00(0.12) 1.00(0.13) 1.00(0.12) 0.3 αˆ1 - 0.74(0.06) 0.74(0.06) 0.74(0.06) 0.73(0.07) 0.73(0.07) ˆ α2 - 1.85(0.09) 1.85(0.09) 1.85(0.09) 1.84(0.11) 1.84(0.11) ˆ β1 1.91(0.12) 1.99(0.13) 2.00(0.13) 1.98(0.13) 1.99(0.13) 1.93(0.12) ˆ β2 1.00(0.13) 1.00(0.13) 1.00(0.13) 1.00(0.12) 1.00(0.13) 1.00(0.13) 0.7 αˆ1 - 0.74(0.06) 0.74(0.06) 0.74(0.06) 0.73(0.07) 0.73(0.07) ˆ α2 - 1.85(0.09) 1.85(0.09) 1.85(0.09) 1.84(0.11) 1.84(0.11) ˆ β1 1.8(0.14) 1.99(0.14) 1.99(0.15) 1.96(0.14) 1.99(0.15) 1.85(0.14) ˆ β2 1.00(0.14) 1.00(0.14) 1.00(0.14) 1.00(0.14) 1.00(0.14) 1.00(0.14) 0.95 αˆ1 - 0.74(0.06) 0.74(0.06) 0.74(0.06) 0.73(0.07) 0.73(0.07) ˆ α2 - 1.85(0.09) 1.85(0.09) 1.85(0.09) 1.84(0.11) 1.84(0.11) ˆ β1 1.73(0.16) 1.99(0.16) 1.99(0.16) 1.95(0.16) 1.99(0.17) 1.79(0.16) ˆ β2 1.00(0.16) 1.00(0.15) 1.00(0.16) 1.00(0.15) 1.00(0.16) 1.00(0.15)

Tabel 5: Schattingen voor alfa’s en beta’s voor verschillende ρ’s en methoden bij bimo-dale verdeelde storingstermen u en 

(21)

ρ OLS PH PC PN NC NN 0 αˆ1 - 1.11(0.1) 1.11(0.1) 1.11(0.1) 1.12(0.11) 1.12(0.11) ˆ α2 - 2.77(0.2) 2.77(0.2) 2.77(0.2) 2.78(0.21) 2.78(0.21) ˆ β1 2.00(0.03) 2.00(0.03) 2.00(0.03) 2.00(0.03) 2.00(0.03) 2.00(0.03) ˆ β2 1.00(0.03) 1.00(0.03) 1.00(0.03) 1.00(0.03) 1.00(0.03) 1.00(0.03) 0.3 αˆ1 - 1.11(0.1) 1.11(0.1) 1.11(0.1) 1.12(0.11) 1.12(0.11) ˆ α2 - 2.77(0.2) 2.77(0.2) 2.77(0.2) 2.78(0.21) 2.78(0.21) ˆ β1 1.96(0.04) 2.00(0.04) 2.00(0.04) 1.99(0.04) 2.00(0.04) 1.98(0.04) ˆ β2 1.00(0.04) 1.00(0.04) 1.00(0.04) 1.00(0.04) 1.00(0.04) 1.00(0.04) 0.7 αˆ1 - 1.11(0.1) 1.11(0.1) 1.11(0.1) 1.12(0.11) 1.12(0.11) ˆ α2 - 2.77(0.2) 2.77(0.2) 2.77(0.2) 2.78(0.21) 2.78(0.21) ˆ β1 1.90(0.07) 2.01(0.07) 2.00(0.07) 1.97(0.08) 2.01(0.08) 1.94(0.08) ˆ β2 1.00(0.07) 1.00(0.06) 1.00(0.06) 1.00(0.06) 1.00(0.06) 1.00(0.07) 0.95 αˆ1 - 1.11(0.1) 1.11(0.1) 1.11(0.1) 1.12(0.11) 1.12(0.11) ˆ α2 - 2.77(0.2) 2.77(0.2) 2.77(0.2) 2.78(0.21) 2.78(0.21) ˆ β1 1.86(0.09) 2.01(0.09) 2.01(0.1) 1.96(0.1) 2.01(0.1) 1.92(0.1) ˆ β2 1.00(0.09) 1.00(0.08) 1.00(0.08) 1.00(0.08) 1.00(0.08) 1.00(0.09)

Tabel 6: Schattingen voor alfa’s en beta’s voor verschillende ρ’s en methoden bij eerste stap logistische verdeelde storingsterm en tweede stap uniform(-1,1) verdeelde storings-term

(22)

ρ OLS PH PC PN NC NN 0 αˆ1 - 1.11(0.1) 1.11(0.1) 1.11(0.1) 1.12(0.11) 1.12(0.11) ˆ α2 - 2.77(0.2) 2.77(0.2) 2.77(0.2) 2.78(0.21) 2.78(0.21) ˆ β1 0.98(19.39) 0.88(20.04) 0.97(21.98) 0.86(20.58) 1.00(22.28) 0.91(20.32) ˆ β2 0.30(25.69) 0.30(25.47) 0.44(24.92) 0.34(25.46) 0.40(25.21) 0.35(25.68) 0.3 αˆ1 - 1.11(0.1) 1.11(0.1) 1.11(0.1) 1.12(0.11) 1.12(0.11) ˆ α2 - 2.77(0.2) 2.77(0.2) 2.77(0.2) 2.78(0.21) 2.78(0.21) ˆ β1 0.94(19.39) 0.88(20.04) 0.98(21.98) 0.85(20.58) 1.00(22.28) 0.89(20.32) ˆ β2 0.30(25.69) 0.30(25.47) 0.44(24.92) 0.34(25.46) 0.40(25.21) 0.35(25.68) 0.7 αˆ1 - 1.11(0.1) 1.11(0.1) 1.11(0.1) 1.12(0.11) 1.12(0.11) ˆ α2 - 2.77(0.2) 2.77(0.2) 2.77(0.2) 2.78(0.21) 2.78(0.21) ˆ β1 0.88(19.39) 0.88(20.04) 0.98(21.99) 0.83(20.58) 1.00(22.28) 0.85(20.32) ˆ β2 0.30(25.69) 0.31(25.47) 0.44(24.92) 0.34(25.46) 0.40(25.21) 0.35(25.68) 0.95 αˆ1 - 1.11(0.1) 1.11(0.1) 1.11(0.1) 1.12(0.11) 1.12(0.11) ˆ α2 - 2.77(0.2) 2.77(0.2) 2.77(0.2) 2.78(0.21) 2.78(0.21) ˆ β1 0.84(19.39) 0.89(20.05) 0.98(21.99) 0.82(20.58) 1.00(22.28) 0.83(20.32) ˆ β2 0.31(25.69) 0.31(25.48) 0.44(24.92) 0.34(25.46) 0.40(25.22) 0.35(25.68)

Tabel 7: Schattingen voor alfa’s en beta’s voor verschillende ρ’s en methoden bij eerste stap logistische verdeelde storingsterm en tweede stap Cauchy verdeelde storingsterm

In tabel 8 staan de resultaten van 1000 keer een likelihoodratio-toets voor PN en PC tegenover OLS, waarbij dus getest wordt in hoeverre de polynomen of dummy’s gezamenlijk iets toevoegen bij een signficantieniveau van α = 0.05 van de 1000 itera-ties. Hierbij is een ρ van 0.7 gebruikt. Bij een bimodale verdeling en stap 1: logistische verdeling en stap 2: uniforme(-1,1) verdeling wordt het gebruik van polynomen en dummy’s het vaakst geprefereerd boven OLS. Ook bij logistische en normale verdeling

(23)

gebeurt dat vaak. Bij de Cauchy-verdeling doet de methode van Cosslett het beter dan die van Newey, net zoals bij stap 1 logistische en stap 2 Cauchy-verdeling. Bij uniforme verdeling doet de methode van Newey het beter dan die van Cosslett.

Newey Cosslett Normaal 693 679 Logistisch 768 928 Cauchy 52 419 Uniform 537 381 Bimodaal 969 991 Logistisch + Uniform 997 1000 Logistisch + Cauchy 57 136

Tabel 8: LR-toets tussen H0=OLS tegen H1=PN of H1=PC. Hoevaak H0 verwerpen

van de 1000 iteraties dat polynomen (Newey) of dummy’s (Cosslett) niks toevoegen bij significantieniveau van α = 0.05

De resultaten lijken erop te wijzen dat vrijwel altijd de eerste stap zuiver wordt geschat, of onzuiver maar schatters dicht bij de werkelijke waarden. In de tweede stap waren er wel verschillen. Zo lijken bij de standaardnormale, logistische, uniforme en bi-modale verdeling de stappers in de tweede stap zuiver of dicht bij de werkelijke waarden te zitten. Alleen wanneer de storingstermen uit een Cauchy verdeling waren getrokken, zowel in de tweede stap als in beide stappen, lijken er onzuivere schatters in de tweede stap te ontstaan. OLS lijkt de minst robuuste schattingen, al lijkt het mee te vallen hoever de schattingen van OLS van de werkelijke waarden afzitten. Newey, toegepast bij zowel probit als Gallant en Nychka, levert daarna de minst robuuste schattingen op. Tussen Heckman en probit met Cosslett of Gallant en Nychka met Cosslett zijn geen

(24)

opvallende verschillen gevonden. Cossletts dummy’s voegen vaker gezamenlijk wat toe dan Newey’s polynomen, alleen bij de uniforme verdeling waren Newey’s polynomen vaker gezamenlijk significant dan Cossletts dummy’s.

Deze resultaten komen niet overeen met voorgaand onderzoek: Heckman’s me-thode lijkt minstens even robuuste schattingen op te leveren als de semiparametrische methoden die ontwikkeld waren voor misspecficatie van de verdeling van de storingster-men. Een mogelijke verklaring kan zijn dat er niet genoeg dummy’s en polynomen ge-bruikt zijn. Daardoor zouden de dummy’s en polynomen niet vaak genoeg gezamenlijk iets toevoegen aan de regressie. In vervolgonderzoek zouden verschillende ordegroottes van polynomen van Newey’s methode en dummy’s van Cossletts methode onderzocht kunnen worden.

Een ander verassend resultaat is dat Gallant en Nychka’s methode niet robuuster lijkt te schatten dan probit. Een reden zou kunnen zijn dat er te weinig selectie plaats-vind. In dit onderzoek bleven bijvoorbeeld bij de logistische verdeling na selectie van de 1000 waarnemingen 426 over. Bij bimodale verdeling 544. Dit zou te weinig kunnen zijn. In vervolgonderzoek zou verschillende grootheden van selectie onderzocht kunnen worden. Als de selectie niet groot genoeg is, kan de selectiebias te weinig invloed hebben op de zuiverheid van de schattingen.

5

Conclusie

Het doel van dit onderzoek was om te analyseren welke methoden van Cosslett (1991), Newey (2009) en Gallant en Nychka (1987) betere schattingsresultaten opleveren dan Heckman (1977). Uit de resultaten lijkt de methode van Heckman, probit in combinatie met de methoden van Cosslett en de methode van Gallant en Nychka in combinatie met Cossletts methode de meest robuuste schattingen te geven bij misspecificatie van

(25)

de verdeling van de storingstermen. Hierop volgen de methoden van Gallant en Nych-ka in combinatie met Newey en probit in combinatie met Newey. OLS leek de minst robuuste schattingen te geven. Er waren geen verschillen tussen de schattingen van Gallant en Nychka en probit in de eerste stap gevonden. Cossletts methode leek iets robuuster te schatten dan die van Newey’s.

Deze resultaten wijken af van wat verwacht mag worden op basis van voorgaan-de onvoorgaan-derzoeken. Een mogelijke revoorgaan-den is dat voorgaan-de onvoorgaan-derzochte vervoorgaan-delingen niet genoeg verschillen. Welke verdelingen wel genoeg van elkaar verschillen en welke verdelings-kenmerken daarbij belangrijk zijn zou in vervolgonderzoek onderzocht kunnen worden. Ook verschillende groottes van de selectiebias zou in vervolgonderzoek onderzocht kun-nen worden. Misschien dat in dit onderzoek de selectiebias niet groot genoeg is, waar-door teveel waarnemingen gebruikt zijn voor de schattingen en de schattingen daarom robuust lijken te zijn.

Dit onderzoek heeft voorzien in de behoefte de robuustheid van verschillende me-thoden te onderzoeken voor het oplossen van het selectieprobleem bij data met niet normaal verdeelde storingstermen. Onderzoekers die veel met selectiebias te maken krijgen kunnen met behulp van dit onderzoek bewustere keuzes maken voor het ge-bruik van een bepaalde methode om modellen robuuster te maken tegen selectiebias in de data. Dat dit ook maatschappelijk steeds belangrijker wordt, mag blijken uit de onthutste reacties na de presidentsverkiezingen in de VS.

(26)

6

Literatuur

Cosslett, S. R. (1991). Semiparametric estimation of a regression model with sam-ple selectivity. Nonparametric and semiparametric methods in econometrics and statistics, 175–97.

Gallant, A. R. & Nychka, D. W. (1987). Semi-nonparametric maximum likelihood estimation. Econometrica: Journal of the Econometric Society, 55 (2), 363–390. Hall, B. (2002). Notes on sample selection models (Rapport). Mimeo.

Heckman, J. J. (1977). Sample selection bias as a specification error (with an applica-tion to the estimaapplica-tion of labor supply funcapplica-tions). Econometrica: Journal of the Econometric Society, 47 , 153–161.

Hussinger, K. (2008). R&d and subsidies at the firm level: An application of parametric and semiparametric two-step selection models. Journal of applied econometrics, 23 (6), 729–747.

Manski, C. F. (1989). Anatomy of the selection problem. Journal of Human resources, 24 (3), 343–360.

Nawata, K. (1993). A note on the estimation of models with sample-selection biases. Economics Letters, 42 (1), 15–24.

Newey, W. K. (1999). Consistency of two-step sample selection estimators despite misspecification of distribution. Economics Letters, 63 (2), 129–132.

Newey, W. K. (2009). Two-step series estimation of sample selection models. The Econometrics Journal , 12 (1), S217–S229.

Puhani, P. (2000). The heckman correction for sample selection and its critique. Journal of economic surveys, 14 (1), 53–68.

Van Der Klaauw, B. & Koning, R. H. (2003). Testing the normality assumption in the sample selection model with an application to travel demand. Journal of Business

(27)

& Economic Statistics, 21 (1), 31–42.

Van Ophem, H. (2001). Polynomial approximation of densities in microeconometrics with two applications to count data.

Referenties

GERELATEERDE DOCUMENTEN

Wageningen University &amp; Research | Open Teelten stelt zich niet aansprakelijk voor eventuele schadelijke gevolgen die kunnen ontstaan bij gebruikmaking van de gegevens..

In verband met het bovenstaande werd een oriënterend onderzoek verricht (38) met het antibioticum Pimaricine, dat ons ter beschikking werd gesteld door de Koninklijke

Werd de behandeling met dit middel voorafgegaan door 24 uur weken in water, dan werkte deze stof niet op de mate van ontkieming in het donker (7).. De werking

Die afstanden zijn gekozen omdat de stuurgroep Co- existentie die als norm wil gebruiken voor de afstand tussen respectievelijk genmaïs en gewone maïs, en genmaïs en biologische

Wij herkennen de wens om duidelijkheid te verkrijgen in de rollen voor betrokken partijen bij de verschillende routes voor een geneesmiddel om in het verzekerde pakket te

Nu een stijging van kosten niet aanvaardbaar is en ook de suggestie uit het Pakketadvies 2010 om het eigen risico te verhogen niet door de minister is overgenomen, meent het CVZ

This research uses the high-sulfidation epithermal system in the Rodalquilar Caldera Complex where hypogene alteration is associated with gold accumulations, and also