• No results found

Inkomensongelijkheid tussen rassen : misspecificaties in huidig model

N/A
N/A
Protected

Academic year: 2021

Share "Inkomensongelijkheid tussen rassen : misspecificaties in huidig model"

Copied!
26
0
0

Bezig met laden.... (Bekijk nu de volledige tekst)

Hele tekst

(1)

Universiteit van Amsterdam, Faculteit Economie en Bedrijfskunde Bachelorscriptie en afstudeerseminar econometrie 2015/2016

Inkomensongelijkheid tussen rassen

Misspecificaties in huidig model

Maurice Chin Ten Fung (10617566)

Begeleider: dhr. dr. N.P.A. (Noud) van Giersbergen

28 juni 2016

(2)

Verklaring eigen werk

Hierbij verklaar ik, Maurice Chin Ten Fung, dat ik deze scriptie zelf geschreven heb en dat ik de volledige verantwoordelijkheid op me neem voor de inhoud ervan.

Ik bevestig dat de tekst en het werk dat in deze scriptie gepresenteerd wordt origineel is en dat ik geen gebruik heb gemaakt van andere bronnen dan die welke in de tekst en in de referenties worden genoemd.

De Faculteit Economie en Bedrijfskunde is alleen verantwoordelijk voor de begeleiding tot het inleveren van de scriptie, niet voor de inhoud.

(3)

Inhoudsopgave

1 Introductie 1

2 Achterliggende literatuur 3

2.1 Racial wage gap-modellen . . . 3 2.2 Aritificial Neural Networks . . . 4

3 Onderzoeksopzet 7 3.1 Data . . . 7 3.2 Methodiek . . . 9 4 Resultaten en analyse 10 4.1 OLS-model . . . 10 4.2 Lineariteitstoets . . . 11 4.3 ANN-model . . . 12 5 Conclusie 18 Appendix I Bibliografie IV

(4)

1

Introductie

Nadat de burgeroorlog in de Verenigde Staten in 1865 was afgelopen is in de Amerikaanse grondwet het dertiende amendement opgenomen. Dit dertiende amendement staat voor de landelijke afschaffing van de slavernij. Dit is de eerste stap geweest naar gelijkheid tussen blanke en donkere Amerikanen. Na deze eerste stap heeft het bijna honderd jaar geduurd voordat de Civil Rights Act of 1964 werd ingevoerd. In deze wetgeving werden de belangrijk-ste vormen van discriminatie van Afro-Amerikanen en vrouwen verboden. Deze wetgeving verbeterde de situatie van de zwarte bevolking aanzienlijk, maar wist de discriminatie jegens donkere Amerikanen nog niet volledig te stoppen.

Een aspect waarin duidelijk sprake van een verbetering is geweest tussen blanke mannen en donkere mannen is het salaris. Zo merkt Chandra (2000) op dat het gemiddelde wekelijkse salaris van een donkere man in de Verenigde Staten ten opzichte het gemiddelde wekelijkse salaris van een blanke man is toegenomen van 48.4 procent in 1940 tot 75 procent in 1990. Deze 75 procent in 1990 is een mooi percentage in vergelijking met de 48.4 procent in 1940, maar dit laat nog steeds zien dat er sprake is van een noemenswaardige inkomensongelijkheid tussen blanke en donkere mannen in de Verenigde Staten.

Er zijn al vele onderzoeken geweest naar de inkomensongelijkheid tussen blanke mensen en donkere mensen in de Verenigde Staten. Deze ongelijkheid, ook wel de racial wage gap genoemd, wordt bevestigd door Neal en Johnson (1995). Ze vinden dat er een duidelijk ver-schil is tussen het inkomen van blanke en donkere mannen. Ze vinden echter ook dat deze verschillen te verklaren zijn door het verschil in vaardigheden tussen de twee groepen mensen en dus niet alleen komen door het verschil in huidskleur.

Neal en Johnson (1995) maken onderscheid tussen blanke en donkere mannen en onder-zoeken het verschil in inkomen tussen de twee groepen. Kreisman en Rangel (2015) maken eenzelfde soort onderscheid tussen blanke en donkere mannen om het verschil in inkomen te onderzoeken. Kreisman en Rangel (2015) gaan echter dieper in op het verschil in inko-men tussen de twee groepen. Ze beperken zich niet alleen tot het verschil tussen de blanke mensen en de donkere mensen, maar verdelen de donkere mensen ook nog eens onder in drie categorieën. Deze categorieën zijn LightBlack, M ediumBlack en DarkBlack. Kreisman en Rangel richten zich in hun onderzoek, net zoals Neal en Johnson, alleen op mannen uit de Verenigde Staten. Ze maken in hun onderzoek gebruik van het National Longitudinal Study of Youth (NLSY97) datapanel om hun hypothese te kunnen testen. In hun hypothese stellen ze dat de mensen in de categorie light black meer zullen verdienen dan de mensen in de donkerdere categorieën. Ze komen tot deze hypothese aan de hand van eerdere literatuur

(5)

zoals Bertrand en Mullainathan (2003), die stellen dat mensen met een ’blanke’ naam een voordeel zouden hebben op de arbeidsmarkt ten opzichte van de mensen met een ’donkere’ naam en Austen-Smith en Fryer Jr (2005), die stellen dat mensen die zich als blanke mensen gedragen al een voordeel zou leveren op de arbeidsmarkt.

Om onderzoek te kunnen doen naar het verschil in inkomen tussen mensen met verschil-lende huidskleurtinten maken Kreisman en Rangel gebruik van econometrische modellen. Ze beginnen in hun onderzoek met een cross-sectie analyse naar de verschillen tussen de inko-mens. Dankzij het feit dat hun onderzoek gebaseerd is op een vaste groep respondenten over meerdere jaren hebben ze ook de mogelijkheid om een longitudinaal onderzoek te doen naar het verschil in inkomen tussen mensen met verschillende huidskleurtinten.

In het artikel van Kreisman en Rangel (2015) wordt voor de cross-sectie analyse een log-lineair regressiemodel gebruikt om de coëfficiënten van hun model te schatten. Ze komen op basis van dit model tot de conclusie dat mensen in de categorie light black meer verdienen dan de mensen in de categorie medium black, maar dat er niet een significant verschil is tussen de categorieën medium black en dark black. Dit suggereert een negatief niet-lineair verband in het model, terwijl deze niet zo opgesteld is. Dit zorgt voor vraagtekens over de correctheid van het model dat Kreisman en Rangel hebben opgesteld.

In dit onderzoek wordt er getest of het model dat Kreisman en Rangel gebruiken een niet-lineair verband herbergt en als dit het geval is wordt er een nieuw, verbeterd model opgesteld. De testen op lineariteit worden uitgevoerd op basis van Artificial Neural Network (ANN) regressies.

De opbouw van dit onderzoek is als volgt. In het volgende hoofdstuk wordt dieper inge-gaan op het model gebruikt door Kreisman en Rangel (2015) en wordt gekeken naar verge-lijkbare onderzoeken. Tevens wordt de ANN methode verder belicht en zal er achterliggende literatuur besproken worden. Vervolgens wordt in hoofdstuk 3 de opzet van het onderzoek verder besproken. Er wordt dan onder andere dieper ingegaan op de gebruikte data en de te gebruiken methoden voor de lineariteitstoets. Aansluitend in hoofdstuk 4 worden de resul-taten van het onderzoek gepresenteerd en wordt er gediscussieerd over de uitkomst van het onderzoek. Tot slot worden in hoofdstuk 5 de conclusies gegeven.

(6)

2

Achterliggende literatuur

In dit hoofdstuk wordt het onderzoek van Kreisman en Rangel (2015) verder besproken. Er wordt dieper ingegaan op de gebruikte methoden voor hun onderzoek en deze methoden worden vergeleken met vergelijkbare onderzoeken. Tevens wordt de ANN-regressiemethode verder besproken aan de hand van relevante literatuur. Vervolgens wordt de ANN methode vergeleken met de Ordinary Least Squares (OLS) regressiemethode. Tot slot worden de mogelijke lineariteitstoetsen besproken.

2.1

Racial wage gap-modellen

Kreisman en Rangel (2015) borduren in hun onderzoek voort op eerdere onderzoeken van ondere andere Neal en Johnson (1995), Altonji en Pierret (1997) en Oettinger (1996). Ze stellen aan de hand van de bevindingen van de hiervoor genoemde onderzoeken hun model op om de racial wage gap te schatten. Zo wordt er net als door Neal en Johnson gebruikgemaakt van variabelen die aangeven hoeveel vaardigheden de respondenten van de enquête hebben opgebouwd voordat ze toetreding hebben gezocht op de arbeidsmarkt.

Het model van Kreisman en Rangel dat in dit onderzoek wordt getoetst op lineariteit ziet er als volgt uit:

log(wage) = α + β1LightBlack + β2M ediumBlack + β3DarkBlack + β4HGC (1)

+ β5AF QT Z + γ0X + ε

In het model is als de te verklaren variabele log(wage) gekozen, wat staat voor de natuurlijke logaritme van het uurloon van een respondent. In dit model zijn LightBlack, M ediumBlack en DarkBlack dummyvariabelen die 0 zijn als een respondent niet in de categorie behoort en 1 als de respondent wel tot deze categorie behoort. HGC staat in dit model voor Highest Grade Completed, AF QT Z is een variabele die staat voor een gestandardiseerd testresul-taat. X is de matrix die alle controle variabelen bevat die in het model worden opgenomen. Deze bevat onder andere gegevens over de leeftijd van de respondent en het jaar waarin de respondent is ondervraagd. Verder is er ook nog een constante α opgenomen in dit model.

Een ander onderzoek naar hetzelfde onderwerp is uitgevoerd door Goldsmith, Hamilton en Darity (2007). Zij schatten net als Kreisman en Rangel het effect van verschillende huids-kleurtinten onder donkere Amerikaanse mannen op het uurloon ten opzichte van blanke Ame-rikaanse mannen. Goldsmith et al. (2007) maken echter wel gebruik van andere datapanels. Om hun onderzoek te doen maken ze gebruik van de National Survey of Black Americans

(7)

(NSBA 1979) en de Multi City Study of Urban Inequality (MCSUI 1992). In deze datasets worden de donkere mensen ook onderverdeeld in dezelfde drie categorieën als bij het NLSY97 datapanel.

In het artikel van Goldsmith et al. wordt gebruik gemaakt van het volgende model:

log(wage) = α + β1LightBlack + β2M ediumBlack + β3DarkBlack + γ0X + ε (2)

In de matrix X zijn controlevariabelen opgenomen die wat zeggen over het menselijk kapitaal dat de respondenten hebben opgebouwd, de demografische eigenschappen van de responden-ten, eigenschappen van de baan die de respondent op dat moment heeft of andere eigenschap-pen afhankelijk van het model. Er kan geconcludeerd worden dat de modellen die gebruikt zijn door Kreisman en Rangel (2015) en Goldsmith et al. (2007) in grote mate overeenkomen, alleen de controlevariabelen variëren per geschat model.

Als een model van Goldsmith et al. (2007) bestudeerd wordt, kan worden geconcludeerd dat er net zoals bij Kreisman en Rangel (2015) sprake moet zijn van niet-lineaire verbanden. Dit kan gesteld worden omdat er een significant verschil is tussen het inkomen van mensen uit de categorie LightBlack en M ediumBlack, maar tussen M ediumBlack en DarkBlack is er geen sprake van een significant verschil. Dit impliceert dat elke categorie donkerder niet even zwaar telt. Van LightBlack naar M ediumBlack telt zwaarder dan van M ediumBlack naar DarkBlack. Het model van Goldsmith et al. kan net als het model van Kreisman en Rangel verbeterd worden door een niet-lineair verband op te nemen in het model.

Om erachter te komen of er een niet-lineair verband moet worden opgenomen in het model van Kreisman en Rangel (2015) wordt eerst een andere manier van regressie besproken om een test voor lineariteit mogelijk te maken.

2.2

Aritificial Neural Networks

Een veel gebruikte regressiemethode voor dataonderzoek is de kleinstekwadratenmethode. Hier wordt gebruikgemaakt van de leastsquares (LS)-schatter die ervoor zorgt dat de totale kwadratische afstand van de datapunten naar het geschatte model minimaal zijn. Hierdoor kan er gesteld worden dat de foutenmarge zo klein mogelijk is en het model dus zo goed mogelijk is.

Stel er is een standaardmodel bekend:

(8)

In dit model is y een n×1 vector, X een n×k matrix, β een k×1 vector en ε is een n×1 vector. y staat hier voor de te verklaren variabele, wat in het model van Kreisman en Rangel (2015) de logaritme van het uurloon is van de respondenten. X is de matrix die alle verklarende variabelen bevat, dit is bij Kreisman en Rangel onder andere LightBlack, M ediumBlack en DarkBlack. β is de vector van de coëfficiënten. Dit is de vector die geschat wordt door de regressie. ε is de storingsterm van het model met de data per observatie. Deze ε wordt in het kwadraat geminimaliseerd door de kleinstekwadratenmethode. Het geschatte model wordt als volgt weergegeven:

e = y − Xb min b e 0 e = min b (y − Xb) 0 (y − Xb) (4)

De oplossing van de minimalisatie (4) wordt gegeven door Heij et al. (2004):

b = (X0X)−1X0y (5)

waarbij b de geschatte coëfficiënt van β is.

Het OLS-model is een veel gebruikt model omdat het heel makkelijk is om toe te passen. Er is altijd een vaste oplossing voor het model en het model is makkelijk te interpreteren. Voor een goed OLS-model moet er wel sprake zijn van geldende aannames over het model. Als de lineariteitsaanname bijvoorbeeld niet correct is, zal het OLS-model een misvormd beeld geven. Er kan dan sprake zijn van identificatieproblemen.

In een andere regressiemethode wordt gebruikgemaakt van Artificial Neural Networks. Waar bij de LS-methode, die hierboven besproken is, het model lineair van vorm is, hoeft dit bij ANN-regressies niet het geval te zijn. Bij een ANN-regressie is het ook niet altijd mogelijk om de coëfficiënten van de geschatte parameters direct te interpreteren en ANN wordt ook wel een niet-parametrische regressiemethode genoemd.

ANNs zijn anders dan een normale regressie. Een normale LS-regressie volgt altijd de-zelfde berekeningen, terwijl een ANN zichzelf ’traint’. Er wordt een berekening gedaan en dan wordt er een errorfunctie opgesteld die na elke iteratie lager moet uitvallen. Dit gebeurt doordat er wegingen in het netwerk veranderd worden na elke iteratie. Zo ’traint’ het ANN zichzelf om een zo goed mogelijke voorspelling te doen.

Een veel voorkomende vorm van ANNs is de vorm met één hidden layer. Deze hidden layer transformeert de input van het model, in dit geval dus de verklarende variabelen. Deze

(9)

hidden layer kan er als volgt uitzien (Jain, Mao & Mohiuddin, 1996): g(x) = 1

1 + e−x (6)

Deze vorm van hidden layer wordt ook wel de logistische functie genoemd.

Een artikel waarin gebruik is gemaakt van ANNs is het artikel van Landajo, Bilbao en Bilbao (2012). In dit artikel wordt een hedonische prijs functie (HPF) geschat voor een hui-zenmarkt in een Spaanse regio. In het verleden is er gebruik gemaakt van lineairisaties om deze HPF via een lineaire regressie te schatten, maar nu blijkt dat dit eigenlijk een foutieve schattingsmethode is. Er is namelijk gebleken dat deze HPFs in het algemeen niet-lineaire functies zijn. De lineaire schattingen leveren voor het model dan identificatieproblemen op die lastig op te lossen zijn.

Een oplossing voor dit probleem is gevonden in het gebruik van ANNs om het model te schatten. Ze maken gebruik van ANNs omdat deze de kans op misspecificatie in het model aanzienlijk kleiner maken. Overigens wordt in het onderzoek van Landajo et al. ook een lineair en een semi-log lineair model geschat en vergeleken met de resultaten van het ANN model. Het ANN-model van Landajo et al. is van de volgende vorm:

yi = ˜zi0α + m

X

j=1

βjg( ˜zi0γj) + ε; m = 0, 1, ...; i = 1, 2, ..., n (7)

In dit model is ˜zi de vector die alle variabelen per respondent bevat, inclusief de constante die

in het model is opgenomen.De parameters die in dit model geschat worden zijn α, βj en γj.

In dit model is g(x) de eerder genoemde logistische functie (6).

In hun onderzoek gebruiken ze het ANN-model voor verschillende doeleinden. Het wordt gebruikt als een niet-parametrische regressiemethode om de HPF te schatten. Ze gebruiken het ANN-model ook om niet-parametrische misspecificatie toetsen op te stellen voor para-metrische modellen. Een van deze misspecificatie toetsen is de toets op lineariteit die in dit onderzoek zal worden gebruikt om het parametrische model van Kreisman en Rangel (2015) te testen op lineariteit.

Samenvattend kan uit de theorie opgemaakt worden dat een lineair geschat model dat gebaseerd is op niet-lineaire verbanden identificatieproblemen levert. Deze identificatiepro-blemen kunnen tegen worden gegaan door een andere schattingsmethode te gebruiken zoals ANNs. Het model van Kreisman en Rangel (2015) lijkt zo een lineair geschat model te zijn, dat is gebaseerd op niet-lineaire verbanden. Er gaat in het volgende hoofdstuk van dit onder-zoek besproken worden hoe de lineariteitstoets van Landajo et al. (2012) eruitziet. Tevens

(10)

wordt er beschreven hoe het model met behulp van ANNs geschat kan worden zodanig dat er rekening wordt gehouden met de niet-lineaire verbanden.

3

Onderzoeksopzet

In dit hoofdstuk wordt de data besproken die door Kreisman en Rangel (2015) is gebruikt in hun onderzoek. Vervolgens wordt besproken hoe het model van Kreisman en Rangel geanalyseerd gaat worden. Er wordt tevens aandacht besteed aan de te gebruiken ANN-regressiemethode die op de data van Kreisman en Rangel toegepast wordt. Ten slotte wordt er beschreven hoe de test op lineariteit wordt uitgevoerd op basis van de resultaten gevonden in zowel de LS-regressie als de ANN-regressie.

3.1

Data

Om hun onderzoek mogelijk te maken, maken Kreisman en Rangel (2015) gebruik van de NLSY97 database. Deze database bestaat uit een voor de Verenigde Staten representatieve steekproef van ongeveer 9000 respondenten. Kreisman en Rangel hebben alleen mannen opgenomen uit de database die in 2008 in een huidskleurtinten categorie zijn ingedeeld door de afnemer van de enquête. De huidskleurtinten zijn opgesplitst in 10 categorieën, categorie 1 tot en met categorie 10, waarbij categorie 1 staat voor de lichtste donkere mensen en categorie 10 voor de donkerste donkere mensen. Vervolgens noemen ze categorie 1 tot en met 5 de LightBlack groep, categorie 6 en 7 vormen samen de categorie M ediumBlack en categorie 8 tot en met 10 vormen de groep DarkBlack.

De dataset die Kreisman en Rangel gebruiken bevat naast de huidskleurtinten ook ge-gevens over de scholing van de respondent in de vorm van de HGC variabele. Dit staat voor Highest Grade Completed en varieert van 6 tot en met 20, waarbij 6 betekent dat de respondent de Amerikaanse 6th grade heeft afgerond. De hoogste waarde, 20, staat voor het afronden van het 8e jaar of hoger aan een Amerikaanse college. Naast de scholing is er ook

een variabele AF QT Z wat een gestandardiseerde testscore is die wat zegt over de intelli-gentie van de respondent. Verder zijn er nog een aantal controlevariabelen aanwezig in de dataset. Hieronder is een tabel te vinden met de beschrijvende statistiek van de belangrijkste variabelen van de dataset die gebruikt is in het onderzoek van Kreisman en Rangel.

(11)

Figuur 1: Beschrijvende statistiek

Gemiddelde Std. Dev. Min. Max. N

log(wage) 2.638 0.456 0.756 4.793 8428 LightBlack 0.091 0.288 0 1 8428 M ediumBlack 0.127 0.333 0 1 8428 DarkBlack 0.105 0.306 0 1 8428 HGC 12.426 2.433 6 20 8428 AF QT Z -0.112 0.963 -1.535 1.785 8428 Age 24.82564 2.853857 16.16667 31.25 8428

In de tabel hierboven is te zien dat de dataset voor 9.1 procent bestaat uit mensen uit de LightBlack categorie, voor 12.7 procent uit mensen van de M ediumBlack categorie en voor 10.5 procent uit mensen van de DarkBlack categorie. Verder is te zien dat de gemiddelde HGC waarde 12.426 is, wat betekent dat de gemiddelde persoon in de dataset ongeveer met het 1e jaar van een Amerikaanse college is begonnen. In de tabel hieronder is te zien hoe de

verdeling van het logarite van het uurloon is per huidskleurcategorie. Figuur 2: log(wage) per huidskleurgroep

Gemiddelde Std. Dev. Min. Max. N

W hite 2.708679 0.454814 0.7561221 4.793177 5712 LightBlack 2.548614 0.455152 1.256875 4.466691 767 M ediumBlack 2.464447 0.3948494 0.9666409 4.544271 1067 DarkBlack 2.468685 0.4222454 0.9666409 4.751627 882

Hierboven is te zien dat zoals verwacht mensen uit de categorie W hite gemiddeld over het hoogste uurloon beschikken. Zoals verwacht daalt het gemiddelde uurloon als de huidskleur-tint donkerder wordt, behalve van M ediumBlack naar DarkBlack. Het is opmerkelijk dat het uurloon bij mensen in de categorie DarkBlack hoger ligt dan het uurloon van de mensen uit de M ediumBlack categorie.

Om deze data om te kunnen zetten in nuttige informatie zijn bepaalde technieken nodig. Deze technieken worden in de volgende paragraaf besproken.

(12)

3.2

Methodiek

In dit onderzoek wordt gekeken naar het model van Kreisman en Rangel (2015). Hiervoor wordt gebruikgemaakt van hetzelfde model en dezelfde data die gebruikt zijn door Kreisman en Rangel. Om dit model te schatten wordt een LS-regressie uitgevoerd van de logaritme van het uursalaris van de respondenten op de verklarende variabelen. Deze zijn terug te vinden in vergelijking (1). De LS-regressie wordt gedaan door vergelijking (5) uit te voeren in MATLAB.

Vervolgens wordt het model van Kreisman en Rangel geanalyseerd aan de hand van me-thodes die opgesteld zijn door Landajo et al. (2012). Deze meme-thodes zijn gebaseerd op het gebruik van een ANN-model. De eerste stap van de analyse is de lineariteitstoets. Deze wordt opgesteld vanuit een ANN-model.

Het ANN-model heeft de volgende structuur:

Y = ˜Zα + βg(˜Zγ) + ε

De eerste stap is de γ vector schatten. Dit gaat via een iteratief proces. De γ vector wordt willekeurig gekozen uit Γ ≡ [−2, 2]1+N. In dit geval staat N voor het aantal verklarende

variabelen in de ˜Z matrix. Vervolgens wordt er een LS-regressie uitgevoerd in het volgende model:

Y = δG + ε

In dit model is G de matrix met alle verklarende variabelen. Deze matrix is opgebouwd als G = (˜Z g(˜Zγ)). In dit model wordt δ geschat met behulp van de leastsquaresmethode. Vervolgens wordt de mean squared error van de regressie berekend. Deze mean squared error wordt dan opgeslagen. Vervolgens wordt er opnieuw willekeurig een γ vector getrokken uit Γ en dan herhaald dit proces zich steeds weer. Als dit proces zich vaak genoeg heeft herhaald dan wordt het model gekozen met de laagste mean squared error. Nu dit model gekozen is wordt hier het Levenberg-Marquardt algoritme op uitgevoerd. Dit is een niet-lineaire techniek die de waardes van de parameters zo bepaald dat de mean squared error wordt geminimaliseerd. Dit model wordt dan gebruikt om het model van Kreisman en Rangel (2015) te testen op lineariteit. De toets op lineariteit is als volgt opgebouwd. We hebben het ANN-model Y = ˜Zα + βg(˜Zγ) + ε. Hier wordt vervolgens H0 : β = 0 voor alle γ ∈ Γ

getoetst tegen H1 : β 6= 0 voor alle γ ∈ Γ. De toetsingsgrootheid wordt dan als volgt

opgesteld. Eerst wordt de matrix ˜Z herschaald naar het [0, 1] interval. Dan wordt er een LS-regressie uitgevoerd van Y op ˜Z. De residuen e van deze regressie worden vervolgens bewaard. Daaropvolgend wordt er een LS-regressie gedaan van e op G(= (˜Z g(˜Zγ))). Nu

(13)

kan de toetsingsgrootheid d = nR2 bepaald worden met R2 = ˆee00eˆe, ˆe = Gˆζ, waarbij ˆζ de

vector met LS-regressie coëfficiënten is van de regressie van e op G.

Om over deze toetsingsgrootheid wat te kunnen zeggen moet er gekeken worden naar de verdeling onder de nulhypothese. Dit is niet zoals gebruikelijk een bekende verdeling, maar wordt nu benaderd door de Monte Carlo procedure die door Hansen (1996) voorgesteld is.

Mocht er nu blijken dat het model niet-lineair is, dan wordt er aan de hand van ANNs een nieuw model geschat. Dit gebeurt op eenzelfde manier als bij de lineariteitstoets. Er wordt willekeurig een γ vector gekozen. Vervolgens wordt met behulp van deze γ vector de LS-regressie van y op G uitgevoerd. Dit proces wordt weer een groot aantal keren herhaald totdat er een model is gevonden met een kleine mean squared error. Op het model dat de kleinste mean squared error heeft wordt vervolgens het Levenberg-Marquardt algoritme uitgevoerd. Dit model wordt dan voorgesteld als het best gefitte model.

In het volgende hoofdstuk worden de resultaten van de LS-regressie op het lineaire model van Kreisman en Rangel gepresenteerd en besproken. Vervolgens wordt de lineariteitstoets op het model van Kreisman en Rangel uitgevoerd en besproken. Tot slot wordt het ANN-model geschat en geanalyseerd.

4

Resultaten en analyse

In dit hoofdstuk wordt eerst gekeken naar het model opgesteld door Kreisman en Rangel (2015). De resultaten van dit model zullen in kaart worden gebracht en worden besproken. Vervolgens wordt de uitkomst van de lineariteits toets van Landajo et al. (2012) op het mo-del van Kreisman en Rangel (2015) besproken. Ten slotte wordt er gekeken naar het nieuwe model dat opgesteld is met behulp van Artificial Neural Networks.

4.1

OLS-model

Kreisman en Rangel (2015) hebben in hun onderzoek meerdere modellen geschat. In dit onderzoek wordt alleen aandacht besteed aan het model dat controlevariabelen over de leeftijd van de respondent en controlevariabelen over het jaar van afname bevat. De modelspecificatie is te zien in vergelijking (1). In het onderstaande figuur zijn de uitkomsten van het model te vinden dat geschat is met behulp van de leastsquaresmethode.

(14)

Figuur 3: Uitkomst model Kreisman en Rangel (2015) Robust

log(wage) Coëfficiënt Std. Err. t P>|t| [95% Betr. Interval]

Constant 1.165 0.181 6.43 0.000 0.810 1.520 LightBlack -0.100 0.030 -3.34 0.001 -0.159 -0.041 M ediumBlack -0.163 0.025 -6.43 0.000 -0.213 -0.113 DarkBlack -0.139 0.029 -4.7 0.000 -0.197 -0.081 HGC 0.052 0.006 7.63 0.000 0.038 0.065 AF QT Z 0.041 0.011 3.65 0.000 0.019 0.063 Observaties 8428 R2 0.235

Bron: Kreisman en Rangel (2015) Table 5

De belangrijkste resultaten in dit model zijn de coëfficiënten van LightBlack, M ediumBlack en DarkBlack. Deze geven aan hoeveel procent het uursalaris van een persoon uit een van deze drie categorieën verschilt met die van een blank persoon. Zo verdient een persoon uit de categorie LightBlack ongeveer 10 procent minder dan een blanke collega. Wat opvalt is dat personen uit de categorie DarkBlack meer verdienen per uur dan personen uit de categorie M ediumBlack. Verder valt te zien dat zowel HGC als AF QT Z een positief effect hebben op het salaris, wat een verschijnsel is dat verklaard kan worden door de menselijk kapitaal theorie. Tevens zijn er ook nog een aantal controlevariabelen opgenomen in dit model. Het betreft variabelen die corrigeren voor de leeftijd van een respondent en variabelen die laten zien in welk jaar de respondent mee heeft gedaan aan het onderzoek. De uitkomsten van deze coëfficiënten zijn echter niet heel interessant voor de resultaten van het onderzoek van Kreisman en Rangel en worden daarom uit het figuur gelaten.

Uit deze resultaten valt ook op te merken dat het verschil tussen de coëfficiënten van LightBlack en M ediumBlack duidelijk aanwezig is. Het verschil tussen de coëfficiënten van M ediumBlack en DarkBlack is daarentegen minder groot. Dit is de hoofdzakelijke reden dat Kreisman en Rangel een niet-lineair verband in hun model verwachten.

4.2

Lineariteitstoets

Om te controleren of de verwachting van Kreisman en Rangel correct is wordt hun model getoetst op lineariteit. Dit gebeurt aan de hand van de lineariteitstoets zoals die is opgesteld door Landajo et al. (2012). Om hun toets correct op het model van Kreisman en Rangel toe te kunnen passen zijn er een aantal specificaties in de toets gewijzigd. Zo is er nu gebruik

(15)

gemaakt van 10-fold cross validation in plaats van 20-fold. Tevens is het aantal willekeurige bepalingen van γ verhoogd van 1000 naar 5000. Dit is gedaan omdat het aantal variabelen in het model van Kreisman en Rangel groter is dan het aantal variabelen van het model dat Landajo et al. schatten. Als het aantal willekeurige bepalingen van γ gelijk zou zijn gebleven, zou de kans groot zijn dat de er een verkeerde optimale γ gekozen zou worden. De uitkomst van de lineariteitstoets is als volgt:

Figuur 4: Misspecificatie toets op basis van ANN

(1) (2)

Toetsingsgrootheid 110.89 112.214 p-waarde 0.000 0.000

Om een sterke conclusie te kunnen trekken uit de lineariteitstoets is deze twee keer uitge-voerd en zijn de resultaten hierboven weergegeven. Zoals te zien is in beide gevallen de p-waarde 0.000 wat impliceert dat er in beide uitvoeringen van de test voldoende statistisch bewijs is gevonden om de nulhypothese te verwerpen. Dit betekent dat er in het model van Kreisman en Rangel sprake is van niet-lineaire verbanden. Nu is het van belang om met be-hulp van ANN-regressies een nieuw model te schatten dat rekening houdt met de niet-lineaire verbanden.

4.3

ANN-model

Om een ANN-model te kunnen schatten moet in eerste instantie bepaald worden hoeveel hidden layers het model bevat. Het model met één hidden layer is het meest gebruikt en wordt hier dus toegepast voor het toetsen op lineariteit en voor het schatten van het niet-lineaire model. Deze hidden layer is de logistische functie die eerder al beschreven is. Het ANN-model ziet er dus als volgt uit:

Y = ˜Zα + βg(˜Zγ) + ε g(x) = 1

1 + e−x

In de ANN-regressie worden de waardes van α, β en γ geschat. De belangrijkste uitkomsten van de ANN-regressie zien er als volgt uit:

(16)

Figuur 5: ANN-regressie output

1st-layer (α) 1st-hidden layer (γ)

Constante 2.083 -0.489 LightBlack -0.254 -0.389 M ediumBlack -0.065 0.216 DarkBlack -0.064 0.172 HGC -0.074 -0.279 AF QT Z 0.463 0.880 Age 0.034 -0.017 β -2.324 ANN complexity (m) 1 R2 0.246

Bij een ANN-model is het niet makkelijk om de resultaten direct goed te interpreteren, zoals dit wel het geval is bij een OLS-regressie. Er is hier namelijk sprake van een niet-lineaire factor die meegerekend moet worden. Er kan dus niet direct gezegd worden dat een persoon uit de LightBlack categorie ongeveer 25 procent minder verdient dan een blank persoon om-dat de coëfficiënt van LightBlack −0.254 is. Er moet nu ook rekening worden gehouden met het niet-lineaire deel, namelijk de logistische functie. Er zal later in deze paragraaf aandacht besteed worden aan de verdere interpretatie van het model.

Er is door de lineariteitstoets al bewezen dat er sprake is van niet-lineaire verbanden in het model van Kreisman en Rangel (2015). Aan de uitkomsten van het ANN-model kunnen we ook direct zien dat het niet-lineaire verband niet op 0 geschat wordt. De waarden van de γ vector verschillen namelijk allemaal van 0. We weten nu dus zeker dat er niet-lineaire verbanden aanwezig zijn in het model van Kreisman en Rangel.

Nu kunnen we bepalen waar de niet-lineariteit vandaan komt. Dit is het makkelijkst te doen door te kijken naar bepaalde grafieken. Deze grafieken worden opgesteld aan de hand van het geschatte ANN-model. Er wordt gebruik gemaakt van de geschatte coëfficiënten van het ANN-model in combinatie met de rijvector ¯Z die alle gemiddelde waarden bevat van de matrix ˜Z. Vervolgens kiezen we een variabele uit de vector ¯Z die we laten variëren. De variabelen die we laten variëren zullen respectievelijk Age, HGC en AF QT Z zijn. Om het effect van de verschillende huidskleurtinten bij een variërende variabele in kaart te brengen evalueren we ¯Z voor respectievelijk LightBlack = 1, M ediumBlack = 1 en DarkBlack = 1.

(17)

We beginnen het ANN-model te analyseren om achter de effecten van de verschillende huids-kleurtinten op verschillende leeftijden te komen.

Figuur 6: Verschil in log(wage) voor verschillende leeftijden

18 20 22 24 26 28 30 −25 −20 −15 −10 −5 0 Leeftijd Salaris

Verschil tussen White en LightBlack Verschil tussen White en MediumBlack Verschil tussen White en DarkBlack

In deze grafiek wordt het procentuele verschil in uurlonen tussen respectievelijk de groepen LightBlack, M ediumBlack, DarkBlack en W hite weergeven op verschillende leeftijden. De andere verklarende variabelen worden geëvalueerd in hun gemiddelde waarde. Uit deze grafiek kan opgemaakt worden dat het verschil in uurloon tussen de categorieën W hite en LightBlack toeneemt als de leeftijd van de respondent hoger wordt. Op 17 jarige leeftijd is het verschil ongeveer 7.5 procent en op 31 jarige leeftijd is het rond de 9 procent. We zien dat voor de andere twee groepen het verschil juist kleiner wordt als de leeftijd van de respondent toeneemt. Wat verder opvalt is dat het verschil tussen de groepen W hite en M ediumBlack en W hite en DarkBlack over een variërende leeftijd exact gelijk blijft. Op

(18)

elke leeftijd verdienen mensen uit de groep M ediumBlack ongeveer 2.5 procentpunt minder dan mensen uit de groep DarkBlack.

In een lineair model zou het niet uitmaken welke leeftijd een individu heeft. Er zou dan voor elke leeftijd hetzelfde verschil zijn tussen de verschillende categorieën. Hier is wel enigszins sprake van een niet-lineair verband, maar het is maar een klein verschil ten opzichte van een lineair verband. Er is maar een kleine helling in iedere lijn aanwezig. Het echte niet-lineaire verband in het model komt dus ergens anders vandaan. Een andere mogelijkheid is dat de verklaring ligt bij de hoeveelheid scholing die een individu heeft gevolgd.

Figuur 7: Verschil in log(wage) voor verschillende hoogtes van scholing

7 9 11 13 15 17 19 −25 −20 −15 −10 −5 0 HGC Salaris

Verschil tussen White en LightBlack Verschil tussen White en MediumBlack Verschil tussen White en DarkBlack

In bovenstaande grafiek wordt net als in de vorige grafiek het procentuele verschil in uurloon tussen de categorieën LightBlack, M ediumBlack, DarkBlack en W hite weergeven. Nu wordt dit verschil niet afgezet tegen de leeftijd van de respondent, maar tegen de higest grade

(19)

completed variabele. In deze grafiek is direct te zien dat de verschillen veel meer variëren dan bij de vorige grafiek. Er blijkt bij een HGC van 9, dat staat voor 9th grade completed in het Amerikaanse schoolsysteem, dat het verschil in inkomen tussen de LightBlack en W hite groepen minder dan 5 procent is. Opvallend is dat wanneer een respondent een HGC van 20, wat staat voor het 8e jaar van een Amerikaanse college, heeft, het effect van de huidskleur

LightBlack veel groter is. Uit deze grafiek kan ook opgemerkt worden dat de verschillen tussen de groepen M ediumBlack en W hite en DarkBlack en W hite een tegenovergesteld verloop hebben van het verschil tussen LightBlack en W hite. Rond een HGC van 9 is het verschil tussen respectievelijk M ediumBlack en DarkBlack met W hite op het hoogste punt, terwijl dit bij een HGC van 20 afgenomen is tot het laagst.

Wat direct opvalt in de grafiek is dat de lijnen een aanzienlijke kromming bevatten. Het betekent in deze grafiek dat de effecten van de verschillende huidskleurtinten op het loon verschillend zijn voor mensen met verschillende achtergronden wat betreft opleiding. Het is zelfs zo dat rond een HGC van 15, wat staat voor het behalen van het 3e jaar van een

Amerikaanse college, het bijna niks uitmaakt voor het salaris welke donkere huidskleurtint een respondent heeft.

Wat deze krommingen in de grafiek van de HGC aantonen is dat voor verschillende waar-den van de HGC het effect van de huidskleur op het salaris aanzienlijk verschilt. Het laat zien dat het niet-lineaire aspect van het model van Kreisman en Rangel verklaard kan worden door de verschillende effecten van huidskleurtinten bij verschillende scholings niveaus. Nu wordt er gekeken of het intelligentieniveau ook een rol speelt in het niet-lineaire verband in het model van Kreisman en Rangel.

(20)

Figuur 8: Verschil in log(wage) voor verschillende hoogtes van intelligentie −1.3603 −1.0108 −0.6614 −0.3119 0.0376 0.3871 0.7365 1.0860 1.4355 1.7849 −22 −20 −18 −16 −14 −12 −10 −8 −6 −4 −2 0 AFQTZ Salaris

Verschil tussen White en LightBlack Verschil tussen White en MediumBlack Verschil tussen White en DarkBlack

In de grafiek die hierboven te zien is, is wederom het procentuele verschil in uurloon tussen mensen met de drie donkere huidskleurtinten en blanke mensen te zien. Nu is het verschil afgezet tegen de variabele AFQTZ. Uit de grafiek is op te maken dat op het laagste intelli-gentieniveau het verschil in uurloon tussen mensen uit de groep LightBlack en mensen uit de groep W hite ongeveer 19 procent is. Het verschil tussen deze groepen is het kleinst bij een AFQTZ van ongeveer 0.8. Voor mensen uit de groepen M ediumBlack en DarkBlack is het verloop van het verschil wat anders. Het verschil in inkomen voor deze groepen is namelijk het kleinst voor het laagst gemeten intelligentieniveau. Het verschil in uurloon is rond een AFQTZ van 0.7 het grootst.

Wat hier net zo opvalt als bij de grafiek met als variërende variabele HGC is de aanzien-lijke kromming in de lijnen. Het niet-lineaire aspect van het model van Kreisman en Rangel

(21)

zou dus ook door de verschillende effecten van huidskleurtinten bij variërende intelligentieni-veaus verklaard kunnen worden.

5

Conclusie

Er is door Kreisman en Rangel (2015) een model opgesteld dat de effecten van verschillende donkere huidskleurtinten op het salaris in kaart brengt. Dit model is geschat met behulp van de leastsquaresmethode. Als er gebruik wordt gemaakt van de leastsquaresmethode is een belangrijke aanname de lineariteitsaanname. Kreisman en Rangel stuitte na afloop van hun onderzoek op het feit dat er mogelijk sprake was van een niet-lineair verband in hun model. In dit onderzoek is op zoek gegaan naar bewijs voor het niet-lineaire verband in het model van Kreisman en Rangel.

Om deze lineariteit te testen is gebruik gemaakt van een misspecificatietoets die opgesteld is door Landajo et al. (2012). Deze misspecificatietoets maakt gebruik van Artificial Neural Networks. Uit deze toets is gebleken dat er in het model van Kreisman en Rangel sprake is geweest van niet-lineariteit. Dat impliceert dat het model dat ze hebben opgesteld niet helemaal correct is. Om toch een correct model te verkrijgen is gebruik gemaakt van een andere regressiemethode, namelijk Artificial Neural Network regressies. Met behulp van deze regressiemethode is er een nieuw model opgesteld dat rekening houdt met de niet-lineaire aspecten van het model. Met behulp van het nieuwe model is ook gezocht naar een verklaring voor het niet-lineaire aspect van het oorspronkelijke model.

Voor deze verklaringen is gekeken naar drie verschillende variabelen van het model. Er is gekeken naar de het verschil tussen de effecten van de verschillende huidskleuren op het inkomen voor verschillende leeftijden, scholingsniveaus en intelligentieniveaus. Er is gebleken dat verschillende leeftijden niet voor een wezenlijk verschil zorgt tussen de effecten van de verschillende huidskleurtinten op het salaris. Wat wel invloed lijkt te hebben op het ver-schil tussen de effecten van de verver-schilende huidskleurtinten zijn de verver-schillende niveaus van scholing en de verschillende intelligentieniveaus. Er is bijvoorbeeld duidelijk geworden dat als iemand het 3e jaar van een Amerikaanse college heeft afgerond er bijna geen verschil is tussen de inkomens van de verschillende huidskleurtinten. Terwijl als iemand 8 of meer jaar van een Amerikaanse college gevolgd heeft er een verschil is van ongeveer 12 procent in het inkomen tussen iemand uit de LightBlack categorie en iemand uit de M ediumBlack cate-gorie. Tevens is gebleken dat als iemand een bovengemiddeld intelligentieniveau heeft, het verschil in inkomen tussen de LightBlack categorie aan de ene kant en de M ediumBlack en DarkBlack groep aan de andere kant tussen de 10 en 20 procent zit.

(22)

Uit dit onderzoek is duidelijk geworden dat het model van Kreisman en Rangel een niet-lineair verband bevat. Met behulp van het nieuwe model op basis van ANN-regressies is naar voren gekomen dat het effect van de LightBlack huidskleur op het inkomen aanzienlijk afwijkt van de effecten van M ediumBlack en DarkBlack. Het lijkt dus dat het niet-lineaire verband niet te vinden is tussen de categorieën M ediumBlack en DarkBlack, maar tussen de categorieën LightBlack en M ediumBlack.

(23)

Appendix

In deze appendix zullen uitgebreidere tabellen te vinden zijn van de tabellen die in het artikel weergeven worden.

Figuur 9: Uitgebreide beschrijvende statistiek

Gemiddelde Std. Dev. Min. Max. N

log(wage) 2.638 0.456 0.756 4.793 8428 LightBlack 0.091 0.288 0 1 8428 M ediumBlack 0.127 0.333 0 1 8428 DarkBlack 0.105 0.306 0 1 8428 HGC 12.426 2.433 6 20 8428 AF QT Z -0.112 0.963 -1.535 1.785 8428 Age 24.825 2.853 16.166 31.25 8428 Entryage 20.919 2.336 12.916 29.75 8428 yr1999 0.010 0.102 0 1 8428 yr2000 0.022 0.148 0 1 8428 yr2001 0.035 0.184 0 1 8428 yr2002 0.050 0.218 0 1 8428 yr2003 0.070 0.255 0 1 8428 yr2004 0.081 0.274 0 1 8428 yr2005 0.093 0.290 0 1 8428 yr2006 0.118 0.323 0 1 8428 yr2007 0.126 0.332 0 1 8428 yr2008 0.134 0.341 0 1 8428 yr2009 0.132 0.339 0 1 8428

(24)

Figuur 10: Uitkomst model Kreisman en Rangel (2015) Robust

log(wage) Coëfficiënt Std. Err. t P>|t| [95% Betr. Interval]

Constant 1.165 0.181 6.43 0.000 0.810 1.520 LightBlack -0.100 0.030 -3.34 0.001 -0.159 -0.041 M ediumBlack -0.163 0.025 -6.43 0.000 -0.213 -0.113 DarkBlack -0.139 0.029 -4.7 0.000 -0.197 -0.081 HGC 0.052 0.006 7.63 0.000 0.038 0.065 AF QT Z 0.041 0.011 3.65 0.000 0.019 0.063 Age 0.0405 0.006 6.49 0.000 0.028 0.052 Entryage -0.008 0.007 -1.17 0.242 -0.021 0.005 yr1999 0.017 0.068 0.25 0.804 -0.117 0.151 yr2000 0.076 0.063 1.20 0.230 -0.048 0.199 yr2001 0.037 0.056 0.66 0.507 -0.072 0.146 yr2002 0.027 0.050 0.55 0.583 -0.070 0.125 yr2003 0.037 0.044 0.83 0.405 -0.050 0.124 yr2004 0.052 0.040 1.29 0.198 -0.026 0.129 yr2005 0.035 0.035 1.01 0.313 -0.033 0.103 yr2006 0.044 0.029 1.56 0.120 -0.011 0.100 yr2007 0.064 0.024 2.69 0.007 0.017 0.110 yr2008 0.018 0.018 0.98 0.326 -0.017 0.054 yr2009 0.020 0.015 1.40 0.161 -0.008 0.048 Observaties 8428 R2 0.235

(25)

Figuur 11: ANN-regressie output

1st-layer (α) 1st-hidden layer (γ)

Constante 2.083 -0.489 LightBlack -0.254 -0.389 M ediumBlack -0.065 0.216 DarkBlack -0.064 0.172 HGC -0.074 -0.279 AF QT Z 0.463 0.880 Age 0.034 -0.017 Entryage 0.067 0.171 yr1999 0.696 1.323 yr2000 0.205 0.254 yr2001 0.051 0.015 yr2002 0.280 0.507 yr2003 0.152 0.229 yr2004 0.137 0.169 yr2005 0.170 0.272 yr2006 0.072 0.050 yr2007 0.114 0.100 yr2008 0.002 -0.047 yr2009 0.035 0.022 β -2.324 ANN complexity (m) 1 R2 0.246

(26)

Bibliografie

Altonji, J. G. & Pierret, C. R. (1997). Employer learning and statistical discrimination (Rapport). National Bureau of Economic Research.

Austen-Smith, D. & Fryer Jr, R. G. (2005). An economic analysis of "acting white". The Quarterly Journal of Economics, 120 (2), 551–583.

Bertrand, M. & Mullainathan, S. (2003). Are emily and greg more employable than lakisha and jamal? a field experiment on labor market discrimination (Rapport). National Bureau of Economic Research.

Chandra, A. (2000). Labor-market dropouts and the racial wage gap: 1940-1990. The American Economic Review , 90 (2), 333–338.

Goldsmith, A. H., Hamilton, D. & Darity, W. (2007). From dark to light: Skin color and wages among african-americans. Journal of Human Resources, 42 (4), 701–738.

Hansen, B. E. (1996). Inference when a nuisance parameter is not identified under the null hypothesis. Econometrica: Journal of the econometric society, 64 (2), 413–430.

Heij, C., De Boer, P., Franses, P. H., Kloek, T., Van Dijk, H. K. et al. (2004). Econometric methods with applications in business and economics. OUP Oxford.

Jain, A. K., Mao, J. & Mohiuddin, K. (1996). Artificial neural networks: A tutorial. Computer , 29 (3), 31–44.

Kreisman, D. & Rangel, M. A. (2015). On the blurring of the color line: Wages and employment for black males of different skin tones. Review of Economics and Statistics, 97 (1), 1–13.

Landajo, M., Bilbao, C. & Bilbao, A. (2012). Nonparametric neural network modeling of hedonic prices in the housing market. Empirical Economics, 42 (3), 987–1009.

Neal, D. A. & Johnson, W. R. (1995). The role of pre-market factors in black-white wage differences (Rapport). National Bureau of Economic Research.

Oettinger, G. S. (1996). Statistical discrimination and the early career evolution of the black-white wage gap. Journal of Labor Economics, 14 (1), 52–78.

Referenties

GERELATEERDE DOCUMENTEN

En is het niet de Europese rechter, dan is het wel de voor privacy- bescherming verantwoordelijk Europees Commissaris, Viviane Reding, die dit signaal expliciet verwoordde: “This

De zaak werd vervolgens voor de rechter gebracht omdat deze geacht wordt geen belang in de zaak te hebben en daardoor tot een onpartijdig oordeel te kunnen komen.. Maar hoe maakt de

In de eikenopstanden hebben de behandelingen slechts in zeer geringe mate geleid tot de verwachte vestiging van soorten uit eer-

When occupying Germany, Ame- ricans had already done extensive research on the attitude of Germans and on cultural and historical traditions in German society that may have

Het aantal bloemen en knoppen per plant, van de planten, die in fase 1, 2 of 3 de eerste, tweede of laatste twaalf weken van de teelt of in alle fasen verschillende

Het unieke karakter van PXTM-PLD en het gegeven dat inactivatie groeiverstorend werkt, maakt fosfolipase D een geschikt aangrijpingspunt voor

Uit het rapport van Broekema et al (2005) valt op te maken dat er in totaal 12.000 betaalde arbeidsplaatsen zijn waarvan het overgrote deel (7.360) binnen de directe

Uiteindelijk worden de prijzen van landbouwgrond dus beïnvloed door zowel de verhoudingen op de lokale markt als de persoonlijke kenmerken van kopers en verkopers.. Zowel de