• No results found

4. Methodologie en data

4.1. Methodologie

Zoals in hoofdstuk 2 beargumenteerd is er in dit onderzoek voor gekozen om het model van Riddel (2004) toe te passen op de geselecteerde woningdeelmarkten (koop- en vrije huursector) van de vier grote steden (G4). Riddel (2004) en later ook Steiner, (2010) benadrukken dat juist de onbalansen in vraag en aanbod de dynamiek van de woningmarkt bepalen. In dit onderzoek wordt de marktdynamiek geanalyseerd voor zowel de koopsector als de vrije huursector om ze met elkaar te kunnen vergelijken. Deze twee sectoren van de woningmarkt worden als elkaars substituten beschouwd. De mathematische weergave van de langetermijnvraag naar (koop/huur) woningen is vergelijking (2), de mathematische weergave van het aanbod van (koop/huur) woningen is vergelijking (3). In het oorspronkelijke model van Riddel (2004) is ook de huurprijs in het kwadraat opgenomen. Riddel (2004) motiveert dit dat het openomen van de gekwadrateerde huurprijs een betere verklaring oplevert, zonder de bijbehorende onderbouwing te leveren. In dit onderzoek wordt de gekwadrateerde huurprijs niet in beschouwing genomen. In lijn met DiPasquale & Wheaton (1994)wordt de grondprijs (LCt) in het model (3) opgenomen, Riddel (2004) heeft alleen de bouwkosten(CC) in het model opgenomen.

S

t

/Ahh

t

= β

0

+ β

1

P

t

+ β

2

User

t

+ β

3

Rent

t

+ β

4

Y

t

+ ε

t

(2)

S

t

= β

0

+ β

1

P

t

+ β

2

Tbill

t

+ β

3

GDP

t

+ β

4

Vac

t

+ β

5

CC

t

+ β

6

LC

t

+ ν

t

(3)

De onbalansen (εt en νt) zijn de absolute waarde van het ‘residu’ van respectievelijk vergelijking 2 en 31. Vergelijking (4) is de mathematische weergave van de kortetermijnontwikkeling van de vraag en vergelijking (5) is de weergave van de kortetermijnontwikkeling van het aanbod.

1Gedachte achter het schatten van eerst de langetermijn separaat van de kortermijndynamiek is gebaseerd op de error correctiemodeltheorie ontwikkeld door Hendry (1976). Langetermijndynamiek houdt in de schatting van de langetermijnevenwichtmodellen en kortermijn- dynamiek houdt in de schatting van de kortermijndynamiekmodellen, analoog aan die van Van der Minne (2015).

36 Daarbij zijn c’ en a’ΔXt een weergave van modelvariabelen die na schatting een significante relatie blijken te hebben met respectievelijk de vraag en het aanbod

ΔP

t

= δ

1

ε

t-1

+ δ

2

ν

t-1

+ c’ΔX

t

+ w

t

(4)

ΔS

t

= γ

1

ε

t-1

+ γ

2

ν

t-1

+ a’ΔX

t

+ w

t

(5)

De symbolen in de modellen hebben de volgende betekenis

• St = voorraad (huur/koop) woning op tijdstip t. • Pt = koopprijs op tijdstip t.

• Ahht = Aantal huishoudens dat op basis van de leeftijdsverdeling verwacht wordt een (huur/koop) woning te willen bewonen op tijdstip t.

• Usert = gebruikerskosten voor het bezit van de woning op tijdstip t. • Rentt = huurprijs op tijdstip t.

• Yt = inkomen per (leeftijdsgecorrigeerde) huishouden op tijdstip t. • Tbillt = korte termijn financieringskosten op tijdstip t.

• Xt = hypotheekrente op tijdstip t. • Vact = leegstand op tijdstip t.

• CCt = constructiekostenindex op tijdstip t.

• GDPt = bruto binnenlands product per hoofd van de bevolking op tijdstip t. • εt en νt zijn de onbalansen in vraag respectievelijk aanbod uitgedrukt in aantallen

woningen op tijdstip t.

• γ1&2, zijn de parameters van de vertragingseffecten welke de snelheid aangeven waarmee het aanbod reageert op de onbalans in vraag en aanbod.

• 𝛿1&2, zijn de parameters van de vertragingseffecten welke de snelheid aangeven waarmee de vraag reageert op de onbalans in vraag en aanbod.

• wt en ut zijn correctietermen op tijdstip t.

De dynamiek van de woningmarkt (vergelijkingen (2-5)) wordt geschat met behulp van de parametrische meervoudige logistische regressiemethodiek. Voor een logistische regressie is gekozen omdat de data zonder transformatie niet normaal verdeeld zijn, hetgeen een voorwaarde is voor het toepassen van deze methode. De getransformeerde data zijn getoetst op normaliteit met de Shapiro-Wilk test. De nul-hypothese luidt: de variabele is normaal

37 verdeeld. De nul-hypothese wordt aangenomen dan wel verworpen met een betrouwbaarheidsinterval van 95 procent. Naast de voorwaarde van normaliteit moeten de afzonderlijke datareeksen stationair zijn voor betrouwbare resultaten. Hierop is getoetst met behulp van de Augmented Dickey-Fuller test (Brooks & Tsolacos, 2010). De nul-hypothese luidt: de variabele is niet stationair. De nul-hypothese wordt aangenomen dan wel verworpen met een betrouwbaarheidsinterval van 95 procent. De vergelijkingen (2-5) worden gebruikt voor het schatten van afzonderlijke G4 woningmarkten en de G4 geagregeerd. De data van de woningmarkten worden getypeerd als tijdreeksdata Voor het schatten van de woningmarkten is bij het schatten van vergelijking (2) en (3) de 2SLS2 methode toegepast, voor de vergelijking (4) en (5) is een OLS3 toegepast. Op basis van de correlatiematrices en de variantie inflatie analyse is aangetoond dat in bijna alle (datasets van de geselecteerde) woningmarkten sprake is van multicollineariteit. De effecten van multicollineariteit, verkeerde richtingen van correlatiecoeffiënten, worden gedeeltelijk bestreden door gebruik te maken van een ridge kleinstekwadratenschatter (Brooks & Tsolacos, 2010). Deze methode maakt gebruik van een ‘strafwaarde’ welke ervoor zorgt dat de standaardfouten en de coëffiënten van de schattingen kleiner worden. In de schattingen blijft een bepaalde mate van onnauwkeurigeheid zitten. Multicollineariteit heeft echter geen effect op de verklarende kracht van het gehele model en daarmee de R².

22SLS wordt gebruikt om endogeniteit, causaliteit tussen de errorterm en de afhankelijke variabele, te voorkomen in het model waardoor de verklarende variabele niet met de residuen in de vergelijking correleren. In vergelijking (2) wordt Rentt op basis van DiPasquale & Wheaton (1994) en Riddel (2004) als endogene variabele aangemerkt en wordt deze geschat aan de hand van de instrumenten Tbillt, CCt,

S(huur)t,Vact,Vact-1,Pt-1.

In vergelijking (3) worden op basis van DiPasquale & Wheaton (1994) en Riddel (2004) St, Pt, Vact en CCt als endogene variabelen aangemerkt en worden deze geschat aan de hand van respectievelijk de Δ(St), Δ(Pt), Δ(Vact), Δ(CCt). Deze instrumenten zijn echter te zwak om een ridgeregressie te kunnen uitvoeren waardoor er een andere set van sterkere instumenten in dit onderzoek is gebruikt. De set van sterkere instrumenten is geselecteerd met behulp van de Lasso-methode (Tibshirani, 1996)

3De kortertermijn vraag en aanbod wordt geschat aan de hand van een selectie van de modelvariabele en hun waarde t – 1 jaar en t – 2 jaar. De variabele worden geselecteerd aan de hand van allereerst een voorwaarste stapsgewijze selectie methode en vervolgens een

achterwaarste stapsgewijze selectie methoden. De variabele met een lagere significantie dan 30% worden niet in het model opgenomen. Deze methodiek is in lijn met Riddel (2004).

38