www.quickprinter.be
Q
170 A
11,00 €
3de bach HI
Volledige samenvatting
uickprinter
Koningstraat 13
2000 Antwerpen
Econometrie
1
Practicum 0: Herhaling statistiek
Hier vindt u een kort overzicht van enkele belangrijke begrippen uit de voorgaande cursussen statistiek die we zullen gebruiken bij KBM.
3
enkel gehele getallen
(„4,5 mensen antwoorden dit‟ kan je
9
Practicum 1: Inleiding
Tijdens dit eerste werkcollege overlopen we de belangrijkste eigenschappen van schatters en frissen we de kennis over multivariate kansvariabelen op.
Bovendien wordt het begrip hypothesetoets nog eens uitgebreid herhaald aan de hand van een nieuwe toets voor bivariate variabelen.
Mogelijke examenvraag: “Bewijs waarom het steekproefgemiddelde een goede schatter is voor het populatiegemiddeld”.
11
Schatter met kleinste GGA is de beste.
y
2 1 var y i
μ 3 E(yi)
GGA = var + vertekening² var(T1) = var
(Y1, Y2, Y3 zijn onafhankelijk)
= 1
16(varY1 + varY2 + varY3)
=
→ efficiëntste (maar wat is de vertekening?) var(T2) = var = var(T3) = var = V(T1) = |E(T1) – μ| |E
– μ| = | (E(Y1) + E(Y2) + E(Y3) – μ| | – 3| =
V(T2) = analoog = 0
V(T3) = analoog = 0
Je hebt nu de vertekening en de variantie dus nu kan je de GGA‟s gaan bepalen.
GGA(T1) = + =
GGA(T2) = +0² =
GGA(T3) = +0² =
Conclusie: T3 is de beste schatter want kleinste GGA.
12
Verwachte afstand μ m
E(T1) = 0,8m; var(T1) = m² 0,8 = vertekening
E(T2) = m; var(T2) = 1,5m²
V(T1) = |E(T1) – m| = |0,8m – m| = 0,2m
V(T2) = |m – m| = 0
T1 heeft vertekening maar kleine variantie
T2 heeft geen vertekening maar grotere variantie
GGA(T1) = m² + (0,2m)² = 1,04m² → beste
GGTA(T2) = 1,5m² + 0 = 1,50m²
13
= steekproefcovariantie matrix
14 Extra informatie bij voorgaande uitleg ter verduidelijking:
covariantie – variantie – correlatie
steekproef populatie
1 variabele X → variantie
2 variabelen X,Y → covariantie
correlatie Opmerkingen:
X, Y onafhankelijk → cov(X,Y) = 0 maar niet omgekeerd Variantie van functies van variabelen
Stel 2 variabelen X en Y.
var(aX + bY + c) a²var(X) + b²var(Y) + 2abcov(X,Y) a² ²X + b² ²Y + 2ab XY =
covariantiematrix
Voor k variabelen: var(a1X1 + a2X2 + … + akXk) =
populatiecovariantiematrix
De “populatiecovariantiematrix”” is vierkant en heeft dus evenveel rijen als kolommen. Analoog is er de “steekrpoefcovariantiematrix”: s =
„ transponeren rijen & kolommen van
plaats verwisselen waarbij: X = datamatrix =
hier n subjecten (rijen) in k variabelen (kolommen)
18 Shapiro-wilk moet je niet kunnen.
„sig‟ significance p-waarde
Ze zijn alle drie univariaat verdeeld maar men kan niet zeggen of ze multivariaat verdeeld zijn. gezamenlijk dichtheid is multivariaat normaal → marginale dichtheden zijn univariaat normaal (geldt niet omgekeerd)
a. OECD
- kindersterfte: X1
H0: X1 is normaal verdeeld
Ha: X1 is niet normaal verdeeld
Toetsingsgrootheid: d1 = 0,124
P-waarde: p = P(D > d1) = 0,200 > α (α significantieniveau)
→ X1 is normaal verdeeld
- aantal aids: X2
P-waarde: p = 0,027 < α → X2 is niet normaal verdeeld
- calorie-inname: X3
P-waarde: p =0,200 > α → X3 is normaal verdeeld
Conclusie: voor OECD is er geen multivariate normaalverdeling.
(analoge bewerking en zelfde conclusie voor Asian/Pasific en Latin America) c. Africa
analoog maar X1, X2, en X3 zijn wel univariaat normaal, dus “misschien” multivariaat normaal. X1
X2
19
Kritieke waarde (verwerpingsgebied):
1 rechterkritieke waarde namelijk:
AG VG
P-waarde:
p = de kans dat u toetsingsgrootheid nog extremer is dan de berekende waarde met behulp van u steekproef
20 Onderzoeksvraag:
Is het geslacht bepalend voor het correct herkennen van een merk? Kansvariabelen:
2 nominale variabelen (gepaard) Voorwaarden:
ok
Hypothesen:
H0: merk en geslacht zijn onafhankelijk
Ha: merk en geslacht zijn afhankelijk
Toetsingsgrootheid onder H0: geslacht man vrouw merk ja 95 11 41 12 136 neen 55 21 109 22 164 150 150 300 = n Nu is eij =
21 e11 = = 68 e21 = = 82 e12 = = 68 e22 = = 82 Dus x = + … + = 39,22 Beslissingsregel:
H0 wordt verworpen t.v.v. Ha ↔ … ↔ x te groot bij
Kritieke waarde (verwerpingsregel):
1 rechterkritieke waarde namelijk: : = : = 3,841
AG VG = 3,841 P-waarde: p = P( > x) = P( > 39,22) = kans < 0,001 dus < 0,05 Conclusie:
H0 wordt verworpen en dus zijn gender en merk niet onafhankelijk.
Cramers V = met x = 39,22
n = 300
L = min(2,2) = 2
22 (r-1)(k-1) = (4-1)(3-1) = 3 x 2
P( > x) > α → H0 (onafhankelijk) = niet verwerpen
p-waarde
= laag
Percent = 62/440 Row Pct = 62 = 178