stochastische veranderlijken
Christophe Ley Universiteit Gent, 2019-2020
Statistiek I
Outline
1 Verwachtingswaarde of gemiddelde (3.1) Definitie (3.1.1)
Eigenschappen (3.1.2)
Conditionele verwachtingswaarde (3.1.3)
2 Variantie of spreiding (3.2) Definitie (3.2.1)
Eigenschappen (3.2.2) Conditionele variantie (3.2.3) Covariantie (3.3)
3 Momenten en momentgenererende functies (3.4 en 3.5) Momenten en centrale momenten (3.4)
Momentgenererende functies (3.5)
Nood aan samenvattingsmaten
Verdelingsfunctie karakteriseert gegevens volledig.
Vaak nood aan meer beknopte beschrijving.
voorbeeld
Chemische samenstelling van rivieren in de Catskill Mountains (USA) op 38 sites over een periode van 3 jaren.
Outline
1 Verwachtingswaarde of gemiddelde (3.1) Definitie (3.1.1)
Eigenschappen (3.1.2)
Conditionele verwachtingswaarde (3.1.3)
2 Variantie of spreiding (3.2) Definitie (3.2.1)
Eigenschappen (3.2.2) Conditionele variantie (3.2.3) Covariantie (3.3)
3 Momenten en momentgenererende functies (3.4 en 3.5) Momenten en centrale momenten (3.4)
Momentgenererende functies (3.5)
Doel
Samenvattingsmaten voor centrale locatie, spreiding, ...
defini¨eren.
Eerst op basis van FX in de onderstelling dat FX gekend is.
Laterzullen we dit schatten o.b.v. gegevens.
Verwachtingswaarde van discrete s.v. X
Wat is het gemiddelde resultaat na een worp met een dobbelsteen?
verwachtingswaarde of gemiddelde van discrete s.v. X maat voorcentrale locatie
E (X) = Z
G
xdFX(x) ≡
∞
X
i=1
xifX(xi)
met G = {x1, x2, . . . }.
voorbeeld
Gemiddelde SO2−4 concentratie is 61.92 µmol/l.
Verwachtingswaarde van continue s.v. X
verwachtingswaarde of gemiddelde van continue s.v. X maat voorcentrale locatie
E (X) = Z
R
xdFX(x) ≡ Z +∞
−∞
x fX(x) dx.
Voorbeeld: X = N (µ, σd 2) ⇒ E(X) = µ
verwachtingswaarde van stochastische vector (X1, X2, . . . , Xn) vector van marginale gemiddelden (E(X1), E(X2), ..., E(Xn)).
Verwachtingswaarde na transformatie
E{g(X)} kan berekend worden zonder verdelingsfunctie van Y = g(X) te kennen
E {g(X)} = Z
R
ydFY(y) = Z
R
g (x) dFX(x)
Voorbeelden
X = χd 21 ⇒ E(X) = 1.
Kansen kunnen als gemiddelden worden opgevat:
P(A) = Z
A
dFX(x) = Z
R
I (x ∈ A) dFX(x) = E {I(X ∈ A)}
Eigenschappen en beperkingen
E(aX + b) = aE(X) + b E(X1+ X2) = E(X1) + E(X2) Voorbeeld
X= χd 2n⇒ E(X) = n
E(X1X2) = E(X1)E(X2) als X1 en X2 onafhankelijk zijn.
Voor symmetrische verdelingen is E(X) symmetriepunt;
voor scheve verdelingen mogelijks slechte locatiemaat.
Voorbeeld
Over periode van 30 jaar wensen mannen gemiddeld 64.3 partners en vrouwen 2.8.
Gemiddelde zeer gevoelig aan outliers
Eigenschappen en beperkingen
Net zoals log van een som 6= som van de log’s is log van gemiddelde 6= gemiddelde van de log’s!
Jensen’s ongelijkheid: als g convex, dan is E {g (X)} ≥ g {E (X)}
Conditionele verwachtingswaarde
conditionele verwachtingswaarde van Y gegeven X = x verwachtingswaarde van Y in desubgroepwaar X = x:
E (Y |X = x) ≡ Z
R
ydFY |X(y|x) = Z
yfY |X(y|x)dy
Als
Y |X = N (−2.45 + 0.35X, 4)d dan is
E(Y |X) = −2.45 + 0.35X.
Interpretatie
Terwijl
E(Y ) een constanteis, is
E(Y |X) een stochastische veranderlijke met waarde E(Y |X = x) als X = x.
Drukt uit hoe centrale locatie van Y wijzigt in functie van X.
Oefening
Persoon komt lukraak aan tussen 8u en 9u en krijgt dokter te zien op lukraak tijdstip tussen aankomsttijd en 9u.
Verwachte tijd van doktersbezoek als je aankomsttijd kent?
Rekenen met conditionele verwachtingswaarden
oefening
Vereenvoudig E(Y + X − XY + 2|X).
Bij het berekenen van een conditionele verwachtingswaarde E (R|X)
vat men X als een constante op.
oefening
Vereenvoudig E [{X − E(X|Z)} Y ] wetende dat Y ⊥⊥ X|Z.
Regel van herhaalde verwachtingswaarde
Veronderstel dat mannen en vrouwen gemiddeld 80 and 70 kg wegen.
Dan is
E(Y |X) = 70 + 10X
met X = 1 voor mannen en X = 0 voor vrouwen.
Als er 60% vrouwen zijn, wat is dan het gemiddelde gewicht?
Wat we net deden, is volgende berekening:
E(Y ) = E(Y |X = 1)P (X = 1) + E(Y |X = 0)P (X = 0)
= E {E(Y |X)}
Dit is de regel van herhaalde verwachtingswaarde.
Law of iterated expectation
Regel van herhaalde verwachtingswaarde voor willekeurige functie R ≡ r (X, Y ):
E (R) = E {E (R|X)}
Dit vereenvoudigt de berekening gemiddelden m.b.t. meerdere veranderlijken:
1 Bereken E(Y |X); het gemiddelde heeft enkel betrekking op Y ; X wordt vastgehouden.
2 Bereken het gemiddelde van E(Y |X); het gemiddelde heeft enkel betrekking op X, vermits Y reeds weggemiddeld werd.
Oefening
Oefening
Oefening Onderstel dat
P (A = 0|X, Y ) = expit{h(X) + γY }
waarbij h een gekende functie van X is en expit(x) = ex/(1 + ex).
Toon aan dat (voor elke functie ψh(X)):
0 = E {(1 − A [1 + exp{h(X) + γY }]) ψh(X)}
Outline
1 Verwachtingswaarde of gemiddelde (3.1) Definitie (3.1.1)
Eigenschappen (3.1.2)
Conditionele verwachtingswaarde (3.1.3)
2 Variantie of spreiding (3.2) Definitie (3.2.1)
Eigenschappen (3.2.2) Conditionele variantie (3.2.3) Covariantie (3.3)
3 Momenten en momentgenererende functies (3.4 en 3.5) Momenten en centrale momenten (3.4)
Momentgenererende functies (3.5)
Spreiding meten
Typisch aan statistische analyses
is dat ze ook spreiding op gegevens in kaart brengen.
Soms is dat het primaire doel.
voorbeelden
Normale cholesterolwaarden te bepalen.
Nauwkeurigheid van metingen van alcoholconcentratie bepalen.
In alle analyses vormt het ook een secundair doel.
Het verschaft informatie hoe betrouwbaar de resultaten van een steekproef zijn.
Variantie
Afwijking X − E(X) relevant om spreiding te meten.
Verwachtingswaarde van die afwijkingen is 0.
variantie van stochastische veranderlijke X Var (X) ≡ Eh
{X − E (X)}2i
= E(X2) − E(X)2 Voorbeeld: als X = N (µ, σd 2) ⇒ Var(X) = σ2
Voorbeeld: als X = P oi(λ) ⇒ Var(X) = λd
Interpretatie
Nadeel van variantie is dat ze niet interpreteerbaar is op oorspronkelijke schaal.
Voorbeeld: variantie SO2−4 concentratie: 27.46 (µmol/l)2. standaarddeviatie (SD) of standaardafwijking van s.v. X
SD(X) =p
Var(X)
Voorbeeld: SD SO2−4 concentratie: 5.24 µmol/l.
Voor normaal verdeelde metingen is dit interpreteerbaar.
voorbeeld
voor 95% van de rivieren in de Catskill Mountains wordt SO2−4 concentratie verwacht tussen
61.92 ± 2 × 5.24 = [51.44, 72.40] µmol/l
Eigenschappen van variantie
eigenschappen
Var(aX + b) = a2Var(X)
Var(X1+ X2) = Var(X1) + Var(X2) als X1 ⊥⊥ X2 Voorbeeld
X= B(n, p) ⇒ Var(X) = np(1 − p)d
Conditionele variantie
conditionele variantie van Y gegeven X = x variantie van Y in desubgroep waar X = x:
Var (Y |X = x) ≡ Eh
{Y − E (Y |X = x)}2|X = xi
Als
Y |X = N (−2.45 + 0.35X, 4)d dan is
Var(Y |X) = 4.
Motivatie
voorbeeld
Is variabiliteit op gemeten alcoholconcentratie Y in bloed afhankelijk van werkelijke concentratie X in het staal?
Rekenen met conditionele varianties
Oefening
Vereenvoudig Var(Y + X − XY + 2|X) als Var(Y |X) = σ2. Var(Y |X) is een stochastische veranderlijkedie uitdrukt hoe spreiding van Y wijzigt in functie van X.
Bij het berekenen van een conditionele variantie Var (R|X)
vat men X als een constante op.
Regel van herhaalde variantie
regel van herhaalde variantie
voor toevalsveranderlijken X, Y en een functie r is
Var [r(X, Y )] = E [Var{r(X, Y )|X}] + Var [E {r(X, Y )|X}]
Voorbeeld Variantie van
Y = α + βX +
met gemiddeld 0 en variantie σ2 conditioneel op X.
Variantie van toevalsvector
variantie van stochastische vector (X1, X2, . . . , Xn) n × ncovariantiematrixmet elementen
Cov(Xi, Xj) ≡ E [{Xi− E (Xi)} {Xj− E (Xj)}]
= E(XiXj) − E(Xi)E(Xj) Diagonaal bevat varianties.
Off-diagonaal druktsamenhang tussen 2 stochastische veranderlijken uit.
Interpretatie covariantie
Positieve covariantie: Xi % ⇒ Xj %.
Negatieve covariantie: Xi % ⇒ Xj &.
grootteorde moeilijk te interpreteren
Correlatieco¨ effici¨ ent
Standaardisatie helpt om covariantie te interpreteren.
correlatieco¨effici¨ent van s.v. X1 en X2 maat voorsamenhangtussen X1 en X2, steeds gelegen tussen -1 en 1:
Corr(X1, X2) ≡ Cov(X1, X2) pVar (X1)pVar (X2)
voorbeeld
correlatie tussen SO2−4 en Cl− concentraties bedraagt 0.255
Correlatie
Eigenschappen van correlatie
Onafhankelijkheidvan X1 en X2 is equivalentmet Cov {r (X1) , s (X2)} = 0 voor alle meetbare re¨eelwaardige functies r(.) en s(.) waarvoor E {r (X1)} en E {s (X2)} bestaan.
Onafhankelijke toevalsveranderlijken zijn ongecorreleerd.
Ongecorreleerde toevalsveranderlijken vertonengeen lineaire associatie, maar zijn niet noodzakelijk onafhankelijk.
Eigenschappen van correlatie
variantie van som of verschil
Variantie van som
Outline
1 Verwachtingswaarde of gemiddelde (3.1) Definitie (3.1.1)
Eigenschappen (3.1.2)
Conditionele verwachtingswaarde (3.1.3)
2 Variantie of spreiding (3.2) Definitie (3.2.1)
Eigenschappen (3.2.2) Conditionele variantie (3.2.3) Covariantie (3.3)
3 Momenten en momentgenererende functies (3.4 en 3.5) Momenten en centrale momenten (3.4)
Momentgenererende functies (3.5)
Momenten
moment van de k-de orde van stochastische veranderlijke X
µk= E(Xk) voorbeeld: µ1 = E(X).
voorbeeld: voor exponenti¨ele verdeling is µk= k!/λk. centrale moment van de k-de orde van s.v. X
µ0k= Eh
{X − E (X)}ki
voorbeeld: µ02 = Var(X)
Gebruik van momenten
scheefheid
α3 ≡ µ03 (µ02)3/2 =
E h
{X − E (X)}3i
Eh
{X − E (X)}2i3/2
is 0 a.s.a. dichtheidsfunctie symmetrisch is.
kurtosis
α4≡ µ04 (µ02)2 =
Eh
{X − E (X)}4i
Eh
{X − E (X)}2i2
geeft aan hoe zwaar de staarten van de dichtheidsfunctie zijn
Momentgenererende en karakteristieke functie
momentgenererende functie
ψX : R+→ R : ψX(t) ≡ E etX Momentgenererende functie niet altijd gedefinieerd.
karakteristieke functie
φX(t) : R → C : φX(t) ≡ E eitX = E {cos(tX)}+i E {sin(tX)}
Poisson verdeling
ψX(t) = exp [λ {exp(t) − 1}] φX(t) = exp [λ {exp(it) − 1}]
Momenten genereren
gebruik van genererende functies
Momenten van een toevalsveranderlijke berekenen.
Als E(Xk) bestaat, dan is E
Xk
= 1
ik φ(k)X (t) t=0
Als ψX(t) bestaat in omgeving van t = 0, dan bestaan de momenten van alle orde:
E
Xk
= ψ(k)X (t) t=0
Verdeling van som van onafhankelijke s.v.
gebruik van genererende functies
Verdelingsfunctie afleiden van som vanonafhankelijke toevalsveranderlijken.
Verdeling van som van onafhankelijke Poisson veranderlijken;
normale veranderlijken, wetende dat φX(t) = exp
iµt −σ2 2 t2
Uniciteitsstellingen
In tegenstelling tot momenten, karakteriserengenererende functies volledig de verdeling van toevalsveranderlijke.
uniciteitsstelling X= Y a.s.a.d
ψX(t) = ψY(t) < ∞ voor alle t in omgeving van 0 of φX(t) = φY(t), ∀t