• No results found

Hoofdstuk 3: Numerieke karakteristieken van stochastische veranderlijken

N/A
N/A
Protected

Academic year: 2022

Share "Hoofdstuk 3: Numerieke karakteristieken van stochastische veranderlijken"

Copied!
40
0
0

Bezig met laden.... (Bekijk nu de volledige tekst)

Hele tekst

(1)

stochastische veranderlijken

Christophe Ley Universiteit Gent, 2019-2020

Statistiek I

(2)

Outline

1 Verwachtingswaarde of gemiddelde (3.1) Definitie (3.1.1)

Eigenschappen (3.1.2)

Conditionele verwachtingswaarde (3.1.3)

2 Variantie of spreiding (3.2) Definitie (3.2.1)

Eigenschappen (3.2.2) Conditionele variantie (3.2.3) Covariantie (3.3)

3 Momenten en momentgenererende functies (3.4 en 3.5) Momenten en centrale momenten (3.4)

Momentgenererende functies (3.5)

(3)

Nood aan samenvattingsmaten

Verdelingsfunctie karakteriseert gegevens volledig.

Vaak nood aan meer beknopte beschrijving.

voorbeeld

Chemische samenstelling van rivieren in de Catskill Mountains (USA) op 38 sites over een periode van 3 jaren.

(4)

Outline

1 Verwachtingswaarde of gemiddelde (3.1) Definitie (3.1.1)

Eigenschappen (3.1.2)

Conditionele verwachtingswaarde (3.1.3)

2 Variantie of spreiding (3.2) Definitie (3.2.1)

Eigenschappen (3.2.2) Conditionele variantie (3.2.3) Covariantie (3.3)

3 Momenten en momentgenererende functies (3.4 en 3.5) Momenten en centrale momenten (3.4)

Momentgenererende functies (3.5)

(5)

Doel

Samenvattingsmaten voor centrale locatie, spreiding, ...

defini¨eren.

Eerst op basis van FX in de onderstelling dat FX gekend is.

Laterzullen we dit schatten o.b.v. gegevens.

(6)

Verwachtingswaarde van discrete s.v. X

Wat is het gemiddelde resultaat na een worp met een dobbelsteen?

verwachtingswaarde of gemiddelde van discrete s.v. X maat voorcentrale locatie

E (X) = Z

G

xdFX(x) ≡

X

i=1

xifX(xi)

met G = {x1, x2, . . . }.

voorbeeld

Gemiddelde SO2−4 concentratie is 61.92 µmol/l.

(7)

Verwachtingswaarde van continue s.v. X

verwachtingswaarde of gemiddelde van continue s.v. X maat voorcentrale locatie

E (X) = Z

R

xdFX(x) ≡ Z +∞

−∞

x fX(x) dx.

Voorbeeld: X = N (µ, σd 2) ⇒ E(X) = µ

verwachtingswaarde van stochastische vector (X1, X2, . . . , Xn) vector van marginale gemiddelden (E(X1), E(X2), ..., E(Xn)).

(8)

Verwachtingswaarde na transformatie

E{g(X)} kan berekend worden zonder verdelingsfunctie van Y = g(X) te kennen

E {g(X)} = Z

R

ydFY(y) = Z

R

g (x) dFX(x)

Voorbeelden

X = χd 21 ⇒ E(X) = 1.

Kansen kunnen als gemiddelden worden opgevat:

P(A) = Z

A

dFX(x) = Z

R

I (x ∈ A) dFX(x) = E {I(X ∈ A)}

(9)

Eigenschappen en beperkingen

E(aX + b) = aE(X) + b E(X1+ X2) = E(X1) + E(X2) Voorbeeld

X= χd 2n⇒ E(X) = n

E(X1X2) = E(X1)E(X2) als X1 en X2 onafhankelijk zijn.

Voor symmetrische verdelingen is E(X) symmetriepunt;

voor scheve verdelingen mogelijks slechte locatiemaat.

Voorbeeld

Over periode van 30 jaar wensen mannen gemiddeld 64.3 partners en vrouwen 2.8.

(10)

Gemiddelde zeer gevoelig aan outliers

(11)

Eigenschappen en beperkingen

Net zoals log van een som 6= som van de log’s is log van gemiddelde 6= gemiddelde van de log’s!

Jensen’s ongelijkheid: als g convex, dan is E {g (X)} ≥ g {E (X)}

(12)

Conditionele verwachtingswaarde

conditionele verwachtingswaarde van Y gegeven X = x verwachtingswaarde van Y in desubgroepwaar X = x:

E (Y |X = x) ≡ Z

R

ydFY |X(y|x) = Z

yfY |X(y|x)dy

Als

Y |X = N (−2.45 + 0.35X, 4)d dan is

E(Y |X) = −2.45 + 0.35X.

(13)

Interpretatie

Terwijl

E(Y ) een constanteis, is

E(Y |X) een stochastische veranderlijke met waarde E(Y |X = x) als X = x.

Drukt uit hoe centrale locatie van Y wijzigt in functie van X.

Oefening

Persoon komt lukraak aan tussen 8u en 9u en krijgt dokter te zien op lukraak tijdstip tussen aankomsttijd en 9u.

Verwachte tijd van doktersbezoek als je aankomsttijd kent?

(14)

Rekenen met conditionele verwachtingswaarden

oefening

Vereenvoudig E(Y + X − XY + 2|X).

Bij het berekenen van een conditionele verwachtingswaarde E (R|X)

vat men X als een constante op.

oefening

Vereenvoudig E [{X − E(X|Z)} Y ] wetende dat Y ⊥⊥ X|Z.

(15)

Regel van herhaalde verwachtingswaarde

Veronderstel dat mannen en vrouwen gemiddeld 80 and 70 kg wegen.

Dan is

E(Y |X) = 70 + 10X

met X = 1 voor mannen en X = 0 voor vrouwen.

Als er 60% vrouwen zijn, wat is dan het gemiddelde gewicht?

Wat we net deden, is volgende berekening:

E(Y ) = E(Y |X = 1)P (X = 1) + E(Y |X = 0)P (X = 0)

= E {E(Y |X)}

Dit is de regel van herhaalde verwachtingswaarde.

(16)

Law of iterated expectation

Regel van herhaalde verwachtingswaarde voor willekeurige functie R ≡ r (X, Y ):

E (R) = E {E (R|X)}

Dit vereenvoudigt de berekening gemiddelden m.b.t. meerdere veranderlijken:

1 Bereken E(Y |X); het gemiddelde heeft enkel betrekking op Y ; X wordt vastgehouden.

2 Bereken het gemiddelde van E(Y |X); het gemiddelde heeft enkel betrekking op X, vermits Y reeds weggemiddeld werd.

Oefening

(17)

Oefening

Oefening Onderstel dat

P (A = 0|X, Y ) = expit{h(X) + γY }

waarbij h een gekende functie van X is en expit(x) = ex/(1 + ex).

Toon aan dat (voor elke functie ψh(X)):

0 = E {(1 − A [1 + exp{h(X) + γY }]) ψh(X)}

(18)

Outline

1 Verwachtingswaarde of gemiddelde (3.1) Definitie (3.1.1)

Eigenschappen (3.1.2)

Conditionele verwachtingswaarde (3.1.3)

2 Variantie of spreiding (3.2) Definitie (3.2.1)

Eigenschappen (3.2.2) Conditionele variantie (3.2.3) Covariantie (3.3)

3 Momenten en momentgenererende functies (3.4 en 3.5) Momenten en centrale momenten (3.4)

Momentgenererende functies (3.5)

(19)

Spreiding meten

Typisch aan statistische analyses

is dat ze ook spreiding op gegevens in kaart brengen.

Soms is dat het primaire doel.

voorbeelden

Normale cholesterolwaarden te bepalen.

Nauwkeurigheid van metingen van alcoholconcentratie bepalen.

In alle analyses vormt het ook een secundair doel.

Het verschaft informatie hoe betrouwbaar de resultaten van een steekproef zijn.

(20)

Variantie

Afwijking X − E(X) relevant om spreiding te meten.

Verwachtingswaarde van die afwijkingen is 0.

variantie van stochastische veranderlijke X Var (X) ≡ Eh

{X − E (X)}2i

= E(X2) − E(X)2 Voorbeeld: als X = N (µ, σd 2) ⇒ Var(X) = σ2

Voorbeeld: als X = P oi(λ) ⇒ Var(X) = λd

(21)

Interpretatie

Nadeel van variantie is dat ze niet interpreteerbaar is op oorspronkelijke schaal.

Voorbeeld: variantie SO2−4 concentratie: 27.46 (µmol/l)2. standaarddeviatie (SD) of standaardafwijking van s.v. X

SD(X) =p

Var(X)

Voorbeeld: SD SO2−4 concentratie: 5.24 µmol/l.

Voor normaal verdeelde metingen is dit interpreteerbaar.

voorbeeld

voor 95% van de rivieren in de Catskill Mountains wordt SO2−4 concentratie verwacht tussen

61.92 ± 2 × 5.24 = [51.44, 72.40] µmol/l

(22)

Eigenschappen van variantie

eigenschappen

Var(aX + b) = a2Var(X)

Var(X1+ X2) = Var(X1) + Var(X2) als X1 ⊥⊥ X2 Voorbeeld

X= B(n, p) ⇒ Var(X) = np(1 − p)d

(23)

Conditionele variantie

conditionele variantie van Y gegeven X = x variantie van Y in desubgroep waar X = x:

Var (Y |X = x) ≡ Eh

{Y − E (Y |X = x)}2|X = xi

Als

Y |X = N (−2.45 + 0.35X, 4)d dan is

Var(Y |X) = 4.

(24)

Motivatie

voorbeeld

Is variabiliteit op gemeten alcoholconcentratie Y in bloed afhankelijk van werkelijke concentratie X in het staal?

(25)

Rekenen met conditionele varianties

Oefening

Vereenvoudig Var(Y + X − XY + 2|X) als Var(Y |X) = σ2. Var(Y |X) is een stochastische veranderlijkedie uitdrukt hoe spreiding van Y wijzigt in functie van X.

Bij het berekenen van een conditionele variantie Var (R|X)

vat men X als een constante op.

(26)

Regel van herhaalde variantie

regel van herhaalde variantie

voor toevalsveranderlijken X, Y en een functie r is

Var [r(X, Y )] = E [Var{r(X, Y )|X}] + Var [E {r(X, Y )|X}]

Voorbeeld Variantie van

Y = α + βX + 

met  gemiddeld 0 en variantie σ2 conditioneel op X.

(27)

Variantie van toevalsvector

variantie van stochastische vector (X1, X2, . . . , Xn) n × ncovariantiematrixmet elementen

Cov(Xi, Xj) ≡ E [{Xi− E (Xi)} {Xj− E (Xj)}]

= E(XiXj) − E(Xi)E(Xj) Diagonaal bevat varianties.

Off-diagonaal druktsamenhang tussen 2 stochastische veranderlijken uit.

(28)

Interpretatie covariantie

Positieve covariantie: Xi % ⇒ Xj %.

Negatieve covariantie: Xi % ⇒ Xj &.

grootteorde moeilijk te interpreteren

(29)

Correlatieco¨ effici¨ ent

Standaardisatie helpt om covariantie te interpreteren.

correlatieco¨effici¨ent van s.v. X1 en X2 maat voorsamenhangtussen X1 en X2, steeds gelegen tussen -1 en 1:

Corr(X1, X2) ≡ Cov(X1, X2) pVar (X1)pVar (X2)

voorbeeld

correlatie tussen SO2−4 en Cl concentraties bedraagt 0.255

(30)

Correlatie

(31)

Eigenschappen van correlatie

Onafhankelijkheidvan X1 en X2 is equivalentmet Cov {r (X1) , s (X2)} = 0 voor alle meetbare re¨eelwaardige functies r(.) en s(.) waarvoor E {r (X1)} en E {s (X2)} bestaan.

Onafhankelijke toevalsveranderlijken zijn ongecorreleerd.

Ongecorreleerde toevalsveranderlijken vertonengeen lineaire associatie, maar zijn niet noodzakelijk onafhankelijk.

(32)

Eigenschappen van correlatie

variantie van som of verschil

(33)

Variantie van som

(34)

Outline

1 Verwachtingswaarde of gemiddelde (3.1) Definitie (3.1.1)

Eigenschappen (3.1.2)

Conditionele verwachtingswaarde (3.1.3)

2 Variantie of spreiding (3.2) Definitie (3.2.1)

Eigenschappen (3.2.2) Conditionele variantie (3.2.3) Covariantie (3.3)

3 Momenten en momentgenererende functies (3.4 en 3.5) Momenten en centrale momenten (3.4)

Momentgenererende functies (3.5)

(35)

Momenten

moment van de k-de orde van stochastische veranderlijke X

µk= E(Xk) voorbeeld: µ1 = E(X).

voorbeeld: voor exponenti¨ele verdeling is µk= k!/λk. centrale moment van de k-de orde van s.v. X

µ0k= Eh

{X − E (X)}ki

voorbeeld: µ02 = Var(X)

(36)

Gebruik van momenten

scheefheid

α3 ≡ µ0302)3/2 =

E h

{X − E (X)}3i

 Eh

{X − E (X)}2i3/2

is 0 a.s.a. dichtheidsfunctie symmetrisch is.

kurtosis

α4≡ µ0402)2 =

Eh

{X − E (X)}4i

 Eh

{X − E (X)}2i2

geeft aan hoe zwaar de staarten van de dichtheidsfunctie zijn

(37)

Momentgenererende en karakteristieke functie

momentgenererende functie

ψX : R+→ R : ψX(t) ≡ E etX Momentgenererende functie niet altijd gedefinieerd.

karakteristieke functie

φX(t) : R → C : φX(t) ≡ E eitX = E {cos(tX)}+i E {sin(tX)}

Poisson verdeling

ψX(t) = exp [λ {exp(t) − 1}] φX(t) = exp [λ {exp(it) − 1}]

(38)

Momenten genereren

gebruik van genererende functies

Momenten van een toevalsveranderlijke berekenen.

Als E(Xk) bestaat, dan is E

 Xk



= 1

ik φ(k)X (t) t=0

Als ψX(t) bestaat in omgeving van t = 0, dan bestaan de momenten van alle orde:

E

 Xk



= ψ(k)X (t) t=0

(39)

Verdeling van som van onafhankelijke s.v.

gebruik van genererende functies

Verdelingsfunctie afleiden van som vanonafhankelijke toevalsveranderlijken.

Verdeling van som van onafhankelijke Poisson veranderlijken;

normale veranderlijken, wetende dat φX(t) = exp



iµt −σ2 2 t2



(40)

Uniciteitsstellingen

In tegenstelling tot momenten, karakteriserengenererende functies volledig de verdeling van toevalsveranderlijke.

uniciteitsstelling X= Y a.s.a.d

ψX(t) = ψY(t) < ∞ voor alle t in omgeving van 0 of φX(t) = φY(t), ∀t

Referenties

GERELATEERDE DOCUMENTEN

een stofzuiger een caravan Amsterdam een berg een zanger een dokter.

- vacant verklaring voor 1 april van vacante betrekkingen op 1 maart - vaste benoeming op 1 juli en 1 oktober.. Nieuwe procedure vanaf 15

Er zijn 2 grafieken, eentje waar de fout vergeleken met de gevonden waarden is gegeven, en een waar de fout vergeleken met de afgeleiden wordt gegeven... a) Verklaar beiden

  2 Bewijs dat met de nieuwe uitdrukking voor relativistische impuls inderdaad de impuls behouden blijft voor het botsend systeem dat we in de les gezien hebben.. Maximum

Tesamen leven ze in een

(e) Calculate the matrix element for the diagram in chich the incoming particles annihilate to a spin 0, which ten decays in a new electron - positron pair.. First give names

Welke types van de gammaovergang zijn waargenomen tussen de toestanden?. (b) twee neutronen in twee verschillende orbitalen νh 9/2 ⊗

Een blok met massa M is met twee identieke, massaloze veren opgehangen aan het midden van het deksel en het midden van de bodem van een hjolle cilinder met massa M/8, die