• No results found

Examen Statistiek I

N/A
N/A
Protected

Academic year: 2021

Share "Examen Statistiek I"

Copied!
11
0
0

Bezig met laden.... (Bekijk nu de volledige tekst)

Hele tekst

(1)

Examen Statistiek I

18 januari 2019

Punten: 2 3 6 2 1 14

Score:

Naam : Richting :

Lees volgende aanwijzingen alvorens aan het examen te beginnen

• Wie de vragen aanneemt en bekijkt, moet minstens 1 uur blijven zitten.

• Schrijf op 1ste blad duidelijk je volledige naam en richting (en op elk blad je naam).

• Je mag gebruik maken van niet-grafisch rekenmachine, formularium en statistische tabellen. Op het formularium en de tabellen mag niets geschreven staan! Berekeningen moeten altijd schriftelijk uitgevoerd worden tot het moment dat je de waarde zou kunnen opzoeken in een statistische tabel. Bijvoorbeeld: het uitrekenen van een kans onder een normale verdeling moet herleid worden tot een kans onder een standaardnormale

verdeling. Wanneer het nodige aantal vrijheidsgraden niet in de tabel staat, mag je gaan kijken bij het dichtstbijzijnde aantal dat wel in de tabel staat. Werk met 3 cijfers na de komma!

• Alle communicatie-apparatuur is strikt verboden.

• Gebruik de voorziene ruimte om te antwoorden op de vragen (voor- en achterkant).

• Bij het indienen van je examen, geef je ook kladpapier af (maar daar wordt geen rekening mee gehouden tijdens verbetering).

• Let op

– correct (numeriek) antwoord zonder uitleg (of foute uitleg) is weinig/niets waard!

– fout (numeriek) antwoord zonder uitleg is niets waard.

– fout numeriek antwoord (bvb ten gevolge van een rekenfout) met juiste afleiding is veel waard.

Toon dus DUIDELIJK aan hoe je tot ieder numeriek resultaat komt (telegramstijl is toegelaten). Vermeld de gebruikte formules en ook je berekening. Gebruik zoveel mogelijk de wiskundige notatie zoals die in de leerstof is aangebracht. Verklaar nieuwe symbolen.

• Je hebt 3 uur tijd om het examen op te lossen.

VEEL SUCCES !

(2)

1. (2 punten) In een boxplot worden observaties die voorbij de whiskers liggen aangeduid als uitschieters. Stel dat X exponentieel verdeeld is met verwachtingswaarde E[X] = 2.

(a) Hoeveel observaties verwacht je dat er als uitschieters worden aangeduid bij de boxplot van een steekproef uit X bij een steekproefomvang van n = 1000?

(b) Verklaar dit resultaat aan de hand van de vorm van de verdeling van X als je weet dat voor een normale verdeling ongeveer 0.37% van de observaties boven de bovenste whisker liggen en 0.37% van de observaties onder de onderste whisker.

(3)

2. (3 punten) Zij X een discrete toevalsvariabele met de volgende kansdichtheid, die afhangt van een onbekende parameter θ (met 0 6 θ 6 1):

x 0 1 2

P (X = x) θ 2(1 − θ) 3

1 − θ 3

Op basis van een o.o.i.v. steekproef X1, X2, . . . , Xn kan men de volgende schatters voor θ bepalen:

T1= 1 −3

4X¯ en T2= N0

n met ¯X het steekproefgemiddelde en N0 het aantal Xi’s gelijk aan 0.

(a) Bereken de MSE van T1

(4)

(b) Bereken de MSE van T2

(c) Welk van beide schatters zou je verkiezen? Beantwoord deze vraag door de maximale MSE in functie van θ voor beide schatters met elkaar te vergelijken.

(5)

3. (6 punten) In De Morgen kon je op 30/11/2018 de volgende krantenkop lezen:

Minstens ´e´en op de zes Vlaamse specialisten verdient meer dan de premier

In de onderstaande tabel vind je lonen van 30 willekeurig uitgekozen Vlaamse specialisten (in 1000 euro).

mannen 248 319 292 298 314 278 266 298 269 235 208 255 340 278 389 gemiddelde 285.80

variantie 1973.46

vrouwen 282 245 212 323 294 126 258 252 352 401 214 158 247 198 339 gemiddelde 260.07

variantie 5520.07

(a) Onderzoek of je op basis van deze gegevens kan bewijzen dan meer dan ´e´en op zes Vlaamse specialisten meer verdient dan de premier, als je weet dat het loon van de premier 290 000 euro bedraagt. Doe dit aan de hand van een geschikte hypothesetest.

Vermeld zeker H0 en H1 en de gebruikte teststatistiek met de verdeling ervan onder H0, de p-waarde van de test en formuleer je (genuanceerd) besluit op

significantieniveau 0.05. Ga ook na of de voorwaarden die nodig zijn om deze test te mogen uitvoeren, voldaan zijn.

(6)

(b) Maak een schets waarop je de testwaarde en de p-waarde uit de hypothesetest in (a) aanduidt.

(c) Bereken de kans op een type II fout indien de kans dat een Vlaamse specialist meer verdient dan de premier, gelijk is aan 0.3.

(7)

(d) Kan je op basis van deze gegevens besluiten dat een mannelijke Vlaamse specialist gemiddeld 10% meer verdient dan een vrouwelijke Vlaamse specialist? Onderzoek aan de hand van een geschikte hypothesetest. Vermeld zeker H0 en H1 en de gebruikte teststatistiek met de verdeling ervan onder H0, het aanvaardingsgebied van de test en formuleer je (genuanceerd) besluit op significantieniveau α = 0.01. Ga de

voorwaarden om de test te mogen uitvoeren na aan de hand van de grafieken in Figuur 1 en de R-uitvoer op pagina 9.

Vermeld bij het beantwoorden van de vragen steeds welke output en/of grafieken je gebruikt om je conclusie(s) te trekken.

(8)

(e) Leg uit hoe je de hypotheses in (d) kan testen op significantieniveau α aan de hand van een ´e´enzijdig betrouwbaarheidsinterval (je moet het betrouwbaarheidsinterval niet berekenen!).

(9)

250300350

Boxplot van de lonen van mannelijke Vlaamse specialisten Histogram van de lonen van mannelijke Vlaamse specialisten

Frequency

200 250 300 350 400

02468

−1 0 1

250300350

Normale kwantielplot van de lonen van mannelijke Vlaamse specialisten

Sample Quantiles

150200250300350400

Boxplot van de lonen van vrouwelijke Vlaamse specialisten Histogram van de lonen van vrouwelijke Vlaamse specialisten

Frequency

100 150 200 250 300 350 400 450

01234

−1 0 1

150200250300350400

Normale kwantielplot van de lonen van vrouwelijke Vlaamse specialisten

Sample Quantiles

Figuur 1: grafische voorstellingen van de gegevens per groep

> shapiro.test(loon_m) Shapiro-Wilk normality test data: m

W = 0.97607, p-value = 0.9356

> shapiro.test(loon_v) Shapiro-Wilk normality test data: v

W = 0.98822, p-value = 0.9983

(10)

4. (2 punten)

(a) Beschrijf het enkelvoudige lineaire regressiemodel waarmee je de waarde van een kwantitatieve variabele Y op een lineaire manier kan voorspellen aan de hand de waarde van een kwantitatieve variabele X op basis van een steekproef van grootte n.

Leg uit hoe je de parameters in dit model zou schatten. Het is niet nodig om de (afleiding van) de formules voor schatters te geven.

(b) Leg uit hoe je de modelveronderstellingen kan nagaan.

(11)

(c) Men vindt voor deze steekproef dat R2 = 0.35. Interpreteer deze waarde indien aan alle modelveronderstellingen voldaan is. [Enkele zinnen volstaan !]

(d) Welke hypotheses ga je testen om na te gaan of het zinvol is om lineaire regressie uit te voeren?

5. (1 punt) Op de figuur hieronder zie je twee verschillende OC-curves. Naar welk van beide curves zou de voorkeur van de producent uitgaan en welke heeft de voorkeur van de consument? Verklaar je antwoord.

0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9

0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1

curve 1

curve 2

p Pa(p)

Referenties

GERELATEERDE DOCUMENTEN

In deze opgaven kunnen de leerlingen vooruitlopend op de volgende paragraaf zelf een aantal regelmatigheden in de klokvormige verdeling ontdekken die

c) Geef een schatting van het percentage van de Nederlandse mannen met een voetlengte van meer dan 44 cm. d) Schat ook op basis van de gegevens in de database het gemiddelde en de

Daardoor zal de verdeling scheef zijn: mannen met een groot gewicht komen veel vaker voor.... Je moet dan

De afgelopen vijf jaar was de verpleegduur in Nederlandse ziekenhuizen voor heupoperaties ongeveer normaal verdeeld met een gemiddelde van 4,5 dagen en een standaardafwijking van

Een meetwaarde die dus buiten die grenzen valt, komt maar in 5% van alle gevallen voor.. Daarom wijkt deze significant af van

 Bereken dit exact met behulp van je rekenmachine.  Bereken dit benaderend door ervan uit te gaan dat de verdeling normaal is. De tijdsduur van lokale telefoongesprekken is

In al deze gevallen is het van belang dat de wetgever vooraf een duidelijk beeld heeft  van  de  bestaande  drukverdeling  van  de  belastingen.  Dit  is 

13 Voor de wedstrijd wordt een groepsfoto gemaakt van het elftal. Zo'n foto heeft een vaste indeling: zes spelers blij- ven staan, terwijl de andere vijf daarvoor hurken. De