• No results found

Voorbeeldtoets Statistiek voor INF en BIT (Module ) tijdsduur 2.15 uur Gebaseerd op HWO 1-4

N/A
N/A
Protected

Academic year: 2022

Share "Voorbeeldtoets Statistiek voor INF en BIT (Module ) tijdsduur 2.15 uur Gebaseerd op HWO 1-4"

Copied!
5
0
0

Bezig met laden.... (Bekijk nu de volledige tekst)

Hele tekst

(1)

Voorbeeldtoets Statistiek voor INF en BIT (Module 6 -201400256) โ€“ tijdsduur 2.15 uur Gebaseerd op HWO 1-4

Deze toets bestaat uit 5 opgaven, een formuleblad en de ๐‘(0,1)-, ๐‘ก-, ๐œ’2- en Shapiro-Wilk-tabellen.

Een gewone rekenmachine is toegestaan, een programmeerbare (GR) niet.

1. Een garage houdt het aantal dagen bij dat een occasion te koop staat.

Van 25 occasions zijn in onderstaande tabel de aantallen verkoopdagen en de bijbehorende numerieke samenvatting gegeven. De meetgegevens zijn al gerangschikt

van klein naar groot.

a. Bepaal het 10de en het 80ste percentiel van deze waarnemingen.

b. Ga na of er sprake is van uitschieters volgens de ๐Ÿ. ๐Ÿ“ ร— ๐‘ฐ๐‘ฒ๐‘จ โˆ’ ๐ซ๐ž๐ ๐ž๐ฅ.

c. Ga met behulp van de numerieke samenvatting en het QQ-plot na of het redelijk is hier een normale verdeling voor de aantallen dagen te veronderstellen.

d. Omdat twijfel gerezen is ten aanzien van de normaliteitsveronderstelling wordt de toets van Shapiro-Wilk uitgevoerd: ๐‘พ = ๐ŸŽ. ๐Ÿ–๐Ÿ•๐ŸŽ. Bepaal het kritieke gebied bij deze toets en trek je conclusie ten aanzien van de normaliteitsveronderstelling met ๐œถ = ๐Ÿ๐ŸŽ%.

2. In een onderzoek naar de effectiviteit van een helpdesk werden onder meer de bedieningsduren van klanten, die de helpdesk een probleem voorlegden, onderzocht. Hieronder staan de gemeten

bedieningsduren (in minuten) in een steekproef van 42 klanten, gerangschikt van klein naar groot.

Het steekproefgemiddelde is ๐’™ = 2.570 en de steekproefstandaardafwijking is ๐’” = 1.421

a. Geef een 95%-betrouwbaarheidsinterval voor de verwachte bedieningsduur van klanten bij de helpdesk. Geef duidelijk aan op welke veronderstellingen dit interval gebaseerd is.

b. Iemand interpreteert het interval onder a. als volgt: โ€œAls we de bedieningsduren van willekeurige klanten meten, zullen zoโ€™n 95 van de 100 bedieningsduren in dit interval liggenโ€.

Is dit een correcte interpretatie? Waarom (niet)?

c. Schat de standaardafwijking van de bedieningsduren met een betrouwbaarheid van 95%.

4 4 8 8 8 Numerieke samenvatting: . Steekproefomvang 25 Steekproefgemiddelde 26.16 Steekproefstandaardafwijking 20.32 Steekproefvariantie 412.98 Steekproefscheefheidcoรซfficiรซnt 1.30

Steekproefkurtosis 4.38 11 11 13 15 15

16 18 18 24 26 27 29 29 33 34 51 52 54 62 84

0.20 0.62 0.63 1.02 1.08 1.23 1.23 1.24 1.38 1.45 1.80 1.85 1.86 1.91 1.93 1.99 2.10 2.11 2.16 2.21 2.24 2.26 2.29 2.37 2.41 2.42 2.49 2.57 2.81 2.94 3.10 3.34 3.66 3.69 3.81 3.98 4.52 4.67 4.95 5.22 5.76 6.44

(2)

3. Het nut van de marktwerking in de zorg wordt betwist door tal van politieke partijen en maatschappelijke organisaties. Een deel van hen is voorstander van een terugkeer naar het systeem van โ€œziekenfondsโ€, nu in de vorm van een solidaire zorgverzekering voor alle bevolkingsgroepen. Een eerste indicatief

onderzoek moet uitwijzen of een meerderheid voor afschaffen van de marktwerking is. Daartoe gaat een opiniepeiler 200 willekeurig gekozen Nederlanders na enige uitleg bij de vraagstelling de vraag

voorleggen of hij/zij vรณรณr het afschaffen van de markwerking is. ๐’‘ is de fractie van voorstanders van afschaffen onder alle Nederlanders. In de (aselecte) steekproef van 200 personen blijken er 111 voorstander van afschaffen te zijn.

a. Toont de steekproef aan dat de meerderheid van de Nederlanders vรณรณr afschaffen is,?

Voer de toets uit in 8 stappen met ๐œถ๐ŸŽ= ๐ŸŽ. ๐ŸŽ๐Ÿ“, door het kritiek gebied te bepalen.

b. Bepaal ook de overschrijdingskans van de toets in a en geef aan voor welke waarden van ๐œถ๐ŸŽ (tussen 1% en 10%) ๐‘ฏ๐ŸŽ wordt verworpen.

c. Bereken het onderscheidend vermogen van de toets in a. als het percentage voorstanders van afschaffen in werkelijkheid 60% is.

4. In een onderzoek onder UT-studenten is aantal zaken gemeten. Ten aanzien van het gewicht verwachtten de onderzoekers dat mannen gemiddeld zwaarder zijn dan vrouwen (zoals meestal uit dit soort

onderzoeken blijkt). De meetgegevens waren het (o.m.):

Gewicht (in kg) Aantal Gemiddelde Standaardafwijking

vrouw 21 61.3 7.0

man 60 73.9 10.8

a. Ga met een geschikte toets na of de verwachting van de onderzoekers juist is (โ€œmannen zijn aantoonbaar zwaarder dan vrouwenโ€). Gebruik de 8 stappen van de toetsingsprocedure met ๐œถ = ๐ŸŽ. ๐ŸŽ๐Ÿ.

b. Bij a. werd onder meer aangenomen dat de varianties gelijk zijn. Is dit een correcte aanname? Voer daartoe een geschikte toets uit: vermeld (alleen) 1. de hypothesen, 2. de toetsingsgrootheid en zijn

waarde, 3. het kritieke gebied en 4. de conclusie die je daaruit trekt m.b.t. de toets onder a., met ๐œถ = ๐Ÿ“%.

c. Als de normaliteit van de twee gewichtspopulaties geen houdbare aanname blijkt, welke toets kunnen we dan al alternatief uitvoeren? Vermeld ook 1. de hypothesen, 2. De formule van de toetsingsgrootheid en 3. De benaderende verdeling die je in dit geval gebruikt om de overschrijdingskans te bepalen.

5. De gegevens in bovenstaand onderzoek zijn bij nader inzien afkomstig uit een tweetal enquรชtes, รฉรฉn onder INF/BIT en รฉรฉn onder Create studenten (die nu samen module 6 doen). Nagegaan werd ook of zij het nieuwe TOM-onderwijs aantrekkelijk vinden. In de volgende tabel zie je de resultaten samengevat:

We vatten deze cijfers op als resultaten van een steekproef uit een grotere populatie (van bijv. ook toekomstige studenten). Ga met een geschikte toets na of de twee groepen studenten verschillende opinies hebben over de aantrekkelijkheid van TOM. Gebruik de toetsingsprocedure met ฮฑ = 1%.

Opinie over aantrekkelijkheid TOM

Mee eens/neutraal Mee oneens Totaal mee oneens

Studie INF/BIT 15 12 3

Create 6 19 28

(3)

Uitwerkingen:

Opgave 1

a. Het 10de percentiel: 10% van 25 is 2.5, dus het 10de percentiel is ๐’™(๐Ÿ‘) = ๐Ÿ– Het 80ste percentiel: 80% van 25 is 20, dus het 80ste percentiel is ๐’™(๐Ÿ๐ŸŽ)+๐’™(๐Ÿ๐Ÿ)

๐Ÿ = ๐Ÿ‘๐Ÿ’+๐Ÿ“๐Ÿ๐Ÿ = ๐Ÿ’๐Ÿ. ๐Ÿ“ b. 25% van 25 is 6.25, dus ๐‘ธ๐Ÿ= ๐’™(๐Ÿ•) = ๐Ÿ๐Ÿ en ๐‘ธ๐Ÿ‘= ๐’™(๐Ÿ๐Ÿ—) = ๐Ÿ‘๐Ÿ‘, dus IKA = 33 โ€“ 11 = 22.

(๐‘ธ๐Ÿโˆ’ ๐Ÿ. ๐Ÿ“ ร— ๐‘ฐ๐‘ฒ๐‘จ, ๐‘ธ๐Ÿ‘+ ๐Ÿ. ๐Ÿ“ ร— ๐‘ฐ๐‘ฒ๐‘จ) = (โˆ’๐Ÿ๐Ÿ, ๐Ÿ”๐Ÿ”), dus 1 (potentiรซle) uitschieter: 84

c. 1. De numerieke waarden van de scheefheidcoรซfficiรซnt 1.30 (> 0, dus scheefheid naar rechts) en de kurtosis 4.38 wijken af van de referentiewaarden 0 resp. 3 van de normale verdeling, (maar ook van de referentiewaarden van de exponentiรซle verdeling (2 resp. 9).

2. het normale Q-Q plot vertoont een duidelijk patroon (middenstuk boven de lijn ๐’š = ๐’™ en de rest eronder)

Conclusie: al met al is vanwege de evidente scheefheid naar rechts de normale verdeling wellicht geen correct model.

d. uit de Shapiro-Wilk tabel met ๐’ = ๐Ÿ๐Ÿ“ volgt:

- het kritieke gebied voor ๐œถ = ๐Ÿ๐ŸŽ% is: ๐‘พ โ‰ค ๐’„ = ๐ŸŽ. ๐Ÿ—๐Ÿ‘๐Ÿ

- ๐‘พ = ๐ŸŽ. ๐Ÿ–๐Ÿ•๐ŸŽ < ๐’„, dus ๐‘ฏ๐ŸŽ verwerpen: de verdeling van het aantal dagen is niet normaal met een onbetrouwbaarheid van 5%.

Opgave 2

a. We passen het normale model toe met onbekende ฮผ en ฯƒ2 (dus de โ€œt-procedureโ€):

Model: de bedieningsduren ๐‘ฟ๐Ÿ, โ€ฆ , ๐‘ฟ๐Ÿ’๐Ÿ zijn o.o. en alle N(ยต, ฯƒ2)-verdeeld (Zie formuleblad:) het 95%-BI (ฮผ) heeft grenzen ๐’™ ยฑ ๐’„ โˆ™ ๐’”

โˆš๐’ , met x = 2.57, ๐’” = 1.421, ๐’ = 42

en, uit de t41-tabel: P(T41 โ‰ฅ ๐’„) = ยฝ ฮฑ = 0.025, dus ๐’„ = 2.02 (we nemen de t40-tabel als โ€œbeste benaderingโ€).

Dus 95%-BI (ฮผ) = (2.13, 3.01)

b. Deze interpretatie is onjuist (er liggen ook maar 12 van de 42 waarnemingen binnen dit interval, dus minder dan 30%). Het betrouwbaarheidsinterval heeft betrekking op de verwachte bedieningsduur (= het gemiddelde van alle mogelijke bedieningsduren) en niet op de waarde van รฉรฉn bedieningsduur.

c. 95%-betrouwbaarheidsinterval (ฯƒ) = (โˆš(๐‘›โˆ’1)๐‘†๐‘ 2

2 , โˆš(๐‘›โˆ’1)๐‘†๐‘ 2

1 ),

met ๐‘ƒ(๐œ’๐‘›โˆ’12 โ‰ค ๐‘1) =12๐›ผ en ๐‘ƒ(๐œ’๐‘›โˆ’12 โ‰ค ๐‘2) = 1 โˆ’12๐›ผ (zie formuleblad!).

Hierin is n = 42, S2 = 1.4212, c1 = 24.4 en c2 = 59.3 zodat ๐‘ƒ(๐œ’412 โ‰ค ๐‘1) = 2.5% en ๐‘ƒ(๐œ’๐‘›โˆ’12 โ‰ฅ ๐‘2) = 2.5%.

Dus 95%-BI(ฯƒ) โ‰ˆ (1.18, 1.84) Opgave 3

a. 1. ๐‘‹ = โ€œaantal voorstanders in de steekproef metโ€:

๐‘‹ is ๐ต(200, ๐‘)-verdeeld, met ๐‘ = โ€œde onbekende fractievoorstanders inde populatieโ€.

2. We toetsen ๐ป0: ๐‘ =12 tegen ๐ป1: ๐‘ > 12 met ๐›ผ0 = 5%

3. Toetsingsgrootheid ๐‘‹

4. Onder ๐ป0 geldt: ๐‘‹ ~๐ต (200,12) , dus bij benadering ๐‘(100, 50) 5. Waargenomen: ๐‘ฅ = 111

6. Verwerp ๐ป0 als ๐‘‹ โ‰ฅ ๐‘.

๐‘ƒ(๐‘‹ โ‰ฅ ๐‘|๐ป0) =c.c. ๐‘ƒ (๐‘‹ โ‰ฅ ๐‘ โˆ’12|๐ป0) = ๐‘ƒ(๐‘ โ‰ฅ ๐‘โˆ’0.5โˆ’100

โˆš50 )= 1 โˆ’ ฮฆ (๐‘โˆ’0.5โˆ’100

โˆš50 )โ‰ค ๐›ผ0 = 0.05

(4)

Dus ๐‘โˆ’0.5โˆ’100

โˆš50 โ‰ฅ 1.645, ofwel ๐‘ โ‰ฅ 100.5 + 1.645 โˆ™ โˆš50 โ‰ˆ 112.13 . Dus ๐‘ = 113.

7. ๐‘ฅ = 111 ligt niet in het kritieke gebied (< 113), dus ๐ป0 niet verwerpen.

8. Met een onbetrouwbaarheidsdrempel van 10% is niet aangetoond dat meer dan de helft voor het afschaffen van de marktwerking in de zorg is.

b. Als ๐ป0: ๐‘ = ยฝ , is ๐‘‹ bij benadering N(100, 50). Dus (met continuรฏteitscorrectie):

P(X โ‰ฅ 111|๐ป0 ) c.c.= P(X โ‰ฅ 110.5|๐ป0) = ๏ƒท๏‚ป ๏€ญ ๏‚ป

๏ƒธ

๏ƒง ๏ƒถ

๏ƒจ

๏ƒฆ ๏€ญ ๏‚ณ ๏€ญ ( . )

P X . 1 148

50 100 5 110 50

100 ๏† 6.9%

De P-waarde = 6.9% โ‰ค ๐›ผ0 , als ๐›ผ0 โ‰ฅ 6.9%. Dus ๐ป0 wordt allรฉรฉn verworpen ๐›ผ0 โ‰ฅ 6.9%.

c. ๐›ฝ(0.6) = ๐‘ƒ(๐‘‹ โ‰ฅ 113|๐‘ = 0.6) = ๐‘ƒ (๐‘ โ‰ฅ112.5โˆ’200โˆ™0.6

โˆš200 โˆ™ 0.6 โˆ™ 0.4) = ๐‘ƒ(Z โ‰ฅ โˆ’1.08) = ฮฆ(1.08) โ‰ˆ 86.0%.

Opgave 4

a. 1. Modelaannames (โ€œstatistische veronderstellingenโ€):

het gaat om twee onafhankelijke, aselecte steekproeven van gewichten, uit de ๐‘(๐œ‡1, ๐œŽ2)-verdeling voor ๐‘›1 = 21 vrouwen en de ๐‘(๐œ‡2, ๐œŽ2)-verdeling voor ๐‘›2 = 60 mannen (gelijke ฯƒโ€™s!)

Formeler: de opbrengsten ๐‘‹1, โ€ฆ , ๐‘‹21, ๐‘Œ1, โ€ฆ , ๐‘Œ60 zijn o. o., ๐‘‹๐‘– ~๐‘(๐œ‡1, ๐œŽ2) en ๐‘Œ๐‘— ~๐‘(๐œ‡2, ๐œŽ2) 2. We toetsen ๐ป0: ๐œ‡1 = ๐œ‡2 tegen ๐ป1: ๐œ‡1 < ๐œ‡2 met ฮฑ = 1%

3. Toetsingsgrootheid ๐‘‡ = ๐‘‹1โˆ’๐‘‹2

โˆš๐‘ 2(211+601) met S2 =20๐‘†21+60โˆ’212+59๐‘†22 4. T is onder ๐ป0 t-verdeeld met ๐‘‘๐‘“ = ๐‘›1 + ๐‘›2 โˆ’ 2 = 18

5. Waargenomen: ๐‘ 2 = 20ร—7.02 + 59ร—10.879 2 โ‰ˆ 99.52 (๐‘  โ‰ˆ 9.98), dus ๐‘ก = 61,3โˆ’73.9

โˆš99.52(211+601)= โˆ’4.98 6. De toets is tweezijdig: verwerp ๐ป0 als ๐‘‡ โ‰ค โˆ’๐‘ met ๐‘ = 2.374 uit de ๐‘ก79 โ‰ˆ ๐‘ก80tabel 7. ๐‘ก = โˆ’4.98 ligt in het kritieke gebied, dus ๐ป0 verwerpen.

8. De gewichten van de vrouwen zijn gemiddeld aantoonbaar lager dan die van mannen bij een onbetrouwbaarheid van 1%.

6./7. Met overschrijdingskans bij de waargenomen ๐‘ก = โˆ’4.98:

๐‘ƒ(๐‘‡79 โ‰ค โˆ’4.98) โ‰ˆ ๐‘ƒ(๐‘‡80 โ‰ฅ 4.98) < 0.0005, dus ook kleiner dan 1% = ฮฑ, dus ๐ป0verwerpen,

b. De F-toets op de gevraagde punten:

1. Toets ๐ป0: ๐œŽ12 = ๐œŽ22 tegen ๐ป1: ๐œŽ12 โ‰  ๐œŽ22met ๐›ผ = 5%

2. Toetsingsgrootheid ๐น =๐‘†๐‘†12

22 =10.87.022 โ‰ˆ 0.42

3. Het is een tweezijdige toets: verwerp ๐ป0 als ๐น โ‰ค ๐‘1 of ๐น โ‰ฅ ๐‘2. ๐‘ƒ(๐น5920 โ‰ฅ ๐‘2) =๐›ผ2 = 0.05 , dus (volgens de ๐น6020-tabel) ๐‘2 = 1.94 ๐‘ƒ(๐น5920 โ‰ค ๐‘1) = ๐‘ƒ (๐น2059 โ‰ฅ ๐‘1

1) =๐›ผ2 = 0.05, dus ๐‘1

1 = 2.22 , ofwel ๐‘1 โ‰ˆ 0.45 4. De waarde ๐น = 0.41 ligt niet in het kritieke gebied (< 0.45), dus ๐ป0 verwerpen.

We mogen dus niet gelijke varianties veronderstellen, bij een onbetrouwbaarheid van 5%

c. Wilcoxonโ€™s rangsomtoets: we toetsen ๐ป0: ๐น(๐‘ฅ) = ฮฆ (๐‘ฅโˆ’๐œ‡๐œŽ ) tegen ๐ป1: ๐น(๐‘ฅ) โ‰  ฮฆ (๐‘ฅโˆ’๐œ‡๐œŽ ) met ๐‘Š = โˆ‘21๐‘–=1๐‘…(๐‘‹๐‘–), die onder ๐ป0 bij benadering normaal verdeeld is met:

๐ธ(๐‘Š) =12๐‘›1(๐‘ + 1) =12โˆ™ 21 โˆ™ 82 = 861 en ๐‘ฃ๐‘Ž๐‘Ÿ(๐‘Š) = 121 ๐‘›1๐‘›2(๐‘ + 1) = 8610 Opgave 5

(5)

Er is hier sprake van twee (o.o.) aselecte steekproeven, dus een toets op homogeniteit van de meningsverdelingen van de twee populaties INF-BIT en Create.

De berekening van ๐ธฬ‚0๐‘๐‘–๐‘— =kolomsom ร— rijsom

๐‘› in onderstaande tabel levert ๐ธ๐‘–๐‘— โ‰ฅ 5 op voor alle (๐‘–, ๐‘—)

1. De aantallen N11, N12, N13 in de meningsklassen voor de INF-BIT studenten is multinomiaal verdeeld met ๐‘›1 = 100 en kansen p11, p12 en p13 . En N21, N22 en N23 analoog voor de Create studenten: multinomiaal verdeeld met ๐‘›2 = 100 en kansen p21, p22 en p23

2. We toetsen ๐ป0: ๐‘11= ๐‘21, ๐‘12 = p22 en p13 = p23 (gelijke meningsverdelingen) tegen ๐ป1: ๐‘1๐‘— โ‰  ๐‘2๐‘— voor minstens รฉรฉn waarde van ๐‘— met ๏ก ๏€ฝ0.01

3. Toetsingsgrootheid is ๐œ’2 = โˆ‘ โˆ‘(๐‘๐‘–๐‘—โˆ’๐ธฬ‚0๐‘๐‘–๐‘—)

2

๐ธฬ‚0๐‘๐‘–๐‘— met schattingen ๐ธฬ‚0๐‘๐‘–๐‘— =kolomsom ร— rijsom ๐‘›

4. Onder H0 heeft ๐œ’2 heeft een Chi kwadraat verdeling, aantal vrijheidsgraden df = (r โ€“ 1)(c โ€“ 1) = 2 5. We berekenen eerst de verwachte aantallen bij onafhankelijkheid: zie tabel hierboven: ๐ธฬ‚0๐‘๐‘–๐‘— = ๐ธ๐‘–๐‘— Waargenomen: ๐œ’2 = (15โˆ’7.6)7.6 2+(6โˆ’13.4)13.4 2+(12โˆ’11.2)11.2 2+(19โˆ’19.8)19.8 2+(3โˆ’11.2)11.2 2+(28โˆ’19.8)19.8 2 = 20.78 6. We verwerpen ๐ป0 als ๐œ’2 โ‰ฅ ๐‘. In de ๐œ’2-tabel met df = 2 vinden we ๐‘ โ‰ˆ 9.21

7. De uitkomst 20.78 ligt in het kritiek gebied (> 9.21), dus ๐ป0 verwerpen.

8. Bij significantieniveau 1% is een verband tussen de mening over TOM en de studierichting aangetoond.

Opinie over aantrekkelijkheid TOM

Mee eens/neutraal Mee oneens Totaal mee oneens Totaal Studie INF/BIT ๐‘11=15, ๐ธ11 =7.6 ๐‘12 =12, ๐ธ12 = 11.2 ๐‘13 =3, ๐ธ13= 11.2 30

Create ๐‘21 = 6, ๐ธ21 = 13.4 ๐‘22=19, ๐ธ22 =19.8 ๐‘23=28, ๐ธ23= 19.8 53

Totaal 21 31 31 83 = ๐‘›

Referenties

GERELATEERDE DOCUMENTEN

C: Een dioxine is opgebouwd uit twee benzeen moleculen, die verbonden zijn door twee zuurstofatomen en waarbij minimaal op plaats 2, 3, 7 en 8 een chlooratoom aanwezig is. D:

Toets thema 2 Het Lichaam Pagina 1 Toets thema 2: Het lichaam.. Kiezen

Toets thema 4 Eten en Drinken Pagina 1 Toets thema 4: Eten en drinken.. Vul de

Het materiaal voor de voor- en achterkant kost 3 Euro per dm 2 en voor de twee zijkanten van de doos 2 Euro per dm 2. Voor welke afmetingen van de doos is de

[Je kunt dit ook nog eens apart nagaan in dit geval door de scalaire producten uit te rekenen.] Dus de drie vectoren zijn onderling loodrecht als en slechts als p = 2.. (c)

Initiยจ eel is de asteroยจฤฑde op zeer grote afstand van de zon, heeft een constante snelheid V en beweegt zich in de richting van een rechte lijn waarop de kortste afstand tot de zon d

Geef uitleg over je oplossingen; antwoorden zonder heldere afleiding worden als niet gegeven beschouwd.. Het gebruik van een rekenmachine is niet nodig en ook

Geef de matrix van deze samengestelde transformatie van het vlak aan (met betrek- king tot de standaardbasis van R 2 ) en bereken waar de de vier punten uit deel (i) onder