• No results found

Schatten van proporties

In document Normale verdeling 44 (pagina 29-37)

Practicum

Bij deze paragraaf horen het VUStat-practicum SCHATTEN VAN PROPORTIES, de VUStat-simulatie STEEKPROEVENVERDELING en de VUStat-module NORMALE VERDELING.

Verkennen

In hoofdstuk 3 heb je met behulp van een steekproef een populatieproportie leren schatten. Je hebt toen met behulp van een tabel een

betrouwbaarheidsinterval leren bepalen. Je kunt dat interval ook bepalen met behulp van een normale verdeling, sterker, die tabel in hoofdstuk 3 is opgesteld door berekeningen met de normale verdeling. Met wat je in dit hoofdstuk geleerd hebt zou je zelf zo’n tabel kunnen opstellen.

Opgave 42

Je wilt bepalen hoeveel procent van de Nederlandse vrouwen tussen 15 en 25 jaar rookt. In een aselecte steekproef van 1200 vind je 348 vrouwen die roken. a) Laat zien dat de steekproefproportie ˆp gelijk aan 29% is.

b) Je hebt alleen maar deze ene steekproef en je weet dat het

steekproefresultaat afhankelijk is van toeval. Simuleer daarom een

steekproevenverdeling: neem 1000 keer een steekproef van 1200 en teken het histogram van de steekproefproporties ˆp en de bijpassende

normaalkromme.

c) Een andere simulatie heeft de

steekproevenverdeling van de figuur hiernaast opgeleverd. Neem aan dat de steekproefproporties ˆp normaal verdeeld zijn met gemiddelde 0,29 en

standaardafwijking 0,013. Tussen welke

waarden liggen dan de steekproefproporties van 95% van de vrouwen? d) Geef het betrouwbaarheidsinterval van de populatieproportie bij

betrouwbaarheidsniveau van 95%

e) Doe nu met een betrouwbaarheid van 95% een uitspraak over het percentage vrouwen tussen 15 en 25 jaar die roken.

Opgave 43

a) Simuleer 5000 aselecte steekproeven van 200 uit een populatie van 20000 met een steekproefproportie van 0,25 en maak de bijbehorende

steekproevenverdeling.

b) Ga na, dat deze steekproevenverdeling bij benadering normaal is met gemiddelde   = 0,25. ˆp

c) Schat met behulp van de figuur de standaarddeviatie van deze steekproevenverdeling.

d) Je kunt deze standaardafwijking ook schatten met de formule

 = pˆ (1 pˆ) n

  . Doe dat en laat zien dat de uitkomst ongeveer met je schatting overeen komt.

e) Teken de normaalkromme van de steekproevenverdeling met gemiddelde 0,25 en de standaardafwijking van opgave d.

f) Bereken het betrouwbaarheidsinterval bij een betrouwbaarheidsniveau van 90%.

Uitleg

In hoofdstuk 3 heb je gezien hoe je een steekproevenverdeling kunt gebruiken om uitspraken te doen over een populatieproportie.

Steekproevenverdelingen zijn altijd normaal verdeeld. Daarom kun je met de normale verdeling uitspraken doen over de populatieproportie.

Je neemt de steekproefproportie ˆp als gemiddelde. Het is onhandig om de steekproevenverdeling te moeten simuleren. Wiskundigen hebben een formule gevonden om de standaardafwijking van de steekproevenverdeling uit de gevonden steekproefproportie ˆp en de steekproefgrootte n af te leiden:

ˆ (1 ˆ)

p p

n

  . De formule is ongevoelig voor kleine veranderingen van ˆp .

Heb je in een steekproef van 1200 bijvoorbeeld ˆp = 0,45 gevonden, dan hoort daar theoretisch gesproken een normale steekproevenverdeling bij met  = 0,45 en  = 0, 45 (1 0, 45) 

Dit geeft   0,014.

De steekproevenverdeling is dus normaal verdeeld met  = 0,45 en  = 0,014. Nu kun je bij een gegeven betrouwbaarheidsniveau de foutenmarge berekenen.

Opgave 44

Om te bepalen hoeveel procent van de Nederlanders linkshandig is wordt een aselecte steekproef van 1500 Nederlanders getrokken. Daarvan waren er 136 linkshandig.

a) Hoeveel bedraagt de steekproefproportie? Op hoeveel schat je de populatieproportie dus?

b) Bereken nu met behulp van de formule in de Uitleg de standaarddeviatie van de steekproevenverdeling.

c) Teken de normaalkromme van de steekproevenverdeling van het aantal linkshandigen.

d) Tussen welke grenzen ligt nu het 90%-betrouwbaarheidsinterval?

e) Bereken de grenzen van het betrouwbaarheidsinterval bij een betrouwbaarheidsniveau van 97,5%.

f) Doe nu een statistisch verantwoorde uitspraak over het aantal linkshandigen in Nederland.

Opgave 45

De consumentenbond wil weten of een bepaald type laptop minstens acht uur op de batterij kan werken. Ze testen 50 aselect getrokken laptops van dat type. Het blijkt dat 41 van die laptops inderdaad acht uur werken op de batterij.

a) Hoeveel bedraagt het percentage laptops in de steekproef dat acht uur lang op de batterij werkt?

b) Je wilt nu een uitspraak doen over alle laptops van dat type met een betrouwbaarheid van 95%. Met welke foutenmarge moet je dan rekening houden?

c) Formuleer nu de uitspraak die je met die betrouwbaarheid kunt doen. d) Welke uitspraak kun je doen met een betrouwbaarheid van 90%?

e) Nu worden er 500 aselect getrokken laptops onderzocht. Er blijken 406 van die laptops inderdaad acht uur te werken op de batterij. Welke uitspraak kun je nu met een betrouwbaarheid van 90% doen?

Theorie ***************************************

Door middel van een aselecte steekproef kun je schatten hoeveel procent van een populatie een zekere eigenschap heeft. Je kunt ook met een bepaalde vooraf gekozen betrouwbaarheid zeggen tussen welke waarden deze populatieproportie ligt of de foutenmarge berekenen.

Dat doe je als volgt:

Je berekent de steekproefproportie ˆp .

ˆp is je schatting van de populatieproportie.

 Je bepaalt de standaarddeviatie  van de steekproevenverdeling met de formule ˆp (1 ˆp)

n  

 Je bepaalt de grenswaarden van het betrouwbaarheidsinterval dat hoort bij het gekozen betrouwbaarheidsniveau (vaak 95%).

 De foutenmarge is nu de helft van de lengte van het betrouwbaarheidsinterval tussen beide grenswaarden.

*********************************************

Voorbeeld

Er wordt onderzoek gedaan naar het percentage voorstanders van de hypotheekrenteaftrek onder stemgerechtigden. Gekozen is een

betrouwbaarheidsniveau van 95%.

Steekproef omvang 1000, aantal voorstanders 570. De steekproefproportie is dus 0,57.

De geschatte populatieproportie is daarom ook 0,57 = 57%.

De standaardafwijking van de steekproevenverdeling is  = 0,57 (1 0,57) 1000

  . De geschatte standaarddeviatie is dus 0,0157.

Met de module NORMALE VERDELING bepaal je het 95% betrouwbaarheidsinterval [0,54; 0,60].

Conclusie: Het percentage voorstanders van hypotheekrenteaftrek ligt tussen de 54% en 60% met een betrouwbaarheid van 95%.

Je kunt de conclusie ook zo formuleren: het percentage voorstanders is 57 ± 3% met een betrouwbaarheid van 95%.

Opgave 46 Bekijk het voorbeeld.

a) Ga na dat de grenzen van het 95%-betrouwbaarheidsinterval correct zijn.

b) Bepaal met behulp daarvan de foutenmarge en ga na dat de gedane uitspraak correct is.

Opgave 47

Bij een onderzoek naar de slagingskans voor het rijexamen wordt in een bepaald jaar van een steekproef van 800 pogingen vastgesteld of het examen is gehaald of niet. Van die 800 pogingen bleken er 683 succesvol te zijn.

a) Hoeveel bedraagt de steekproefproportie?

b) Bereken de standaarddeviatie van de steekproevenverdeling.

c) Bepaal de foutenmarge bij een betrouwbaarheid van 90%. Welke uitspraak kun je doen?

Opgave 48

Uit een enquête in opdracht van de Stichting tegen Kanker van maart/april 2007 onder 1988 Belgen bleek 61% voorstander te zijn van het rookvrij maken van cafés. In oktober 2006 was dat nog 55% van de toen ondervraagde personen. a) Bepaal bij het onderzoek van maart/april 2007 de foutenmarge bij een

betrouwbaarheid van 95%.

b) Kun je zeggen dat het aantal voorstanders in de periode van oktober 2006 tot maart 2007 is toegenomen? Geef statistische argumenten voor en tegen deze stelling.

Verwerken

Opgave 49

Voorafgaande aan verkiezingen worden opiniepeilingen gehouden. Daarbij worden door een onderzoeksbureau 2000 aselect getrokken Nederlanders gevraagd naar de partij van hun voorkeur. Het onderzoeksbureau hanteert een betrouwbaarheidsniveau van 90%. Een partij gaat in zo’n opiniepeiling van 30 naar 31 zetels (van de 150 zetels).

Onderzoek of er reden tot vrolijkheid is in verband met het gehanteerde betrouwbaarheidsniveau.

Opgave 50

Op de website van de Dienst Onderzoek en Statistiek van de gemeente Amsterdam stond in december 2008 het volgende:

In totaal hebben 379 Amsterdammers meegedaan aan de telefonische enquête van november. Op de vraag of men voor of tegen de aanleg van de Noord/Zuidlijn is, zegt ongeveer de helft van respondenten (49%) voor de aanleg te zijn. Het percentage voorstanders ligt hoger dan bij de vorige meting: in september was 38% voorstander. Het percentage voorstanders is hiermee terug op het niveau van 2006 toen 48% voorstander was. Het effect van de gebeurtenissen rond de Vijzelgracht lijkt te zijn vervlogen in de mening van Amsterdammers.

a) Met welke betrouwbaarheid kun je zeggen dat het aantal voorstanders in december 2008 van de Noord/Zuidlijn tussen de 47% en de 51% ligt?

b) In september kon men met een betrouwbaarheid van 95% beweren dat het aantal voorstanders tussen de 37% en de 39% lag. Hoeveel mensen zijn er toen ondervraagd?

Overzicht

Je hebt nu alle theorie van het onderwerp “Normale verdeling” doorgewerkt. Het is nu tijd om een overzicht over het geheel te krijgen.

Begrippen

41: gemiddelde  – gewogen gemiddelde – deviatie – variantie – standaardafwijking of standaarddeviatie 

42: normaalkromme – normale verdeling –  en  van een normale verdeling – vuistregels bij een normale verdeling

43: grenswaarde en gebied

44: gemiddelde en standaardafwijking (standaarddeviatie) van: de populatie meetwaarden - de steekproef – de schatting van die van de populatie

45: schatten van proporties - formule voor de standaardafwijking van de steekproefverdeling

Vaardigheden

41: gemiddelde, variantie en standaardafwijking berekenen bij een frequentietabel

42: normale verdeling herkennen aan histogram –  en  herkennen in normaalkromme – vuistregels toepassen

43: gebied onder een normaalkromme weergeven als percentage van het totaal m.b.v. de computer – grenswaarden berekenen bij gegeven percentage onder een normaalkromme -  of berekenen bij gegeven grenswaarden en

percentages

44: gemiddelde m en standaardafwijking s van een steekproef van meetwaarden berekenen – gemiddelde m en standaardafwijking S als schatting van die van de populatie bepalen

45: betrouwbaarheidsintervallen en foutenmarges bepalen met behulp van de steekproevenverdeling benaderd door een normale verdeling.

Opgave 51 Samenvatten

Maak een samenvatting van dit onderwerp door bij elk van de genoemde begrippen een omschrijving of een voorbeeld te geven en bij elk van de genoemde vaardigheden een voorbeeld te geven.

Toetsen

Opgave 52

Open het bestand cijfers CE wi A met de resultaten behaald op het centraal examen wiskunde A van 100 willekeurige kandidaten in één schooljaar.

a) Bereken het gemiddelde en de standaardafwijking van deze resultaten. b) Hoeveel procent van deze kandidaten hadden een resultaat dat meer dan

twee standaardafwijkingen van het gemiddeld aflag?

De zwangerschapsduur bij mensen is normaal verdeeld met een gemiddelde van 266 dagen en een standaarddeviatie van 16 dagen.

a) Bij een premature geboorte wordt het kind minstens drie weken voor het gemiddelde geboren. Hoe groot is de kans daar op?

b) In 7% van de gevallen duurt een zwangerschap zo lang dat de geboorte moet worden ingeleid. Vanaf welke zwangerschapsduur gebeurt dit dus? c) In 1973 beweerde een vrouw dat ze 310 dagen zwanger was geweest omdat

op de dag van de bevalling haar man al 310 dagen als marinier van huis was. Hoe groot is de kans op een zwangerschap van minstens 310 dagen?

Opgave 54

Een bakker bakt kerststollen van 1000 g.

a) Wat is de standaardafwijking als het gemiddelde gewicht 1000 g is en 5% van de stollen minder weegt dan 900 g?

b) Als de standaardafwijking van de stollen 60 g is, hoeveel procent van de stollen weegt dan minder dan 900 g?

c) Hoe groot is het gemiddelde gewicht van de stollen bij een

standaardafwijking van 65 g als 5% van de stollen minder weegt dan 900 g?

Opgave 55

In een fabriek worden sokken machinaal vervaardigd. De gemiddelde lengte van een sok blijkt 47 cm te zijn. De lengte van de sokken is normaal verdeeld met een standaardafwijking van 0,2 cm.

De sokken worden in paren verkocht. In de fabriek worden paren gevormd door willekeurig twee sokken bij elkaar te stoppen.

a) Als één sok een lengte heeft van 46,5 cm, hoe groot is dan de kans dat het lengteverschil met de andere sok van het paar meer dan 0,7 cm bedraagt? b) Als de eerste sok een lengte heeft van 49,5 cm, is dan de kans dat het

lengteverschil met de andere sok van het paar meer dan 0,7 cm is even groot? Licht je antwoord toe.

c) Bepaal deze kans.

Opgave 56 Lengte van vrouwen

In deze opgave bekijk je de lengte van Nederlandse vrouwen. In de loop van deze eeuw zijn de Nederlandse vrouwen steeds langer geworden. De confectie-industrie heeft deze ontwikkeling gevolgd. Dat heeft voor een bepaalde categorie vrouwen onprettige gevolgen gehad.

Neem aan dat in elk jaar de lengte van vrouwen normaal verdeeld is.

Bekend is dat in 1900 de gemiddelde lengte van de Nederlandse vrouw 160 cm was (zie figuur) met een standaardafwijking van 5,7 cm.

a) Bereken hoeveel procent van de vrouwen in dat jaar een lengte tussen 154 cm en 170 cm had.

De confectie-industrie richtte zich gedurende een lange periode op de vrouwen van 154 cm tot 170 cm. In 1960 vielen precies de ‘middelste’ 82% van de vrouwen in deze lengtematen. Dat wil zeggen dat 9% van de vrouwen kleiner was dan 154 cm en 9% groter was dan 170 cm. De gemiddelde lengte van de Nederlandse vrouw was in 1960 dus toegenomen tot 162 cm. Ook de spreiding was iets groter geworden. b) Bereken de standaardafwijking van

de lengte van de Nederlandse vrouw in 1960.

In 1995 is de gemiddelde lengte van de vrouwen in Nederland inmiddels 170 cm geworden met een standaardafwijking van 6,4 cm. Hoewel de confectie-industrie zich in 1995 op een groter percentage richt, namelijk op de

‘middelste’ 90% van de vrouwen, doet zich toch een bijzonder verschijnsel voor. De vrouwen met een lengte van 154 cm tot 170 cm konden in 1960 zonder problemen confectiekleding kopen. Onder deze vrouwen echter is een categorie waarvan de lengte zo is dat ze in 1995 niet meer zonder problemen

confectiekleding kunnen kopen. De vrouwen uit deze categorie blijken in 1995 te klein voor confectiekleding.

c) Welke lengten leidden in 1960 niet maar in 1995 wel tot problemen bij het kopen van confectiekleding? Licht je antwoord toe.

(bron: havo examen wiskunde A in 1998). Opgave 57

Open het bestand cijfers CE wiA met de resultaten behaald op het centraal examen wiskunde A van 100 willekeurige kandidaten in één schooljaar. Je beschouwt deze resultaten als een steekproef voor alle examenkandidaten wiskunde A van dat jaar. De resultaten van al die kandidaten zijn bij benadering normaal verdeeld.

a) Gebruik de steekproef om het gemiddelde en de standaardafwijking van die normale verdeling te schatten.

b) Hoeveel procent van alle kandidaten had dat jaar voor wiskunde A een cijfer hoger dan 8,5?

c) Hoeveel procent van de kandidaten van dat jaar had voor het centraal examen wiskunde A een voldoende (5,5 of hoger)?

Opgave58

Uit een aselecte steekproef van 335 jongeren tussen de 14 en de 18 jaar blijkt dat 40 van hen regelmatig spijbelt. Welke uitspraak kun je op grond hiervan doen over het percentage spijbelaars in deze leeftijdscategorie met een

betrouwbaarheid van 90%? Opgave 59 Tennisballen

Een fabrikant maakt tennisballen. Deze fabrikant wil dat zijn product bij competitiewedstrijden en op toernooien gebruikt mag worden.

De Koninklijke Nederlandse Lawn Tennis Bond (KNLTB) stelt aan ballen die daarvoor gebruikt mogen worden de volgende eis:

“Het gewicht van de bal dient te liggen tussen 56,7 en 58,5 g.”

Het gewicht van de tennisballen van de fabrikant is normaal verdeeld met een gemiddelde van 57,6 g en een standaardafwijking van 0,44 g.

a) Laat zien dat ongeveer 96% van deze tennisballen aan de eis voldoet.

Verder stelt de KNLTB nog een eis aan de zogenaamde stuithoogte van de bal. In de KNLTB-reglementen staat: “De bal wordt losgelaten op een hoogte van 254 cm boven een betonnen vloer. De stuithoogte van de bal dient groter te zijn dan 135 cm en kleiner dan 147 cm. De stuithoogte te meten vanaf het vloeroppervlak tot onderkant bal.” De fabrikant heeft zelf vastgesteld dat 94% van zijn ballen

voldoet aan deze tweede eis. Daarbij is ook gebleken dat de stuithoogte normaal verdeeld is met een gemiddelde van 141 cm.

b) Bereken de standaardafwijking van de stuithoogte van deze ballen.

We nemen aan dat het gewicht van de bal geen invloed heeft op de stuithoogte. c) Hoeveel procent van de door deze fabrikant gemaakte tennisballen zal aan

beide eisen van de KNLTB voldoen? Licht je antwoord toe. (bron: havo examen wiskunde A in 1998).

In document Normale verdeling 44 (pagina 29-37)

GERELATEERDE DOCUMENTEN