• No results found

Een ondersteunende statistiekcursus: Inhoud

In het project ‘Aspirine’ dienen de studenten zich eerst te realiseren dat er vaste laboratoriumvoorschriften zijn voor de synthese van de werkzame stof in aspirine en voor de bepaling van de hoeveelheid werkzame stof in een aspirine. Daarna liggen de volgende vragen van de studenten voor de hand, als het ondersteunende onderwijs hints in deze richting geeft:

• Als wij aspirines produceren en controleren volgens deze vaste voorschriften, kunnen we de hoeveelheid werkzaam bestanddeel die we in elk van onze aspirines bepalen dan opvatten als trekkingen uit een normale verdeling?

• Als wij van bekende identieke normale verdelingen voor al onze aspirines uitgaan, hoe wordt dan de spreiding in de gemiddelde dosering van onze aspirines beïnvloed door het aantal aspirines? • Wat verandert in de spreiding in de gemiddelde

dosering van onze aspirines als wij alleen van identieke normale verdelingen voor al onze aspirines mogen uitgaan?

• Hoeveel aspirines moeten gecontroleerd worden om een voldoend kleine spreiding te kunnen

garanderen?

Antwoorden op deze vragen komen voort uit de JIT- onderwerpen:

• normale verdelingen,

• sommen en gemiddelden van normaal verdeelde kansvariabelen,

• betrouwbaarheidsintervallen voor gemiddelden van onderling onafhankelijke identiek normaal verdeelde kansvariabelen bij onbekende standaarddeviatie, • vereiste steekproefomvang bij gegeven marge. Ten behoeve van de theoretische consistentie worden twee onderwerpen toegevoegd:

• de maatstaven gemiddelde en standaarddeviatie uit de beschrijvende statistiek,

• betrouwbaarheidsintervallen voor gemiddelden van onderling onafhankelijke identiek normaal verdeelde kansvariabelen bij bekende standaarddeviatie. De projectvraag tien aspirinetabletten van gelijke samenstelling te maken is in de ondersteunende cursus verwerkt door de volgende onderzoeksvragen.

Onderzoeksvraag 1

Hoe kun je de metingen uit figuur 1Avan de hoeveelheid werkzame stof in een zestal aspirines karakteriseren?

Oplossing:

Maatstaven die deze metingen karakteriseren staan in

figuur 1B. Hierbij staat x– voor het gemiddelde, Sx voor de standaarddeviatie en nStat voor het aantal metingen.

Onderzoeksvraag 2

Zou het zestal gegeven metingen kunnen voortkomen uit een normale verdeling?

1 8 1

euclides nr.4 / 2003

FIGUUR 3A Kansberekening bij willekeurige normale verdeling

FIGUUR 3B Resultaat van kansberekening uit figuur 3A

FIGUUR 4A Bepaling grenswaarde bij bekende ‘ -kans’ met ‘inverse’ normale verdeling

Oplossing:

Neem een normale verdeling met een gemiddelde en standaarddeviatie gelijk aan de waarden uit figuur 1B. Genereer een zestal trekkingen uit die normale verdeling, zoals in figuur 2Agebeurt. Vergelijk de resultaten uit figuur 2Bmet de zes voorbeeldmetingen. Hoe kansberekening bij gegeven normale verdelingen verloopt, blijkt uit de figuren 3A en 3Bvoor gegeven grenzen met een te bepalen kans en uit de figuren 4A

en 4Bvoor een gegeven kans en een te bepalen grens.

In de laatste situatie werkt het infstat.9xg-programma altijd met kansen in ‘ -vorm’, zodat slechts één onbekende bovengrens bepaald kan worden. Voor gemiddelden van n onderling onafhankelijke identieke normale verdelingen met gemiddelde µen standaarddeviatie σgeldt de situatie van figuur 5. Een onbekende gemiddelde steekproefuitkomst x– ligt dan tussen µz  σ n   en µz  σ n   met kans 1α. Als, omgekeerd, het gemiddelde µvan de identieke normale verdelingen onbekend is en de gemiddelde steekproefuitkomst x– bekend uit metingen, ontstaat de situatie van figuur 6. Een onbekend gemiddelde µligt dan tussen x–z  σ n   en x–zσ n   met kans 1α.

Onderzoeksvraag 3

Wat is het 95%-betrouwbaarheidsinterval dat hoort bij de 6 metingen uit figuur 1A, onder veronderstelling dat σ0,6?

Oplossing:

In figuur 7Aworden de metingen ingevoerd bij List,

hun frequentie bij Freq en de betrouwbaarheid (in procenten) bij Conf-Level. Het betrouwbaarheids- interval 150,0 < µ< 151,0 volgt uit figuur 7B. Waar figuur 7Aeen invuloefening is, is voor het bepalen van een minimale steekproefomvang om een vereiste precisie voor het onbekende gemiddelde te bereiken wel vereist dat met figuur 6gerekend wordt.

Onderzoeksvraag 4

Hoeveel metingen moeten er verricht worden om het 95%-betrouwbaarheidsinterval voor het onbekende gemiddelde maximaal 0,2 breed te laten zijn? Oplossing:

Uit figuur 6volgt dat z

 0,1. De z-waarde wordt n

verkregen met de ‘inverse’ standaardnormale via een -formulering met onbekende kans 0,950,

2 05

0,975.

Analoog aan figuur 4A en 4Bvolgt z1,96. Het oplossen van n uit 1,96 

 0,6

n



 0,1 geeft n 139. Tot slot volgt de meest praktijkgetrouwe situatie met onbekende standaarddeviatie σin de normale verdeling. Deze wordt geschat door de standaard- deviatie s van de gedane metingen. Daarom heeft het onderliggende kansmodel voor deze situatie een

1 8 2

euclides nr.4 / 2003

FIGUUR 5 Kansinterval voor onbekend steekproefgemiddelde x- bij normale verdeling met gegeven µen σ

FIGUUR 6 Betrouwbaarheidsinterval voor onbekende µbij normale verdeling met gegeven steekproefuitkomst x- en bekende σ

FIGUUR 7A Opdracht betrouwbaarheidsinterval voor gemiddelde µte bepalen met t-waarde voor normale verdeling met onbekende σ

grotere standaarddeviatie dan bij bekende standaard- deviatie van de normale verdeling die de metingen verklaart. Er wordt dan met een t-verdeling met n1 vrijheidsgraden gewerkt in plaats van een normale verdeling. Analoog aan de aanpak bij de normale verdeling wordt met de t-verdeling een betrouwbaar- heidsinterval bepaald dat het onbekende gemiddelde µ met kans 1αbevat bij bekende gemiddelde

steekproefuitkomst x–. Het resultaat is weergegeven in

figuur 7.

Onderzoeksvraag 5

Wat is het 95%-betrouwbaarheidsinterval dat hoort bij de zes metingen uit figuur 1A?

Oplossing:

In figuur 7Aworden de metingen ingevoerd en het

resultaat staat in figuur 7B: 149,8 < µ<151,1. Ook bij de t-verdeling kan naar steekproefomvang gevraagd worden, waarmee een onbekend gemiddelde

µbinnen vooraf gegeven marge vastgesteld kan worden. Deze vragen zijn ingewikkelder dan voor de normale verdeling, omdat de t-waarde afhangt van het aantal vrijheidsgraden.