Exact competentiegericht

(1)

Exact competentiegericht

Statistiek voor het laboratorium Uitwerkingen versie juli-2016

T.J. Kleintjes

(2)

Opgave 1.1 Precisie en juistheid bij het schieten

Opgave 1.2 Precisie en juistheid van metingen - precies en juist  D

- precies en onjuist  C - niet precies en juist  B - niet precies en onjuist  A

Opgave 1.3 Hoe geven we de meetonzekerheid weer?

a v = 135 ± 3 km/h

relatieve meetonzekerheid = 100% 2,2% 135

3  

v = 135 km/h ± 2,2 % b

Opgave 1.4 Meer metingen doen: duplo en triplo (meetonzekerheid bekend)

a relatieve meetonzekerheid = 100% 11,9% 126

15  

132 135 138

3 3

B

C D

A

nauwkeurig en juist onnauwkeurig en juist

nauwkeurig en onjuist onnauwkeurig en onjuist

1 Precisie en juistheid

(3)

b De meting wordt 2  nauwkeuriger dus absolute meetonzekerheid = 10,6

2

15  afgerond 11 mg/L c

Aantal metingen (n) meetonzekerheid

1 ± 15

2 ± 11

3 ± 9

4 ± 8

….. ± 5

9 3 5 3

5 15

15   n   n ₂  n

d gemiddelde = 127,3

3 127 129

126  

De meting wordt 3  preciezer dus absolute meetonzekerheid = 8,66

3

15  afgerond 9 mg/L Zoutgehalte = 127 ± 9 mg/L

Zoutgehalte = 127 mg/L ± 7,1 %

Opgave 1.5 Schatting van een onbekende meetonzekerheid a

b

w = hoogste waarde– laagste waarde = 35,5 – 32,8 = 2,7 g/100g

c gemiddelde = 33,8

3

5 , 35 8 , 32 2 ,

33   

g/100g d verschil = 35,5 – 33,8 = 1,7 g/100g

e de spreiding = 1,7 g/100g

f de spreiding in % = 100% 5,0% 8

, 33

7 ,

1  

g vetgehalte = 33,8 ± 1,7 g/100 g vetgehalte = 33,8 g/100 g ± 5,0 %

32 33 34 35

meetonzekerheid = 15 10,6 2

meetonzekerheid 11 (afgerond)



(4)

R1 bijvoorbeeld 100, 97 en 103 R2 bijvoorbeeld 200, 100 en 300

R3 die kun je niet vergelijken, omdat het gemiddelde verschilt

R4 nee

R5 omdat de relatieve meetonzekerheid rekening houdt met de gemiddelde waarde

Opgave 1.6 Het suikergehalte van cola

gemiddelde waarde = 8,9 g/100 mL

spreiding (absolute meetonzekerheid) = 9,3 – 8,9 = 0,4 g/100 mL spreiding in % (relatieve meetonzekerheid) = 100% 4,5%

9 , 8

4 ,

0  

suikergehalte = 8,9 ± 0,4 g/100 mL Opgave 1.7 Bacteriën tellen

gemiddelde waarde per plaat = 51 KVE meetonzekerheid = 65 – 51 = 14 KVE meetonzekerheid in % = 100% 27,5%

51

14 

KVE waarde = 51 ± 14 KVE 10⁴ keer verdund dus

KVE waarde = 5110⁴ ± 1410⁴ KVE/mL

betere notatie: KVE waarde = (51 ± 14)10⁴ KVE/mL relatief KVE waarde = 5110⁴ KVE/mL ± 27,5%

Opgave 1.8 Juistheid van een meting bepalen

a je moet de werkelijke waarde van het controlemonster weten

b gemiddelde = 24,3 mg/L (controlemonster niet meenemen!!)

spreidingsbreedte = 24,3 – 24,0 = 0,3 mg/L absolute meetonzekerheid = 0,3

relatieve meetonzekerheid = 100% 1,2% 3

, 24

3 ,

0  

c ja, het gemeten controlemonster valt binnen de opgegeven grenzen, dus er is geen reden om aan te nemen dat de meting niet juist zou zijn

Opgave 1.9 Het ℮-teken

a Van 100 tot 200  4,5 % van 200 g = 9 g 1.1

(5)

of van 200 tot 300  9 g b tussen 191 g en 209 g

c Van 100 tot 200  4,5 % van 175 mL = 7,9 mL d 9 mL van 265 mL = 100% 3,4%

265

9  

Opgave 2.1 Toevallige meetfout door de waarnemer 1,55 cm

2 cijfers achter de komma

Opgave 2.2 Meer streepjes is nauwkeuriger?

boven 1,8 cm 1 decimaal onder 1,86 cm 2 decimalen Opgave 2.3 Afleesonnauwkeurigheid bij glaswerk

middelste maatcilinder: 3,0 mL afleesonnauwkeurigheid 0,1 mL rechter maatcilinder: 0,34 mL afleesonnauwkeurigheid 0,01 mL buret: 46, 55 mL afleesonnauwkeurigheid 0,02 of 0,03 mL Opgave 2.4 De schaalverdeling bepaalt hoe goed je kunt aflezen

a de thermometer links heeft als kleinste schaaldeel 0,1 C en de thermometer rechts heeft als kleinste schaaldeel 1 C b links 32,35 C en rechts 32,4 C

c links 0,02 C en rechts 0,2 C d de thermometer links

R1 4 significante cijfers

R2 er is een schatting gemaakt tussen de streepjes van 23,1 en 23,2 dus het kleinste schaaldeel is 0,1 C

R3 het laatste cijfer R4 4 significante cijfers R5 ongeveer 0,05 mL

R6 nee, de relatieve afleesonnauwkeurigheid wordt dan veel te groot

R7 het is eigenlijk niet fout, want je kunt het niet beter met de beschikbare middelen

2 Meetresultaten verschillen. Hoe komt dat?

2.1

(6)

Opgave 2.5 Toevallige fout bij aflezen van grafieken

a bij 21,3 C max. vochtigheid = 18,5 ± 0,2 g/m³ (of 0,3) bij 21,3 C max. vochtigheid = 18,5 g/m³ ± 1,08 % bij 6,7 C max. vochtigheid = 7,5 ± 0,2 g/m³ (of 0,3)) bij 6,7 C max. vochtigheid = 7,5 g/m³ ± 2,67 % b relatieve vochtigheid = 100% 40,5%

5 , 18

5 ,

7  

c totale onnauwkeurigheid = 1,08 % + 2,67 % = 3,75 % absolute onnauwkeurigheid = 3,75 % van 40,5 % = 1,52 % relatieve vochtigheid = 40,5 ± 1,5 % (absoluut)

relatieve vochtigheid = 40,5 % ± 3,75 % (relatief) Opgave 2.7 Systematische fout bij een liniaal

a het nulpunt ligt niet gelijk met de zijkant van het kaartje b ongeveer 0,5 cm

c de fout precies bepalen en alle meetwaarden corrigeren Opgave 2.8 Systematische fouten

a niet waterpas zetten

b niet goed kalibreren (ijken) c niet op nul stellen

d bij de verkeerde temperatuur gebruiken

Opgave 2.9 Systematische fout: de instrumentonnauwkeurigheid a Hygrometer

waarde = 66,5 %

afleesmeetonnauwkeurigheid 0,2-0,5 %

instrumentmeetonnauwkeurigheid 1,0 % (1 schaaldeel = 2%)  ½ schaaldeel = 1 %)

Universeelmeter waarde = 14,19 V

afleesmeetonnauwkeurigheid 0 V (!!) instrumentmeetonnauwkeurigheid 0,01 V (1 schaaldeel=0,01 V)

b waarde = 28,1 C

afleesmeetonnauwkeurigheid 0,1-0,2 C

instrumentmeetonnauwkeurigheid 0,5 C (1 schaaldeel = 1C  ½ schaaldeel = 0,5 C)

c volume = 42,24 mL

afleesmeetonnauwkeurigheid 0,02-0,03 mL instrumentmeetonnauwkeurigheid 0,05 mL (1 schaaldeel = 1mL  ½ schaal = 0,5 mL)

(7)

Opgave 2.10 Wat doe je met twee onnauwkeurigheden?

a Als je door het aflezen er bijv. 0,2 C naast kunt zitten en het instrument wijkt maximaal 0,5 C af, dan kun je maximaal 0,7 C ernaast zitten

b 74,0 C

c Ongeveer 0,2 C d 2  2 C = 4 C

e Maximaal 4 C + 0,2 C = 4,2 C

f gecombineerde onnauwkeurigheid  4²0, 2² 4, 0 g T = 74  4 C

h relatieve onnauwkeurigheid = 100% 5,4% 74

4  

i De grootste afwijking is 4 C, dus dat is hetzelfde Opgave 2.11 Twee onnauwkeurigheden 1

2 2

1 2

spreiding totaal  spreiding spreiding

2 2

12  8 biologische spreiding2

2 2

biologische spreiding  12 8 8,9 % Opgave 2.12 Twee onnauwkeurigheden 2

2 2

1 2

spreiding totaal  spreiding spreiding

2 2

0,45  0,30 fout analist2

2 2 2

0,45 0,30 fout analist2

2 2

fout analist2 0, 45 0,30 0,335 Opgave 2.13 Verschilmeting

a V = Vbegin – Veind = 35,18 – 11,56 = 23,62 mL

b Dat betekent dat alle metingen maximaal 0,05 mL kunnen afwijken

c Het verschil blijft dan precies hetzelfde dus 23,62 mL d De onnauwkeurigheid in de resultaat is dan 2  de

afleesonnauwkeurigheid, dus 0,04 mL

e Bij een verschilmeting met één instrument hoef je alleen rekening te houden met de afleesonnauwkeurigheid Opgave 2.14 Instrumentonnauwkeurigheid in de manual

a resolution = 0,1 C (of F)

(8)

b accuracy = 0,2 C (of 0,4 F)

c 115,8  0,2 C  afwijking in % = 100% 0,17% 8

, 115

2 ,

0  

R8 Nee, het is de maximale afwijking die de thermometers onderling kunnen verschillen

R9 Worstcase betekent slechtste geval R10 Dat ze maximaal 0,5 C verschillen R11 schatting van de fout: ongeveer 1,3

R12 Hier is een verandering opgetreden waardoor het gemiddelde is verschoven en er een systematische afwijking is ontstaan

R13 Een toevallige fout zal soms boven en soms onder de werkelijke waarde liggen, dus de precisie wordt daardoor beïnvloed.

R14 Door een systematische fout ligt de gevonden waarde gemiddeld altijd boven of onder de werkelijke waarde, dus de juistheid wordt daardoor beïnvloed.

Opgave 2.15 Een moderne thermometer

a hij meet de temperatuur d.m.v. infraroodstraling, hij werkt dus op afstand (contactloos)

b T > 100 ºC dus 3 % of reading betekent 3 % van de afgelezen waarde = 3 % van 342 C = 10,26 C en dat is groter dan 3C, dus het is 10,26 C en dat is afgerond 10 ºC

c je hoeft niet te schatten, de aflezing is digitaal Opgave 2.16 Andere foutbronnen

a door niet loodrecht kijken wordt een verkeerde waarde afgelezen

b bij alle meters met wijzerplaten.

c A leest 54 cm³ af B leest 50 cm³ af C leest 40 cm³ af

d A zit er 8% naast, B nul % en C zit er liefst 20% naast

Opgave 3.1 Steekproef en populatie

a Dat is praktisch onmogelijk en ook veel te duur.

2.2

3 Spreiding van data (meetresultaten)

(9)

b in al de 4 situaties kan er sprake zijn van zowel een steekproef als een populatie, het hangt er helemaal van af welke onderzoeksvraag er wordt gesteld.

c De steekproef is niet representatief, want de

samenstelling van de bevolking in de villawijk is anders dan in heel Nederland. In een villawijk zullen vaker mensen wonen die van klassieke muziek houden dan in een achterstandswijk.

d De steekproef is niet aselect. Hij had moeten schudden en dan een monster nemen.

R1 je kiest steeds de beste leerlingen uit iedere klas bij een steekproef over de cijferverdeling van het

biologieproefwerk

R2 je onderzoekt het gemiddelde inkomen van Nederlanders en ondervraagt alleen mensen in een villawijk

R3

R4 Bij het bevolkingsonderzoek naar baarmoederhalskanker worden alle vrouwen van 30 t/m 60 jaar onderzocht, het gaat hier namelijk om de individuele gezondheid

Opgave 3.2 Spreidingsbreedte en centrummaten a zo’n analyse is altijd een steekproef b w = max – min = 14,8 – 13,7 = 1,1 m%

c

d gemiddelde = 14,1 m%

e mediaan ligt tussen meetwaarde 5 (= 14,0) en 6 (= 14,1) dus 14,05 m%

f Er zijn twee modussen: 13,9 en 14,5

populatie

steekproef

13,5 14 14,5 15

(10)

Opgave 3.3 Lichaamslengte

a gemiddelde = 178,8 mediaan = 179,5 er is geen modus

R5 verschil met gemiddelde

R6 Zie boven., het gemiddelde van de verschillen is nul.

Dat is niet zo verrassend want het is juist een eigenschap van de gemiddelde waarde R7

gemiddelde mediaan

b de mediaan ligt vlakbij het gemiddelde dus er geen sprake van een scheve verdeling

Opgave 3.4 Examenscore

a de notatie is heel compact, hier staan 35 meetwaarden.

b gemiddelde = 71,4; mediaan = 71; modus = 75 (3 x)

13,5 14 14,5 15

som van de negatieve afwijkingen

som van de positieve afwijkingen

???

helft van de waarnemin- gen

???

3.2 167 -11,8

175 -3,8

176 -2,8

184 5,2

182 3,2

179 0,2

188 9,2

180 1,2

173 -5,8

184 5,2

178,8 0,0

(11)

Opgave 3.5 Boxplot a

b er is een symmetrische verdeling. Het gemiddelde en de mediaan zijn vrijwel gelijk

Opgave 3.6 Percentielen a 4 5 6 8

5 3 4 5 6 9 6 2 3 5 6 6 9 9

7 0 1 1 3 3 4 5 5 5 7 8 8 1 2 3 6 9

9 3 5 7 8

34 meetwaarden, 60 % van 34 = 20,4, dus het 60^e percentiel is de 21^ste meetwaarde = 74

b de mediaan en het bovenste kwartiel R8 Goed of fout:

 niet juist, dat geldt voor de mediaan

 dat kan, we zagen dat al eerder

R9 het gemiddelde wordt sterk beïnvloed, de mediaan niet (de middelste blijft de middelste)en de modus en de frequentie ook niet

R10 Een smal kwartiel in een boxplot komt overeen met een hoog / laag blok in een histogram.

R11 Geef in de boxplot aan waar (ongeveer) het gemiddelde ligt

Opgave 3.7 Histogram

Bovenstaand histogram loopt van 155,6 cm tot 179,6 cm.

De klassenbreedte is de breedte van 1 kolom uitgedrukt (in dit geval) in cm.

a Hoeveel klassen zijn er gebruikt?

3.3

(12)

gewoon tellen, dus 7

b 179, 6 155, 6

klassenbreedte 3, 43

7

  

c aantal klassen n  40 6, 4afgerond 7

d dat is hetzelfde als in het histogram van het programma e maximum = 195,8 cm

minimum = 155,6 cm

als we kiezen voor 12 klassen, wordt de klassenbreedte:

195,8 155, 6

klassenbreedte 5, 7

7

   cm

f de verdeling is symmetrisch

R12 Het inkomen in Nederland is niet symmetrisch verdeeld:

hij is rechts-scheef verdeeld

modaal is afgeleid van modus, het meest voorkomende, dus dat is ongeveer 16.00 euro

Opgave 3.8 Spreidingsmaat

a A is minder precies, de meetwaarden liggen gemiddeld verder van de gemiddelde waarde

b Daar komt altijd nul uit d

3.4

(13)

% 3 , 24

% 30 100

3 ,

% 7 100 ëfficiënt

variatieco  ^¹   

x σ_n

dat is heel hoog d

Berekening gemiddelde afwijking meting B

nummer meting gemiddelde verschil verschil²

i xi x x_i -x (x_i -x)²

1 33 30 3 9

2 20 30 -10 100

3 24 30 -6 36

4 31 30 1 1

5 30 30 0 0

6 40 30 10 100

7 27 30 -3 9

8 36 30 6 36

9 29 30 -1 1

n = 9 x = 30



(xi -x) = 0



(xi -x)² = 292 0

, 6 5 , 8 36

292 1

)

( ²

1   









 n

x x_i

n

% 20

% 30 100

% 6 100 ëfficiënt

variatieco  ^¹    

x σ_n

e meting B is preciezer dan meting A

R14 Het is eigenlijk niet één formule maar een voorschrift om in een aantal stappen en bewerkingen de uitkomst te vinden

R15 De standaarddeviatie bij een steekproef is groter

R16 Een steekproef geeft veel meer onzekerheid dan een hele populatie

R17 Een tabel maken en alle meetwaarden verwerken volgens het voorschrift dat deze formule voorstelt

R18 Je deelt dan door 49 i.p.v. 50, dat geeft een klein verschil.

Voorbeeld 1,60

49 125

1  

n

 en 1,58

50 125 

n 

 R19 Fout, de meetwaarden zijn meer verspreid R20 nul

R21 Bij ziekenhuis 1 moet je altijd 30 minuten wachten. Bij ziekenhuis 2 is er een kans dat je meteen aan de beurt bent, maar een even grote kans dat je een uur moet wachten, dus…..

3.5

(14)

R22 De linker meting ligt wel erg ver van de andere af, hier kan iets fout gegaan zijn, je moet eerst onderzoeken of de meting een uitschieter is

R23 Het is wel een maat maar niet precies hetzelfde, een andere steekproef geeft vast en zeker een andere waarde.

Je kunt dit verhelpen door de steekproef heel groot te maken.

Opgave 3.9 Bloedonderzoek x= 0,436 L/L

n-1 = 0,04643 L/L

variatiecoëfficiënt = 10,6 % Opgave 3.10 Kleine meetseries

a 3,34  0,22 g/L (= de spreiding) b n-1 = 0,31 g/L

de afwijking is groter dan we eerst hadden aangenomen c 3,34  0,31 g/L

d gemiddelde = 3,33

maximale afwijking = 3,56 – 3,30 = 0,23

n-1 = 0,22

bij 3 metingen zijn de spreiding en de standaarddeviatie ongeveer gelijk

Opgave 3.11 Herhaalbaarheid

a n-1 = 0,001527 molL^-1 b variatiecoëfficiënt = 1,52 % c ----

Opgave 3.12 Reproduceerbaarheid

a _n-1 = 0,009676 molL^-1 b variatiecoëfficiënt = 8,96 %

c de reproduceerbaarheid is slechter dan de

herhaalbaarheid van de ene analist. Ze werken niet allemaal even nauwkeurig.

d Het verschil lijkt wel veel te groot Opgave 3.13 Gebruik van Excel

a b

(15)

Opgave 4.1 Uitschieters: de Dixons-test of Q-test

a het vermoeden bestaat dat 3,7 een uitschieter is, het verschil met de dichtstbijzijnde waarde is 1,2 b

3,7 lijkt zo een uitschieter c 3,7 - 2,5 = 1,2

d w = 3,7 - 1,7 = 2,0 e

6 , 0 0 , 2

2 , waarneming 1 nde

naastligge waarneming

verdachte

test   

 w

Q

f

Kritische waarden voor het bepalen van één uitschieter (Dixons-test of Q-test)

n 3 4 5 6 7 8 9 10 11

Qkritisch 0,94 0,76 0,64 0,56 0,51 0,47 0,44 0,41 0,39

n 12 13 14 15 16 17 18 19 20

Qkritisch 0,37 0,35 0,34 0,33 0,32 0,31 0,30 0,29 0,28

n 21 22 23 24 25 30 35 40 45

Qkritisch 0,29 0,29 0,28 0,28 0,28 0,26 0,25 0,24 0,23 g 0,6 > 0,41 dus 3,7 is inderdaad een uitschieter

h eerst 3,7 weglaten

nieuwe verdachte = 1,7 dus 2,1 - 1,7 = 0,4 w = 2,5 - 1,7 = 0,8

test

verdachte waarneming naastliggende waarneming 0, 4 0,8 0,5

Q w

   

opzoeken in tabel Q_kritisch = 0,44

0,5 > 0,44 dus 1,7 is ook een uitschieter Opgave 4.2 Nitraatgehalte

1^ste verdachte = 2,5 2,5 - 1,9 = 0,6 w = 2,5 - 1,1= 1,4

1,5 2,0 2,5 3,0 3,5 4,0

4 Uitschieters bepalen en afronden

(16)

test

verdachte waarneming naastliggende waarneming 0, 6

0, 43 Q 1, 4

w

   

opzoeken in tabel Qkritisch = 0,41 0,43> 0,43 dus 2,5 is net een uitschieter nieuwe verdachte = 1,1 dus 1,1 1, 4 0,3 w = 1,9 - 1,1 = 0,8

test

verdachte waarneming naastliggende waarneming 0,3 0,8 0,38

Q w

   

opzoeken in tabel Qkritisch = 0,44 0,38 < 0,44 dus 1,1 is geen uitschieter!!

Opgave 4.3 Waar ligt de eerste uitschieter (oplossen van een vergelijking)?

a

b (x23,5)0,94x24,2 2 , 24 09

, 22 94 ,

0 x  x

2 , 06 35 , 0

11 , 11 2

, 2 06 ,

0 



 







 x x !!!!

c waarschijnlijk niet R1 zie vorige opgave

R2 dat hangt af van: het aantal waarnemingen dat in het rechter gedeelte ligt

R3

test

verdachte-naastliggende 7, 4

0, 49 Q 15

 w  

in de tabel zien we dat bij totaal 8 waarnemingen er een uitschieter is

R4 als er rechts maar 1 waarde zou liggen was die

waarschijnlijk wel een uitschieter; doordat de andere er dichtbij ligt wordt verdachte - naastliggende te klein R5 waarschijnlijk zijn beide rechtse metingen uitschieters Opgave 4.4 Uitschieters: de boxplot

a waarschijnlijk alle waarden vanaf 79,0 zijn uitschieters, dat zijn er 16

b c ja

d 150 waarnemingen: mediaan is nr 75 dus mediaan = 69,5

K₁ ligt tussen 37 en 38 dus K₁ = 66,5 K3 ligt tussen 112 en 113 dus K3 = 71,65

IKA= 1,5  (K₃ - K_O) = 1,5  (71,65 - 66,5) = 1,5  5,15

= 7,725

K1 - 1,5  IKA = 66,5 - 7,725 = 58,775 4.1

(17)

K₃ + 1,5  IKA =71,65 + 7,725 = 79,375 onderkant: geen uitschieters

bovenkant: alles vanaf 79,375 dus 15 uitschieters, ongeveer zoals we al vermoedden

Opgave 4.5 Uitschieters: gebruik van SPSS Mediaan = 0,43

K1 = 0,39 K3= 0,46 IKA= 0,07

1,5 IKA = 0,035 = 0,04 0,46 + 0,04= 0,50 0,39 – 0,04 = 0,35

Er zijn 2 uitschieters: 0,30 en 0,60 Opgave 4.6 Afrondingsregels

a 5,237

b b = ₂¹  = ₂¹ × 23,24 = 11,62 afronden op 10.

machten van 10 gebruiken i.v.m. significantie, dus (8,7 ± 0,3)∙10²

c x= 5,2366667 g/L

n-1 = 0,0096 g/L

b = ₂¹  = ₂¹ × 0,0096 = 0,0048 dus afronden op 0,001

x= 5,237 g/L Opgave 4.7 Afronden oefenen

a x= 149,907 g/L

_n-1 = 0,11394 g/L

b b = ₂¹  = ₂¹ ×0,11394 = 0,056 afronden op 0,01 x= 149,91 g/L

_n-1 = 0,11 g/L c

Chloor in bleekloog (g/L)

1 149,85

2 149,97

3 150,03

4 149,78

5 Normaalverdeling

(18)

Opgave 5.1 IQ

a De gegevens zijn duidelijk verdeeld in klassen. De hoogte van de klassen geeft de frequentie, relatieve frequentie of frequentiedichtheid van de gegevens in die klasse.

b streepjes tellen: tussen 100 en 120 liggen 20 streepjes, dus klassenbreedte = 1

c gemiddelde = mediaan = modus = 100 d 50 %

e die zijn er waarschijnlijk wel maar die aantallen zijn te klein om hier weer te geven

f ongeveer 84 g 100 - 84 = 16

h onderkant: 100 - 2 ×16 = 68 bovenkant: 100 + 2 ×16 = 132 Opgave 5.2 Vuistregels normaalverdeling

a 34 % + 34 % = 68 %

b 68 % + 13,6 + 13,6 % = 95,2 % c 95,2 % + 2,2 + 2,2 = 99,6 % d --

e 2,4 % (= 2,2 + 0,2) ligt op de onderste 2 grens 82,4 – 54 = 2 dus  = 14,2 kg

f

g 110,8 kg h 13,6 % Opgave 5.3 Significantie

a Boven en onder 2 standaarddeviatie ligt samen 4,8 %.

Als we dat afronden tot 5 % hebben we precies de grenzen te pakken. Een zwangerschap is significant te lang na

266 + 210 = 286 dagen

b 286 dagen is 286/7 = 40 weken en 6 dagen c significant laag IQ onder 100 – 32 = 68

significant hoog IQ boven 100 + 32 = 132

(19)

R1 Welke van de volgende zaken zouden volgens jou een normaalverdeling kunnen hebben? Leg uit waarom.

 de lengte van alle studenten op de laboratoriumschool wel

 het gewicht van alle vrouwelijke studenten wel

 de leeftijd van alle studenten niet

 de geboortedata van alle studenten niet

 het aantal uren dat iedere student per week aan de studie besteedt wel

 de tijdsduur van mobiele telefoongesprekken van studenten wel

 het aantal uren dat een student TV kijkt wel R2 de meest spitse en dus hoge normaalverdeling Opgave 5.4 Kansrekening

a allebei ₆¹ dus 1/16 ×100 % = 16,7 % b ₆¹₆¹ ¹₃

c De kans om geen 5 te gooien, dus om een 1, 2 3, 4 of 6 te gooien is 1₆¹ ₆⁵

d Omdat je dan veel vaker moet gooien.

e ₆¹50083keer, het gaat over kansen, niet over zekerheid

f

g ofwel 0,0977%

h 50 %

i met totaal 36 mogelijke worpen krijg je 11 verschillende uitkomsten

j slechts een van de 36 geeft 12 punten, dus ₃₆¹

k

0012 , 000 0 . 125

150 

Opgave 5.5 Kansrekening en medische testen

a 1 % van de baby’s heeft het syndroom, dat zijn er dus 0,0110.000 = 100

b 90 % kans dat de testuitslag positief is, dus dat zijn er 0,9100 = 90

c dat zijn er 10.000 – 100 = 9.900

d 1 % kans op vals positief, dus dat zijn 0,01  9900 = 99 e totaal 90 + 99 = 189

f 5.1

(20)

Kans =

werkelijk aantal positief 90

100% 100% 47, 6%

totaal gemeten positief  189  g dat is een beroerde test

h de kans wordt dan 9,17%, een onzinnige test dus Opgave 5.6 Kansrekening en normaalverdeling

a dat is 1 rechts van het gemiddelde; 50 + 34 = 84 % is kleiner dan 188 cm, dus 100 – 84 = 16 % is langer dan 188 cm

b dat is 16 % van 60.000 = 9600 mannen c 0,159 (15,9 %)?

d P(lengte >188) = 0,159

e 2 links van het gemiddelde, dus 2,4 % ofwel P(l <164 cm) = 0,024

f 50 + 34 %, dus 84 % en dat ligt bij 1 links van het gemiddelde, dus P(l >172 cm) = 0,84

g 196 cm = +2

204 cm = +3 daartussen ligt 2,2 % P(196 cm < l < 204 cm) = 0,021

h moeilijk in te schatten, de lijn loopt niet recht Opgave 5.7 Standaard normaalverdeling

a 50 + 34 = 84 %

b 100 – 0,1 – 0,5 = 99, 4 %

c moeilijk in te schatten, de lijn loopt niet recht d 99,38 %

e 100 – 99,38 = 0,62 % f --

Opgave 5.8 Hartslag

a 2,00

10 70 90 

 

 

 Z x

tabel P(Z <90) = 0,9772 = 97,72 %

P(Z >90) = 1 - 0,9772 = 0,0228 dus 2,28 %

R3 We moeten uitrekenen hoe groot de kans is om bij een steekproef een man aan te treffen met een hartslag minder dan 55. Dat is het blauwe gebied in de tekening

linksonder.

5.2

(21)

tabel P(Z <1,5) = 0,9332 = 93,32 % P(Z >1,5) = 1 - 0,9332 = 0,0668 = 6,68 % 6,68 %

b

gebied links van 75: 0,5

10 70 75 

 

 



Z x geeft

69,15 %

gebied links van 65: 0,5

10 70 65 

 

 



Z x geeft

100 – 69,15 = 30,85 %

daartussen ligt: 69,15 – 30,85 = 38,3 % Opgave 5.9 Standaard normaalverdeling en metingen

5 % van 23,5 mg/L = 1,175 afgerond 1,2 mg/L 25

, 2 1

, 1

5 , 23

25 

 

 

 Z x

Z-tabel: P(Z <1,25) = 0,8944

P(Z >1,25) = 1 – 0,8944 = 0,1056 (of 10,95 %)

Opgave 5.10 Standaard normaalverdeling en microbiologische metingen a gehalte = 100  100 = 10.000 = 10⁴ KVE

b logwaarde gehalte = log(10⁴)= 4,0 onderste 2 grens 4 – 2  0,15 = 3,70 bovenste 2 grens 4 + 2  0,15 = 4,30 c 10^3,70 KVE < gehalte <10^4,30 KVE

5012 KVE < gehalte < 19.952 KVE

d De gevonden gemiddelde waarde ligt niet midden tussen de uiterste waarden

Opgave 5.11 Lampen a

(22)

^{700 800} 2,5 40

Z x 



 

   

Z-tabel: P(Z <2,5) = 0,9938

P(Z <–2,5) = 1 – 0,9938 = 0,0062 (of 0,62 %)

b De lampen moeten langer dan ? uur branden. Dat gebied zit helemaal rechts in de normaalverdeling.

P(Z >Zx) = 0,01

P(Z <Zx) = 1 – 0,01 = 0,99 Z-tabel: Zx = 2,33

Z x  Z  x  x Z  



          2,33 40 800 893, 2 x   Z     

Dus 1 % van de lampen houdt het minstens 893 uur vol.

Opgave 5.12 Kwaliteitscontrole bij de bakker

a 1,27

11 436

450 

 

 



Z x en dat geeft 0,8980, dus

89,80 % van de broden ligt beneden de 450 g. Hij levert te weinig waar voor zijn geld

b Uit het histogram blijkt dat we maar de helft van een normaalverdeling zien. Het is dus zeer waarschijnlijk dat de bakker de broden voor deze klant netjes heeft uitgezocht. De andere klanten krijgen dan nog meer broden die te weinig wegen.

R4 Goed R5 –1,5

Opgave 5.13 Chipszakken vullen

a 9 gram dus tussen 191 en 209 g (zie hoofdstuk 1) b We kijken alleen aan de onderkant (teveel vindt de

consument niet erg, de fabrikant wel):

191 200

2, 25 4

Z x 



 

   

Z-tabel: P(Z <2,25) = 0,9878

P(Z <–2,5) = 1 – 0,9878 = 0,0122 (of 1,22 %) 1,22 % van de productie voldoet niet aan de norm c 0,1 % is 3 , het gemiddelde moet dan 3  4 = 12 g

verder liggen dus 200 + 12 = 212 g 5.3

(23)

Opgave 6.1 Steekproeven

a Met slechts drie mannen zegt dit natuurlijk bijzonder weinig over de hele populatie.

b Waarschijnlijk is dat al een iets betere schatting, als de steekproef volgens de regels is uitgevoerd.

c Hoe groter de steekproef hoe betrouwbaarder meestal het resultaat.

d De gemiddeldes liggen dicht bij elkaar maar de standaarddeviatie wordt kleiner als het aantal samples per steekproef groter wordt.

e De nauwkeurigheid neemt dus toe met het aantal samples.

f De beste schatting van de gemiddelde lengte van de populatie mannen boven de 20 is 180,7 cm

g Het 99 % betrouwbaarheidsinterval hoort bij een kans van 0,995 (99% ligt tussen 0,005 en 0,995); dit levert een Z-waarde van 2,575.

5 , 1 575 , 2 7 , 180 5

, 1 575 , 2 7 ,

180     

176,8 cm < μ < 184,6 cm

Het 99 % betrouwbaarheidsinterval is dus groter dan het 95 % betrouwbaarheidsinterval

h 180,71,962,5180,71,962,5

dus bij 10 samples 175,8 cm < μ < 185,6 cm en bij 50 samples 177,8 cm < μ < 183,6 cm bij een grotere steekproef wordt de schatting nauwkeuriger

Opgave 6.2 Standaardfout en populatie

a SE n

n

SEⁿ _n  

10  3 samples _n SE n4,2 37,3 10  10 samples _n SE n 2,5 107,9 10  25 samples _n SE n1,5 257,5

Ze verschillen heel weinig. De laatste zal wel het meest betrouwbaar zijn.

b Het klopt heel behoorlijk. Als je alles herhaalt komt er toch ook niet steeds weer hetzelfde uit.

6 Van steekproef naar populatie

(24)

Opgave 6.3 Kan het niet met wat minder steekproeven?

R1 Bij de lengtemeting heb je natuurlijk mannen met allemaal verschillende lengtes, maar ook de meting zelf is niet nauwkeurig.

R2 De spreiding in de resultaten van de zoutmeting wordt allen bepaald door de meetonzekerheid van mijn meetmethode. Het monster is overal gelijk. Het heeft maar één onbekend) zoutgehalte.

R3 De populatie is de verzameling van alle mogelijke metingen.

a Meting zoutgehalte x = 15,1 mg/L en n-1 = 0,2 mg/L

 _n= 2,5 % van 15,1 mg/L = 0,38 mg/L b Bereken de standaardfout SE.

22 , 0 3 38 ,

n  0 

 SE

n SE 

c Bereken het 95 % betrouwbaarheidsinterval voor de werkelijke waarde van het zoutgehalte.

22 , 0 96 , 1 1 , 15 22

, 0 96 , 1 1 ,

15     

mg/L 53 , 15 mg/L

67 ,

14 

d Je kunt de steekproef groter maken dus meer metingen aan hetzelfde monster doen.

e Nee, want het 99 % betrouwbaarheidsinterval is groter dan het 95 % interval. Het aantal metingen verandert namelijk niet door een andere berekening. De

steekproef blijft even (on)nauwkeurig.

f Reken uit hoe groot de steekproef minstens moet zijn om een afwijking van maximaal 2 % te krijgen.

2 % afwijking betekent 2 % van 15,1 = 0,302 dus 1,96 × SE = 0,302

15 , 96 0 , 1

302 ,

0 

 SE

n n 0,38

2, 47 0,1541

SE n

n SE

 

    

2, 472 6,1

n 

afgerond n =7

je moet dus nog 4 meting extra doen.

Opgave 6.4 Simulatie van steekproeven uit een populatie a 5

b afwijking = 16 – 13,18 = 2,82 6.1

(25)

afwijking = 100% 17,6% 16

82 ,

2  

c 8  5 = 40

d afwijking = 100% 0,625% 16

10 ,

0   het gemiddelde van

de steekproef komt steeds dichter bij die van de populatie te liggen

d Die is 2,38

f  ⁿ  _n SE n 2,38 5 5,32 n

SE  

Hoe meer metingen je doet, hoe beter dit gaat kloppen Opgave 6.5 Betekenis van het betrouwbaarheidsinterval

a 10 steekproeven b 9 van de 10 dus 90 % c 15 van de 20 dus 75 % d --

Opgave 6.6 Schatting van het populatiegemiddelde bij een kleine steekproef

a Tabel: 95%; tweezijdig; n =5 dus v = 4  t = 2,78 b

n t x n

t

x ⁿ^¹   ⁿ^¹

0, 06 0, 06

0,91 2, 78 0,91 2, 78

5  5

     

BI: 0,84 g/kg < μ < 0,98 g/kg

c De maximale waarde van 1,0 kg ligt boven het betrouwbaarheidsinterval, dus het gehalte is niet te hoog.

R4 een kleiner gebied kun je met minder zekerheid voorspellen dat de werkelijke waarde erin ligt R5 zie vorige vraag

R6 bij eenzelfde betrouwbaarheid (bijv. 95 %) wordt het interval kleiner want nwordt groter, bovendien wordt de t-waarde kleiner, dus ook daardoor wordt het interval kleiner

Opgave 6.7 Schatting van het populatiegemiddelde bij een grote steekproef a n =200, dus v = n – 1 = 199, tabel: t = 1,64

1 1

n n

x t x t

n n

 ^   ^

      6.2

(26)

200 64 118 , 1 200

64 118 ,

1     

 x

x 

14 1594 14

1594  

€ 1580 <  < € 1608

b 190

64 118 , 190 1

64 118 ,

1     

 x

x 

14 1594 14

1594  

€ 1580 <  < € 1608 en dat blijft door de afronding hetzelfde

Opgave 6.8 BI bij controles - Koloniegetalbepaling a gemiddelde

t n n x

t

x ⁿ^¹   ⁿ^¹

5 78 12 , 2 75 5

78 12 , 2

75    

BI: 60 KVE/g < μ < 90 KVE/g

b Ja, het hele interval ligt onder de 100 dus het kiemgetal is niet te hoog

Opgave 6.9 Controle - Zout in mineraalwater

a Tabel: 95%; tweezijdig; n =25 dus v = 24  t = 2,06 gemiddelde:

n t x n

t

x  ⁿ^¹    ⁿ^¹

 

25 06 12 , 2 25 130

06 12 , 2

130    

BI: 125 mg/L < μ < 135 mg/L

b zoals al eerder vermeld kan bij een redelijk grote steekproef de standaarddeviatie gebruikt worden als schatting van de standaarddeviatie van de populatie.

schatting n ≈ n-1 = 12 mg/L

c ^{150 130} 1, 67

12

Z x 



 

  

Z-tabel: P(Z <1,67) = 0,9525 P(Z >1,67) = 1 – 0,9525 = 0,0475

Dus 4,75 % van de flessen zal waarschijnlijk meer dan 150 mg/L zout bevatten

Opgave 6.10 BI van verschillen: is het gehalte significant gedaald?

a standaarddeviatie = 0,05  500 = 25 UI/L b tussen  – 2 en  + 2

(27)

c 2 = 2  25 = 50 UI/L BI: 500 – 50 < μ < 500 + 50 BI: 450 UI/L < HGC < 550 UI/L

d standaarddeviatie tweede meting = 0,05  475 = 24 UI/L

35 24 25² ²

2 2 2 1

TOT     

 UI/L

e 2 = 2  35 = 70

het verschil is 500 – 475 = 25

het verschil kan dus 70 UI/L afwijken BI: 25 – 70 < μ < 25 + 70

BI: – 45 < verschil < 95 UI/L

f het als er geen verschil zou zijn tussen de metingen van 500 en 475 dan zou het verschil nul zijn; dit getal nul ligt ruim binnen dit interval dus het verschil is niet significant, dat betekent dat we door de onzekerheid van de meetmethode niet mogen aannemen dat de metingen van het gehalte HCG echt verschillen.

Opgave 6.11 Statistisch significant of praktisch significant?

a Middel B geeft de grootste gemiddelde gewichtsafname, maar ook de grootste onzekerheid, de afname kan zelfs negatief zijn, dat betekent dus sommige gebruikers een gewichtstoename kunnen verwachten. Van middel A wordt in ieder geval iedereen (95% betrouwbaar) lichter.

b Wie graag een gok waagt neemt middel B, als je op zekerheid speelt neem je A.

Opgave 7.1 Variaties a --

b Omdat dat afhangt van de gewenste nauwkeurigheid c --

d 20 op de 100 dus 1 op 5, dus 4 rode ballen e toeval

f het kan theoretisch wel, maar de kans is ontzettend klein.

Opgave 7.2 Oorzaken van variaties en controlekaarten

Opgave 7.3 Controlekaarten van losse (enkele) meetwaarden b Welke conclusies zou je kunnen trekken?

7 Kwaliteitszorg en controlekaarten

(28)

a Maak een controlekaart van de uitslagen met grenzen.

b het LDL gehalte stijgt en wordt te hoog Opgave 7.4 Controlekaarten voor apparatuur of meetmethode

a 2  2,4 = 4,8 % b 2  0,2 = 0,4 %

Opgave 7.5 Kwaliteitscontrole bij de melkproductie a x= 44,9 g/L en n-1 = 0,9 g/L

b 1 = 0,9 g/L dus grenzen 44,0 en 45,8 g/L 2 = 1,8 g/L dus grenzen 43,2 en 46,7 g/L 3 = 2,7 g/L dus grenzen 42,2 en 47,6 g/L c

d

LDL gehalte

3 3,5 4 4,5 5

0 5 10 15

maand

LDL (mmol/L)

meetwaarden ondergrens bovengrens

(29)

e we zien alleen toevallige variaties.

Opgave 7.6 Hoe bepalen we nu of de kwaliteit onbeheerst is?

a Er worden geen regels overtreden Opgave 7.7 Is er actie nodig?

a dag 6 de 12 – regel: waarschuwing dus geen actie dag 16 de 41 – regel: hier had actie ondernomen moeten worden

b dag 3 de 12 – regel: waarschuwing dus geen actie dag 13 de 41 – regel: hier had actie ondernomen moeten worden

c dag 7 de 12 – regel: waarschuwing dus geen actie dag 14 de 12 – regel: waarschuwing dus geen actie Opgave 7.8 Controleregels in chemie en microbiologie

a 95% betrouwbaarheidsinterval geeft de 2 grenzen aan, dus 8200 – 2500 = 5700 en 8200 + 2500 = 10.700

3 is dan 1,5 × 2500 = 3750

Dus de 3 grenzen zijn: 8200 – 3750 = 4450 en 8200 + 3750 = 11.950

Dus: 4450 – 5700 – 10.700 – 11.950 b dag 5 t/m 14 de 10x regel

c dag 7 de 12 – regel: waarschuwing dus geen actie dag 8 de 22 – regel: hier had actie ondernomen moeten worden

dag 11 de 41 – regel: hier had actie ondernomen moeten worden

dag 19 de 13 – regel: hier had actie ondernomen moeten worden

d nee

(30)

EXTRA INFORMATIE Opgave 7.9 Een kijk achteraf: de runchart

24 meetwaarden en 7 runs: dit duidt op afwijkingen er is een shift: een run van 8 ook dit duidt op afwijkingen er is geen trend waarneembaar

Opgave 8.1 Wel of geen verband tussen de grootheden?

a waar je ongeveer een rechte lijn door de punten kunt trekken, dus de bovenste en de onderste

b de bovenste is positief, als de ene grootheid toeneemt, neemt de andere ook toe; de onderste is negatief, als de ene grootheid toeneemt, neemt de andere af

c boven r > 0; midden r = 0 en onder r < 0 Opgave 8.2 Berekenen van de correlatiecoëfficiënt

a

b negatief: zware mensen hebben meer kans vroeg te overlijden

c

i Xi Yi X_iX Y_iY (X_iX)(Y_iY)

1 74 72 -0,5 -3 1,5

2 90 68 15,5 -7 -108,5

3 80 70 5,5 -5 -27,5

4 67,5 85 -7 10 -70

5 68 82 -6,5 7 -45,5

6 78 69 3,5 -6 -21

verband tussen gewicht en overlijden

65 70 75 80 85 90

60 65 70 75 80 85 90 95

gewicht (kg)

leeftijd overlijden

8 Correlatie en regressie

(31)

7 70 77 -4,5 2 -9

8 69,5 74 -5 -1 5

9 79 71 4,5 -4 -18

10 69 82 -5,5 7 -38,5

n =

10



^xⁱ ^⁷⁴⁵



^yⁱ ^⁷⁵⁰

^

⁽^xⁱ^^x⁾^⁽^yⁱ^^y⁾^^³³¹^,⁵

x74,5 y75 ^x ^⁷^,²³ _y 6,13

1

( ) ( )

331, 5

0,831

( 1) 9 7, 23 6,13

n

i i

i

x y

x x y y

r ^ n  

  

    

    



d 0,831 > 0,632 dus er is een aantoonbare correlatie e r² = 0,831² = 0,691

f voor 69,1 %

g 0,846 < 0,878 dus er is geen aantoonbare correlatie, het kan dus toeval zijn

Opgave 8.3 Bepalen van een lineaire regressielijn 705 , 23 0 , 7

13 , 831 6 ,

0  









x

r y

a 



52 , 127 5 , 74 ) 705 , 0 (

75   







 y a x b

De vergelijking van de regressielijn is dus: y = -0,71 x + 127,5 Opgave 8.4 Oefenen met lineaire regressie

a

er is aantoonbare correlatie want r = 0,982

volgehouden dagen dieet

0 0,5 1 1,5 2 2,5 3 3,5

0 10 20 30 40 50 60

dagen dieet

gewichtsverlies (kg)

(32)

vergelijking volgens methode boven: y = 0,0585x – 0,2687 b y = 0,0585x – 0,2687 = 10

0585 175 , 0

2687 , 0

10 



x dagen

c meerdere redenen: houd je het vol en blijft de afname per dag gelijk?

R1 hoe kleiner het aantal hoe groter de invloed van het toeval R2 er is wel een heel grote correlatie maar de lijn loopt niet

recht

R3 waarschijnlijk een wortelverband R4 laten we hopen van niet

R5 de grootte van de bevolking?

R6 agressieve kinderen kijken veel vaker TV,………..

R7 statisch: ze hebben duidelijk met elkaar te maken maar er kan een heel andere oorzaak zijn

oorzakelijk: een van de twee is de oorzaak en de andere is daar een gevolg van

Opgave 8.5 Lineaire regressie met Casio fx-82SX Opgave 8.6 Lineaire regressie met Excel

a

r = R²  0,98870,994 b YES , want 0,994 > 0,666

c Dat is natuurlijk niet waarschijnlijk. de grafiek zal minder steil gaan lopen, want afkeur blijft er altijd

verband tussen afkeur en dagproductie y = 0,0013x - 1,8182 R² = 0,9887

0 0,5 1 1,5 2 2,5 3 3,5 4 4,5 5

0 500 1000 1500 2000 2500 3000 3500 4000 4500 5000

productie/dag

afkeur (%)

9 Testen van meetresultaten

8.1

(33)

R1 Hoe zou de tekening van de eenzijdige toets eruit zien als we als alternatieve hypothese gesteld hadden: H₁: µ < 50?

R2 Als we het voorbeeld van de cola eenzijdig hadden getest, was de uitslag dan anders geweest? Leg uit, eventueel met een berekening.

Opgave 9.1 Testen van het uit de steekproef geschatte gemiddelde t.o.v.  a x= 24,5 kg en n-1 = 1,0 kg

b 1,12

0 , 1 5 5 , 24 25 )

(

1 - n













  x ⁿ t

c 2,5 %

d v = n – 1 = 5 – 1 = 4 tabel: tkritisch = 2,78.

e 1,12 < 2,78

f de nulhypothese wordt aangenomen

g Het gewicht voldoet aan de specificatie van 25 kg met een betrouwbaarheid van 95 %

Opgave 9.2 Paracetamol

a via de website:

One sample t test results

P value and statistical significance:

The two-tailed P value equals 0.0045

By conventional criteria, this difference is considered to be very statistically significant.

zelf berekenen Nulhypothese:

Het gewicht voldoet aan de specificatie, de waarde wijkt niet significant af van 200 g

H₀: µ = 200 g

Alternatieve hypothese

Het gewicht voldoet niet aan de specificatie, de waarde wijkt significant af van 200 g

H₀: µ  200

90 , 4 4 192 6 200 )

(

1 - n













  x ⁿ t

v = n – 1 = 6 – 1 = 5

tabel: 95%; tweezijdig,  tkritisch = 2,57

4,90 > 2,57, dus de nulhypothese wordt verworpen Het gewicht is significant lager dan 200 g met een betrouwbaarheid van 95 %

9.1

(34)

b bij een eenzijdige test is de tkritisch = 2,02; deze afwijking is nog groter, dus de conclusie is hetzelfde

Opgave 9.3 Nieuwe machine

a eenzijdig, je wilt bewijzen dat hij sneller is.

b Nulhypothese:

Het aantal van de nieuwe machine verschilt niet van de oude H0: µ = 250

Het aantal van de nieuwe machine is groter dan van de oude H1: µ > 250

91 , 6 7 265 10 250 )

(

1 - n













  x ⁿ t

v = n – 1 = 10 – 1 = 9 tabel: t_kritisch = 1,83

7,91 > 1,83 dus de nulhypothese wordt afgewezen en de alternatieve dus aangenomen; de nieuwe machine werkt significant sneller dan de oude.

Opgave 9.4 Slootwater

a plaatje II past het best

b de meetserie van de partner lijkt nauwkeuriger c Eigen metingen

Nulhypothese:

Het “werkelijke” gehalte wijkt niet significant af: H0: µ = 0,40

Het “werkelijke” gehalte wijkt wel significant af: H0: µ  0,40

46 , 02 3 , 0 38 12 , 0 40 , 0 )

(

1 - n













  x ⁿ t

v = n – 1 = 12 – 1 = 11

tabel: t_kritisch = 2,20 (geen voorkeur dus tweezijdig testen) 2,20 < 3,46 dus de nulhypothese wordt afgewezen

De gevonden waarde wijkt significant af van de werkelijke waarde.

Metingen partner

Het “werkelijke” gehalte wijkt niet significant af: H0: µ = 0,40

Het “werkelijke” gehalte wijkt wel significant af: H0: µ  0,40

3 , 01 11 , 0 44 8 , 0 40 , 0 )

(

1 - n













  x  ⁿ t

(35)

tabel: tkritisch = 2,36 (geen voorkeur dus tweezijdig testen) 2,36 < 11,3 dus de nulhypothese wordt afgewezen

De gevonden waarde wijkt significant af van de werkelijke waarde.

d Beide meetmethoden voldoen niet Opgave 9.5 Vergelijken van twee meetseries

Opgave 9.6 T-test van gemiddelde uit twee steekproeven a Bereken S.

5 , 74 422

74

425 74 420

74 ² ²

2 1

2 2 2 2 1

1 







 







 

v v

v

S v  

b 5,07

75 1 75 5 1

, 422

2750 3100

1 1

2 1

2

1 





 





 

n S n

x x t

c tabel: tkritisch = 2,00

5,07 > 2,00 dus de nulhypothese wordt verworpen d Er is wel een significant verschil tussen de gemiddelden

Het gemiddelde gewicht van de behandelde groep is dus groter dan die van de controlegroep

Opgave 9.7 F-test van standaarddeviaties uit twee steekproeven a

2 2

A

2 2

B

0, 40

2, 56 0, 25

F 

   

b tabel: Fkritisch = 3,58

2,56 < 3,58 dus de nulhypothese wordt aangenomen c De meetseries verschillen niet significant in precisie. Je

kunt dus niet zeggen dat serie B nauwkeuriger is. De verschillen zijn aan toeval te wijten

Opgave 9.8 Afvalwateronderzoek Gemiddelde

Nulhypothese: Er is geen significant verschil tussen de gemiddelden: H0: µ1 – 2 = 0

Alternatief: H1: µ1 – 2  0 (geen voorkeur voor een van beide methoden), dus tweezijdig testen.

67 , 10 1

10

99 , 1 10 27 , 1

10 ² ²

2 1

2 2 2 2 1

1 







 







 

v v

v

S v  

(36)

55 , 8 11

1 11 67 1

, 1

37 , 6 55 , 4 1

1

2 1

2

1 





 





 

n S n

x x t

tabel: tkritisch = 2,23

8,55 > 2,23 dus de nulhypothese wordt verworpen. Er is een significant (opvallend) verschil in de gevonden gemiddelden Standaarddeviatie

Nulhypothese: De precisie van methode B is niet significant beter dan de precisie van methode A: H₀: _A = _B

Alternatief: de precisie van methode B is significant slechter dan de precisie van methode A H1: A < B . Dus tweezijdig testen.

46 , 27 2 , 1

99 , 1

2 2 2

B 2

A  

  F 

tabel: Fkritisch = 3,72

2,46 < 3,72 dus de nulhypothese wordt aangenomen. De meetseries zijn wel vergelijkbaar wat betreft precisie.

Opgave 9.9 T-test van gemiddelde uit twee steekproeven met gepaarde waarnemingen

a op het geluidsignaal b ja

c nul?

d 2,02

4 , 34

10

22 

 



V

v n

t x



e tabel: t_kritisch = 2,26

2,02 < 2,26 dus de nulhypothese wordt aangenomen.

f Er is geen significant verschil tussen de gemiddelde reactietijden.

Opgave 9.10 Hemoglobinegehalte Nulhypothese

Er is geen significant verschil tussen de gemiddelde Hb-gehaltes per patiënt

H₀: xv 0

Er is wel een significant verschil tussen de gemiddelde Hb- gehaltes per patiënt

H₁: xv 0

Hb-gehalte (g/dL)

patiënt A B verschil

(37)

1 12,5 13,4 -0,9

2 13,6 14,7 -1,1

3 16,3 17,1 -0,8

4 15,8 15,2 0,6

5 14,6 15,3 0,7

6 11,3 13,8 -2,5

gemiddeld 14,0 14,9 -0,9 0,9

45 , 9 2

, 0

6 9 ,

0  

 



V

v n

t x

 ^(neem^x^v ^⁰⁾

tabel: t_kritisch = 2,57

2,45 < 2,57 dus de nulhypothese wordt aangenomen. Er is geen significant verschil tussen beide meetmethoden

Opgave 9.11 Opstellen van hypotheses CASUS 1

a Het gemiddelde gehalte van een steekproef uit de partij kindervoeding.

b Nulhypothese

Er is geen significant verschil tussen het gemiddelde gehalte en de maximale waarde van 0,02 kg

H₀:  = 0,02 mg/kg Alternatieve hypothese

Het gemiddelde gehalte is significant lager dan de maximale waarde van 0,02 kg

H1:  < 0,02 mg/kg

c Wel een voorkeur dus eenzijdig toetsen.

d De t-test voor vergelijking van een gemiddelde van een steekproef met een (on)gewenste waarde 

CASUS 2

a Steekproeven met methode A en een met methode B worden vergeleken. De standaarddeviaties worden vergeleken.

b Nulhypothese

Er is geen significant verschil tussen de standaarddeviaties van methode A en B

H0: A = B

Alternatief: de precisie van methode B is significant beter dan de precisie van methode A

H₁: B < A.

(38)

d De F-test voor vergelijking van de standaarddeviaties van twee steekproeven.

CASUS 3

a Aan begin en eind van de periode van alle patiënten de bloeddruk meten. Het gemiddelde verschil wordt vergeleken.

b Nulhypothese

Er is geen significant tussen het gemiddelde verschil van de bloeddrukwaarden per patiënt.

H₀: xv 0

Het gemiddelde verschil van de bloeddrukwaarden per patiënt is significant lager na de behandeling.

H1: x > 0 v

d De gepaarde t-test voor vergelijking van de steekproeven CASUS 4

a De standaarddeviaties van de metingen van de twee analisten worden vergeleken.

b Nulhypothese

Er is geen significant verschil tussen de standaarddeviaties van analist A en analist B

H0: A = B

Er is een significant verschil tussen de standaarddeviaties van analist A en analist B.

H1: B A.

c Geen voorkeur dus tweezijdig toetsen.

d De F-test voor vergelijking van de standaarddeviaties van twee steekproeven.

Opgave 9.12 Grafische vergelijking van meetmethoden a