• No results found

Exact competentiegericht

N/A
N/A
Protected

Academic year: 2021

Share "Exact competentiegericht"

Copied!
59
0
0

Bezig met laden.... (Bekijk nu de volledige tekst)

Hele tekst

(1)

Exact competentiegericht

Statistiek voor het laboratorium Uitwerkingen versie juli-2014

T.J. Kleintjes

(2)

Opgave 1.1 Precisie en juistheid bij het schieten

Opgave 1.2 Precisie en juistheid van metingen - nauwkeurig en juist  D

- nauwkeurig en onjuist  C - onnauwkeurig en juist  B - onnauwkeurig en onjuist  A

Opgave 1.3 Hoe nauwkeurig is een meting bij een bepaalde meetmethode?

a v = 135 ± 3 km/h

relatieve onnauwkeurigheid = 100% 2,2% 135

3  

v = 135 km/h ± 2,2 % b

Opgave 1.4 Meer metingen doen: duplo en triplo (meetonnauwkeurigheid bekend)

a relatieve onnauwkeurigheid = 100% 11,9% 126

15  

132 135 138

3 3

B

C D

A

nauwkeurig en juist onnauwkeurig en juist

nauwkeurig en onjuist onnauwkeurig en onjuist

1 Precisie en juistheid

(3)

b De meting wordt 2  nauwkeuriger dus absolute onnauwkeurigheid = 10,6

2

15  afgerond 11 mg/L c

Aantal metingen (n) onnauwkeurigheid

1 ± 15

2 ± 11

3 ± 9

4 ± 8

….. ± 5

9 3 5 3

5 15

15   n   n2n

d gemiddelde = 127,3

3 127 129

126  

De meting wordt 3  nauwkeuriger dus absolute onnauwkeurigheid = 8,66

3

15  afgerond 9 mg/L Zoutgehalte = 127 ± 9 mg/L

Zoutgehalte = 127 mg/L ± 7,1 % Opgave 1.5 Meetonnauwkeurigheid onbekend

a

b

w = hoogste waarde– laagste waarde = 35,5 – 32,8 = 2,7 g/100g

c gemiddelde = 33,8

3

5 , 35 8 , 32 2 ,

33   

g/100g d verschil = 35,5 – 33,8 = 1,7 g/100g

e de spreiding = 1,7 g/100g

f de spreiding in % = 100% 5,0% 8

, 33

7 ,

1  

g vetgehalte = 33,8 ± 1,7 g/100 g vetgehalte = 33,8 g/100 g ± 5,0 %

R1 bijvoorbeeld 100, 97 en 103 R2 bijvoorbeeld 200, 100 en 300

32 33 34 35

1.1 onnauwkeurigheid =15 10,6

2

onnauwkeurigheid 11 (afgerond)

(4)

R3 die kun je niet vergelijken, omdat het gemiddelde verschilt

R4 nee

R5 omdat de relatieve onnauwkeurigheid rekening houdt met de gemiddelde waarde

Opgave 1.6 Het suikergehalte van cola

gemiddelde waarde = 8,9 g/100 mL

spreiding (absolute onnauwkeurigheid) = 9,3 – 8,9 = 0,4 g/100 mL

spreiding in % (relatieve onnauwkeurigheid) =

% 5 , 4

% 9 100 , 8

4 ,

0  

suikergehalte = 8,9 ± 0,4 g/100 mL Opgave 1.7 Bacteriën tellen

gemiddelde waarde per plaat = 51 KVE onnauwkeurigheid = 65 – 51 = 14 KVE onnauwkeurigheid in % = 100% 27,5%

51

14 

KVE waarde = 51 ± 14 KVE 104 keer verdund dus

KVE waarde = 51104 ± 14104 KVE/mL

betere notatie: KVE waarde = (51 ± 14)104 KVE/mL relatief KVE waarde = 51104 KVE/mL ± 27,5%

Opgave 1.8 Juistheid van een meting bepalen

a je moet de werkelijke waarde van het controlemonster weten

b gemiddelde = 24,3 mg/L (controlemonster niet meenemen!!)

spreidingsbreedte = 24,3 – 24,0 = 0,3 mg/L absolute onnauwkeurigheid = 0,3

relatieve onnauwkeurigheid = 100% 1,2% 3

, 24

3 ,

0  

c ja, het gemeten controlemonster valt binnen de opgegeven grenzen, dus er is geen reden om aan te nemen dat de meting niet juist zou zijn

Opgave 1.9 Het ℮-teken

a Van 100 tot 200  4,5 % van 200 g = 9 g

(5)

of van 200 tot 300  9 g b tussen 191 g en 209 g

c Van 100 tot 200  4,5 % van 175 mL = 7,9 mL d 9 mL van 265 mL = 100% 3,4%

265

9  

Opgave 2.1 Toevallige meetfout door de waarnemer 1,55 cm

2 cijfers achter de komma

Opgave 2.2 Meer streepjes is nauwkeuriger?

boven 1,8 cm 1 decimaal onder 1,86 cm 2 decimalen Opgave 2.3 Afleesonnauwkeurigheid bij glaswerk

middelste maatcilinder:3,0 mL afleesonnauwkeurigheid 0,1 mL rechter maatcilinder: 0,34 mL afleesonnauwkeurigheid 0,01 mL buret: 46, 55 mL afleesonnauwkeurigheid 0,02 of 0,03 mL Opgave 2.4 De schaalverdeling bepaalt hoe goed je kunt aflezen

a de thermometer links heeft als kleinste schaaldeel 0,1 C en de thermometer rechts heeft als kleinste schaaldeel 1 C b links 32,35 C en rechts 32,4 C

c links 0,02 C en rechts 0,2 C d de thermometer links

R1 4 significante cijfers

R2 er is een schatting gemaakt tussen de streepjes van 23,1 en 23,2 dus het kleinste schaaldeel is 0,1 C

R3 het laatste cijfer R4 4 significante cijfers R5 ongeveer 0,05 mL

R6 nee, de relatieve onnauwkeurigheid wordt dan veel te groot

R7 het is eigenlijk niet fout, want je kunt het niet beter met de beschikbare middelen

2 Meetresultaten verschillen. Hoe komt dat?

2.1

(6)

Opgave 2.5 Toevallige fout bij aflezen van grafieken

a bij 21,3 C max. vochtigheid = 18,5 ± 0,2 g/m3 (of 0,3) bij 21,3 C max. vochtigheid = 18,5 g/m3 ± 1,08 % bij 6,7 C max. vochtigheid = 7,5 ± 0,2 g/m3 (of 0,3)) bij 6,7 C max. vochtigheid = 7,5 g/m3 ± 2,67 % b relatieve vochtigheid = 100% 40,5%

5 , 18

5 ,

7  

c totale onnauwkeurigheid = 1,08 % + 2,67 % = 3,75 % absolute onnauwkeurigheid = 3,75 % van 40,5 % = 1,52 % relatieve vochtigheid = 40,5 ± 1,5 % (absoluut)

relatieve vochtigheid = 40,5 % ± 3,75 % (relatief) Opgave 2.7 Systematische fout bij een liniaal

a het nulpunt ligt niet gelijk met de zijkant van het kaartje b ongeveer 0,5 cm

c de fout precies bepalen en alle meetwaarden corrigeren Opgave 2.8 Systematische fouten

a niet waterpas zetten

b niet goed kalibreren (ijken) c niet op nul stellen

d bij de verkeerde temperatuur gebruiken

Opgave 2.9 Systematische fout: de instrumentonnauwkeurigheid a Hygrometer

waarde = 66,5 %

afleesonnauwkeurigheid 0,2-0,5 %

instrumentonnauwkeurigheid 1,0 % (1 schaaldeel = 2%) 

½ schaaldeel = 1 %) Universeelmeter waarde = 14,19 V

afleesonnauwkeurigheid 0 V (!!)

instrumentonnauwkeurigheid 0,01 V (1 schaaldeel=0,01 V) b waarde = 28,1 C

afleesonnauwkeurigheid 0,1-0,2 C

instrumentonnauwkeurigheid 0,5 C (1 schaaldeel = 1C

 ½ schaaldeel = 0,5 C) c volume = 42,24 mL

afleesonnauwkeurigheid 0,02-0,03 mL instrumentonnauwkeurigheid 0,05 mL (1 schaaldeel = 1mL  ½ schaal = 0,5 mL)

(7)

Opgave 2.10 Wat doe je met twee onnauwkeurigheden?

a Als je door het aflezen er bijv. 0,2 C naast kunt zitten en het instrument wijkt maximaal 0,5 C af, dan kun je maximaal 0,7 C ernaast zitten

b 74,0 C

c Ongeveer 0,2 C d 2  2 C = 4 C

e Maximaal 4 C + 0,2 C = 4,2 C

f gecombineerdeonnauwkeurigheid  420,22 4,0 g T = 74  4 C

h relatieve onnauwkeurigheid = 100% 5,4% 74

4  

i De grootste afwijking is 4 C, dus dat is hetzelfde Opgave 2.11 Twee onnauwkeurigheden 1

2 2 2

spreiding1

totaal

spreiding  spreiding

2 2

2 log

8

12 bio ischespreiding

% 9 , 8 8 12

logischespreiding22bio

Opgave 2.12 Twee onnauwkeurigheden 2

2 2 2

spreiding1

totaal

spreiding  spreiding

2 2

0,302

0,45  fout analist

2 2 2

2 0,30

0,45   foutanalist

335 , 0 30 , 0 45 ,

0 2 2

2   

analist fout

Opgave 2.13 Verschilmeting

a V = Vbegin – Veind = 35,18 – 11,56 = 23,62 mL

b Dat betekent dat alle metingen maximaal 0,05 mL kunnen afwijken

c Het verschil blijft dan precies hetzelfde dus 23,62 mL d De onnauwkeurigheid in de resultaat is dan 2  de

afleesonnauwkeurigheid, dus 0,04 mL

e Bij een verschilmeting met één instrument hoef je alleen rekening te houden met de afleesonnauwkeurigheid Opgave 2.14 Instrumentonnauwkeurigheid in de manual

a resolution = 0,1 C (of F)

(8)

b accuracy = 0,2 C (of 0,4 F)

c 115,8  0,2 C  afwijking in % = 100% 0,17% 8

, 115

2 ,

0

R8 Nee, het is de maximale afwijking die de thermometers onderling kunnen verschillen

R9 Worstcase betekent slechtste geval R10 Dat ze maximaal 0,5 C verschillen R11 schatting van de fout: ongeveer 1,3

R12 Hier is een verandering opgetreden waardoor het gemiddelde is verschoven en er een systematische afwijking is ontstaan

R13 Een toevallige fout zal soms boven en soms onder de werkelijke waarde liggen, dus de precisie wordt daardoor beïnvloed.

R14 Door een systematische fout ligt de gevonden waarde gemiddeld altijd boven of onder de werkelijke waarde, dus de juistheid wordt daardoor beïnvloed.

Opgave 2.15 Een moderne thermometer

a hij meet de temperatuur d.m.v. infraroodstraling, hij werkt dus op afstand (contactloos)

b T > 100 ºC dus 3 % of reading betekent 3 % van de afgelezen waarde = 3 % van 342 C = 10,26 C en dat is groter dan 3C, dus het is 10,26 C en dat is afgerond 10 ºC

c je hoeft niet te schatten, de aflezing is digitaal Opgave 2.16 Andere foutbronnen

a door niet loodrecht kijken wordt een verkeerde waarde afgelezen

b bij alle meters met wijzerplaten.

c A leest 54 cm3 af B leest 50 cm3 af C leest 40 cm3 af

d A zit er 8% naast, B nul % en C zit er liefst 20% naast

Opgave 3.1 Steekproef en populatie

a Dat is praktisch onmogelijk en ook veel te duur 2.2

3 Spreiding van data (meetresultaten)

(9)

b aselect betekent dat een keuze wordt gemaakt op basis van willekeurigheid dus dat elk individu uit de

populatie even veel kans maakt om gekozen te worden.

(wikipedia)

representatief betekent dat de steekproef ongeveer dezelfde samenstelling heeft als de populatie (dus mannen – vrouwen, leeftijdsopbouw, etcetera) c random

d

R1 je kiest steeds de beste leerlingen uit iedere klas bij een steekproef over de cijferverdeling van het

biologieproefwerk

R2 je onderzoekt het gemiddelde inkomen van Nederlanders en ondervraagt alleen mensen in een villawijk

R3

R4 Bij het bevolkingsonderzoek naar baarmoederhalskanker worden alle vrouwen van 30 t/m 60 jaar onderzocht, het gaat hier namelijk om de individuele gezondheid

Opgave 3.2 Spreidingsbreedte en centrummaten a zo’n analyse is altijd een steekproef b w = max – min = 14,8 – 13,7 = 1,1 m%

c

d gemiddelde = 14,1 m%

e mediaan ligt tussen meetwaarde 5 (= 14,0) en 6 (= 14,1) dus 14,05 m%

f Er zijn twee modussen: 13,9 en 14,5

populatie

steekproef

13,5 14 14,5 15

13,5 14 14,5 15

13,5 14 14,5 15

3.1

(10)

Opgave 3.3 Lichaamslengte

a gemiddelde = 178,8 mediaan = 179,5 er is geen modus

R5 verschil met gemiddelde

R6 Zie boven., het gemiddelde van de verschillen is nul.

Dat is niet zo verrassend want het is juist een eigenschap van de gemiddelde waarde R7

gemiddelde mediaan

b de mediaan ligt vlakbij het gemiddelde dus er geen sprake van een scheve verdeling

Opgave 3.4 Examenscore

a de notatie is heel compact, hier staan 35 meetwaarden.

b gemiddelde = 71,4; mediaan = 71; modus = 75 (3 x)

13,5 14 14,5 15

som van de negatieve afwijkingen

som van de positieve afwijkingen

???

helft van de waarnemin- gen

helft van de waarnemin- gen

???

3.2 167 -11,8

175 -3,8

176 -2,8

184 5,2

182 3,2

179 0,2

188 9,2

180 1,2

173 -5,8

184 5,2

178,8 0,0

(11)

Opgave 3.5 Boxplot a

b er is een symmetrische verdeling. Het gemiddelde en de mediaan zijn vrijwel gelijk

Opgave 3.6 Percentielen a 4 5 6 8

5 3 4 5 6 9 6 2 3 5 6 6 9 9

7 0 1 1 3 3 4 5 5 5 7 8 8 1 2 3 6 9

9 3 5 7 8

34 meetwaarden, 60 % van 34 = 20,4, dus het 60e percentiel is de 21ste meetwaarde = 74

b de mediaan en het bovenste kwartiel R8 Goed of fout:

 niet juist, dat geldt voor de mediaan

 dat kan, we zagen dat al eerder

R9 het gemiddelde wordt sterk beïnvloed, de mediaan niet (de middelste blijft de middelste)en de modus en de frequentie ook niet

R10 Een smal kwartiel in een boxplot komt overeen met een hoog / laag blok in een histogram.

R11 Geef in de boxplot aan waar (ongeveer) het gemiddelde ligt

Opgave 3.7 Histogram

Bovenstaand histogram loopt van 155,6 cm tot 179,6 cm.

De klassenbreedte is de breedte van 1 kolom uitgedrukt (in dit geval) in cm.

a Hoeveel klassen zijn er gebruikt?

3.3

(12)

gewoon tellen, dus 7

b 179, 6 155, 6

klassenbreedte 3, 43

7

  

c aantal klassen2 n 2 4012, 6 13

d dat is bijna twee keer zoveel als in het histogram van het programma

e maximum = 195,8 cm minimum = 155,6 cm

als we kiezen voor 12 klassen, wordt de klassenbreedte:

195,8 155, 6

klassenbreedte 3,35

12

   cm

het is slim om dan af te ronden op 3,4 cm f de verdeling is symmetrisch

R12 Het inkomen in Nederland is niet symmetrisch verdeeld:

hij is rechts-scheef verdeeld

modaal is afgeleid van modus, het meest voorkomende, dus dat is ongeveer 16.00 euro

Opgave 3.8 Spreidingsmaat

a A is minder precies, de meetwaarden liggen gemiddeld verder van de gemiddelde waarde

b Daar komt altijd nul uit d

3.4

(13)

% 3 , 24

% 30 100

3 ,

% 7 100 ëfficiënt

variatieco  1   

x σn

dat is heel hoog d

Berekening gemiddelde afwijking meting B

nummer meting gemiddelde verschil verschil2

i xi x xi -x (xi -x)2

1 33 30 3 9

2 20 30 -10 100

3 24 30 -6 36

4 31 30 1 1

5 30 30 0 0

6 40 30 10 100

7 27 30 -3 9

8 36 30 6 36

9 29 30 -1 1

n = 9 x = 30

(xi -x) = 0

(xi -x)2 = 292 0

, 6 5 , 8 36

292 1

)

( 2

1   

n

x xi

n

% 20

% 30 100

% 6 100 ëfficiënt

variatieco  1    

x σn

e meting B is preciezer dan meting A

R14 Het is eigenlijk niet één formule maar een voorschrift om in een aantal stappen en bewerkingen de uitkomst te vinden

R15 De standaarddeviatie bij een steekproef is groter

R16 Een steekproef geeft veel meer onzekerheid dan een hele populatie

R17 Een tabel maken en alle meetwaarden verwerken volgens het voorschrift dat deze formule voorstelt

R18 Je deelt dan door 49 i.p.v. 50, dat geeft een klein verschil.

Voorbeeld 1,60

49 125

1  

n en 1,58

50 125 

n

R19 Fout, de meetwaarden zijn meer verspreid R20 nul

R21 Bij ziekenhuis 1 moet je altijd 30 minuten wachten. Bij ziekenhuis 2 is er een kans dat je meteen aan de beurt bent, maar een even grote kans dat je een uur moet wachten, dus…..

R22 De linker meting ligt wel erg ver van de andere af, hier kan iets fout gegaan zijn, je moet eerst onderzoeken of de 3.5

(14)

meting een uitschieter is

R23 Het is wel een maat maar niet precies hetzelfde, een andere steekproef geeft vast en zeker een andere waarde.

Je kunt dit verhelpen door de steekproef heel groot te maken.

Opgave 3.9 Bloedonderzoek x= 0,436 L/L

n-1 = 0,04643 L/L

variatiecoëfficiënt = 10,6 % Opgave 3.10 Kleine meetseries

a 3,34  0,22 g/L (= de spreiding) b n-1 = 0,31 g/L

de afwijking is groter dan we eerst hadden aangenomen c 3,34  0,31 g/L

d gemiddelde = 3,33

maximale afwijking = 3,56 – 3,30 = 0,23

n-1 = 0,22

bij 3 metingen zijn de spreiding en de standaarddeviatie ongeveer gelijk

Opgave 3.11 Herhaalbaarheid

a n-1 = 0,001527 molL-1 b variatiecoëfficiënt = 1,52 % c ----

Opgave 3.12 Reproduceerbaarheid a n-1 = 0,01013 molL-1 b variatiecoëfficiënt = 9,26 %

c de reproduceerbaarheid is slechter dan de

herhaalbaarheid van de ene analist. Ze werken niet allemaal even nauwkeurig.

d Het verschil lijkt wel veel te groot Opgave 3.13 Gebruik van Excel

a b

(15)

Opgave 4.1 Uitschieters: de Dixons-test of Q-test

a het vermoeden bestaat dat 3,7 een uitschieter is, het verschil met de dichtstbijzijnde waarde is 1,2 b

3,7 lijkt zo een uitschieter c 3,7 - 2,5 = 1,2

d w = 3,7 - 1,7 = 2,0 e

6 , 0 0 , 2

2 , waarneming 1 nde

naastligge waarneming

verdachte

test   

w

Q

f

Kritische waarden voor het bepalen van één uitschieter (Dixons-test of Q-test)

n 3 4 5 6 7 8 9 10 11

Qkritisch 0,94 0,76 0,64 0,56 0,51 0,47 0,44 0,41 0,39

n 12 13 14 15 16 17 18 19 20

Qkritisch 0,37 0,35 0,34 0,33 0,32 0,31 0,30 0,29 0,28

n 21 22 23 24 25 30 35 40 45

Qkritisch 0,29 0,29 0,28 0,28 0,28 0,26 0,25 0,24 0,23 g 0,6 > 0,41 dus 3,7 is inderdaad een uitschieter

h eerst 3,7 weglaten

nieuwe verdachte = 1,7 dus 2,1 - 1,7 = 0,4 w = 2,5 - 1,7 = 0,8

5 , 8 0 , 0

4 , waarneming 0 nde

naastligge waarneming

verdachte

test   

w

Q

opzoeken in tabel Qkritisch = 0,44

0,5 > 0,44 dus 1,7 is ook een uitschieter Opgave 4.2 Nitraatgehalte

1ste verdachte = 2,5 2,5 - 1,9 = 0,6 w = 2,5 - 1,1= 1,4

1,5 2,0 2,5 3,0 3,5 4,0

4 Uitschieters bepalen en afronden

(16)

43 , 4 0 , 1

6 , waarneming 0 nde

naastligge waarneming

verdachte

test   

w

Q

opzoeken in tabel Qkritisch = 0,41 0,43> 0,43 dus 2,5 is net een uitschieter nieuwe verdachte = 1,1 dus 1,1 - 1,4 = 0,3 w = 1,9 - 1,1 = 0,8

test

verdachte waarneming naastliggende waarneming 0,3

0,375 0,38 0,8

    

Q w

opzoeken in tabel Qkritisch = 0,44 0,38 < 0,44 dus 1,1 is geen uitschieter!!

Opgave 4.3 Waar ligt de eerste uitschieter (oplossen van een vergelijking)?

a

b (x23,5)0,94x24,2 2 , 24 09

, 22 94 ,

0 x  x

2 , 06 35 , 0

11 , 11 2

, 2 06 ,

0 

 

x x !!!!

c waarschijnlijk niet R1 zie vorige opgave

R2 dat hangt af van: het aantal waarnemingen dat in het rechter gedeelte ligt

R3 0,49

15 4 , nde 7 naastligge verdachte

test

w

Q

in de tabel zien we dat bij totaal 8 waarnemingen er een uitschieter is

R4 als er rechts maar 1 waarde zou liggen was die

waarschijnlijk wel een uitschieter; doordat de andere er dichtbij ligt wordt verdachte - naastliggende te klein R5 waarschijnlijk zijn beide rechtse metingen uitschieters Opgave 4.4 Uitschieters: de boxplot

a waarschijnlijk alle waarden vanaf 79,0 zijn uitschieters, dat zijn er 16

b c ja

d 150 waarnemingen: mediaan is nr 75 dus mediaan = 69,5 KO ligt tussen 37 en 38 dus KO = 66,5

KB ligt tussen 112 en 113 dus KB = 71,65

ΔK = 1,5  (KB - KO) = 1,5  (71,65 - 66,5) = 1,5  5,15

= 7,725

KO - ΔK = 66,5 - 7,725 = 58,775 KB + ΔK =71,65 + 7,725 = 79,375 4.1

(17)

onderkant: geen uitschieters

bovenkant: alles vanaf 79,375 dus 15 uitschieters, ongeveer zoals we al vermoedden

Opgave 4.5 Uitschieters: gebruik van SPSS Mediaan = 0,43

K1 = 0,39 K3= 0,46 IKA= 0,07

1,5 IKA = 0,035 = 0,04 0,46 + 0,04= 0,50 0,39 – 0,04 = 0,35

Er zijn 2 uitschieters: 0,30 en 0,60

Opgave 4.6 Afrondingsregels a 5,237

b  is niet bekend: 0,005 3

2

228 , 5 247 , 5

2   

n

b w

ligt tussen 0,001 en 0,01 dus afronden op 0,001 dus 3 decimalen.

Opgave 4.7 Afronden oefenen a x= 149,907 g/L

n-1 = 0,11394 g/L

b b = 21  = 21 ×0,11394 = 0,056 afronden op 0,01 x= 149,91 g/L

n-1 = 0,11 g/L c

Chloor in bleekloog (g/L)

1 149,85

2 149,97

3 150,03

4 149,78

Opgave 5.1 IQ

a De gegevens zijn duidelijk verdeeld in klassen. De hoogte van de klassen geeft de frequentie, relatieve

5 Normaalverdeling

(18)

frequentie of frequentiedichtheid van de gegevens in die klasse.

b streepjes tellen: tussen 100 en 120 liggen 20 streepjes, dus klassenbreedte = 1

c gemiddelde = mediaan = modus = 100 d 50 %

e die zijn er waarschijnlijk wel maar die aantallen zijn te klein om hier weer te geven

f ongeveer 84 g 100 - 84 = 16

h onderkant: 100 - 2 ×16 = 68 bovenkant: 100 + 2 ×16 = 132 Opgave 5.2 Vuistregels normaalverdeling

a 34 % + 34 % = 68 %

b 68 % + 13,6 + 13,6 % = 95,2 % c 95,2 % + 2,2 + 2,2 = 99,6 % d --

e 2,4 % (= 2,2 + 0,2) ligt op de onderste 2 grens 82,4 – 54 = 2 dus  = 14,2 kg

f

g 110,8 kg h 13,6 % Opgave 5.3 Significantie

a Boven en onder 2 standaarddeviatie ligt samen 4,8 %.

Als we dat afronden tot 5 % hebben we precies de grenzen te pakken. Een zwangerschap is significant te lang na

266 + 210 = 286 dagen

b 286 dagen is 286/7 = 40 weken en 6 dagen c significant laag IQ onder 100 – 32 = 68

significant hoog IQ boven 100 + 32 = 132

R1 Welke van de volgende zaken zouden volgens jou een normaalverdeling kunnen hebben? Leg uit waarom.

 de lengte van alle studenten op de schoolvoor LMP wel

5.1

(19)

 het gewicht van alle vrouwelijke studenten wel

 de leeftijd van alle studenten niet

 de geboortedata van alle studenten niet

 het aantal uren dat iedere student per week aan de studie besteedt wel

 de tijdsduur van mobiele telefoongesprekken van studenten wel

 het aantal uren dat een student TV kijkt wel R2 de meest spitse en dus hoge normaalverdeling Opgave 5.4 Kansrekening

a allebei 61ofwel 1/6 * 100% = 16,7 % b 616113

c De kans om geen 5 te gooien, dus om een 1, 2 3, 4 of 6 te gooien is 16165

d Omdat je dan veel vaker moet gooien.

e 6150083keer, het gaat over kansen, niet over zekerheid

f

g ofwel 0,0977%

h 50 %

i met totaal 36 mogelijke worpen krijg je 11 verschillende uitkomsten

j slechts een van de 36 geeft 12 punten, dus 361 k

0012 , 000 0 . 125

150 

Opgave 5.5 Kansrekening en medische testen

a 1 % van de baby’s heeft het syndroom, dat zijn er dus 0,0110.000 = 100

b 90 % kans dat de testuitslag positief is, dus dat zijn er 0,9100 = 90

c dat zijn er 10.000 – 100 = 9.900

d 1 % kans op vals positief, dus dat zijn 0,01  9900 = 99 e totaal 90 + 99 = 189

f Kans =

werkelijk aantal positief 90

100% 100% 47, 6 % totaal gemeten positief  189 

g dat is een beroerde test

h de kans wordt dan 9,17%, een onzinnige test dus

(20)

Opgave 5.6 Kansrekening en normaalverdeling

a dat is 1 rechts van het gemiddelde; 50 + 34 = 84 % is kleiner dan 188 cm, dus 100 – 84 = 16 % is langer dan 188 cm

b dat is 16 % van 60.000 = 9600 mannen c 0,159 (15,9 %)?

d P(lengte >188) = 0,159

e 2 links van het gemiddelde, dus 2,4 % ofwel P(l <164 cm) = 0,024

f 50 % + 34 % dus 84 % en dat ligt bij 1 links van het gemiddelde, dus P(l >172 cm) = 0,84

g 196 cm = +2

204 cm = +3 daartussen ligt 2,2 % P(196 cm < l < 204 cm) = 0,021

h moeilijk in te schatten, de lijn loopt niet recht Opgave 5.7 Standaard normaalverdeling

a 50 % + 34,1% = 84,1 %

b ongeveer 100 % – 0,2 – 1 % = 98,8 %

c moeilijk in te schatten, de lijn loopt niet recht d 99,38 %

e 100 – 99,38 = 0,62 % f --

Opgave 5.8 Hartslag

a 2,00

10 70 90

xZ

tabel P(Z <90) = 0,9772 = 97,72 % P(Z >90) = 1 - 0,9772 = 0,0228 dus 2,28 %

R3 We moeten uitrekenen hoe groot de kans is om bij een steekproef een man aan te treffen met een hartslag minder dan 55. Dat is het blauwe gebied in de tekening

linksonder.

tabel P(Z <1,5) = 0,9332 = 93,32 % P(Z >1,5) = 1 - 0,9332 = 0,0668 = 6,68 % 6,68 %

b 5.2

(21)

gebied links van 75: 0,5 10

70 75

Z x geeft

69,15 %

gebied links van 65: 0,5

10 70 65

x

Z geeft

100 – 69,15 = 30,85 %

daartussen ligt: 69,15 – 30,85 = 38,3 % Opgave 5.9 Standaard normaalverdeling en metingen

5 % van 23,5 mg/L = 1,175 afgerond 1,2 mg/L 25 23,5

1, 28 1,175

Z x

 

  

Z-tabel: P(Z <1,28) = 0,8997

P(Z >1,25) = 1 – 0,8997 = 0,1003 (of 10,03 %)

Opgave 5.10 Standaard normaalverdeling en microbiologische metingen a gehalte = 100  100 = 10.000 = 104 KVE

b logwaarde gehalte = log(104)= 4,0 onderste 2 grens 4 – 2  0,15 = 3,70 bovenste 2 grens 4 + 2  0,15 = 4,30 c 103,70 KVE < gehalte <104,30 KVE

5012 KVE < gehalte < 19.952 KVE

d De gevonden gemiddelde waarde ligt niet midden tussen de uiterste waarden

Opgave 5.11 Lampen

a 700 800 2,5

40

Z x

 

   

Z-tabel: P(Z <2,5) = 0,9938

P(Z <–2,5) = 1 – 0,9938 = 0,0062 (of 0,62 %) b

De lampen moeten langer dan ? uur branden. Dat gebied zit helemaal rechts in de normaalverdeling.

P(Z >Zx) = 0,01

P(Z <Zx) = 1 – 0,01 = 0,99 Z-tabel: Zx = 2,33

(22)

Z xZxx Z  

         

Dus 1 % van de lampen houdt het minstens 891 uur vol.

Opgave 5.12 Kwaliteitscontrole bij de bakker

a 1,27

11 436

450 

 

 

Z x en dat geeft 0,8980, dus

89,80 % van de broden ligt beneden de 450 g. Hij levert te weinig waar voor zijn geld

b Uit het histogram blijkt dat we maar de helft van een normaalverdeling zien. Het is dus zeer waarschijnlijk dat de bakker de broden voor deze klant netjes heeft uitgezocht. De andere klanten krijgen dan nog meer broden die te weinig wegen.

R4 Goed R5 –1,5

Opgave 5.13 Chipszakken vullen

a 9 gram dus tussen 191 en 209 g

b We kijken alleen aan de onderkant (teveel vindt de consument niet erg, de fabrikant wel):

191 200

2, 25 4

Z x

 

   

Z-tabel: P(Z <2,25) = 0,9878

P(Z <–2,5) = 1 – 0,9878 = 0,0122 (of 1,22 %) 1,22 % van de productie voldoet niet aan de norm c 0,1 % is 3 , het gemiddelde moet dan 3  4 = 12 g

verder liggen dus 200 + 12 = 212 g

Opgave 6.1 Steekproeven

a met slechts drie mannen zegt dit natuurlijk bijzonder weinig over de hele populatie.

b waarschijnlijk is dat al een iets betere schatting.

c hoe groter de steekproef hoe betrouwbaarder meestal het resultaat.

d De gemiddeldes liggen dicht bij elkaar maar de standaarddeviatie wordt kleiner als het aantal samples per steekproef groter wordt.

6 Van steekproef naar populatie

5.3

(23)

e De nauwkeurigheid neemt dus toe met het aantal samples.

f de beste schatting van de gemiddelde lengte van de populatie mannen boven de 20 is 180,7 cm

g het 99 % betrouwbaarheidsinterval hoort bij een kans van 0,995 (99% ligt tussen 0,005 en 0,995); dit levert een Z-waarde van 2,575.

5 , 1 575 , 2 7 , 180 5

, 1 575 , 2 7 ,

180     

176,8 cm < μ < 184,6 cm

Het 99 % betrouwbaarheidsinterval is dus groter dan het 95 % betrouwbaarheidsinterval

h 180,71,962,5180,71,962,5

dus bij 10 samples 175,8 cm < μ < 185,6 cm en bij 50 samples 177,8 cm < μ < 183,6 cm bij een grotere steekproef wordt de schatting nauwkeuriger

Opgave 6.2 Standaardfout en populatie

a SE n

n

SEn n  

10  3 samples nSEn4,2 37,3 10  10 samples nSEn 2,5 107,9 10  25 samples nSEn1,5 257,5

Ze verschillen heel weinig. De laatste zal wel het meest betrouwbaar zijn.

b Het klopt heel behoorlijk. Als je alles herhaalt komt er toch ook niet steeds weer hetzelfde uit.

Opgave 6.3 Kan het niet met wat minder steekproeven?

R1 Bij de lengtemeting heb je natuurlijk mensen met allemaal verschillende lengtes, maar ook de meting zelf is niet nauwkeurig.

R2 De spreiding in de resultaten van de zoutmeting wordt allen bepaald door de onnauwkeurigheid van mijn meetmethode. Het monster is overal gelijk. Het heeft maar één (onbekend) zoutgehalte.

R3 De populatie is de verzameling van alle mogelijke metingen.

6.1

(24)

a meting zoutgehalte x = 15,1 mg/L en n-1 = 0,2 mg/L

n= 2,5 % van 15,1 mg/L = 0,38 mg/L b Bereken de standaardfout SE.

22 , 0 3 38 ,

n  0 

SE

n SE

c Bereken het 95 % betrouwbaarheidsinterval voor de werkelijke waarde van het zoutgehalte.

22 , 0 96 , 1 1 , 15 22

, 0 96 , 1 1 ,

15     

mg/L 53 , 15 mg/L

67 ,

14 

d Je kunt de steekproef groter maken dus meer metingen aan hetzelfde monster doen.

e Nee, want het 99 % betrouwbaarheidsinterval is groter dan het 95 % interval. Het aantal metingen verandert namelijk niet door een andere berekening. De

steekproef blijft even (on)nauwkeurig.

f Reken uit hoe groot de steekproef minstens moet zijn om een afwijking van maximaal 2 % te krijgen.

2 % afwijking betekent 2 % van 15,1 = 0,302 dus 1,96 × SE = 0,302

0,302

0,1541 SE 1,96 

n n 0,38

2, 47 0,1541

SE n

n SE

 

    

2, 472 6,1

n 

afgerond n =7

je moet dus nog 4 metingen extra doen.

Opgave 6.4 Simulatie van steekproeven uit een populatie a 5

b afwijking = 16 – 13,18 = 2,82 afwijking = 100% 17,6%

16 82 ,

2

c 8  5 = 40

d afwijking = 100% 0,625% 16

10 ,

0 het gemiddelde van

de steekproef komt steeds dichter bij die van de populatie te liggen

e Die is 2,38

f n n SE n 2,38 5 5,32 n

SE  

Hoe meer metingen je doet, hoe beter dit gaat kloppen Opgave 6.5 Betekenis van het betrouwbaarheidsinterval

(25)

a 10 steekproeven b 9 van de 10 dus 90 % c 15 van de 20 dus 75 % d --

Opgave 6.6 Schatting van het populatiegemiddelde bij een kleine steekproef

a Tabel: 95%; tweezijdig; n =5 dus v = 4  t = 2,78 b

n t x n

t

x n1 n1

0, 06 0, 06

0,91 2, 78 0,91 2, 78

5  5

     

BI: 0,84 g/kg < μ < 0,98 g/kg

c De maximale waarde van 1,0 kg ligt boven het betrouwbaarheidsinterval, dus het gehalte is niet te hoog.

R4 een kleiner gebied kun je met minder zekerheid voorspellen dat de werkelijke waarde erin ligt R5 zie vorige vraag

R6 bij eenzelfde betrouwbaarheid (bijv. 95 %) wordt het interval kleiner want nwordt groter, bovendien wordt de t-waarde kleiner, dus ook daardoor wordt het interval kleiner

Opgave 6.7 Schatting van het populatiegemiddelde bij een grote steekproef a n =200, dus v = n – 1 = 199, tabel: t = 1,64

200 64 118 , 200 1

64 118 ,

1     

x

x

14 1594 14

1594  

€ 1580 <  < € 1608 b

190 64 118 , 1 190

64 118 ,

1     

x

x

14 1594 14

1594  

€ 1580 <  < € 1608 en dat blijft door de afronding hetzelfde

Opgave 6.8 BI bij controles - Koloniegetalbepaling a gemiddelde

t n n x

t

x n1 n1 6.2

(26)

5 78 12 , 2 75 5

78 12 , 2

75    

BI: 60 KVE/g < μ < 90 KVE/g

b Ja, het hele interval ligt onder de 100 dus het kiemgetal is niet te hoog

Opgave 6.9 Controle - Zout in mineraalwater

a Tabel: 95%; tweezijdig; n =25 dus v = 24  t = 2,06 gemiddelde:

n t x n

t

x n1 n1

25 06 12 , 2 25 130

06 12 , 2

130    

BI: 125 mg/L < μ < 135 mg/L

b zoals al eerder vermeld kan bij een redelijk grote steekproef de standaarddeviatie gebruikt worden als schatting van de standaarddeviatie van de populatie.

schatting n ≈ n-1 = 12 mg/L

mg/L 60 25

n 12

n      

SE n

SEn

c 150 130 1, 67

12

Z x

 

  

Z-tabel: P(Z <1,67) = 0,9525 P(Z >1,67) = 1 – 0,9525 = 0,0475

Dus 4,75 % van de flessen zal waarschijnlijk meer dan 150 mg/L zout bevatten

Opgave 6.10 BI van verschillen: is het gehalte significant gedaald?

a standaarddeviatie = 0,05  500 = 25 UI/L b tussen  – 2 en  + 2

c 2 = 2  25 = 50 UI/L BI: 500 – 50 < μ < 500 + 50 BI: 450 UI/L < HGC < 550 UI/L

d standaarddeviatie tweede meting = 0,05  475 = 24 UI/L

35 24 252 2

2 2 2 1

TOT     

 UI/L

e 2 = 2  35 = 70

het verschil is 500 – 475 = 25

het verschil kan dus 70 UI/L afwijken BI: 25 – 70 < μ < 25 + 70

BI: – 45 < verschil < 95 UI/L

(27)

f het als er geen verschil zou zijn tussen de metingen van 500 en 475 dan zou het verschil nul zijn; dit getal nul ligt ruim binnen dit interval dus het verschil is niet significant, dat betekent dat we door de onzekerheid van de meetmethode niet mogen aannemen dat de metingen van het gehalte HCG echt verschillen.

Opgave 6.11 Statistisch significant of praktisch significant?

a Middel B geeft de grootste gemiddelde gewichtsafname, maar ook de grootste onzekerheid, de afname kan zelfs negatief zijn, dat betekent dus sommige gebruikers een gewichtstoename kunnen verwachten. Van middel A wordt in ieder geval iedereen (95% betrouwbaar) lichter.

b Wie graag een gok waagt neemt middel B, als je op zekerheid speelt neem je A.

Opgave 7.1 Variaties a --

b Omdat dat afhangt van de gewenste nauwkeurigheid c --

d 20 op de 100 dus 1 op 5, dus 4 rode ballen e toeval

f het kan theoretisch wel, maar de kans is ontzettend klein.

Opgave 7.2 Oorzaken van variaties en controlekaarten

Opgave 7.3 Controlekaarten van losse (enkele) meetwaarden b Welke conclusies zou je kunnen trekken?

a Maak een controlekaart van de uitslagen met grenzen.

LDL gehalte

3 3,5 4 4,5 5

0 5 10 15

maand

LDL (mmol/L)

meetwaarden ondergrens bovengrens

7 Kwaliteitszorg en controlekaarten

(28)

b het LDL gehalte stijgt en wordt te hoog Opgave 7.4 Controlekaarten voor apparatuur of meetmethode

a 2  2,4 = 4,8 % b 2  0,2 = 0,4 %

Opgave 7.5 Kwaliteitscontrole bij de melkproductie a x= 44,9 g/L en n-1 = 0,9 g/L

b Tabel: 95%; tweezijdig; n =10 dus v = 9  t = 2,26

n t x n

t

x n1 n1

0,9 0,9

44,9 2, 26 44,9 2, 26

10  10

     

44,9 0, 64   44,9 0, 64

De 2σ grenzen liggen op – 0,6 en + 0,6 g/L 1 = 0,5 × 0,6 = 0,3 g/L dus 44,6 en 45,2 g/L 2 = 0,6 dus 44,3 en 45,5 g/L

3 = 3  0,3 = 0,9 g/L dus 44,0 en 45,8 g/L c

d De waarden in de tabel kloppen niet, de juiste zijn:

43,7 44,2 44,7 45,2 45,7

0 2 4 6 8 10

vetgehalte (g/L)

dag

controlemonster vetgehalte (g/L)

45,3 45,1 44,4 44,0 44,8 45,8 45,6 44,7

(29)

e op dag 4 is er een meting buiten de

waarschuwingsgrens en op dag 6 zelfs een buiten de actiegrens.

Opgave 7.6 Hoe bepalen we nu of de kwaliteit onbeheerst is?

a ja, op dag 4 en dag 6

b op dag 4 de 12 – regel: waarschuwing dus geen actie op dag 6 de 13 – regel: hier had actie ondernomen moeten worden

c zie b,

 de meting herhalen;

 onderzoek doen naar de oorzaak;

 na opheffen oorzaak herhalen van de meting;

 nieuwe kaart starten.

Opgave 7.7 Is er actie nodig?

a dag 6 de 12 – regel: waarschuwing dus geen actie dag 16 de 41 – regel: hier had actie ondernomen moeten worden

b dag 3 de 12 – regel: waarschuwing dus geen actie dag 13 de 41 – regel: hier had actie ondernomen moeten worden

c dag 7 de 12 – regel: waarschuwing dus geen actie dag 14 de 12 – regel: waarschuwing dus geen actie Opgave 7.8 Controleregels in chemie en microbiologie

a 95% betrouwbaarheidsinterval geeft de 2 grenzen aan, dus 8200 – 2500 = 5700 en 8200 + 2500 = 10.700

3 is dan 1,5 × 2500 = 3750

Dus de 3 grenzen zijn: 8200 – 3750 = 4450 en 8200 + 3750 = 11.950

Dus: 4450 – 5700 – 10.700 – 11.950 b dag 5 t/m 14 de 10x regel

43,7 44,2 44,7 45,2 45,7

0 2 4 6 8 10

vetgehalte (g/L)

dag

controlemonster vetgehalte (g/L)

(30)

c dag 7 de 12 – regel: waarschuwing dus geen actie dag 8 de 22 – regel: hier had actie ondernomen moeten worden

dag 11 de 41 – regel: hier had actie ondernomen moeten worden

dag 19 de 13 – regel: hier had actie ondernomen moeten worden

d nee

EXTRA INFORMATIE Opgave 7.9 Een kijk achteraf: de runchart

24 meetwaarden en 7 runs: dit duidt op afwijkingen er is een shift: een run van 8 ook dit duidt op afwijkingen er is geen trend waarneembaar

Opgave 8.1 Wel of geen verband tussen de grootheden?

a waar je ongeveer een rechte lijn door de punten kunt trekken, dus de bovenste en de onderste

b de bovenste is positief, als de ene grootheid toeneemt, neemt de andere ook toe; de onderste is negatief, als de ene grootheid toeneemt, neemt de andere af

c boven r > 0; midden r = 0 en onder r < 0 Opgave 8.2 Berekenen van de correlatiecoëfficiënt

a

b negatief: zware mensen hebben meer kans vroeg te overlijden

c

verband tussen gewicht en overlijden

65 70 75 80 85 90

60 65 70 75 80 85 90 95

gewicht (kg)

leeftijd overlijden

8 Correlatie en regressie

(31)

i Xi Yi XiX YiY (XiX)(YiY)

1 74 72 -0,5 -3 1,5

2 90 68 15,5 -7 -108,5

3 80 70 5,5 -5 -27,5

4 67,5 85 -7 10 -70

5 68 82 -6,5 7 -45,5

6 78 69 3,5 -6 -21

7 70 77 -4,5 2 -9

8 69,5 74 -5 -1 5

9 79 71 4,5 -4 -18

10 69 82 -5,5 7 -38,5

n =

10

xi 745

yi 750

(xix)(yiy)331,5

x74,5 y75 x 7,23y 6,13

831 , 13 0 , 6 23 , 7 9

5 , ) 331

( ) (

1 

 

y x n

i

i i

n

y y x x

r  

d 0,831 > 0,632 dus er is een aantoonbare correlatie e r2 = 0,8312 = 0,691

f voor 69,1 %

g 0,846 < 0,878 dus er is geen aantoonbare correlatie, het kan dus toeval zijn

Opgave 8.3 Bepalen van een lineaire regressielijn 705 , 23 0 , 7

13 , 831 6 ,

0  

x

r y

a

52 , 127 5 , 74 ) 705 , 0 (

75   

y a x b

De vergelijking van de regressielijn is dus: y = -0,71 x + 127,5 Opgave 8.4 Oefenen met lineaire regressie

a

(32)

er is aantoonbare correlatie want r = 0,982

vergelijking volgens methode boven: y = 0,0585x – 0,2687 b y = 0,0585x – 0,2687 = 10

0585 175 , 0

2687 , 0

10 

x dagen

c meerdere redenen: houd je het vol en blijft de afname per dag gelijk?

R1 hoe kleiner het aantal hoe groter de invloed van het toeval R2 er is wel een heel grote correlatie maar de lijn loopt niet

recht

R3 waarschijnlijk een wortelverband R4 laten we hopen van niet

R5 de grootte van de bevolking?

R6 agressieve kinderen kijken veel vaker TV,………..

R7 statisch: ze hebben duidelijk met elkaar te maken maar er kan een heel andere oorzaak zijn

oorzakelijk: een van de twee is de oorzaak en de andere is daar een gevolg van

Opgave 8.5 Lineaire regressie met Casio fx-82SX Opgave 8.6 Lineaire regressie met Excel

a

volgehouden dagen dieet

0 0,5 1 1,5 2 2,5 3 3,5

0 10 20 30 40 50 60

dagen dieet

gewichtsverlies (kg)

8.1

(33)

r = R2  0,98870,994 b YES , want 0,994 > 0,666

c Dat is natuurlijk niet waarschijnlijk. de grafiek zal minder steil gaan lopen, want afkeur blijft er altijd

R1 Hoe zou de tekening van de eenzijdige toets eruit zien als we als alternatieve hypothese gesteld hadden: H1: µ < 50?

R2 Als we het voorbeeld van de cola eenzijdig hadden getest, was de uitslag dan anders geweest? Leg uit, eventueel met een berekening.

Opgave 9.1 Testen van het uit de steekproef geschatte gemiddelde t.o.v.  a x= 24,5 kg en n-1 = 1,0 kg

b 1,12

0 , 1 5 5 , 24 25 )

(

1 - n

  xn t

c 2,5 %

d v = n – 1 = 5 – 1 = 4 tabel: tkritisch = 2,78.

e 1,12 < 2,78

f de nulhypothese wordt aangenomen

g Het gewicht voldoet aan de specificatie van 25 kg met een betrouwbaarheid van 95 %

Opgave 9.2 Paracetamol

a via de website:

One sample t test results

verband tussen afkeur en dagproductie y = 0,0013x - 1,8182 R2 = 0,9887

0 0,5 1 1,5 2 2,5 3 3,5 4 4,5 5

0 500 1000 1500 2000 2500 3000 3500 4000 4500 5000

productie/dag

afkeur (%)

9 Testen van meetresultaten

9.1

(34)

P value and statistical significance:

The two-tailed P value equals 0.0045

By conventional criteria, this difference is considered to be very statistically significant.

zelf berekenen Nulhypothese:

Het gewicht voldoet aan de specificatie, de waarde wijkt niet significant af van 200 g

H0: µ = 200 g

Alternatieve hypothese

Het gewicht voldoet niet aan de specificatie, de waarde wijkt significant af van 200 g

H0: µ  200

90 , 4 4 192 6 200 )

(

1 - n

  xn t

v = n – 1 = 6 – 1 = 5

tabel: 95%; tweezijdig,  tkritisch = 2,57

4,90 > 2,57, dus de nulhypothese wordt verworpen Het gewicht is significant lager dan 200 g met een betrouwbaarheid van 95 %

b bij een eenzijdige test is de tkritisch = 2,02; deze afwijking is nog groter, dus de conclusie is hetzelfde

Opgave 9.3 Nieuwe machine

a eenzijdig, je wilt bewijzen dat hij sneller is.

b Nulhypothese:

Het aantal van de nieuwe machine verschilt niet van de oude H0: µ = 250

Alternatieve hypothese

Het aantal van de nieuwe machine is groter dan van de oude H1: µ > 250

91 , 6 7 265 10 250 )

(

1 - n

  xn t

v = n – 1 = 10 – 1 = 9 tabel: tkritisch = 1,83

7,91 > 1,83 dus de nulhypothese wordt afgewezen en de alternatieve dus aangenomen; de nieuwe machine werkt significant sneller dan de oude.

Opgave 9.4 Slootwater

a plaatje II past het best

b de meetserie van de partner lijkt nauwkeuriger c Eigen metingen

(35)

Nulhypothese:

Het “werkelijke” gehalte wijkt niet significant af: H0: µ = 0,40

Alternatieve hypothese

Het “werkelijke” gehalte wijkt wel significant af: H0: µ  0,40

46 , 02 3 , 0 38 12 , 0 40 , 0 )

(

1 - n

  xn t

v = n – 1 = 12 – 1 = 11

tabel: tkritisch = 2,20 (geen voorkeur dus tweezijdig testen) 2,20 < 3,46 dus de nulhypothese wordt afgewezen

De gevonden waarde wijkt significant af van de werkelijke waarde.

Metingen partner

Het “werkelijke” gehalte wijkt niet significant af: H0: µ = 0,40

Alternatieve hypothese

Het “werkelijke” gehalte wijkt wel significant af: H0: µ  0,40

3 , 01 11 , 0 44 8 , 0 40 , 0 )

(

1 - n

  xn t

tabel: tkritisch = 2,36 (geen voorkeur dus tweezijdig testen) 2,36 < 11,3 dus de nulhypothese wordt afgewezen

De gevonden waarde wijkt significant af van de werkelijke waarde.

d Beide meetmethoden voldoen niet Opgave 9.5 Vergelijken van twee meetseries

Opgave 9.6 T-test van gemiddelde uit twee steekproeven a Bereken S.

5 , 74 422

74

425 74 420

74 2 2

2 1

2 2 2 2 1

1

 

 

v v

v

S v  

b 5,07

75 1 75 5 1

, 422

2750 3100

1 1

2 1

2

1

 

 

n S n

x t x

c tabel: tkritisch = 2,00

5,07 > 2,00 dus de nulhypothese wordt verworpen d Er is wel een significant verschil tussen de gemiddelden

Het gemiddelde gewicht van de behandelde groep is dus groter dan die van de controlegroep

(36)

Opgave 9.7 F-test van standaarddeviaties uit twee steekproeven

a 2,56

25 , 0

40 , 0

2 2 2

) 1 ( B

2 ) 1 (

A  

n

F n

b tabel: Fkritisch = 3,58

2,56 < 3,58 dus de nulhypothese wordt aangenomen c De meetseries verschillen niet significant in precisie. Je

kunt dus niet zeggen dat serie B nauwkeuriger is. De verschillen zijn aan toeval te wijten

Opgave 9.8 Afvalwateronderzoek Gemiddelde

Nulhypothese: Er is geen significant verschil tussen de gemiddelden: H0: µ1 – 2 = 0

Alternatief: H1: µ1 – 2  0 (geen voorkeur voor een van beide methoden), dus tweezijdig testen.

67 , 10 1

10

99 , 1 10 27 , 1

10 2 2

2 1

2 2 2 2 1

1

 

 

v v

v

S v  

55 , 8 11

1 11 67 1

, 1

37 , 6 55 , 4 1

1

2 1

2

1

 

 

n S n

x x t

tabel: tkritisch = 2,23

8,55 > 2,23 dus de nulhypothese wordt verworpen. Er is een significant (opvallend) verschil in de gevonden gemiddelden Standaarddeviatie

Nulhypothese: De precisie van methode B is niet significant beter dan de precisie van methode A: H0: A = B

Alternatief: de precisie van methode B is significant slechter dan de precisie van methode A H1: A < B . Dus tweezijdig testen.

46 , 27 2 , 1

99 , 1

2 2 2

B 2

A  

  F

tabel: Fkritisch = 3,72

2,46 < 3,72 dus de nulhypothese wordt aangenomen. De meetseries zijn wel vergelijkbaar wat betreft precisie.

Opgave 9.9 T-test van gemiddelde uit twee steekproeven met gepaarde waarnemingen

a op het beeldsignaal b ja

c nul?

(37)

d 2,02 4

, 34

10

22 

 

V

v n

t x

e tabel: tkritisch = 2,26

2,02 < 2,26 dus de nulhypothese wordt aangenomen.

f Er is geen significant verschil tussen de gemiddelde reactietijden.

Opgave 9.10 Hemoglobinegehalte Nulhypothese

Er is geen significant verschil tussen de gemiddelde Hb-gehaltes per patiënt

H0: xv 0

Alternatieve hypothese

Er is wel een significant verschil tussen de gemiddelde Hb- gehaltes per patiënt

H1: xv 0

Hb-gehalte (g/dL)

patiënt A B verschil

1 12,5 13,4 -0,9

2 13,6 14,7 -1,1

3 16,3 17,1 -0,8

4 15,8 15,2 0,6

5 14,6 15,3 0,7

6 11,3 13,8 -2,5

gemiddeld 14,0 14,9 -0,9 0,9

45 , 9 2

, 0

6 9 ,

0  

 

V

v n

t x

(neem xv 0)

tabel: tkritisch = 2,57

2,45 < 2,57 dus de nulhypothese wordt aangenomen. Er is geen significant verschil tussen beide meetmethoden

Opgave 9.11 Opstellen van hypotheses CASUS 1

a Het gemiddelde gehalte van een steekproef uit de partij kindervoeding.

b Nulhypothese

Er is geen significant verschil tussen het gemiddelde gehalte en de maximale waarde van 0,02 kg

H0:  = 0,02 mg/kg Alternatieve hypothese

Referenties

GERELATEERDE DOCUMENTEN

Voor de werklozen met een werkloosheidsduur tussen 1 en 2 jaar stellen we een toename vast van 6 424 eenheden (+ 8,3%). In juni 2014 zijn 36,0% van de werkzoekende volledig

Er werden in het Vlaams Gewest 181.012 volledig werklozen geteld of 16.824 meer dan in maart 2013 (+ 10,2%). In het Brussels Hoofdstedelijk Gewest ten slotte waren er deze maand

Gemiddeld over de laatste drie maanden waren er 151.442 tijdelijk werklozen of 28.075 minder dan vorig jaar (- 15,6%)... 1.1 Aantallen. Vlaams

Deze sociale hulpbron is wel van belang voor het welzijn, maar de verschillen tussen lhb-jongeren en heteroseksuele jongeren in de ervaren steun van vrienden zijn dermate klein, dat

Eens knielt iedereen in aanbidding voor Hem neer zingend: “Hij is onze Heer,.. Hij is

vitamines zijn organische stoffen en komen dus uit de levende natuur, terwijl mineralen anorganische stoffen zijn en dus uit de dode natuur komen... Oplosbaar in water of

De liefde is lankmoedig, zij is goedertieren; de liefde is niet afgunstig; de liefde handelt niet lichtvaardiglijk, zij is niet opgeblazen; Zij handelt niet ongeschiktelijk, zij

Je kunt iets bedenken, een Eurekamoment hebben, maar het omzetten van een idee naar de praktijk, daar moet je een soort Willie Wortel voor zijn.. En ook Willie Wortel was niet