Gegevens verzamelen
Data zijn vaak gespreid:
-mensen hebben verschillende lengtes , of IQ, of …..
Statistiek gaat over het verzamelen en verwerken van data (gegevens )
-flesjes bier uit eenzelfde partij hebben een verschillende inhoud
Een levend histogram
-analyses van eenzelfde monster geven verschillende uitslagen
monster 1 2 3
Spreidingsmaten
De mate van spreiding varieert afhankelijk van de oorzaak van de spreiding:
-verschillen in lengtes (en IQ en….) van mensen worden veroorzaakt door …….
verschillende en veranderende genen
-de inhoud van flesjes bier varieert doordat ………
de vulmachine niet steeds precies hetzelfde volume doseert -analyse uitslagen verschillen door ………
een groot aantal invloeden waaronder aflees- en instrumentonnauwkeurigheid
Hoe bepaal je de mate van spreiding zonder alles te willen onderzoeken?
Door een steekproef te nemen uit de totale populatie
populatie
steekproef
Steekproeven
Steekproef nemen uit de totale populatie
populatie
steekproef
Eisen aan steekproef:
-aselect
-representatief
Aselect = niet uitgezocht (random)
Is dit een goede steekproef?
Een leerling van de middelbare school wil voor zijn profielwerkstuk onderzoeken hoeveel er gerookt wordt door medeleerlingen. Hij gaat daarom aan het begin van de pauze buiten staan en vraagt aan de eerste 10 leerlingen die naar buiten komen of ze roken of niet.
Representatief = steekproef en populatie hebben dezelfde samenstelling
Steekproeven
Steekproef nemen uit de totale populatie
populatie
steekproef
Eisen aan steekproef:
-aselect
-representatief
Aselect = niet uitgezocht (random)
Representatief = steekproef en populatie hebben dezelfde samenstelling
Is dit een goede steekproef?
Bij een opiniepeiling moet je bellen om je mening te kunnen geven.
Spreidingsmaten
Nieuwe reeks data (voorbeeld):
23, 21, 25, 24, 27, 23, 23, 19, 21, 18, 27 Steekproef nemen uit de totale populatie
populatie
steekproef
Wat gaan we doen?
-ordenen
-getallen bepalen -grafisch weergeven Ordenen
18, 19, 21, 21, 23, 23, 23, 24, 25, 27, 27
Middelste = mediaan
min max
Meest voorkomende = modus Gemiddelde = 22,8
Boxplot
Gesorteerde data grafisch weergeven 18, 19, 21, 21, 23, 23, 23, 24, 25, 27, 27
mediaan
onderste helft = eerste kwartiel
mediaan
mediaan
bovenste helft = derde kwartiel boxplot
25 % 25 % 25 % 25 % Waar ligt het gemiddelde?
Had je dat kunnen voorspellen?
min max
Geeft een beeld van de verdeling van de meetwaarden