Baarde en de goede Hoofdstuk 10:
Datapreparatie
Contact
Dit document is samengesteld door onderwijsbureau Bijles en Training. Wij zijn DE expert op het gebied van bijlessen en trainingen in de exacte vakken, van VMBO tot universiteit.
Zowel voor individuele lessen op maat als voor doelgerichte groepstrainingen die je voorbereiden op een toets of tentamen. Voor meer informatie kun je altijd contact met ons
opnemen
via onze website: http://www.wiskundebijlessen.nl of via e-mail: marc\_bremer@hotmail.com
Disclaimer
Alle informatie in dit document is met de grootst mogelijke zorg samengesteld. Toch is het niet uit te sluiten dat informatie niet juist, onvolledig en/of niet up-to-date is. Wij zijn hiervoor
niet aansprakelijk. Op geen enkele wijze kunnen rechten worden ontleend aan de in dit document aangeboden informatie.
Auteursrecht
Op dit document berust auteursrecht. Het is niet toegestaan om dit document zonder voorafgaande schriftelijke toestemming van de auteur te kopieren en/of te verspreiden in
Verwerken gegevens
Codeboek = overzicht van mogelijke antwoorden per vraag en de code die bij het antwoord hoort
Nr Omschrijving Variabele naam Codes
1 Geslacht patient Geslacht 1 vrouw 2 man 2 Leeftijd in jaren Leeftijd 1, 2, 3, …
3 Woonplaats Woonplaats Kan pas na de enquete gecodeerd worden ! 4 Tevreden over studie Tevredenstudie 1. Ja
2. Nee 3. neutraal
Controleren kwaliteit data 1
Het controleren van de data zul je moeten doen met behulp van een frequentietabel, histogram etc.
Aandachtspunten:
1. Komen er, door tikfouten, niet-toegestane codes voor ?
2. Zijn bepaalde codes niet of nauwelijks als antwoord gekozen ? In dat geval is het niet zinnig deze codes bij je analyse te gebruiken.
3. Is er bij numerieke variabelen voldoende spreiding
en wat is de verdeling ?
Controleren kwaliteit data 2
Controleren kwaliteit data 3
Homogeniteit 1
Vaak stel je meerdere vragen over hetzelfde onderwerp. Deze vragen wil je in je
uiteindelijke analyse combineren.
MAG DAT ?
Om dat te weten te komen bereken je de homogeniteit; meten deze vragen echt hetzelfde ?
Homogeniteit gemeten door Cronbach’s
Alpha. Moet groter dan 0.7 zijn.
Homogeniteit 2
Wat als de homogeniteit te laag is ? 1.Gooi 1 vraag weg en kijk of de
homogeniteit daarmee verbeterd.
2.Probeer of je de vragen kunt verdelen in een aantal groepjes die WEL hetzelfde meten, en kijk of je daarmee dan
meerdere ‘deelvragen’ kunt
beantwoorden.
Homogeniteit 3
Hercoderen 1
Voor het bepalen van de homogeniteit moeten de vragen wel ‘hetzelfde’ zijn. Dat betekent:
1. De vragen moeten evenveel antwoordcategorieen bevatten
2. De antwoordcategorieen moeten ongeveer hetzelfde
betekenen
Hercoderen 2 voorbeeld
Hoe moeten de volgende twee
vragen over de informatievoorziening bij een trammaatschappij worden
aangepast en / of gehercodeerd ?
De dienstregeling is onoverzichtelijk
Mee eens 0 0 0 0 0 Niet mee eens De conducteurs zijn behulpzaam
0 Ja 0 Nee
Oefening
1. Controleer de variabelen op onmogelijke codes en verdeling van waarnemingen. Verbeter waar nodig.
2. Hoe staan missing values in het bestand ? Hoe weet SPSS wat de missing values zijn ?
3. Er zijn in totaal 5 variabelen die horen bij het begrip psychische belasting en 5 variabelen die horen bij het begrip betrokkenheid. Controleer voor iedere variabele of deze voor de homogeniteitsanalyse gehercodeerd moet worden.
Als je een variabele hercodeerd, maak dan een nieuwe variabele aan, en geef de nieuwe variabele een naam, variable label, value labels, en het juiste meetniveau.
4. Voer voor elk van de twee begrippen een
homogeniteitsanalyse uit. Onderzoek of het zinvol is om 1