Examen Data Mining – Januari 2020
Examenvragen Data mining
2019-2020
De cursusdienst van de faculteit Toegepaste Economische
Wetenschappen aan de Universiteit Antwerpen.
Op het Weduc forum vind je een groot aanbod van samenvattingen, examenvragen, voorbeeldexamens en veel meer, bijgehouden door je medestudenten.
Examen Data Mining – Januari 2020
VRAAG 1: 6 PUNTEN
Leg het framework van FAT data science ethics uit en geef voorbeelden van HR Analytics. Geef ook de definities van fair, accountable and transparancy.
__________________________________________________________________________________ Leg association rules van a priori uit.
__________________________________________________________________________________ Leg uit hoe je training, validation en test set bepaalt bij random forests.
Antwoorden met splitting rule, stopping rule en association rule Antwoorden met Gini’s en Laplace
__________________________________________________________________________________ Leg uit hoe je training, validation en test set bepaalt bij decision tree.
__________________________________________________________________________________ Stel ge bent chief data science en de decaan vraagt voor iets te bedenken om plagiaat te checken bij master thesissen. Hoe zou je dat aanpakken?
VRAAG 2: 5 PUNTEN
Je beschikt over Facebook data van 7000 personen. Je wil dit gebruiken om de politieke voorkeur van een persoon te voorspellen. Los de deelvragen op.
1) Wat is de target variabele en hoe bekom je dit?
2) Geef enkele voorbeelden van features die je kan gebruiken. 3) Hoe ga je dit model modelleren?
4) Hoe ga je dit model evalueren?
5) Geef een toepassing van dit model in de praktijk. Zijn er ook ethische vragen?
Een bank heeft betalingsgegevens van 2 miljoen klanten en ze gaan een nieuw 'groen' fonds uitgeven. Bouw een model waaruit je kan zien wie daarin geïnteresseerd is.
1) Wat is de target variabele en hoe bekom je dit?
2) Geef enkele voorbeelden van features die je kan gebruiken. 3) Hoe ga je dit model modelleren?
4) Hoe ga je dit model evalueren?
5) Geef een toepassing van dit model in de praktijk. Zijn er ook ethische vragen?
__________________________________________________________________________________ Oefening: bereken de TPR en AUC (oefening).
Bijvraag: stel een AUC van 50% en TPR van 100%, kan dat?
__________________________________________________________________________________ Oefening: bepaal de associaion rules.
VRAAG 3: 4 PUNTEN (3 definities) Geef de definitie van:
Examen Data Mining – Januari 2020
Lift curve Confidence
Hoe kan de kwaliteit van k means clustering beïnvloed worden?
__________________________________________________________________________________ Geef de definitie van:
Lazy learner ROC
Entropy
__________________________________________________________________________________ Geef de definitie van:
Regressie
Content versus collaborative recommender systems Datamining
__________________________________________________________________________________ Geef de definitie van :
Random forest Profit curve