• No results found

Examenvragen Datamining 2019-2020

N/A
N/A
Protected

Academic year: 2021

Share "Examenvragen Datamining 2019-2020"

Copied!
3
0
0

Bezig met laden.... (Bekijk nu de volledige tekst)

Hele tekst

(1)

Examen Data Mining – Januari 2020

Examenvragen Data mining

2019-2020

De cursusdienst van de faculteit Toegepaste Economische

Wetenschappen aan de Universiteit Antwerpen.

Op het Weduc forum vind je een groot aanbod van samenvattingen, examenvragen, voorbeeldexamens en veel meer, bijgehouden door je medestudenten.

(2)

Examen Data Mining – Januari 2020

VRAAG 1: 6 PUNTEN

Leg het framework van FAT data science ethics uit en geef voorbeelden van HR Analytics. Geef ook de definities van fair, accountable and transparancy.

__________________________________________________________________________________ Leg association rules van a priori uit.

__________________________________________________________________________________ Leg uit hoe je training, validation en test set bepaalt bij random forests.

 Antwoorden met splitting rule, stopping rule en association rule  Antwoorden met Gini’s en Laplace

__________________________________________________________________________________ Leg uit hoe je training, validation en test set bepaalt bij decision tree.

__________________________________________________________________________________ Stel ge bent chief data science en de decaan vraagt voor iets te bedenken om plagiaat te checken bij master thesissen. Hoe zou je dat aanpakken?

VRAAG 2: 5 PUNTEN

Je beschikt over Facebook data van 7000 personen. Je wil dit gebruiken om de politieke voorkeur van een persoon te voorspellen. Los de deelvragen op.

1) Wat is de target variabele en hoe bekom je dit?

2) Geef enkele voorbeelden van features die je kan gebruiken. 3) Hoe ga je dit model modelleren?

4) Hoe ga je dit model evalueren?

5) Geef een toepassing van dit model in de praktijk. Zijn er ook ethische vragen?

Een bank heeft betalingsgegevens van 2 miljoen klanten en ze gaan een nieuw 'groen' fonds uitgeven. Bouw een model waaruit je kan zien wie daarin geïnteresseerd is.

1) Wat is de target variabele en hoe bekom je dit?

2) Geef enkele voorbeelden van features die je kan gebruiken. 3) Hoe ga je dit model modelleren?

4) Hoe ga je dit model evalueren?

5) Geef een toepassing van dit model in de praktijk. Zijn er ook ethische vragen?

__________________________________________________________________________________ Oefening: bereken de TPR en AUC (oefening).

Bijvraag: stel een AUC van 50% en TPR van 100%, kan dat?

__________________________________________________________________________________ Oefening: bepaal de associaion rules.

VRAAG 3: 4 PUNTEN (3 definities) Geef de definitie van:

(3)

Examen Data Mining – Januari 2020

 Lift curve  Confidence

 Hoe kan de kwaliteit van k means clustering beïnvloed worden?

__________________________________________________________________________________ Geef de definitie van:

 Lazy learner  ROC

 Entropy

__________________________________________________________________________________ Geef de definitie van:

 Regressie

 Content versus collaborative recommender systems  Datamining

__________________________________________________________________________________ Geef de definitie van :

 Random forest  Profit curve

Referenties

GERELATEERDE DOCUMENTEN

Een model is een sterk medium om een complex geheel aan anderen over te brengen ↔ Een model is een zwak medium om precies en betrouwbaar een complex geheel aan anderen over te

In juni 2016 zijn er 371 artikelen over suïcide geschreven door drie Engelstalige Indiase kranten.. De artikelen zijn beoordeeld op basis van elf onderdelen die eerder

Audittrail naar unieke identiteit Access Control:

Als een vraag een meerkeuzevraag is, dan wordt dat aangegeven met 'meerkeuze' achter het

Naar aanleiding van informatie 1 bespreken Nadia en Carry met elkaar het voordeel van deze bouw van de longen voor de ademhaling van een dolfijn vergeleken met die van een

Effecten van verstoord ruimteweer Zonnevlammen Protonstormen Oorzaak Gevolgen CMEs CHs 18 april 2018 De Zon 45.. Wekelijkse SIDC

McIntosh-classificatie • Classificatie volgens 3- lettercode – 60 mogelijke combinaties • Classificaties gelinkt aan sterkte zonnevlammen.. McIntosh en

Zeggen of relatie een equivalentierelatie, totale orderelatie, quasi-orde-relatie, partiële orde relatie of geen van beide: