• No results found

. . Deeltoets DAR

N/A
N/A
Protected

Academic year: 2021

Share ". . Deeltoets DAR"

Copied!
3
0
0

Bezig met laden.... (Bekijk nu de volledige tekst)

Hele tekst

(1)

Deeltoets 1 DAR

28 rnei 20L3

9:00

-

10:,15, BBL-001

o

Vernrelcl op e,lk vel

je

rraarn en studentnurnnler.

.

Toon

bii

het inlervererl

ie

collergekaart.

o

Schrijf en fonnuleer cluidelijk.

o

Je nrag een A4 nret uanterkeningen raadplegen.

.

Het tenta,nrer] cluurt 1:-15 urlr

Dit tentamen is in elektronische vorm beschikbaar gemaakt door de TBC van A–Eskwadraat.

A–Eskwadraat kan niet aansprakelijk worden gesteld voor de gevolgen van eventuele fouten in dit tentamen.

1

(2)

1 top-k algoritmeÍl

We hebben een functie

f -

P1

*

Pz. Voor deze frlnctie

waarclen bepalen. De aflopencl gesorteerde lijsten voor OID Pt

4 6

1 5 3 2

100

BO

70 60 50 40

willen \rie een

top

k: van maxitnale P1 elr P2 zrjn hieronder gegevelt.

OID P2 6

1 5 1 2 3

90 80 7A 60 50 50

(i)

Beschrijf hoe via het Threshold Algoritnr.e een

top

3 berekend wordt.

(ii)

Bes<àrijf hoe via het No Random Access Algoritrne een

top

3 berekencl wordt.

2 Sparse matrix techniques en Google Pagerank

(i)

Wat is rle algoritmische complexiteit van cle stanclaardz-r,lgoritme voor vermenigvuldig- ing van een

matrix &í

met een vector u

in

een n-dimensionirle ruinrte? Ga er van

uit dat

we voor zowel

À/

als u arraystructuren gebruiken.

(ii)

Een

matrix

is sparse (spaars) als het aantal niet-nul-elementen aanzienlijk kleiner is dar- n2. Beschriif een tr,lternatieve datastructuur van een

matrix

om de cornplexiteit te verbeteren. Schets een tr,lgoritme voor ,&/u.

(iii)

Stel vast

dat

de Google

matrix G niet

sparse

is.

Hoe

kun je toch

sparse rnatrix technieken gebruiken?

Ter herinnering:

G:aS+(1 -a)T,nl.et S- H+*"o' enZ

3 Map-Reduce

Beschrijf hoe

je via

N,Iap-Recluce woordfrequenties

kunt

bepalen.

Input is

een gesplitste tekstfile die woorden bevat zonder

interpunctie. Output

is een opsomming van woorden rnet de biibehorende frequentie,

in

willekeurige volgorde.

Voorbeeld:

input : to

be or not

to

be

otrtput

:

(be,2), (or,1), (to,2), (not,1)

--

L LeeT

2

(3)

4 alignment

Het Needleman-Wunsch-algoritme

(NW) is in

feite een aanpassing van een standaardal- goritrne vooï approximate string matching op ge$/one tekst,

in

het bijzonder op woorden.

In

het laatste geval gaat men

uit

van de Levenshtein distance oftewel edit distance tussen

strings.

Deze

is

gebaseerd

op drie

soorten

edit-acties: insert,

delete en

update.

Voor- beelden:

o

insert: van

keur

naar

kleur o

delete; van

niets

naar

iets o

update: r,'an f

lets

naar f

iets

Het gaat daarbij steeds om één symbool per keer. De kosten van elke eclit-actie bedragen

1. Dit

correspondeert met een score van

-1.

De kosten van een mtrtch van twee identieke letters zijn

0.

De afstand tussen twee strings is het minimale aantal edit-acties

dat

nodig is orn de ene string om te vorrlen na,ar de anclere. Nlerk op dat

dit

een symmetrische maat is.

Voorbeeld: de edit-distance van GEHEUGEN en BEHAGEN

is drie.

De

G wordt

een

B,

c1e

tweede E een

A

en de

U

wordt verwijderd.

(i)

\,Ierk op dat er een andere manier is om op afstand drie

uit

te komen. Welke?

In

plaats van de protein

similarity

(zoals

bij llw)

gaan v/e nu de edit distauce tussen twee strings berekenen.

Dit

kunnen we wederom bewerkstelligen

via

dynamic prograumring.

We hoeven slechts een klein atrntal wijzigingen op

NW

aan te brengen orn

in

plaats van de

similarity de

edit

distzrnce te berekenen.

(ii) DrukdescorefunctieF(i,,j) uitin.F(i-1.,j),F(i,j-1)en F(i-l,j-L).

Defunctie

geeft de negatieve edit-distance \Meer.

(iii)

Stel voor GEHEUGEN en BEHAGEN een matrix op die de berekening van de edit-distance via dynamic progràrnming weergeeft.

Duidt

de twee oplossingen aan die de minimale afstand representeren.

(iv)

Waarom hanteren we deze afstandsmaat niet

in

het domein van proteïnestrings? Is deze afstandsmaat

in

de context van genoomstrings toch bruikbaar?

2

Referenties

GERELATEERDE DOCUMENTEN

Het besluit van de Vlaamse Regering van 28 mei 2004 betreffende de dossiersamenstelling van de aanvraag voor een stedenbouwkundige vergun- ning bepaalt dat voortaan bij het dossier,

Op de website van OPTA vindt u een handreiking voor het naleven van deze verplichtingen: http://www.opta.nl/nl/actueel/alle-publicaties/publicatie/?id=2967 OPTA heeft

Het valt ook op dat 39 procent van de mensen die een euthanasie aanvragen, verkiezen thuis te sterven, terwijl normaal slechts een vierde van de mensen

Onderwerp: Oproep van de Stichting van het Onderwijs: 'Investeer in onderwijs maar dan ook echt!' Geachte fractievoorzitters van de politieke partijen en woordvoerders van de

Het college kiest er niet voor om in Eelde één gebouw in te zetten als cultuurhuis.. Dat doet afbreuk aan de

familiefilm tekenfilm spannende film natuurfilm soort film groep 6 groep 7 groep 8. Welke film werd in 2 groepen even

familiefilm tekenfilm spannende film natuurfilm soort film groep 6 groep 7 groep 8. Welke film werd in 2 groepen even

Deze vooringenomenheden zijn bij de meeste HRM-afdelingen niet bekend; hierdoor wordt er veelal niet aan vrouwen gedacht voor bepaalde functies 27 en hebben ze ook niet altijd