• No results found

Samenvatting Doctoraatsproefschrift Gert Thijs PROBABILISTISCHE METHODEN OM TE ZOEKEN NAAR REGULATORISCHE ELEMENTEN IN SETS VAN CO-GEREGULEERDE GENEN

N/A
N/A
Protected

Academic year: 2021

Share "Samenvatting Doctoraatsproefschrift Gert Thijs PROBABILISTISCHE METHODEN OM TE ZOEKEN NAAR REGULATORISCHE ELEMENTEN IN SETS VAN CO-GEREGULEERDE GENEN"

Copied!
1
0
0

Bezig met laden.... (Bekijk nu de volledige tekst)

Hele tekst

(1)

Samenvatting Doctoraatsproefschrift

Gert Thijs

PROBABILISTISCHE METHODEN OM TE ZOEKEN NAAR

REGULATORISCHE ELEMENTEN IN SETS VAN CO-GEREGULEERDE

GENEN

In de laatste jaren heeft het onstaan van nieuwe technologi ¨en, zoals microroosters en vol-ledig geautomatiseerde sequentiebepaling, de hoeveelheid beschikbare biologische gegevens sterk doen toe nemen. Deze overvloed aan beschikbare gegevens doet de vraag stijgen naar nieuwe algoritmen die relevante informatie kunnen vinden in deze gegevens. Hier doet de bio-informatica zijn intrede. Op dit kruispunt tussen moleculaire biologie en bio-informatica kunnen we ons onderzoek situeren. In dit proefschrift stellen we een set van algoritmen voor om te zoeken naar potenti ¨ele bindingsplaatsen voor transcriptiefactoren vertrekkend van een probabilistisch sequentiemodel en sets van co-reguleerde genen. Het probleem wordt benaderd vanuit twee invalshoeken: gesuperviseerd of niet-gesuperviseerd.

Om het niet-gesuperviseerd probleem aan te pakken, hebben we het originele Gibbs sampling algoritme om motieven te zoeken aangepast. Vooreerst hebben we een hogere-orde achter-grondmodel ge¨ıntroduceerd om beter het onderscheid te kunnen maken tussen echte motieven en achtergrondruis. Ten tweede hebben we het probabilistische raamwerk gebruikt om het aan-tal instanties van een motief te schatten in een sequentie. Deze uitbreidingen hebben geleid tot de implementatie van MotifSampler. Dankzij een doorgedreven studie van de invloed van de parameters op de performantie hebben we het nodige inzicht verworven in het gedrag van ons algoritme. Deze analyse heeft ons dan toegelaten om een uitgekiende strategie voor te stellen om motieven te zoeken in biologische voorbeelden. In deze thesis gebruiken we vier grote voor-beelden voor een gedetailleerde studie: 33 sequenties met de G-box transcriptiefactor in planten, 10 regulons in gist, deσ54factor in prokaryoten en vier clusters van co-gereguleerde genen uit de

cellcyclus in gist. De grote verscheidenheid van deze voorbeelden illustreert duidelijk de mogelijk-heden en beperkingen van ons algoritme. Het belangrijkste resultaat is dat een goed ontworpen organisme-specifiek achtergrondmodel de performantie singificant verbetert vooral wanneer een grote hoeveelheid ruis aanwezig is in de dataset.

Vertrekkend van het probabilistisch sequentiemodel hebben we ook een gesuperviseerde me-thode, MotifScanner, ge¨ımplementeerd om instanties van gekende motieven te detecteren. Een gedetailleerde analyse van de invloed van de parameters op de performantie toont aan dat on-ze methode robuuster is dan een klassiek schema om met een gewichtsmatrix te scoren. Als een set van bekende matrices voorhanden is, kunnen we een set van co-gereguleerde genen screenen en de statistische significantie berekenen van het aantal gevonden instanties. Als re-ferentie nemen we het verwachte aantal instanties gevonden in alle promoters in het genoom. Voorbeelden in gist tonen aan dat deze methode toepasbaar is maar dat de grootste beperking de kwaliteit van de matrices is.

Tenslotte bespreken we de implementatie van INCLUSive, een ge¨ıntegreerd web-gebaseerd platform voor de analyse van microroostergegevens. De analyseprocedure start met Adaptive Quality-Based Clustering, wat resulteert in een aantal clusters met een gelijkaardig expressie-profiel. In de volgende stap willen we de promotersequenties van deze genen bekijken. Daartoe hebben we een systeem ontworpen dat de promoters probeert te lokaliseren in de genoomse-quentie. De geselecteerde sequenties kunnen dan verwerkt worden door MotifSampler en/of MotifScanner. Om de toepasbaarheid te illustreren, kunnen we verwijzen naar het werk van an-deren die onze algoritmen gebruikt hebben om specifieke motieven te detecteren binnen hun projecten.

Promotor: Prof. dr. ir. Bart De Moor UDC: 681.3*F2:575.113

KATHOLIEKE UNIVERSITEIT LEUVEN FACULTEIT TOEGEPASTE WETENSCHAPPEN DEPARTEMENT ELEKTROTECHNIEK

Referenties

GERELATEERDE DOCUMENTEN

Niet alleen voor leerlingen was het dus even wennen, maar ook docenten waren er niet altijd op ingesteld.. Dat riep vragen op, want hoe breng je de leerlingen bijvoorbeeld de

Chloroquine and the combination drug, pyrimethamine/sulfadoxine, used to be the first line drugs in malaria treatment and prophylaxis but is now virtually

Dat het gebied dat vroeger Mandatory Palestine was al vijftig jaar de facto, uiteindelijk onder Israëlische staats- macht valt, en dat er inmiddels meer dan 600 000 kolonis- ten

Een nieuw lied van een meisje, die naar het slagveld ging, om haar minnaar te zoeken... Een nieuw lied van een meisje, die naar het slagveld ging, om haar minnaar

Bij de keuzes die de smokkelorganisaties maken, spelen de kenmerken van de procedure een belangrijke rol: met name de lengte van de procedure hier te lande is een voordeel

Scholen als Sint- Lucas, Mijn School en het Johan Cruyff College geven heel nadrukkelijk vorm aan deze netwerken, niet omdat het gezellig is, maar omdat het de ma- nier van werken

Deze school moet vernieuwend worden, maar op een andere manier dan de school Het Talent in dezelfde wijk, zodat ouders iets te kiezen hebben.. De ontwerpgroep van zeven leden – de

<©f bat gftn lieber niet in pmanta fcBuït-boecft ftaar, g n bien «Bobt u benijeftt / en frjt niet trot0 ban Bert, g n bien u <0obt berarmt baarom niet treurigB toert*. 21