Systems Biology
“Systems Biology, the future of biology in the 21
stcentury”
Kitano 2002
Overzicht
• Inleiding
• Definitie bio-informatica
• Definitie systeembiologie
• Bio-informatica onderzoek
– Motiefdetectie & comparatieve genoomanalyse – Analyse van high-throughput data
– Pragmatische netwerkinferentie – Gepland onderzoek
– Samenwerkingen
• Bio-informatica onderwijs
• Motivatie
Kathleen Marchal
• 1995: Bio-ir. in de Scheikunde (KULeuven)
• 1995-1999: PhD FLTBW (CMPG, KULeuven)
• 1999-…: werkzaam als postdoc FWO in de BioI- onderzoeksgroep van ESAT/SCD (KULeuven) Bio-informatica ESAT/SCD
• Bio-informatica onderzoek voor klinische applicaties
• Bio-IT onderzoek: database management, standaardisatie
• Systems Biology onderzoek
Inleiding
Bio-informatica definitie
“Klassieke" bio-informatica
– Gebruik van computers/algoritmes voor analyse van moleculair biologische data
– Computational biology
• Alignments
• Phylogeny
• Protein structure modeling,…
Eerste citaties met “bioinformatics”
Trends Biotechnol 1993 Ann N Y Acad Sci 1993
Bio-informatica definitie
Library of strains, each with a tagged regulator
Chromatin IP to enrich promoters bound by regulator
in vivo
Microarray to identify promoters bound by regulator in vivo Regulator Tag
Library of strains, each with a tagged regulator
Chromatin IP to enrich promoters bound by regulator
in vivo
Microarray to identify promoters bound by regulator in vivo Regulator Tag
Sequentiedata Microarraydata SAGE
ChIP-chipdata
Revolutie in moleculaire biologie …
Bio-informatica definitie
"Nieuwe" bio-informatica
– Structural genomics – Comparative genomics – Functional genomics
Mechanistic Biology Systems Biology
2000
1998 2000 1994
Systeembiologie
Onderzoek naar systeembiologie
– Reconstructie van regulatorische netwerken (systeembiologie) in prokaryoten en eukaryoten – Mechanistisch inzicht in het gedrag van een
biologisch systeem
Systems biology is in its infancy, but this is the area that has to be explored and the area that we believe to be the main stream in biological sciences in this century
References:
H. Kitano, Systems Biology: a brief overview, Science, 295:1662-1664, 2002 H. Kitano, Computational Systems Biology, Nature, 420:206-210, 2002
• Bio-informatica: interdisciplinair onderzoek
• Bio-informatica is geen “magic” maar impliceert volwaardig onderzoek
• Relevante problemen voor het bioi-onderzoek ontstaan vanuit de moleculaire biologie
• Moleculair biologische kennis en “wet lab” ervaring zijn essentieel
• Bio-informatica ondersteuning essentieel voor moleculair biologisch onderzoek
Systems Engineering
Biochemistry Molecular Biology
Bioph ysics Statistics
Mathematics Inform
atics
Systems Biology
Bio-informatica onderzoek
Systems Biology = Biosciences + Computational Sciences + Systems Engineering +...
Overzicht systeembiologie
Databronnen
Library of strains, each with a tagged regulator
Chromatin IP to enrich promoters bound by regulator in vivo
Microarray to identify promoters bound by regulator in vivo Regulator Tag
Datacompendia
Databronnen
Preprocessing Motiefdetectie
Pragmatische Inferentieprocedure
Motiefcompendium
Biologische doelstellingen
Motiefmodule
Netwerkmodule
Expressiegedrag
Sequentie-data Microarray data ChIP-chip data
Expressieprofielen Locatie-data
Netwerkinferentie
‘Omics’-dataGeïnfereerd netwerkBio-informatica
Motiefdetectie en comparatieve genoomanalyse
Databronnen
Library of strains, each with a tagged regulator
Chromatin IP to enrich promoters bound by regulator in vivo
Microarray to identify promoters bound by regulator in vivo Regulator Tag
Datacompendia
Databronnen
Preprocessing Motiefdetectie
Pragmatische Inferentieprocedure
Motiefcompendium
Biologische doelstellingen
Motiefmodule
Netwerkmodule
Expressiegedrag
Sequentie-data Microarray data ChIP-chip data
Expressieprofielen Locatie-data
Netwerkinferentie
‘Omics’-dataGeïnfereerd netwerkBio-informatica
Sequentiedata Motiefdata
Motiefdetectie gebaseerd op Gibbs sampling (G. Thijs)
Transcriptieregulatie
Motiefdetectie en comparatieve genoomanalyse
Thijs et al. 2001, Bioinformatics Thijs et al. 2002, J. Comput Biol Lescot et al. 2002, NAR
Marchal et al. 2003, Trends in Micr.
• Phylogenetic footprinting in prokaryoten gebaseerd op Gibbs sampling (P.
Monsieurs)
• Phylogenetic footprinting in eukaryoten (R. Van Hellemont)
ECs2829 NC_002695 E. coli O157 NATCTGATTTAATCAACAATAAAATTGAGGCCCGGCGTATATTGTACCGGGCTTTTTTTTGCCAATTATCTTATAGACTA ugd NC_004431 E. coli CFT073 ATCTGATTTAACCAACATTAAAAATTGAGGCCCGGCGTATATTGCACCGGGCTTTTTTTTGCCAATTATCTTATAGACTA ugd NC_000913 E. coli K12 NATCTGATTTAACCAACAATAAAATTGAGGCCCGGCGTATATTGCACCGGGCTTTTTTTTGCCAAATATCTTATAGACTA ugd NC_002655 E. coli O157 NATCTGATTTAATCAACAATAAAATTGAGGCCCGGCGTATATTGTACCGGGCTTTTTTTTGCCAATTATCTTATAGACTA ugd NC_003198 S.typhi NNNNNNNNNNNNNATTTCTGCAAGCTTGTTTAAGCCCGGTTTAATACTGGGCTTTTTTTTATCTCTATTCTTATTGATTT udg NC_003197 S. typhimurium NNNNNNNNNNNNNATTTCTGCAAAAATGTTTAAGCCCGGTTTAATACCGGGCTTTTTTTTATCTCTATTCTTATTGATTT
ECs2829 NC_002695 E. coli O157 AATATCACTGCTTAATATTAACTTAATAAATATCAGCTATTCTTATAAAGAAAATCTGAATTGTTTTTCGCTGCGTTGAC ugd NC_004431 E. coli CFT073 AATTTCACTGCTTAATATTAACTTAATAAATATCAGCTATCCTTATAAAGAAAATCTGAATTTTTTTTCGTTGCGTTGAC ugd NC_000913 E. coli K12 AATTTCACTGCTTAATATTAACTTAATAAATATCAGCTATTCTTATAAAGAAAATCTGAATTGTTTTTCGTTGCGTTGAC ugd NC_002655 E. coli O157 AATATCACTGCTTAATATTAACTTAATAAATATCAGCTATTCTTATAAAGAAAATCTGAATTGTTTTTCGCTGCGTTGAC ugd NC_003198 S.typhi ATCGCTTTTGCTTAATATTAACTTAATAATCTGTGTTTATCGTAATGAAGATAATCTGAATTGTTTTCGTCTGCGTTGCA udg NC_003197 S. typhimurium ATCGCTTTTGCTTAATATTAACTTAATAATCTGTGTTTATCGTAATGAAGATAATCTGAATTGTTTTCGTCTGCGTTGCA
ECs2829 NC_002695 E. coli O157 CATCGAACAACGTAGCGTTAAAACTTTTAGCTCTTATCAGGATGTTAAAAACATCATGATTCACAGTTAAGTTAATTCTG ugd NC_004431 E. coli CFT073 CATCGAACAACGTAGCGTTAAAACTTTTAGCTCTTATCAGGATGCTAAAAACATCATGATTCACAGTTAAGTTAATTCTG ugd NC_000913 E. coli K12 CATCGAACAACGTAGCGTTAAAACTTTTAGCTCTTATCAGGATGCTAAAAACATCATGATTCACAGTTAAGTTAATTCTG ugd NC_002655 E. coli O157 CATCGAACAACGTAGCGTTAAAACTTTTAGCTCTTATCAGGATGTTAAAAACATCATGATTCACAGTTAAGTTAATTCTG ugd NC_003198 S.typhi CTTTATATACTCAGGCGTTAAAACTTTGATATCTTATCAGGATGCGAAATACATCATGATTCATAATTAAGTTAATTCTG udg NC_003197 S. typhimurium CTTTATATACTCAGGCGTTAAAACTTTAATATCTTATCAGGATGCGAAATACATCATGATTCATAATTAAGTTAATTCTG
ECs2829 NC_002695 E. coli O157 AGAGCATGAAA ugd NC_004431 E. coli CFT073 AGAGCATGAAA ugd NC_000913 E. coli K12 AGAGCATGAAA ugd NC_002655 E. coli O157 AGAGCATGAAA ugd NC_003198 S.typhi AGAGCGAATAA udg NC_003197 S. typhimurium AGAGCGAATAA
PmrA -10 RscB
Marchal et al., 2004, Genome Biology
Rombauts et al., 2004, Plant Physiol
Motiefdetectie en comparatieve genoomanalyse
Analyse van high-throughput data
Databronnen
Library of strains, each with a tagged regulator
Chromatin IP to enrich promoters bound by regulator in vivo
Microarray to identify promoters bound by regulator in vivo Regulator Tag
Datacompendia
Databronnen
Preprocessing Motiefdetectie
Pragmatische Inferentieprocedure
Motiefcompendium
Biologische doelstellingen
Motiefmodule
Netwerkmodule
Expressiegedrag
Sequentie-data Microarray data ChIP-chip data
Expressieprofielen Locatie-data
Netwerkinferentie
‘Omics’-dataGeïnfereerd netwerkBio-informatica
Analyse van high-throughput data
Microarray-data Expressiedata
Preprocessing
ChIP-chip-data Interactiedata
Preprocessing
Library of strains, each with a tagged regulator
Chromatin IP to enrich promoters bound by regulator
in vivo
Microarray to identify promoters bound by regulator in vivo Regulator Tag
Library of strains, each with a tagged regulator
Chromatin IP to enrich promoters bound by regulator
in vivo
Microarray to identify promoters bound by regulator in vivo Regulator Tag
• Normalisatie van ruwe data (K. Engelen)
Verwijderen van consistente bronnen van experimentele variatie
• Analyse van complexe experimentele designs (F. De Smet)
– Feature-extractie – Clustering
Marchal et al., 2002, J Biol Systems Engelen et al., 2003, Bioinformatics
De Smet et al., 2003, Bioinformatics Marchal et al., 2004, Toxicogenomics
Analyse van high-throughput data
Pragmatische netwerkinferentie
Databronnen
Library of strains, each with a tagged regulator
Chromatin IP to enrich promoters bound by regulator in vivo
Microarray to identify promoters bound by regulator in vivo Regulator Tag
Datacompendia
Databronnen
Preprocessing Motiefdetectie
Pragmatische Inferentieprocedure
Motiefcompendium
Biologische doelstellingen
Motiefmodule
Netwerkmodule
Expressiegedrag
Sequentie-data Microarray data ChIP-chip data
Expressieprofielen Locatie-data
Netwerkinferentie
‘Omics’-dataGeïnfereerd netwerkBio-informatica
• Ondergedetermineerd:
– 6000*6000 interacties – 10 a 30 experimenten
• Pragmatisch, stapsgewijs algoritme (Bayesiaans)
– Incorporeert prior-kennis
– Belang van experimenteel design
Reconstructie van transcriptionele netwerken a.h.v expressiedata
Pragmatische netwerkinferentie
Toekomst: focus op Systeembiologie
• Wetenschappelijke doelstelling
– Compendium microarray-data – Compendium motiefdata
– Compendium ChIP-chip-data – Netwerkinferentie
• Ideale onderzoeksomgeving
– Expertise in bio-informatica FTW/FLTBW – Geïntegreerd onderzoek
• Salmonella systeembiologie (CMPG, KULeuven)
• Saccharomyces systeembiologie (Lab of Functional Biology, KULeuven)
• Beoogde resultaten
– Uitbereiden naar andere groepen binnen FLTBW – Publicaties met hoge visibiliteit
– Internationale samenwerkingen uitbouwen (EU)
• Bio-informatica onderzoek
– Prof. Y. Van de Peer, (U. Gent) – Dr. B. Naudts, ISLab (UA)
• Geïntegreerd onderzoek
– Prof. J. Vanderleyden (CMPG, KULeuven)
– Prof. J. Winderickx (Lab. Functional Biology, KULeuven)
• Dienstverlening
– Microarray-analyse en experimenteel design
• Prof. R. Bouillon (LEGENDO, KULeuven)
• Prof J. Vanderleyden (CMPG , KULeuven)
• Prof. T. Ayoubi (VIB)
• Prof. P. Van Hummelen (MAF, VIB) – Sequentie-analyse en annotatie
• Prof. J. Michiels (CMPG , KULeuven)
• Prof J. Vanderleyden (CMPG , KULeuven)
Samenwerkingen
Onderwijs
• Onderwijs KULeuven
– IF17: Bio-informatics (GGS Bio-informatics) – IE72: Bio-informatica werkcollege (FLTBW)
– I427A: Seminaries Cel- en Genbiotechnologie (FLTBW) – Begeleiden van thesisstudenten
• Onderwijs buiten KULeuven
– ICES (Instituut permanente vorming; Bioinformatics, Biostatistics), U. Gent
– Masters of Biotechnology, U. Gent
• Didactische methode
– Praktisch en theoretisch inzicht – Exemplarisch
– Toegepast op biologisch relevante voorbeelden – Aangepaste cursustekst
• Dienstverlening
– Lid van de POC GGS Bioinformatics
– Opstellen van de syllabi voor de BAMA Cel- en Genbiotechnologie
“Bio-informatica als essentieel onderdeel van het curriculum moleculaire biologie”
Motivatie
• Onderzoeksaspect
– Uitdaging van wetenschappelijk onderzoek – Analytisch aspect: hoe efficient probleem
oplossen door combinatie van verschillende disciplines
– Biologisch aspect:
• Noodzaak aan biologisch inzicht
• Onderzoeksdomein op zichzelf
– Interdisciplinair karakter van Bio-informatica
• Didactisch aspect
– Belang van bio-informatica in curriculum moleculaire biologie
•
Meerwaarde– Samenwerken verschillende disciplines – Begeleiden/motiveren van studenten
Besluit
• Bioi-onderzoek in Vlaanderen (BBC) – U. Gent
• F. Wet. Plant Systems Biology
– Prof. Van de Peer, Prof. P. Rouze (Bioinformatics and Evolutionary Biology)
– Dr. Kuiper (Computational Biology)
• F.L.T.B.W. Vakgroep Moleculaire Biotechnologie
– Dr. Van Crieckinge, U.Gent
– U. Antwerpen
• Wiskunde en Computerwetenschappen
– ISLAB, Dr. Naudts
– K.U.Leuven
• Biomedische wetenschappen
– REGA, Prof. Vandamme, Prof. Van Ranst
• Wetenschappen
– Biochemie, Prof. Engelborghs
• Toegepaste wetenschappen
– ESAT/SCD, Prof. De Moor
•
Interdisciplinair aspect– Interfacultaire GGS
– Systems Biology onderzoek (geïntegreerde projecten) – PROMETA
Ideale context voor hoogstaand bio-informatica onderzoek
& onderwijs
Met dank aan …
Collega’s van ESAT/SCD Bioi
Prof. B. De Moor Kristof Engelen Pieter Monsieurs Ruth Van Hellemont Dr. Gert Thijs
Md. Frank De Smet
Collega’s van CMPG
Prof. J. Vanderleyden Prof. J. Michiels
Dr. Sigrid De Keersmaecker