Algebraische data integratiemethodes voor de reconstructie van transcriptionele modules

Probleemstelling

Cellen worden voortdurend blootgesteld aan veranderende externe situaties die de aanwezigheid vereisen in de cel van aangepaste hoeveelheden proteines. Het verwerken van deze steeds wisselende informatie en het bepalen van de mate waarin genen tot expressie dienen te komen, wordt uitgevoerd door het transcriptionele netwerk. Dat netwerk wordt gevormd door transcriptiefactoren, speciale proteines die de expressie van genen reguleren, en hun doelproteinen. Grootschalige experimentele informatie over transcriptionele netwerken is beschikbaar onder de vorm van expressiedata en bindingsdata voor transcriptiefactoren. Expressiedata geeft aan in welke mate alle genen in een cel worden geproduceerd onder verschillende externe condities. Bindingsdata voor transcriptiefactoren geeft aan welke genen fysisch door een bepaalde transcriptiefactor kunnen worden gereguleerd, evenwel zonder informatie over de condities waarin dit al of niet gebeurt. Integratie van beide datatypes laat bijgevolg toe om transcriptionele modules te reconstrueren, groepen van genen die in gelijkaardige mate worden geproduceerd onder verschillende condities en met gemeenschappelijke transcriptiefactoren in de bindingsdata. Gezien de grootschaligheid en complexiteit van het onderliggende transcriptionele netwerk is het onderzoeken en ontwikkelen van geavanceerde methodes voor het integreren van deze diverse datatypes een belangrijk onderwerp in de systeembiologie.

Doelstelling

Bestaande methodes voor de reconstructie van transcriptionele modules maken doorgaans gebruik van heuristische, iteratieve optimizatietechnieken waarbij afwisselend de toewijzing van doelgenen en transcriptiefactoren aan een bepaalde module wordt vernieuwd op basis van de respectievelijke datatypes. Dergelijke methodes hebben de neiging vast te lopen op lokale optima, en dit op een manier die moeilijk te controleren valt (d.w.z. zonder dat men een schatting kan maken hoever het lokale optimum verwijderd is van het globale optimum). Recent hebben we in onze onderzoeksgroep algebraische data-integratiemethodes ontwikkeld die verschillende datatypes gezamenlijk voorstellen als een hoger-dimensionele tensor waarop veralgemeende spectrale clusteringstechnieken kunnen toegepast worden. Een bijzondere eigenschap van deze methodes is dat ze toelaten een expliciete schatting te maken van de afwijking tussen de theoretisch optimale, maar ongekende clustering, en de benaderende oplossing die door de methode gevonden wordt. Het doel van deze thesis is te onderzoeken in welke mate deze algebraische methodes ook geschikt zijn voor het reconstrueren van transcriptionele modules, alsook het eventueel uitbreiden en verbeteren van deze methodes. Hierbij zal specifiek aandacht geschonken moeten worden aan de aanwezigheid van ruis in de data, wat typisch is voor zowel expressiedata als bindingsdata. Voorts zal ook een vergelijkende studie met reeds bestaande methodes worden uitgevoerd.

Contactpersonen










Contact:
VIB / UGent
Bioinformatics & Evolutionary Genomics
Technologiepark 927
B-9052 Gent
BELGIUM
+32 (0) 9 33 13807 (phone)
+32 (0) 9 33 13809 (fax)

Don't hesitate to contact the in case of problems with the website!

You are visiting an outdated page of the BEG/Van de Peer Lab site.

Not all pages have been ported, so these archived pages are still available.

Redirect to the new website?