Objekt-Metadaten

Biclustering analysis for large scale data
Serin, Akdes

HaupttitelBiclustering analysis for large scale data
TitelvarianteBiclusteranalyse für große Dateien
AutorSerin, Akdes
Geburtsort: Istanbul
GutachterMartin Vingron
weitere GutachterTim Beissbarth
Freie Schlagwörterbiclustering; gene expression; data mining; frequent item set; gene set enrichment
DDC004 Datenverarbeitung; Informatik
570 Biowissenschaften; Biologie
ZusammenfassungHigh-Throughput-Technologien stellen einen Durchbruch in der experimentellen Molekularbiologie dar. Sie ermöglichen eine Einsicht in die molekularen Mechanismen der Zelle, die mit traditionellen Ansätzen nicht zu erforschen sind. Mithilfe von differenzierten statistischen und computergestützen Methoden können wertvolle Informationen aus diesen Datensätzen gezogen werden.

Clustering ist der am häufigsten gebrauchte Ansatz, um in solchen Hochdurchsatzdaten Gensätze mit verwandten Funktionen zu entdecken. Traditionelle Clustering-Methoden wie das hierarchische Clustering und k-means haben jedoch ihre Grenzen. Erstens basieren sie auf der Annahme, dass sich ein Gencluster in allen Proben gleich verhält. Es ist aber auch möglich, dass ein zellulärer Prozess nur eine Teilmenge der Gene beeinflußt oder dass er nur unter bestimmten Bedingungen seine Wirkung entfaltet. Zweitens wird in traditionellen Clusteriung-Methoden jedes einzelne Gen einem einzigen Cluster zugeteilt, obwohl manche Gene in bestimmten Proben nicht aktiv, andere dagegen in mehrere Prozesse involviert sind. Biclustering überwindet diese Schwierigkeiten, weil dabei Gene und Proben gleichzeitig gruppiert werden. Neue Studien haben gezeigt, dass Biclustering ein großes Potential für die Entdeckung von Markergenen hat, die mit bestimmten Geweben oder Krankheiten assoziiert sind. Mehrere Biclustering-Algorithmen existieren, aber es ist immer noch schwierig, Bicluster zu finden, deren Signifikanz biologisch validiert ist. Zusätzlich ist es nötig, einen Biclustering-Algorithmus zu finden, der in der Lage ist, sehr große Datensätze innerhalb kurzer Zeit zu analysieren.

Der erste Teil dieser Doktorarbeit beschäftigt sich mit Biclustering-Algorithmen. Wir schlagen einen neuen, schnellen Biclustering-Algorithmus speziell für die Analyse von großen Datensätzen vor. Der Algorithmus findet Bicluster, in denen jedes Gen im Vergleich zu den übrigen Proben in allen Biclusterproben hoch oder niedrig exprimiert ist. Im Gegensatz zu anderen Algorithmen muss die Anzahl der Bicluster nicht a priori definiert werden. Anhand synthetischer und biologischer Datensätze vergleichen wir unsere Methode mit andere Biclustering-Algorithmen. GO term und TFBS-Anreicherung zeigen, dass der DeBi-Algorithmus biologisch signifikante Bicluster identifiziert. Wir zeigen auch, dass der Algorithmus nützlich und leistungsstark in der Analyse großer Datensätze ist. Die Methode kann auf Expressionsdatensätze aus verschiedenen Laboren und von unterschiedlichen Plattformen angewandt werden. Wir hoffen, dass unsere Methode die Entwicklung des Biclustering als Werkzeug für die Datenanalyse in der funktionellen Genomik vorantreiben und unterstützen wird.

Der zweite Teil der Doktorarbeit beschäftigt sich mit der Aufklärung von molekularen Mechanismen in der traditionellen chinesischen Medizin (TCM), sowie mit der Identifi¬kation neuer Kandidaten aus traditionellen chinesischen Heilmitteln für die Entwicklung neuer Medikamente. Für diese Zwecke werden gene set enrichment tools und Biclustering eingesetzt. Weiterhin wurde Datenbank namens Medicinal Connectivity of TCM, MecoTCM, etabliert, welches systematische Verbindungen zwischen Genexpression, Krankheitsstatus und biochemischer Aktivität aufbaut. Dadurch gelang es, biologisch relevante Informationen über die TCM-Theorie zu finden, zum Beispiel über die Pflanze Ginseng. Unsere Ergebnisse wurden mit Chip-Seq-Experimenten validiert. Künftig soll dieser Datensatz durch die Integration von Tumorgenexpressionsprofilen verbessert werden.
Dokumente
PDF-Datei von FUDISS_thesis_000000035625
Falls Ihr Browser eine Datei nicht öffnen kann, die Datei zuerst herunterladen und dann öffnen.
 
SeitenzahlVIII, 86 S.
Fachbereich/EinrichtungFB Mathematik und Informatik
Erscheinungsjahr2012
Dokumententyp/-SammlungenDissertation
Medientyp/FormatText
SpracheEnglisch
Rechte Nutzungsbedingungen
Tag der Disputation18.11.2011
Erstellt am09.01.2012 - 10:07:56
Letzte Änderung13.01.2012 - 12:48:13
 
Statische URLhttp://www.diss.fu-berlin.de/diss/receive/FUDISS_thesis_000000035625
URNurn:nbn:de:kobv:188-fudissthesis000000035625-3
Zugriffsstatistik
E-Mail-Adresseakdess@gmail.com