Navigation/Menü: Links auf weitere Seiten dieser Website
Objekt-Metadaten
| Biclustering analysis for large scale data Serin, Akdes |
| Haupttitel | Biclustering analysis for large scale data |
| Titelvariante | Biclusteranalyse für große Dateien |
| Autor | Serin, Akdes
Geburtsort: Istanbul |
| Gutachter | Martin Vingron |
| weitere Gutachter | Tim Beissbarth |
| Freie Schlagwörter | biclustering; gene expression; data mining; frequent item set; gene set enrichment |
| DDC | 004 Datenverarbeitung; Informatik 570 Biowissenschaften; Biologie |
| Zusammenfassung | High-Throughput-Technologien stellen einen Durchbruch in der experimentellen Molekularbiologie dar. Sie ermöglichen eine Einsicht in die molekularen Mechanismen der Zelle, die mit traditionellen Ansätzen nicht zu erforschen sind. Mithilfe von differenzierten statistischen und computergestützen Methoden können wertvolle Informationen aus diesen Datensätzen gezogen werden. Clustering ist der am häufigsten gebrauchte Ansatz, um in solchen Hochdurchsatzdaten Gensätze mit verwandten Funktionen zu entdecken. Traditionelle Clustering-Methoden wie das hierarchische Clustering und k-means haben jedoch ihre Grenzen. Erstens basieren sie auf der Annahme, dass sich ein Gencluster in allen Proben gleich verhält. Es ist aber auch möglich, dass ein zellulärer Prozess nur eine Teilmenge der Gene beeinflußt oder dass er nur unter bestimmten Bedingungen seine Wirkung entfaltet. Zweitens wird in traditionellen Clusteriung-Methoden jedes einzelne Gen einem einzigen Cluster zugeteilt, obwohl manche Gene in bestimmten Proben nicht aktiv, andere dagegen in mehrere Prozesse involviert sind. Biclustering überwindet diese Schwierigkeiten, weil dabei Gene und Proben gleichzeitig gruppiert werden. Neue Studien haben gezeigt, dass Biclustering ein großes Potential für die Entdeckung von Markergenen hat, die mit bestimmten Geweben oder Krankheiten assoziiert sind. Mehrere Biclustering-Algorithmen existieren, aber es ist immer noch schwierig, Bicluster zu finden, deren Signifikanz biologisch validiert ist. Zusätzlich ist es nötig, einen Biclustering-Algorithmus zu finden, der in der Lage ist, sehr große Datensätze innerhalb kurzer Zeit zu analysieren. Der erste Teil dieser Doktorarbeit beschäftigt sich mit Biclustering-Algorithmen. Wir schlagen einen neuen, schnellen Biclustering-Algorithmus speziell für die Analyse von großen Datensätzen vor. Der Algorithmus findet Bicluster, in denen jedes Gen im Vergleich zu den übrigen Proben in allen Biclusterproben hoch oder niedrig exprimiert ist. Im Gegensatz zu anderen Algorithmen muss die Anzahl der Bicluster nicht a priori definiert werden. Anhand synthetischer und biologischer Datensätze vergleichen wir unsere Methode mit andere Biclustering-Algorithmen. GO term und TFBS-Anreicherung zeigen, dass der DeBi-Algorithmus biologisch signifikante Bicluster identifiziert. Wir zeigen auch, dass der Algorithmus nützlich und leistungsstark in der Analyse großer Datensätze ist. Die Methode kann auf Expressionsdatensätze aus verschiedenen Laboren und von unterschiedlichen Plattformen angewandt werden. Wir hoffen, dass unsere Methode die Entwicklung des Biclustering als Werkzeug für die Datenanalyse in der funktionellen Genomik vorantreiben und unterstützen wird. Der zweite Teil der Doktorarbeit beschäftigt sich mit der Aufklärung von molekularen Mechanismen in der traditionellen chinesischen Medizin (TCM), sowie mit der Identifi¬kation neuer Kandidaten aus traditionellen chinesischen Heilmitteln für die Entwicklung neuer Medikamente. Für diese Zwecke werden gene set enrichment tools und Biclustering eingesetzt. Weiterhin wurde Datenbank namens Medicinal Connectivity of TCM, MecoTCM, etabliert, welches systematische Verbindungen zwischen Genexpression, Krankheitsstatus und biochemischer Aktivität aufbaut. Dadurch gelang es, biologisch relevante Informationen über die TCM-Theorie zu finden, zum Beispiel über die Pflanze Ginseng. Unsere Ergebnisse wurden mit Chip-Seq-Experimenten validiert. Künftig soll dieser Datensatz durch die Integration von Tumorgenexpressionsprofilen verbessert werden. |
| Dokumente |
PDF-Datei von FUDISS_thesis_000000035625
Falls Ihr Browser eine Datei nicht öffnen kann, die Datei zuerst herunterladen und dann öffnen.
|
| Seitenzahl | VIII, 86 S. |
| Fachbereich/Einrichtung | FB Mathematik und Informatik |
| Erscheinungsjahr | 2012 |
| Dokumententyp/-Sammlungen | Dissertation |
| Medientyp/Format | Text |
| Sprache | Englisch |
| Rechte | Nutzungsbedingungen |
| Tag der Disputation | 18.11.2011 |
| Erstellt am | 09.01.2012 - 10:07:56 |
| Letzte Änderung | 13.01.2012 - 12:48:13 |
| Statische URL | http://www.diss.fu-berlin.de/diss/receive/FUDISS_thesis_000000035625 |
| URN | urn:nbn:de:kobv:188-fudissthesis000000035625-3 |
| Zugriffsstatistik | |
| E-Mail-Adresse | akdess@gmail.com |








