Dissertationsserver


Springe direkt zu:Inhalt


Service-Navigation


Hauptnavigation/Hauptmenü: Links auf direkt erreichbare, übergeordnete Webseiten


Grafischer Identitätsbereich:




Navigation/Menü: Links auf weitere Seiten dieser Website


Navigationspfad:

Navigation: FU Dissertationen Online / Mycore 2.0.2

Drucken Icon


Objekt-Metadaten

New statistical algorithms for the analysis of mass spectrometry time-of-flight mass data with applications in clinical diagnostics
Conrad, Tim

Main titleNew statistical algorithms for the analysis of mass spectrometry time-of-flight mass data with applications in clinical diagnostics
Title variationsNeue statistische Algorithmen zur Analyse von Massenspektrometrie Time-Of-Flight Massendaten mit Anwendungen in der klinischen Diagnostik
Author(s)Conrad, Tim
Place of birth: Hamburg
1. RefereeProf. Christof Schütte
Further Referee(s)Prof. Knut Reinert
Dr. Andre Hagehülsmann
KeywordsProteomics, MALDI TOF, Peak Picking, Clinical Diagnostics
Classification (DDC)500 Natural sciences and mathematics
004 Data processing and Computer science
SummaryDas Gebiet der Proteomik umfasst die Erforschung des Proteoms, d.h. der
Gesamtheit aller in einem Organismus (z.B. Mensch) vorhandenen Proteine.

Massenspektrometrie (MS) -basierte Verfahren haben sich als Standardtechnik
zur Proteomanalyse etabliert. Diese Verfahren ermöglichen das Bestimmen der
(relativen) Konzentrationen von Proteinen in Körperflüssigkeiten, wie
zum Beispiel im Blut. Jede Krankheit verändert eine ganz bestimmte Menge von
Proteinen (bzw. deren Konzentration) in einer charakteristischen Art und Weise
und besitzt damit einen eindeutigen Fingerabdruck.

Um einen aussagekräftigen Fingerabdruck für eine bestimmte Krankheit zu
finden, müssen zunächst diese Veränderungen (Signale) zwischen den
Daten (Spektren) von Gesunden und Kranken gefunden werden. Diese Signale
werden Biomarker genannt. Analysen der Unterschiede zwischen einer Gruppe von
gesunden und einer Gruppe von kranken Menschen ergeben oft hunderte von
verschiedenen Biomarker, die von stark unterschiedlicher Qualität sind
(bezogen auf den Unterschied zwischen ``gesund'' und ``krank''). Daher wird
für den tatsächlichen Fingerabdruck diejenige Teilmenge aller möglichen
Signale benutzt, die sich in Kombination am besten dazu eignen, die beiden
Gruppen zu unterscheiden. Diese gefundenen Fingerabdrücke ermöglichen zum
Beispiel die Früherkennung von Krankheiten.

Diese Arbeit beschäftigt sich mit der oben erwähnten Analyse von Daten aus
MS-Experimenten und stellt eine neue web-basierte Analyseplattform und neue
Verfahren zur Vorverarbeitung, Signalerkennung und Fingerabdruckerkennung vor.
Die erreichten Verbesserungen insbesondere der Detektionssensitivität
steigern unmittelbar die resultierende Klassifizierungsgüte, über deren
zugrundeliegende Signale eine gezielte biochemische Identifikation potentieller
Biomarker überhaupt erst möglich wird.

Um die praktische Relevanz der neu entwickelten Algorithmen zu zeigen, wurde die
neu entwickelte Plattform bereits in mehreren klinischen Studien eingesetzt -
zwei dieser Studien werden in dieser Arbeit ausführlich beschrieben. In diesen
Studien wurde gezeigt, dass unsere Verfahren anderen (kommerziellen) Systemen
im Bezug auf die Sensitivität bei der Erkennung von Fingerabdrücken
überlegen ist. Als Ergebnis dieser Studien wurden neue Fingerabdrücke für
verschiedene Krebsarten (u.a. Blase, Niere, Schilddrüse und Bauchspeicheldrüse)
gefunden und validiert. Die klinischen Partner haben ausdrücklich betont, dass
diese Ergebnisse mit den vorhandenen (weniger sensitiven) Systemen nicht
möglich gewesen wären.

Um die Verarbeitung der MS Massendaten zu ermöglichen (ca. 2.5 Gigabyte pro
Datensatz bei Tausenden von Datensätzen), wurde ein neues (quasi) ad-hoc Grid
System entwickelt. Diese Computerinfrastruktur bietet die Möglichkeit zur
Einbindung von Tausenden von Rechenressourcen, zum Beispiel von
Desktopcomputern, Computerclustern oder auch Spezialhardware, wie den
Cell-Prozessor von IBM in einer Playstation 3.
ContentAcknowledgments . . . . . . . . . . . . . . . . . . . . . . . . . . . . . vi
Extended Abstract . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1
1 Introduction and Survey . . . . . . . . . . . . . . . . . . . . . . . 5
1.1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5
1.2 Goals, Objectives and Tasks . . . . . . . . . . . . . . . . . . . . 7
2 Preliminaries . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11
2.1 Topic Overview . . . . . . . . . . . . . . . . . . . . . . . . . . . 11
2.2 An Example . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16
3 Mathematical Modeling and Algorithms . . . . . . . . . . . . . 23
3.1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23
3.2 Introduction to MALDI TOF MS . . . . . . . . . . . . . . . . . 25
3.3 Preprocessing . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30
3.4 Highly Sensitive Peak Detection . . . . . . . . . . . . . . . . . . 36
3.5 Peak Detection in 2D Maps . . . . . . . . . . . . . . . . . . . . 42
3.6 Peak Registration (Alignment) . . . . . . . . . . . . . . . . . . 44
3.7 Identifying Potential Features . . . . . . . . . . . . . . . . . . . 50
3.8 Extracting Fingerprints . . . . . . . . . . . . . . . . . . . . . . 56
3.9 Complexity Analysis . . . . . . . . . . . . . . . . . . . . . . . . 63
4 (Bio-)Medical Applications . . . . . . . . . . . . . . . . . . . . . 65
4.1 Data Used . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 65
4.2 Statistical Remarks . . . . . . . . . . . . . . . . . . . . . . . . . 68
4.3 Study Results . . . . . . . . . . . . . . . . . . . . . . . . . . . . 78
4.4 Identification of Proteomic Fingerprints in Blood Serum by High-sensitive Bioinformatic Analysis of SELDI-TOF MS Data for Detection of Testicular Germ Cell Cancer . . . . . . . . . . 90
4.5 Identification of Proteomic Fingerprints in Blood Serum by High-sensitive Bioinformatic Analysis of MALDI-TOF MS Data for Detection of Thyroid Diseases . . . . . . . . . . . . . . . . . 96
4.6 Biological Applications . . . . . . . . . . . . . . . . . . . . . . . 101
5 Computer Science Grid Strategies . . . . . . . . . . . . . . . . 103
5.1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 103
5.2 The Quasi Ad-hoc (QAD) Grid . . . . . . . . . . . . . . . . . . 111
5.3 QAD Grid Platform Server . . . . . . . . . . . . . . . . . . . . 114
5.4 QAD Grid Worker . . . . . . . . . . . . . . . . . . . . . . . . . 129
5.5 QAD Grid Platform Services . . . . . . . . . . . . . . . . . . . 138
5.6 QAD Grid Workflows . . . . . . . . . . . . . . . . . . . . . . . 141
5.7 Related Work . . . . . . . . . . . . . . . . . . . . . . . . . . . . 146
6 proteomics.net - Product-oriented Case Studies . . . . . . . . 151
6.1 Available Services . . . . . . . . . . . . . . . . . . . . . . . . . 152
6.2 Case Studies . . . . . . . . . . . . . . . . . . . . . . . . . . . . 153
7 Related Work . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 167
8 Conclusion and Future Directions . . . . . . . . . . . . . . . . . 169
8.1 Conclusion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 169
8.2 From Biobanks to Biomarkers . . . . . . . . . . . . . . . . . . . 170
8.3 From Biomarkers to Bioprints . . . . . . . . . . . . . . . . . . . 171
Appendix A Implementation Details . . . . . . . . . . . . . . . . . 173
Appendix B Curriculum Vitae . . . . . . . . . . . . . . . . . . . . . 175
References . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 177
Glossary . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 196
Documents
Dataobject from FUDISS_thesis_000000005486
If your browser can't open the file, please download the file first and then open it
 
Number of pagesVI, 196 S.
FU DepartmentDepartment of Mathematics and Computer Science
Year of publication2008
Document typeDoctoral thesis
Media type/FormatText
LanguageEnglish
Terms of use/Rights Nutzungsbedingungen
Date of defense2008-07-10
Created at2008-10-01 : 12:35:52
Last changed2010-02-19 : 02:00:46
 
Static URLhttp://www.diss.fu-berlin.de/diss/receive/FUDISS_thesis_000000005486
NBNurn:nbn:de:kobv:188-fudissthesis000000005486-0
Statistics
E-mail addressconrad@math.fu-berlin.de
 

 
© 2010 Universitätsbibliothek der Freien Universität Berlin | Feedback | powered by <MyCoRe>

Stand: 28.02.2010

Diese Grafiken werden nur in der Druckvorschau verwendet: