Directly to content
  1. Publishing |
  2. Search |
  3. Browse |
  4. Recent items rss |
  5. Open Access |
  6. Jur. Issues |
  7. DeutschClear Cookie - decide language by browser settings

Machine learning of genomic profiles

Schubert, Falk

German Title: Maschinelles Lernen von genomischen Profilen

[thumbnail of Diss_final.pdf]
Preview
PDF, English
Download (2MB) | Terms of use

Citation of documents: Please do not cite the URL that is displayed in your browser location input, instead use the DOI, URN or the persistent URL below, as we can guarantee their long-time accessibility.

Abstract

Gegenstand dieser Arbeit ist das maschinelle Lernen und seine Anwendung auf genomische Profile. Maschinelles Lernen ist ein Teilbereich der Informatik, der sich mit der Analyse und dem Design von Algorithmen beschaftigt, die Regeln und Muster aus Datensätzen ableiten. Genomische Profile beschreiben Veränderungen der DNA, z.B. der Anzahl ihrer Kopien. Tumorerkrankungen werden oftmals von diesen genomischen Veränderungen hervorgerufen. Es werden verschiedene Verfahren des maschinellen Lernens auf ihre Anwendbarkeit in Bezug auf genomische Profile untersucht. Des Weiteren wird eine Verlustfunktion für Überlebenszeitdaten entworfen. Anschließend wird ein analytischer Bezugsrahmen entwickelt, um Aberrationsmuster zu finden, die mit einer speziellen Tumorerkrankung assoziiert sind. Der Bezugsrahmen umfaßt die Vorverarbeitung, Merkmalsselektion und Diskretisierung von genomischen Profilen sowie Strategien zum Umgang mit fehlenden Werten und eine mehrdimensionale Analyse. Abschließend folgen das Training und die Analyse des Klassifikators. In dieser Arbeit wird weiterhin eine Erklärungskomponente vorgestellt, die wichtige Merkmale für die Klassifikation eines Falles identifiziert und ein Maß für die Richtigkeit einer Klassifikation liefert. Solch eine Erklärungskomponente kann die Basis für die Integration eines Klassifikators , z.B. einer Support-Vektor-Maschine, in ein entscheidungsunterstützendes System sein. Die im Rahmen dieser Arbeit entwickelten Methoden wurden erfolgreich zur Beantwortung von biologischen Fragestellungen wie der frühen Metastasierung oder der Mikrometastasierung angewandt und führten zur Entdeckung bisher unbekannter Tumormarker. Zusammenfassend zeigen die Ergebnisse der vorliegenden Arbeit, dass Verfahren des maschinellen Lernens zum Erkenntnisgewinn in Bezug auf genomische Veränderungen beitragen und Möglichkeiten zu einer weiteren Verbesserung der Therapie für Tumorpatienten aufzeigen.

Translation of abstract (English)

Machine learning is an area of computer science concerned with the study of algorithms that reveal patterns and rules from data sets. Genomic profiles describe alterations of a genome, like copy number variations. Cancer often originates from a combination of genomic alterations. In this thesis, I consider machine learning and its application to genomic profiles. The main aspects of this work can be summarised as follows: First, I discuss several machine learning methods, with particular regard to genomic profiles, and then develop a special loss function for survival data. Next, I introduce a framework to find aberration patterns associated with a particular tumour type or disease state. This workflow starts with preprocessing,feature selection and discretisation of genomic profiles, includes strategies to deal with missing values and provides a multi-resolutional analysis. Then, training and analysis of a classifier is performed. Additionally, I introduce an explanation component that emphasizes important features of the classification process and estimates the certainty of classification results. Such an explanation method could provide the basis for the integration of a classification algorithm, such as a support vector machine, in a clinical decision support system. The methods proposed in the thesis were applied to various data sets, focussing on important biological questions, such as early metastasis and micrometastasis, and lead to the detection of new tumour markers. The results of these investigations indicate that machine learning methods can enhance our understanding of genomic aberrations and may help to improve the delivery of therapies to cancer patients.

Document type: Dissertation
Supervisor: Eils, Prof. Dr. Roland
Date of thesis defense: 21 January 2010
Date Deposited: 25 Jan 2010 12:18
Date: 2008
Faculties / Institutes: Service facilities > German Cancer Research Center (DKFZ)
DDC-classification: 004 Data processing Computer science
Uncontrolled Keywords: Maschinelles Lernen , Krebsforschung , Bioinformatik , KlassifikationMachine learning , CNV , cancer research , bioinformatics , classification
About | FAQ | Contact | Imprint |
OA-LogoDINI certificate 2013Logo der Open-Archives-Initiative