Entwicklung von rangbasierten Kriterien und Methoden zur Optimierung der Normalisierung von Genexpressionsexperimenten am Beispiel membranbasierter cDNA-Arrays

Die Genexpressionsmessung mit DNA-Arrays ist eine sehr komplexe und dadurch fehleranfällige Methode. Jeder der notwendigen Einzelschritte der Messung beeinflußt das letztendliche Meßergebnis durch verschiedene Parameter in signifikanter Weise. Im Gegensatz zu herkömmlichen statistischen Daten mit vielen Messungen und wenig Meßparametern beinhalten die Arraydaten sehr viele Meßparameter und nur wenig Messungen. Der Normalisierung kommt damit eine zentrale Rolle in der Datenanalyse zu. Diese soll die Meßparameter berücksichtigen und die Meßdaten auf die zumessende Größe „Anzahl einer bestimmten mRNA-Spezies in einer definierten Probe“ zurückführen oder zumindestens eine weitgehende Vergleichbarkeit zwischen Experimenten herstellen. Im Rahmen dieser Arbeit wurde ein einfaches Hybridisierungsmodell entwickelt, um Einflüsse von Meßparametern auf die Signalfunktion abzuschätzen. Durch das Hybridisierungsmodell kann der zentrale Meßschritt der Hybridisierung der immoblisierten DNASonde mit der in Lösung befindlichen cDNA-Probe simuliert werden. Hiermit können die Art und Stärke der Haupteinflußgrößen abgeschätzt werden. Für quantitative Aussagen sind die dem Modell zugrunde liegenden Annahmen zu einfach und die verfügbaren Informationen zu unvollständig. Qualitative Vorhersagen sind dagegen möglich. So kann z.B. mengeninduzierte Kreuzhybridisierung auf Oligoarrays beschrieben und verstanden werden. Der zweite und Hauptteil dieser Arbeit beschäftigt sich mit der Normalisierung von cDNA-Filterarrays. Dazu wurde mehrere Skalierungsmethoden und eine nichtlineare adaptive Methode miteinander verglichen. Dabei konnte gezeigt werden, daß die vom Autor entwickelte Normalisierungsmethode des asymmetrisch gestutzten Mittels bei geeigneter Parametrisierung in Bezug auf Testdaten den geringsten Normalisierungsfehler verursacht. Für die Realdaten stellte sich ein leichter Vorteil der Normalisierung durch den Spezialfall des 2%igen oberen gestutzten Mittels heraus, da es damit möglich ist den Einfluß von Sättigungseffekten etc. auf den Skalierungsquotienten zu minimieren. Ausführlich wurden dabei die Grundlagen der rangbasierten Normalisierungsmethoden erörtert und der Fehlereinfluß der nichtlinearen Rangwertnormalisierung diskutiert. Für die Qualitätsbeurteilung und Normalisierungskontrolle erwiesen sich zwei rangbasierte Kriterien als sehr nützlich: die Rang-Intensitäts-Kurven und die davon abgeleitete relative Rang-Intensitäts-Standardabweichung. Beide Kriterien wurden dabei erstmals für die Genexpressionsanalyse angewandt. Ein weiterer Aspekt der zugehörigen Visualisierungen lieferte die Grundlage für die retrospektive Fehlerabschätzung aus realen Genexpressionsdaten. Es wurde gezeigt, daß die mittleren negativen Werte der Rang-Intensitäts-Verteilungen sich proportional zur Standardabweichung des statistischen Rauschanteils verhalten.

Vorschau

Zitieren

Zitierform:
Zitierform konnte nicht geladen werden.

Rechte

Nutzung und Vervielfältigung:
Alle Rechte vorbehalten