Prediction of Protein-Protein Interaction Sites with Conditional Random Fields
Vorhersage der Protein-Protein Wechselwirkungsstellen mit Conditional Random Fields
von Zhijie Dong
Datum der mündl. Prüfung:2012-04-27
Erschienen:2012-11-28
Betreuer:Prof. Dr. Stephan Waack
Gutachter:Prof. Dr. Stephan Waack
Gutachter:Prof. Dr. Carsten Damm
Gutachter:Prof. Dr. Anita Schöbel
Dateien
Name:dong.pdf
Size:766.Kb
Format:PDF
Zusammenfassung
Englisch
Protein-protein interactions appear in almost every biological process. Proteins are mainly folded into three dimensional structures, which requires that a meaningful prediction should take consideration of the important spatial relationships of the amino acid residues. In this regard, many research groups use the spatial neighborhood information to evaluate the residues in their predictions, but the model itself do not consider the dependencies between the spatial neighboring residues. Our contribution is modeling the spatial neighborhood information of a protein directly into a graphical model based on the approach of conditional random fields.
Keywords: Conditional Random Fields (CRFs); protein-protein interaction prediction; machine learning; bioinformatics; mathematical models; stochastical models
Weitere Sprachen
Anwendung der Mathematik, der Statistik
und Informationstheorie auf dem Bereich der Molekularbiologie ist
ein etabliertes Gebiet der Naturwissenschaft. Viele Forschungen
verwenden die statistischen Modelle mit Ansätzen der
Informationstheoie zur Untersuchung und Analyse biologischer
Datensätze. In diesem Projekt wird die
Protein-Protein-Wechselwirkung fokussiert. Das Ziel ist die
bedeutenden Stellen der Protein-Protein-Wechselwirkungen
vorherzusagen, welche eine zentrale Rolle in vielen biologischen
Prozessen spielen. Die Methode basiert auf das so gennante
Conditional Random Field (CRF), welches zu stochastischen Modellen
gehört. Darüber hinaus bezieht sich die Aufgabe auch auf
maschinelles Lernen, was ein wichtiger Punkt in der Anwendung
ist.
Schlagwörter: Conditional Random Fields (CRFs); Vorhersage der Protein-Protein-Wechselwirkung; Maschinelles Lernen; Bioinformatik; Mathematische Modelle; Stochastische Modelle