Assembly and repeat annotation of the nothobranchius furzeri genome

In der Alternsforschung an Vertebraten sind die relativ langen Lebensspannen der derzeitigen Modellorganismen ein Hindernis bei der Durchführung von Experimenten. Der Türkise Prachtgrundkärpfling Nothobranchius furzeri weist eine für Wirbeltiere sehr kurze Lebensspanne (4-12 Monate) auf, was ihn zu einem geeigneten Modellorganismus für die Alternsforschung macht. In der vorliegenden Arbeit wird der mehrstufige Prozess zur Erzeugung der Genomsequenz von N.furzeri beschrieben. Basierend auf umfangreichen Sequenzierungsadaten und zusätzlichen Kartenressourcen wurde eine qualitativ hochwertige Genomassemblierung mit einer Größe von 1,24 Gb (N50 57,4 Mb; 19 Chromosomen) erstellt. Weiterhin wurde die Zusammensetzung repetitiver Sequenzen im N. furzeri Genom untersucht. Neben etablierten Methoden zur Repeatanalyse wurde zudem eine neue Softwarelösung (RepARK) entwickelt und angewendet. Es wurden 35,5% der Genomassemblierung als Repeats eingestuft. Basierend auf dieser Repeatannotation zeigte sich, dass die Genomassemblierung zwar circa 90% der unikalen Sequenzen enthält aber rund 60% der Repeats fehlen. Eine Analyse von unassemblierten Sequenzen zeigt zudem einen genomischen Repeatanteil von 56-70%. Diesen fehlenden Sequenzanteil gilt es in Zukunft insbesondere mit Sequenziertechnologien der dritten Generation möglichst vollständig zu erfassen, um auf dieser Basis die Rolle von repetitiven Elementen in biologischen Prozessen wie dem Altern erforschen zu können.

In aging research, the long lifespan of the current vertebrate model organisms challenges the feasibility of research efforts. The turquoise killifish Nothobranchius furzeri has the shortest lifespan for vertebrates known so far (4-12 months) making it to a valuable new model in aging research. In this thesis, the multi-step process of building genome reference sequence of N. furzeri is described. Based on a broad range of sequencing data and additional map resources, a high-quality genome assembly with a size of 1.24 Gb (N50 57.4 Mb, 19 chromosomes) was achieved. Furthermore, the composition of repetitive sequences in the N. furzeri genome was analyzed. In addition to established repeat detection methods a new software solution (RepARK) was developed and applied. In this analysis, 35.5% of the genome assembly was annotated as repetitive. Using this repeat annotation, it was estimated that the genome assembly contains 90% of the unique sequence while about 60% of the repeats are absent. An analysis in not-assembled data suggests a repeat content in the N. furzeri genome ranging from 56% to 70%. This missing fraction needs to be resolved by further third generation sequencing efforts to study the role of repeats in biological processes such as aging.

Vorschau

Zitieren

Zitierform:
Zitierform konnte nicht geladen werden.

Rechte

Nutzung und Vervielfältigung:
Alle Rechte vorbehalten