Return to search

Kombination von K-means++ Clustering und PCA zur Analyse von Chromatin-Daten

In der Epigenetik werden die Veränderungen der Erbinformationen neben der DNS erforscht. Dabei werden den Histonen, um die sich die DNS im Zellkern wickelt, eine große Bedeutung zugeordnet. In dieser Arbeit werden die Ergebnisse eines neuen Segmentierungsverfahrens ausgewertet und visualisiert. Dabei werden die vorliegenden Daten mittels des k-means++ Algorithmus geclustert.Zuerst werden die Clusterergebnisse statistisch ausgewertet, um sie dann mit den durch vorgehenden Arbeiten erworbenen Kenntnissen zu vergleichen. Mittels dieses Vergleichs werden dann die idealen Parameter für das Clustering bestimmt. Die Ergebnisse dieses idealen Clusterings werden dann mittels Starplots, Scatterplots und Binningplots visualisiert. Für die Erstellung der Scatter- und Binningplots wird eine PCA genutzt, um die Daten auf zwei Dimensionen zu reduzieren.

Identiferoai:union.ndltd.org:DRESDEN/oai:qucosa:de:qucosa:17148
Date12 February 2018
CreatorsGerighausen, Daniel
ContributorsUniversität Leipzig
Source SetsHochschulschriftenserver (HSSS) der SLUB Dresden
LanguageGerman
Detected LanguageGerman
Typeinfo:eu-repo/semantics/publishedVersion, doc-type:bachelorThesis, info:eu-repo/semantics/bachelorThesis, doc-type:Text
Rightsinfo:eu-repo/semantics/openAccess
Relationurn:nbn:de:bsz:15-qucosa2-163403, qucosa:16340

Page generated in 0.0025 seconds