Return to search

Molekylär klassificering av tjocktarmscancer : PAM-klusteranalys för identifiering av undergrupper

The main objective of this study is to divide a number of colorectal cancer cases into subgroups based on their molecular features using cluster analysis. The data used is supplied by a research group at Pathology, the Department of Medical Biosciences, Umeå University, and consists, after some preparation, of 455 observations which is a larger data set than many similar studies. The molecular variables that the clustering is based on are CIMP (CpG Island Methylator Phenotype), MSI (Micro Satellite Instability), BRAF- and KRAS-mutations. These are categorical variables and consequently the clustering method used is PAM (Partitioning Around Medoids) which is particularly useful with data on diverse variable level. The final analysis results in four subgroups that are represented by different combinations of attributes on the aforementioned variables. The disparity between the clusters are then evaluated by, for instance, comparing the survival time for their pertaining patients and it appears that two of the clusters are significantly different in this aspect. Other patient related and tumor specific characteristics are also linked with the separate cancer types and tested if they occur in varying extent. The locations of the tumors in the colon are for instance significantly different between the groups. Cluster analyses are exploratory tools so the choice of useful variables and subsequent interpretation of the results can be complicated and require relevant subject knowledge. / Huvudsyftet med denna studie är att med hjälp av klusteranalys dela in en mängd tjocktarmscancerfall i undergrupper baserat på deras molekylära egenskaper. Materialet som används tillhandahålls av en forskningsgrupp vid Patologi, Institutionen för medicinsk biovetenskap, Umeå universitet, och består efter viss bearbetning av 455 observationer vilket är en större datamängd än flera liknande studier. De molekylära variabler som ligger till grund för klusterindelningen är nivån på CIMP (CpG Island Methylator Phenotype), MSI (Mikrosatellitinstabillitet), BRAF- och KRAS-mutationer. Dessa är kategoriska variabler och därför används PAM (Partitioning Around Medoids) som är en särskild klusterteknik lämpad vid data på varierade variabelnivåer. I det slutliga resultatet fås fyra undergrupper som representeras av olika kombinationer av utfallen på ovannämnda variabler. Klustren utvärderas bland annat genom att jämföra överlevnadstiden för varje kluster, och det visar sig att två av klustren skiljer sig signifikant åt i detta avseende. Även andra patientrelaterade och tumörspecifika egenskaper kopplas samman till de olika cancertyperna och testas om de förekommer i varierande utsträckning. Var någonstans tumören är placerad är till exempel signifikant skilt mellan grupperna. Klusteranalyser är explorativa redskap så valet av variabler och sedermera tolkningar av resultat kan vara komplicerade och kräva stor sakkunskap.

Identiferoai:union.ndltd.org:UPSALLA1/oai:DiVA.org:umu-57412
Date January 2012
CreatorsArvidsson, Per, Snickars, Samuel
PublisherUmeå universitet, Statistik, Umeå universitet, Statistik
Source SetsDiVA Archive at Upsalla University
LanguageSwedish
Detected LanguageSwedish
TypeStudent thesis, info:eu-repo/semantics/bachelorThesis, text
Formatapplication/pdf
Rightsinfo:eu-repo/semantics/openAccess

Page generated in 0.0017 seconds