Return to search

Boosting CNN Performance in Digital Pathology Using Colour Normalisation and Ensembling

Researchers within digital pathology are endeavouringto develop machine-learning tools to support dentists whenmaking a diagnosis. The purpose of this study was to investigatehow applying colour normalisation (CN) algorithms on an oral,histopathological dataset would impact both machine-learningmodels and ensembles of models when classifying cell types.The dataset was run through four different CN algorithms byusing a stain normalisation toolbox. The now five datasets (1 +4) were then fed separately into a pipeline to create machinelearningmodels, specifically convolutional neural networks withEfficientNet architecture. Two different ensembles were studied,one that used all the models and one that used the three modelswith the highest test accuracy. Each model gave a cell typeprediction of each cell. The ensembles super positioned theirmodels’ predictions of the same cell and used the results as theirown predictions.The models based on datasets created by two of the CNalgorithms had a weighted, average accuracy of ca. four percentagepoints higher than the model based on the unnormaliseddataset. Unexpectedly, the models based on the colour-normaliseddatasets had a larger standard deviation than the model basedon the unnormalised dataset. All the models were generally badat classifying two of the four cell types. Both the ensembleshad a weighted, average accuracy of ca. ten percentage pointshigher than the model based on the unnormalised dataset, aswell as a larger standard deviation. The increase in accuracyis significant and could move forward the timeline for whenmachine-leaning tools can be implemented into dentists’ andpathologists’ workflow. / Forskare inom digital patologi strävar efteratt utveckla maskininlärnings-verktyg som stödjer tandläkarenär de ställer diagnoser. Syftet med denna studie är att utreda hurtillämpning av färgnormaliserande algoritmer (CN algoritmer)på ett oralt, histopatologiskt dataset påverkar hur både maskininlärningsmodeller och ensembler av modeller klassificerarcelltyper.Datasetet kördes igenom fyra olika CN algoritmer med hjälpav en färgnormaliserings-verktygslåda. De nu fem dataseten(1 + 4) matades separat in i en ”pipeline” för att skapamaskininlärningsmodeller, specifikt djupa neurala nätverk medEfficientNet arkitektur. Två olika ensembler skapades, en somanvände alla modeller och en som endast använde de tre somhade högst noggrannhet på testsettet. Varje modell uppskattadecelltypen för varje cell. Ensemblerna superpositionerade derasmodellers uppskattningar för varje cell och använde resultatensom sina egna uppskattningar.Modellerna som tränats på två av de färgnormaliseradedataseten ökade i viktad, snitt-noggrannhet med fyra procentenheteri förhållande till modeller tränade på det ursprungligadatasetet. Förvånansvärt nog så ökade även standardavvikelsenhos modeller tränade på de färgnormaliserade dataseten. Allamodeller var generellt dåliga på att klassificera två av de fyracelltyperna. Ensemblen uppnådde en viktad snitt-noggrannhet på ca. tio procentenheter mer än modeller tränade på detursprungliga datasetet. Noggrannhetens signifikanta ökning kanleda till en tidigare implementering av maskininlärnings-verktygi tandläkares och patologers arbetsflöde. / Kandidatexjobb i elektroteknik 2021, KTH, Stockholm

Identiferoai:union.ndltd.org:UPSALLA1/oai:DiVA.org:kth-308449
Date January 2021
CreatorsKvarnström, Emelie, Tibbling, Axel
PublisherKTH, Skolan för elektroteknik och datavetenskap (EECS)
Source SetsDiVA Archive at Upsalla University
LanguageEnglish
Detected LanguageSwedish
TypeStudent thesis, info:eu-repo/semantics/bachelorThesis, text
Formatapplication/pdf
Rightsinfo:eu-repo/semantics/openAccess
RelationTRITA-EECS-EX ; 2021:197

Page generated in 0.0025 seconds