Return to search

Malignant Melanoma Classification with Deep Learning / Klassificering av malignt melanom genom djupinlärning

Malignant melanoma is the deadliest form of skin cancer. If correctly diagnosed in time, the expected five-year survival rate can increase up to 97 %. Therefore, exploring various methods for early detection can contribute with tools which can be used to improve detection of disease and finally to make sure that help is given in time. The purpose of this work was to investigate the performance and behavior of different convolutional neural network (CNN) architectures and to explore whether presegmenting clinical images would improve the prediction results on a binary classifier system. For the purposes of this paper, the two selected CNNs were Inception v3 and DenseNet201. The networks were pretrained on ImageNet and transfer learning techniques such as feature extraction and fine-tuning were used to extract the features of the training set. Batch size was varied and five-fold cross-validation was applied during training to find the optimal number of epochs for training. Evaluation was done on the ISIC test set, the PH2 dataset and a combined set of images from Karolinska University Hospital and FirstDerm, where the latter was also cropped to evaluate presegmentation. The achieved results for the ISIC test set were AUCs of 0.66 for Inception v3 and 0.71 for DenseNet201. For the PH2 test set, the AUCs were 0.82 and 0.73. The results for the Karolinska and FirstDerm set were 0.49 and 0.42. Presegmenting the latter test set resulted in AUCs of 0.58 and 0.51. In conclusion, quality of images could have a big impact on the classification performance. Batch size seems to affect the performance and could thus be an important hyperparameter to tune. Ultimately, the Inception v3 architecture seems to be less affected by different variability why selecting this architecture for a real-world clinical image application could be more suitable. However, the networks performed much worse than state of the art results in previous papers and the conclusions are based on rather inconclusive results. Therefore more research has to be done to verify the conclusions. / Malignt melanom är den dödligaste formen av hudcancer. Om en korrekt diagnos sätts tillräckligt tidigt kan den femåriga överlevnadsgraden uppgå till 97 %. Detta gör att forskningen efter metoder för tidigarelagd upptäckt kan bidra med verktyg som i sin tur kan användas till att upptäcka sjukdom och slutligen bidra till att hjälp sätts in i tid. Målet med detta arbete var att undersöka prestanda och beteende för olika faltningsbara neurala nätverk (CNN) och att undersöka ifall försegmentering av kliniska bilder kunde förbättra resultaten i ett binärt klassificeringssystem. De utvalda faltningsbara neurala nätverksarkitekturerna var Inception v3 och DenseNet201. Nätverken var förträanade på ImageNet och "Transfer-learning"-metoder som feature extraction och fine-tuning användes för att extrahera features från träningsuppsättningen. Batch size varierades och femtalig korsvalidering användes för att hitta det optimala antalet träningsepoker. Utvärderingen gjordes med bilder i testset från ISIC, PH2 och Karolinska och FirstDerm. Bilderna i den senare datamängden beskärdes för att utvärdera försegmenteringen av kliniska bilder. De uppnådda resultaten för ISIC testmängden var AUC-värden på 0.66 för Inception v3 och 0.71 för DenseNet201. För PH2 låg AUC-värdena på 0.82 respektive 0.73. Resultaten för testmängden med bilder frön Karolinska och FirstDerm var 0.40 och 0.42. Försegmenteringen av den sistnämnda testmängden gav AUC-värden på 0.58 och 0.51. Sammanfattningsvis kan bildkvalitet ha en stor inverkan på ett nätverks klassificeringsprestanda. Batch size verkar också påverka resultaten ochkan därför vara en viktig hyperparameter att stämma. Slutligen verkar Inception v3 vara mindre känslig för olika typer av variabiltet vilket görvalet av denna arkitektur mer lämplig ifall en riktig applikation ska byggas för detektion av exempelvis kliniska bilder. Det som bör understrykas i detta arbete är att resultaten var mycket sämre än det som bäst uppvisats i föregående rapporter och att slutasatserna är baserade på relativt ickeövertygande värden. Därför efterkrävs mer forskning för att styrka slutsatserna.

Identiferoai:union.ndltd.org:UPSALLA1/oai:DiVA.org:kth-241694
Date January 2019
CreatorsKisselgof, Jakob
PublisherKTH, Medicinteknik och hälsosystem
Source SetsDiVA Archive at Upsalla University
LanguageEnglish
Detected LanguageSwedish
TypeStudent thesis, info:eu-repo/semantics/bachelorThesis, text
Formatapplication/pdf
Rightsinfo:eu-repo/semantics/openAccess
RelationTRITA-CBH-GRU ; 2018:81

Page generated in 0.0026 seconds