Return to search

A Comparison of Convolutional Neural Networks used in Melanoma Detection : With transfer learning on the PAD-UFES-20 and ISIC datasets

Skin cancer is one of the most common forms of cancer, of which melanoma is the most lethal. Early detection is critical to long term survival rates. The use of machine learning to detect melanoma shows promising results in detecting malignant forms. The use of melanoma detecting models could potentially lead to faster diagnosis, and ensure treatment is applied before the melanoma has spread to other organs. In recent years, many studies have been made on the topic, especially on larger datasets such as ISIC, but there is a lack of studies on how machine learning perform on datasets containing smartphone images of skin lesions. PAD-UFES-20 is a dataset containing 2298 smartphone images of skin lesions, where the malignant forms are all clinically confirmed. The purpose of this thesis was to produce a comparison of the accuracy, precision, recall, and Area under the Curve metrics for several convolutional neural network models that were trained on the PAD-UFES-20 and ISIC datasets to differentiate between melanoma and benign lesions. The goal of this project is to contribute to the knowledge surrounding how neural networks perform in terms of melanoma detection. This is of interest for anyone getting started in the domain of melanoma detection using machine learning, building a melanoma detection application, and for anyone benefiting from earlier diagnosis. A qualitative and inductive approach with the support of quantitative data was adopted. Eight models were selected. They were designed using transfer learning, where the base model acted as a feature extractor, providing input to a dropout layer, and finally to the classification layer, which was retrained for 50 epochs, using the ADAM optimizer with a learning rate of 0.0003. These models were then evaluated against a test set for accuracy, precision, recall and AUC. The results of this study showed that the best performing models in terms of detecting melanoma on the PAD-UFES-20 dataset were Resnet_v2_50 and Mobilenet_v3_Large. Resnet_v2_50 achieved an accuracy of 0.9062, precision of 0.8, recall of 0.6667 and AUC of 0.8846. Mobilenet_v3_Large achieved accuracy of 0.9062, precision of 0.8, recall of 0.6667 and AUC of 0.9295. The best performing model on the ISIC dataset was the Inception_Resnet_v2 model with accuracy of 0.9342, precision of 0.9627, recall of 0.9018 and AUC of 0.9675. The conclusions of this study show that several models achieve promising results on the PAD-UFES-20 dataset. Overall, models that extracted a larger number of features from the base model performed better on the PAD-UFES-20 dataset, whereas this was not the general case on the larger ISIC dataset. It is not too futuristic to claim that machine learning can be applied as complement to standard diagnosis, but the study highlights the need for similar studies on larger and more diverse datasets of smartphone images, from which more transferable results can be obtained. / Hudcancer är en av de vanligaste formerna av cancer, där melanom är den mest dödliga. Tidig upptäckt är avgörande för långsiktiga överlevnadschanser. Användning av maskininlärning för att upptäcka melanom visar lovande resultat i att upptäcka maligna former av hudskador. Användning av modeller för att upptäcka melanom kan potentiellt leda till snabbare diagnos och säkerställa att behandling tillämpas innan melanomet har spridit sig till andra organ. De senaste åren har många studier gjorts inom ämnet, särskilt på större datamängder såsom ISIC datamängden, men det saknas studier om hur maskininlärning presterar på datamängder som innehåller smarttelefonbilder av hudskador. PAD-UFES-20 är en datamängd som innehåller 2298 smarttelefonbilder av hudskador, där de maligna formerna alla är kliniskt bekräftade. Syftet med denna studie var att producera en jämförelse av noggrannhet, precision, recall och Area under the Curve måtten för flera faltnings neuronnätverksmodeller som tränades på PAD-UFES-20 och ISIC-dataseten för att skilja mellan melanom och godartade hudskador. Målet med denna studie är att bidra till kunskapen om hur neurala nätverk presterar när det gäller upptäckt av melanom. Detta är av intresse för alla som börjar inom området för upptäckt av melanom med hjälp av maskininlärning och för alla som gynnas av en tidigare diagnos. En kvalitativ och induktiv ansats med stöd av kvantitativa data antogs. Åtta modeller valdes. De designades med hjälp av överföringsinlärning, där basmodellen fungerade som en producent av funktioner, som gav inmatning till ett Dropout lager och slutligen till klassificeringslagret, som tränades i 50 epoker, med hjälp av ADAM-optimeraren med en inlärningshastighet på 0.0003. Dessa modeller utvärderades sedan mot en test mängd för noggrannhet, precision, recall och AUC. Resultaten av denna studie visade att de bästa presterande modellerna när det gäller att upptäcka melanom på PAD-UFES-20-datasetet var Resnet_v2_50 och Mobilenet_v3_Large. Resnet_v2_50 uppnådde en noggrannhet på 0.9062, precision på 0.8, recall på 0.6667 och AUC på 0.8846. Mobilenet_v3_Large uppnådde noggrannhet på 0.9062, precision på 0.8, recall på 0.6667 och AUC på 0.9295. Den bäst presterande modellen på ISIC-datasetet var Inception_Resnet_v2-modellen med noggrannhet på 0.9342, precision på 0.9627, recall på 0.9018 och AUC på 0.9675. Slutsatserna av denna studie visar att flera modeller uppnår lovande resultat på PAD-UFES-20-datasetet. Sammantaget, presterade modeller som extraherade ett större antal funktioner från basmodellen, bättre på PAD-UFES-20-datasetet, medan detta inte var det generella fallet på det större ISIC-datasetet. Det är inte för långsökt att hävda att maskininlärning kan tillämpas som komplement till standarddiagnos metoder, men denna studie framhäver behovet av liknande studier på större och mer diversifierade datamängder av smarttelefonbilder, från vilka mer överförbara resultat kan erhållas.

Identiferoai:union.ndltd.org:UPSALLA1/oai:DiVA.org:kth-333990
Date January 2023
CreatorsGobena, Abdi
PublisherKTH, Skolan för elektroteknik och datavetenskap (EECS)
Source SetsDiVA Archive at Upsalla University
LanguageEnglish
Detected LanguageSwedish
TypeStudent thesis, info:eu-repo/semantics/bachelorThesis, text
Formatapplication/pdf
Rightsinfo:eu-repo/semantics/openAccess
RelationTRITA-EECS-EX ; 2023:401

Page generated in 0.0026 seconds