Return to search

Exploring Feature Selection Techniques for Machine Learning-based Melanoma Skin Cancer Classification / Utforskar tekniker för attributurval för maskininlärningsbaserad klassificering av melanomhudcancer

One of the most globally common types of cancer is skin cancer, where melanoma is the most deadly form. An important and promising tool for diagnosing diseases such as skin cancer is computer aided diagnostics, a tool which utilizes machine learning to predict and classify cancer. Limiting the complexity of the data, known as feature selection, can potentially improve classification accuracy. This report evaluates the accuracy of four different classifiers - Support Vector Machine, Naive Bayes, Decision Tree and Artificial Neural Network - with four different feature selection methods - Sequantial Forward Selection, Sequantial Backward Selection, Entropy and Principal Component Analysis - on the PH2 skin cancer dataset, containing dermoscopic images of skin lesions and their respective metadata. The findings reveal that all feature selection methods led to an improved accuracy rate on at least one classifier compared to not using feature selection. Furthermore, certain feature selection methods resulted in a significant gain in accuracy, indicating the potential value of feature selection techniques in improving the accuracy and efficiency of machine learning classifiers in computer-aided diagnosis systems for melanoma skin cancer detection. However, the results also underscore the importance of careful selection of the number of features to avoid adverse effects on model performance. This research contributes to the field by demonstrating the impact of feature selection methods on melanoma skin cancer detection and highlighting considerations for their application. / En av de globalt vanligaste typerna av cancer är hudcancer, där melanom är den mest dödliga typen. Ett viktigt och effektivt verktyg för att diagnostisera sjukdomar som hudcancer är datorstödd diagnostik, ett verktyg som använder maskininlärning för att förutse och klassificera cancer. Att begränsa komplexiteten i data, känt som attributurval, kan potentiellt förbättra klassificeringsnoggrannheten. Denna rapport utvärderar noggrannheten hos fyra olika klassificerare - ”Support Vector Machine”, ”Naive Bayes”, ”Decision Tree” och ”Artificial Neural Network” - med fyra olika attributurvalsmetoder - ”Sequantial Forward Selection”, ”Sequantial Backward Selection”, ”Entropy” and ”Principal Component Analysis” - på PH2 hudcancerdatasetet, som innehåller dermoskopiska bilder av hudlesioner och deras respektive metadata. Resultaten visar att alla attributurvalsmetoder ledde till en förbättrad noggrannhetsgrad på minst en klassificerare jämfört med att inte använda attributurval. Dessutom resulterade vissa attributurvalsmetoder i en betydande ökning i noggrannhet, vilket indikerar det potentiella värdet av attributurvalstekniker för att förbättra noggrannheten och effektiviteten hos maskininlärningsklassificerare i datorstödda diagnossystem för detektering av melanom hudcancer. Däremot understryker resultaten också vikten av noggrant urval av antalet attribut för att undvika negativa effekter på modellens prestanda. Denna forskning bidrar till fältet genom att demonstrera inverkan av attributurvalsmetoder på detektering av melanom hudcancer och belysa överväganden för deras tillämpning.

Identiferoai:union.ndltd.org:UPSALLA1/oai:DiVA.org:kth-330858
Date January 2023
CreatorsEriksson Mueller, Thomas, Fornstad, Viktor
PublisherKTH, Skolan för elektroteknik och datavetenskap (EECS)
Source SetsDiVA Archive at Upsalla University
LanguageEnglish
Detected LanguageEnglish
TypeStudent thesis, info:eu-repo/semantics/bachelorThesis, text
Formatapplication/pdf
Rightsinfo:eu-repo/semantics/openAccess
RelationTRITA-EECS-EX ; 2023:311

Page generated in 0.0025 seconds