As the use of advanced machine learning models has increased, the need for explainability that these models lack concerning their prediction has increased simultaneously. The aim of this thesis is to compare different functions available in the program R regarding their ability to provide explainability for these advanced machine learning models, also commonly referred to as black-box models. In this thesis we compare eight functions. Four well known black-box models are implemented on four different datasets in order to compare the functions’ ability to provide explanation in different settings. In our comparative analysis, we evaluate various aspects to assess and contrast each function, including explainability, flexibility, and functionality. Regardless of which model or dataset the explainability functions are exposed to, they are all capable of producing explainability plots. A result that showcases the high level of flexibility that every function holds. The result also provides an insight into how there is not one optimal function suitable for all of the models and datasets. All of the functions instead possess various advantages and disadvantages depending on the complexity of the models and which type of data being used. It is also evident that the number of included features and level of independence between the features has various effects on different functions. In conclusion, the functions in this thesis displayed a combination of significant flexibility and explainability, providing straightforward approaches to addressing the challenge of explainability in black-box models. / I samband med att användandet av avancerade maskininlärningsmodeller har ökat, har samtidigt behovet av förklarbarhet som dessa modeller saknar gällande deras prediktioner ökat. Syftet med denna uppsats är att jämföra olika funktioner som finns tillgängliga i programvaran R gällande deras förmåga att öka förklarbarheten för avancerade maskininlärningsmodeller, ofta benämnda som black-box modeller. I denna uppsats jämför vi åtta olika funktioner. Fyra välkända black-box modeller implementeras på fyra olika dataset för att kunna jämföra de olika funktionernas förmåga att förse förklarbarhet i olika sammanhang. I vår jämförande analys utvärderar vi olika aspekter för att bedöma och kontrastera varje funktion, inklusive förklarbarhet, flexibilitet och funktionalitet. Oavsett modell eller dataset som används, kan varje funktion visualisera förklarbarhet för black-box modeller. Ett resultat som påvisar den höga nivån av flexibilitet varje funktion innehar. Resultatet visar även på att det inte finns en optimal funktion som passar alla modeller och all typ av data. Alla funktioner innehar istället olika för- och nackdelar beroende på modellens komplexitet och vilken typ av data som används, samt antalet prediktorer och till vilken grad korrelation mellan dem finns. Sammanfattningsvis, har funktionerna i denna uppsats påvisat betydande flexibilitet och tolkningsbarhet, som i sin tur visar på att det finns enkla metoder som kan användas för att tackla utmaningen med förklarbarhet hos black-box modeller.
Identifer | oai:union.ndltd.org:UPSALLA1/oai:DiVA.org:umu-210053 |
Date | January 2023 |
Creators | Stålberg, Simon, Isaksson, Olivia |
Publisher | Umeå universitet, Statistik |
Source Sets | DiVA Archive at Upsalla University |
Language | English |
Detected Language | English |
Type | Student thesis, info:eu-repo/semantics/bachelorThesis, text |
Format | application/pdf |
Rights | info:eu-repo/semantics/openAccess |
Page generated in 0.0025 seconds