Return to search

Comparative Analysis of Convolutional Neural Network (CNN) Architectures for Content Restriction

Ökningen av sociala medieanvändare har introducerat betydande utmaningar i att hantera de stora mängder data som delas, särskilt bilder. Med mer än 63% av världens befolkning som använder sociala medieplattformar, har behovet av effektiv innehållsbegränsning blivit kritiskt. Manuell moderering är inte längre praktisk på grund av den stora mängden innehåll. Denna studie adresserar det kritiska problemet med bildbegränsning genom att utvärdera prestandan hos avancerade bildklassificeringsmodeller, specifikt VGG16 och Inception_v3 konvolutionella neurala nätverk (CNNs). För att möta denna utmaning använder studien CIFAR-10 datasetet, vilket är allmänt känt som ett riktmärkesdataset inom bildklassificeringsforskning. Forskningen innebär att implementera förtränade modeller och genomföra en omfattande jämförelse med olika prestandamått, inklusive noggrannhet, precision, återkallning, F1-poäng, förväxlingsmatris, ROC-kurva och AUC. Dessa mått ger en omfattande utvärdering av modellens förmåga att korrekt klassificera bilder. Vidare inkluderar studien en finjusteringsfas efter den inledande jämförelsen för att ytterligare förbättra modellens prestanda. Detta innebär att justera parametrarna i den förtränade modellen för att bättre passa de specifika egenskaperna hos CIFAR-10 datasetet. Efter finjusteringen genomförs ytterligare en jämförande analys för att bedöma förbättringarna och fastställa den mest effektiva modellen. Resultaten visar att både VGG16 och Inception_V3 visade betydande förbättringar i prestanda efter finjustering, med märkbara ökningar i noggrannhet och andra mått. Emellertid visade VGG16 bättre övergripande prestanda, vilket gör den till den föredragna modellen för denna applikation. Huvudsyftet med denna forskning är att identifiera den mest effektiva modellen för bildklassificering och därigenom etablera ett fundamentalt konceptbevis för användningen av konvolutionella neurala nätverk (CNNs) i innehållsbegränsning på sociala medieplattformar. / The increase in social media usage has introduced significant challenges in managing the large amounts of data being shared, particularly images. With more than 63% of the global population using social media platforms, the need for effective content restriction has become critical. Manual moderation is no longer practical due to the large amount of content. This thesis addresses the critical issue of image restriction by evaluating the performance of advanced image classification models, specifically VGG16 and Inception_v3 Convolutional Neural Networks (CNNs). In order to address this challenge, the study utilizes the CIFAR-10 dataset, which is widely known as a benchmark dataset in image classification research. The research involves implementing pre-trained models and conducting a comprehensive comparison using various performance metrics, including Accuracy, Precision, Recall, F1 Score, Confusion Matrix, ROC Curve, and AUC. These metrics provide a comprehensive evaluation of the model's ability to accurately classify images. Furthermore, the study includes a fine-tuning phase after the initial comparison to further improve the model's performance. This involves adjusting the parameters of the pre-trained model to better suit the specific characteristics of the CIFAR-10 dataset. Following the finetuning, another round of comparative analysis is conducted to assess the improvements and determine the most effective model. The results demonstrate that both VGG16 and Inception_V3 showed significant improvements in performance after fine-tuning, with notable increases in accuracy and other metrics. However, VGG16 showed a better overall performance, making it the preferred model for this application. The primary objective of this research is to identify the most effective model for image classification, thereby establishing a foundational proof of concept for the application of Convolutional Neural Networks (CNNs) in content restriction on social media platforms.

Identiferoai:union.ndltd.org:UPSALLA1/oai:DiVA.org:miun-51805
Date January 2024
CreatorsDaher, Abdulhadi
PublisherMittuniversitetet, Institutionen för data- och elektroteknik (2023-)
Source SetsDiVA Archive at Upsalla University
LanguageEnglish
Detected LanguageSwedish
TypeStudent thesis, info:eu-repo/semantics/bachelorThesis, text
Formatapplication/pdf
Rightsinfo:eu-repo/semantics/openAccess

Page generated in 0.0026 seconds