Return to search

Selective Kernel Network based Crowding Counting and Crowd Density Estimation / Selektiv kärna baserad Trängselräkning och Uppskattning av folkmassadensitet

Managing crowd density has become an immense challenge for public authorities due to population growth and evolving human dynamics. Crowd counting estimates the number of individuals in a given area or scene, making it a practical technique applicable in real-world scenarios such as surveillance and traffic control. It contributes to urban planning, retail analytics, and security systems by providing insights into population dynamics and aiding in anomaly detection. This thesis focuses on implementing and evaluating a selective kernel mechanism in crowd counting. The selective kernel block, introduced in a computer vision research known as the Selective Kernel (SK) Network [1], presents an adapted convolution layer as a substitute for the traditional convolution neural network (CNN) architecture. This adaptation has the potential to enhance object detection and image regression tasks. Building upon the C3 framework [2], the thesis applies the selective kernel mechanism to three state-of-the-art crowd counting designs: ResNet [3], CSRNet [4], and SANet [5], resulting in the creation of SK adaptive models. The evaluation process mainly involves collecting and comparing Mean Absolute Error (MAE) and Mean Squared Error (MSE), as well as crowd statistics and crowd density maps. These evaluations are performed using the ShanghaiTech crowd Part A (random high-density crowd images from the website) and Part B (street views in similar scenes) datasets [6]. In 6 comparisons with two different datasets, SK adaptive models were found to have better prediction results in 4 of them against the original models. In conclusion, the SK block offers several advantages: firstly, it enhances feature extraction performance, especially when pretrained with large datasets; secondly, it improves image regression in more straightforward dataset scenarios. On the downside, its impact is limited or detrimental in sparse datasets. This finding suggests that the selective kernel approach holds promise in supporting and improving crowd counting in the high-density group and street view scenarios, facilitating effective public management. / Att hantera folktäthet har blivit en enorm utmaning för offentliga myndigheter på grund av befolkningsökning och förändrade mänskliga dynamiker. Folkräkning uppskattar antalet individer i ett givet område eller scen, vilket gör det till en praktisk teknik som kan tillämpas i verkliga scenarier som övervakning och trafikstyrning. Genom att erbjuda insikter i befolkningsdynamik och hjälpa till med avvikelsedetektering bidrar folkräkning till stadsplanering, detaljhandelsanalys och säkerhetssystem. Denna avhandling fokuserar på implementeringen och utvärderingen av den selektiva kernelmekanismen inom folksamlingars räkning. Den selektiva kernelblocket, introducerat i en datorseendeforskning känd som Selective Kernel Network [1], presenterar en anpassad faltningsskikt som en ersättning för den traditionella konvolutionsneuralnätverk-arkitekturen. Denna anpassning har potential att förbättra objektdetektion och bildregression. Byggande på C3 - ramverket [2] tillämpar avhandlingen den selektiva kernelmekanismen på tre toppmoderna modeller inom folksamlingars räkning: ResNet [3], CSRNet [4], och SANet [5], vilket resulterar i skapandet av SK-adaptiva modeller. Evalueringen innefattar främst insamling och jämförelse av medelabsolutfel och medelkvadratfel, samt statistik om folksamlingar och densitetskartor. Dessa utvärderingar utförs med hjälp av dataseten ShanghaiTech crowd Part A (slumpmässiga bilder av hög densitet från webbplatsen) och Part B (gatuvyer i liknande scenarier) [6]. Totalt genomförs sex jämförelser med två olika dataset, och SK-adaptiva modeller visar bättre prognosresultat i fyra av dem jämfört med de ursprungliga modellerna. Sammanfattningsvis erbjuder SK-blocket flera fördelar: för det första förbättrar det prestandan för funktionsextrahering, särskilt när det förtränas med stora dataset; för det andra förbättrar det bildregression i enklare dataset-scenarier. Å andra sidan är dess påverkan begränsad eller till och med skadlig i glesa dataset. Generellt sett tyder detta på att den selektiva kärnan har lovande att stödja och förbättra publikräkningen i scenarierna med hög täthet och gatuvy, och därigenom underlätta effektiv offentlig förvaltning.

Identiferoai:union.ndltd.org:UPSALLA1/oai:DiVA.org:kth-337236
Date January 2023
CreatorsLiu, Jinchen
PublisherKTH, Skolan för elektroteknik och datavetenskap (EECS)
Source SetsDiVA Archive at Upsalla University
LanguageEnglish
Detected LanguageSwedish
TypeStudent thesis, info:eu-repo/semantics/bachelorThesis, text
Formatapplication/pdf
Rightsinfo:eu-repo/semantics/openAccess
RelationTRITA-EECS-EX ; 2023:541

Page generated in 0.0062 seconds