Return to search

An inquiry into the efficacy ofconvolutional neural networks in low-resolution video feeds for object detection / En undersökning gällande effektiviteten av convolutional neurala nätverk i låg-kvalitets video-strömmar för objekt detektion

In this thesis, various famous models have been investigated and compared to a custom model for people detection in low resolution video feeds. YOLOv3 and SSD in particular are famous models which have, at their time, produced state of the art results on competitions such as ImageNet and COCO. The performance of all models have been compared on speed and accuracy where it was found that YOLOv3 was the slowest and SSD was the fastest. The proposed model was superior in accuracy to both of the aforementioned architectures which can be attributed to addition of newer techniques from research such as leaving activations out and having a carefully balanced loss function. The results seem to suggest that the proposed model is implementable for real-time inference using cheap hardware such as a raspberry pi 3B+ coupled with one or more AI accelerator stickssuch as the Intel Neural Compute Stick 2 and that the networks are usable for detection even in bad video streams. / I denna uppsats så har olika kända modeller undersökts och jämförts med en ny modell för människodetektering i lågkvalitets videoströmmar. YOLOv3 och SSD mer specifikt är kända modeller som, för sin tid, producerade topp resultat på tävlingar såsom ImageNet och COCO. Prestandan för alla modeller jämfördes medavseende på hastighet och träffsäkerhet där det hittades att YOLOv3 var den långsammaste och SSD var den snabbaste. Den förslagna modellen var träffsäkrare än båda tidigarenämnda modeller vilket kan attribueras till att nya tekniker från forskning har tillämpats såsom att låta vissa aktiveringsfunktioner utebli och att ha en försiktigt balanserad förlust funktion. Resultaten pekar mot att den förslagna modellen kan implementeras för bruk i real tid på billig hårdvara såsom en Raspberry pi 3B+ tillsammans med en eller flera AI accelerations stickor så som Intel Neural Compute Stick 2 samt att nätverken är användbara för detektion även i dåliga videoströmmar.

Identiferoai:union.ndltd.org:UPSALLA1/oai:DiVA.org:kth-252704
Date January 2019
CreatorsOkanovic, Mirza
PublisherKTH, Matematisk statistik
Source SetsDiVA Archive at Upsalla University
LanguageEnglish
Detected LanguageSwedish
TypeStudent thesis, info:eu-repo/semantics/bachelorThesis, text
Formatapplication/pdf
Rightsinfo:eu-repo/semantics/openAccess
RelationTRITA-SCI-GRU ; 2019:097

Page generated in 0.0029 seconds