Return to search

Efficient and robust reduction of bounding boxes of a multi-class neural network’s output for vehicular radar-systems / Effektiva och robusta minskningar av avgränsande rutor för en flerklassig neurala nätverks utdata för radar-system för fordon

Object detection has been a fundamental part of many emerging technologies, such as autonomous vehicles, robotics, and security. As deep learning is the main reason behind the leap of performance in object detection, it has mostly been associated with a post-processing step of non-maximum suppression (NMS) to reduce the number of resulting bounding boxes output from the network to, ideally, one box per object. As non-maximum suppression blindly suppress the overlap with a pre-defined threshold, it introduces the problem of suppressing false negatives in crowded scenes by choosing a high threshold, or vice versa. This problem is critical, especially in the autonomous vehicle industry, as this concerns the safety of passengers. The problem of the machine understanding whether these bounding boxes belong to the same object or two near-by objects is still not directly solvable. Although a lot of previous research tried to invent a new box-reduction method, every method has its own drawbacks while solving the problem. That is why, until now, many researchers are still using non‐maximum suppression. In this research, a literature review was carried out to determine the best NMS alternatives. Then, an approach for box reduction based on determinantal point process (DPP) was implemented. Furthermore, an evaluation pipeline was introduced for experimental analysis for the differences between NMS and DPP. Although NMS shows a better performance in terms of precision and recall, DPP chooses better fitting bounding boxes. / Objektdetektering har varit en grundläggande del av många nya tekniker, t.ex. autonoma fordon, robotik och säkerhet. Eftersom djupinlärning är den främsta orsaken till den stora prestandaskillnaden vid objektsdetektering har den oftast varit förknippad med ett efterbehandlingssteg med icke-maximal undertryckning (NMS) för att minska antalet resulterande avgränsande rutor som produceras av nätverket till, idealt sett, en ruta per objekt. Eftersom icke-maximal undertryckning blint undertrycker överlappningen med ett fördefinierat tröskelvärde, uppstår problemet med att undertrycka falskt negativa resultat i överfulla scener genom att välja ett högt tröskelvärde, eller tvärtom. Detta problem är kritiskt, särskilt inom industrin för autonoma fordon, eftersom det gäller passagerarnas säkerhet. Problemet med att maskinen ska förstå om dessa avgränsande rutor tillhör samma objekt eller två närliggande objekt är fortfarande inte direkt lösbart. Även om man i tidigare forskning har försökt hitta en ny metod för att reducera boxar, har varje metod sina egna nackdelar när den löser problemet. Det är därför som många forskare fram till nu fortfarande använder sig av icke-maximalt undertryckande. I denna forskning gjordes en litteraturstudie för att fastställa de bästa NMS-alternativen. Därefter implementerades en metod för boxförminskning baserad på determinant punktprocess (DPP). Dessutom infördes en utvärderingsledning för experimentell analys av skillnaderna mellan NMS och DPP. Även om NMS visar en bättre prestanda när det gäller precision och återkallande, väljer DPP bättre passande avgränsande lådor.

Identiferoai:union.ndltd.org:UPSALLA1/oai:DiVA.org:kth-321928
Date January 2022
CreatorsGasser, Elazab
PublisherKTH, Skolan för elektroteknik och datavetenskap (EECS)
Source SetsDiVA Archive at Upsalla University
LanguageEnglish
Detected LanguageSwedish
TypeStudent thesis, info:eu-repo/semantics/bachelorThesis, text
Formatapplication/pdf
Rightsinfo:eu-repo/semantics/openAccess
RelationTRITA-EECS-EX ; 2022:778

Page generated in 0.0025 seconds