As drones are becoming ubiquitous, robust detection and tracking of potentially hostile drones is becoming a necessity. Among the many approaches being investigated in this relatively new research area, one cost effective option is the use of optical cameras equipped with computer vision algorithms. With the use of deep learning, it becomes possible to achieve high accuracy by generalizing from large datasets. However, drones are small and visually similar to birds, which has proven to be a major difficulty for purely vision based systems. This thesis investigates the utility of trajectory information (velocity and acceleration) in addition to temporal appearance features for detection and tracking of drones. While both kinds of information has been used in a variation of ways, work combining the two is largely lacking. Our approach uses background subtraction to generate candidate objects that initialize an LSTM which in turn combines trajectory and appearance information over multiple frames for joint detection and tracking of drones. While our specific implementation fails to outperform a traditional object detector in the form of YOLOv8, this could change with the solution of two problems identified with our approach. First problem being how to effectively incorporate large amounts of background data into the training of our network. Second being how to avoid repeatedly proposing the same non-drone candidates, while still being able to quickly resume tracking of a lost drone. / I takt med att drönare blir allt vanligare stiger kraven på robusta system som kan upptäcka och spåra hotfulla drönare. Bland de flertal tillvägagångssätt som undersöks i detta relativt nya forskningsområde är användandet av optiska kameror utrustade med datorseende-algoritmer ett kostnadseffektivt val. Genom användningen av djupinlärning har det blivit möjligt att uppnå hög pricksäkerhet genom att generalisera utifrån stora dataset. Men, drönare är små och utseendemässigt sett lika fåglar vilket är ett svåröverkomligt problem för system som endast förlitar sig på datorseende. I detta examensarbete undersöks vilken nytta som kan fås om man även tar hänsyn till information om drönarens trajektoria i form av hastighet och acceleration. Trots att både visuellt utseende och trajektoria är välstuderat när det kommer till drönardetektering, saknas det till stor del forskning som behandlar båda tillsammans. Vi använder bakgrundssubtraktion för att generera kandidater som startpunkt för en LSTM för att sedan kombinera trajektoria med utseende för förenad detektering och spårning av drönare. Fastän vår specifika implementation inte lyckas överträffa en traditionell objektdetekterare i form av YOLOv8, skulle detta kunna ändras givet en lösning på två identifierade problem med vårt tillvägagångssätt. Det första problemet är att hitta ett effektivt sätt att inkorporera stora mängder bakgrundsdata i träningen av vårt nätverk. Det andra är att undvika att gång på gång föreslå samma kandidater och samtidigt kunna snabbt återuppta spårningen av en förlorad drönare.
Identifer | oai:union.ndltd.org:UPSALLA1/oai:DiVA.org:kth-347834 |
Date | January 2024 |
Creators | Puranen Åhfeldt, Theo |
Publisher | KTH, Skolan för elektroteknik och datavetenskap (EECS), Stockholm : KTH Royal Institute of Technology |
Source Sets | DiVA Archive at Upsalla University |
Language | English |
Detected Language | Swedish |
Type | Student thesis, info:eu-repo/semantics/bachelorThesis, text |
Format | application/pdf |
Rights | info:eu-repo/semantics/openAccess |
Relation | TRITA-EECS-EX ; 2024:121 |
Page generated in 0.0031 seconds