The reliance on GPS for Unmanned Aerial Vehicle (UAV) localization limits the areas of application to places with a stable GPS signal. The emergence of deep learning in computer vision has made deep learning methods for visual UAV navigation a promising candidate for autonomous GPS denied localization. These method locate using images taken by a mounted camera on the UAV. Most works in the field evaluate localization ability in urban environments dense with artificial structures. This thesis analyses the localization ability of one such method over agricultural fields and forests in comparison to urban areas to investigate whether such systems rely on artificial structure or if they can function in a general environment. The localization technique is based on the deep feature Lucas-Kanade algorithm and uses convolutional neural network extracted feature representations of images taken by the UAV and satellite images to place the UAV within the satellite image for a position estimate. A network interpretation method is also applied to the problem to investigate whether it can help explain what causes the potential differences in localization accuracy between the areas. The investigation finds that the localization method is applicable in both forests and agricultural fields and pinpoints other factors than the prevalence of artificial structure that are more important for accurate localization. Further, a potential improvement to the algorithm is proposed that is shown to notably improve localization accuracy in certain conditions. It is based on obtaining a second position estimate by reversing the optimization direction and choosing the better of the two based on a loss function. / Obemannade luftburna fordon (UAV) är generellt beroende av GPS för autonom lokalisering vilket begränsar deras användningsområden till platser med en stabil GPS signal. Framväxten av djupinlärning inom datorseende har gjort djupinlärningsbaserade metoder för visuell UAV navigation en lovande kandidat för UAV lokalisering oberoende av GPS. De flesta vetenskapliga artiklar inom området utvärderar lokaliseringsförmågan i urbana miljöer som är fyllda med artificiella strukturer såsom hus och vägar. I den här uppsatsen analyseras lokaliseringsförmågan av en sådan metod över jordbruksområden och skog i förhållande till urbana miljöer för att undersöka om sådana system är beroende av artificiell struktur för att lokalisera korrekt. Lokaliseringsmetoden är baserad på Lukas-Kanade-algoritmen på djupa repesentationer. Konvolverande neurala nätverk tränas för att extrahera representationer av UAV- och satellitbilder som är mer passande för att bestämma förhållandet mellan kamerapositionerna med Lukas-Kanade algoritmen. En nätverkstolkningsmetod appliceras även på problemet för att undersöka huruvida det kan användas för att förklara eventuella skillnader i lokaliseringsförmåga mellan områdena. Undersökningen finner att lokaliseringsmetoden fungerar väl i jordbruksområden och skog och fastställer andra faktorer som är viktigare för välfungerande lokalisering än förekomsten av artificiella strukturer. Ytterligare föreslås en potentiell förbättring till algoritmen som visas kunna förbättra lokaliseringsnoggrannheten markant i vissa förhållanden. Förbättringen är baserad på att utvinna en andra positionsuppskattning genom att omvända optimeringsriktningen och välja den bättre av de två baserat på en förlustfunktion.
Identifer | oai:union.ndltd.org:UPSALLA1/oai:DiVA.org:kth-303806 |
Date | January 2021 |
Creators | Mäkelä, Markus |
Publisher | KTH, Skolan för elektroteknik och datavetenskap (EECS) |
Source Sets | DiVA Archive at Upsalla University |
Language | English |
Detected Language | Swedish |
Type | Student thesis, info:eu-repo/semantics/bachelorThesis, text |
Format | application/pdf |
Rights | info:eu-repo/semantics/openAccess |
Relation | TRITA-EECS-EX ; 2021:578 |
Page generated in 0.0182 seconds