Return to search

Enhancement-basedSmall TargetDetection for InfraredImages

Infrared small target detection is widely used in fields such as military and security. UNet, which is a classical semantic segmentation method proposed in 2015, has shown excellent performance and robustness. However, U-Net suffers from the problem of losing small targets in deep layers after multiple down-sampling operations. Dilated convolution, as a special convolution that can increase the receptive field without increasing the number of parameters, is considered to be able to optimize the problems caused by down-sampling. Dense Nested Attention Network (DNANet), due to its superior performance, was chosen as the baseline, but it still has the issue of target loss. This study proposes three optimization directions: deep down-sampling replaced by cascaded dilated convolution, dilated spatial attention, and dilated residual block. In these three directions, this study proposes four methods, respectively DNANet-DS-1, DNANet-DS-2, DNANet-Att, and DNANet-RB. Two open-source infrared small target datasets, NUDT-SIRST and NUAA-SIRST, were used in this study. The four proposed methods were trained and tested on these two datasets. Among them, DNANetRB significantly outperforms other methods on the NUAA-SIRST dataset, so further experiments were conducted to observe the influence of different network depths on DNANet-RB. The experimental result indicates that when the network depth exceeds a certain threshold, the network can only achieve marginal improvements, but the number of parameters will increase significantly. / Infraröd detektering av små mål används ofta inom områden som militär och säkerhet. U-Net, som är en klassisk semantisk segmenteringsmetod som föreslogs 2015, har visat utmärkt prestanda och robusthet. U-Net lider dock av problemet med att förlora små mål i djupa lager efter flera nedprovningsoperationer. Dilaterad konvolution, som är en speciell konvolution som kan öka det receptiva fältet utan att öka antalet parametrar, anses kunna optimera de problem som orsakas av downsampling. DNANet (Dense Nested Attention Network) valdes som baslinje på grund av dess överlägsna prestanda, men det har fortfarande problemet med målförlust. Denna studie föreslår tre optimeringsriktningar: djup nedsampling ersatt av kaskad dilaterad konvolution, dilaterad rumslig uppmärksamhet och dilaterat restblock. I dessa tre riktningar föreslår denna studie fyra metoder, respektive DNANet-DS-1, DNANet-DS-2, DNANet-Att och DNANet-RB. Två dataset med små infraröda mål med öppen källkod, NUDT-SIRST och NUAA-SIRST, användes i denna studie. De fyra föreslagna metoderna tränades och testades på dessa två datamängder. Bland dem överträffar DNANet-RB betydligt andra metoder på NUAA-SIRST-datasetet, så ytterligare experiment genomfördes för att observera påverkan av olika nätverksdjup på DNANet-RB. Det experimentella resultatet visar att när nätverksdjupet överskrider ett visst tröskelvärde kan nätverket bara uppnå marginella förbättringar, men antalet parametrar kommer att öka avsevärt.

Identiferoai:union.ndltd.org:UPSALLA1/oai:DiVA.org:kth-343007
Date January 2023
CreatorsHanqi, Yang
PublisherKTH, Skolan för elektroteknik och datavetenskap (EECS)
Source SetsDiVA Archive at Upsalla University
LanguageEnglish
Detected LanguageSwedish
TypeStudent thesis, info:eu-repo/semantics/bachelorThesis, text
Formatapplication/pdf
Rightsinfo:eu-repo/semantics/openAccess
RelationTRITA-EECS-EX ; 2023:836

Page generated in 0.0021 seconds