A high quality and large scale training data-set is an important guarantee to teach an ideal classifier for image classification. Manually constructing a training data- set with appropriate labels is an expensive and time consuming task. Active learning techniques have been used to improved the existing models by reducing the number of required annotations. The present work aims to investigate the way to build a model for identifying and utilizing potential informative and representativeness unlabeled samples. To this end, two approaches for deep image classification using active learning are proposed, implemented and evaluated. The two versions of active leaning for deep image classification differ in the input space exploration so as to investigate how classifier performance varies when automatic labelization on the high confidence unlabeled samples is performed. Active learning heuristics based on uncertainty measurements on low confidence predicted samples, a pseudo-labelization technique to boost active learning by reducing the number of human interactions and knowledge transferring form pre-trained models, are proposed and combined into our methodology. The experimental results on two benchmark image classification data-sets verify the effectiveness of the proposed methodology. In addition, a new pool-based active learning query strategy is proposed. Dealing with retraining-based algorithms we define a ”forgetting event” to have occurred when an individual training example transitions the maximum predicted probability class over the course of retraining. We integrated the new approach with the semi- supervised learning method in order to tackle the above challenges and observedgood performance against existing methods. / En högkvalitativ och storskalig träningsdataset är en viktig garanti för att bli en idealisk klassificerare för bildklassificering. Att manuellt konstruera en träningsdatasats med lämpliga etiketter är en dyr och tidskrävande uppgift. Aktiv inlärningstekniker har använts för att förbättra de befintliga modellerna genom att minska antalet nödvändiga annoteringar. Det nuvarande arbetet syftar till att undersöka sättet att bygga en modell för att identifiera och använda potentiella informativa och representativa omärkta prover. För detta ändamål föreslås, genomförs och genomförs två metoder för djup bildklassificering med aktivt lärande utvärderas. De två versionerna av aktivt lärande för djup bildklassificering skiljer sig åt i undersökningen av ingångsutrymmet för att undersöka hur klassificeringsprestanda varierar när automatisk märkning på de omärkta proverna med hög konfidens utförs. Aktiv lärande heuristik baserad på osäkerhetsmätningar på förutsagda prover med låg konfidens, en pseudo- märkningsteknik för att öka aktivt lärande genom att minska antalet mänskliga interaktioner och kunskapsöverföring av förutbildade modeller, föreslås och kombineras i vår metod. Experimentella resultat på två riktmärken för bildklassificering datauppsättningar verifierar effektiviteten hos den föreslagna metodiken. Dessutom föreslås en ny poolbaserad aktiv inlärningsfrågestrategi. När vi använder omskolningsbaserade algoritmer definierar vi en ”glömmer händelse” som skulle ha inträffat när ett individuellt träningsexempel överskrider den maximala förutsagda sannolikhetsklassen under omskolningsprocessen. Vi integrerade den nya metoden med den semi-övervakad inlärning för att hanteraovanstående utmaningar och observeras bra prestanda mot befintliga metoder.
Identifer | oai:union.ndltd.org:UPSALLA1/oai:DiVA.org:kth-270720 |
Date | January 2019 |
Creators | Panagiota Mastoropoulou, Emmeleia |
Publisher | KTH, Skolan för elektroteknik och datavetenskap (EECS) |
Source Sets | DiVA Archive at Upsalla University |
Language | English |
Detected Language | Swedish |
Type | Student thesis, info:eu-repo/semantics/bachelorThesis, text |
Format | application/pdf |
Rights | info:eu-repo/semantics/openAccess |
Relation | TRITA-EECS-EX ; 2019:743 |
Page generated in 0.0018 seconds