La detecció de vianants és crucial per als sistemes d’assistència a la conducció (ADAS).
Disposar d’un classificador precís és fonamental per a un detector de vianants basat
en visió. Al entrenar un classificador, s’assumeix que les característiques de les dades
d’entrenament segueixen la mateixa distribució de probabilitat que la de les dades de
prova. Tot i això, a la pràctica, aquesta assumpció pot no complir-se per diferents
causes. En aquests casos, en la comunitat de visió per computador és cada cop més
comú utilitzar tècniques que permeten adaptar els classificadors existents del seu
entorn d’entrenament (domini d’origen) al nou entorn de prova (domini de destí). En
aquesta tesi ens centrem en l’adaptació de domini dels detectors de vianants basats
en models deformables basats en parts (DPMs). Com a prova de concepte, utilitzem
dades sintètiques com a domini d’origen (món virtual) i adaptem el detector DPM
entrenat en el món virtual per a funcionar en diferents escenaris reals. Començem
explotant al màxim les capacitats de detecció del DPM entrenant en dades del món
virtual, però, tot i això, al aplicar-lo a diferents conjunts del món real, el detector
encara perd poder de discriminació degut a les diferències entre el món virtual i el
real. És per això, que ens centrem en l’adaptació de domini del DPM.
Per començar, considerem un únic domini d’origen per a adaptar-lo a un únic
domini de destí mitjançant dos mètodes d’aprenentatge per lots, l’A-SSVM i el SASSVM.
Després, l’ampliem a treballar amb múltiples (sub-)dominis mitjançant una
adaptació progressiva, utilitzant una jerarquia adaptativa basada en SSVM (HASSVM)
en el procés d’optimització. Finalment, extenem HA-SSVM per a aconseguir
un detector que s’adapti de forma progressiva i sense intervenció humana al domini de
destí. Cal destacar que cap dels mètodes proposats en aquesta tesi requereix visitar
les dades del domini d’origen. L’evaluació dels resultats, realitzada amb el sistema
d’evaluació de Caltech, mostra que el SA-SSVM millora lleugerament respecte el ASSVM
i millora en 15 punts respecte el detector no adaptat. El model jeràrquic
entrenat mitjançant el HA-SSVM encara millora més els resultats de la adaptació de
domini. Finalment, el mètode sequencial d’adaptació de domini ha demostrat que pot
obtenir resultats comparables a la adaptació per lots, però sense necessitat d’etiquetar
manualment cap exemple del domini de destí. L’adaptació de domini aplicada a la
detecció de vianants és de gran importància i és una àrea que es troba relativament
sense explorar. Desitgem que aquesta tesi pugui assentar les bases del treball futur
d’aquesta àrea. / La detección de peatones es crucial para los sistemas de asistencia a la conducción
(ADAS). Disponer de un clasificador preciso es fundamental para un detector de
peatones basado en visión. Al entrenar un clasificador, se asume que las características
de los datos de entrenamiento siguen la misma distribución de probabilidad que las de
los datos de prueba. Sin embargo, en la práctica, esta asunción puede no cumplirse
debido a diferentes causas. En estos casos, en la comunidad de visión por computador
cada vez es más común utilizar técnicas que permiten adaptar los clasificadores existentes
de su entorno de entrenamiento (dominio de origen) al nuevo entorno de prueba
(dominio de destino). En esta tesis nos centramos en la adaptación de dominio de los
detectores de peatones basados en modelos deformables basados en partes (DPMs).
Como prueba de concepto, usamos como dominio de origen datos sintéticos (mundo
virtual) y adaptamos el detector DPM entrenado en el mundo virtual para funcionar
en diferentes escenarios reales. Comenzamos explotando al máximo las capacidades
de detección del DPM entrenado en datos del mundo virtual pero, aun así, al aplicarlo
a diferentes conjuntos del mundo real, el detector todavía pierde poder de discriminaci
ón debido a las diferencias entre el mundo virtual y el real. Es por ello que nos
centramos en la adaptación de dominio del DPM.
Para comenzar, consideramos un único dominio de origen para adaptarlo a un
único dominio de destino mediante dos métodos de aprendizaje por lotes, el A-SSVM
y SA-SSVM. Después, lo ampliamos a trabajar con múltiples (sub-)dominios mediante
una adaptación progresiva usando una jerarquía adaptativa basada en SSVM
(HA-SSVM) en el proceso de optimización. Finalmente, extendimos HA-SSVM para
conseguir un detector que se adapte de forma progresiva y sin intervención humana
al dominio de destino. Cabe destacar que ninguno de los métodos propuestos en esta
tesis requieren visitar los datos del dominio de origen. La evaluación de los resultados,
realizadas con el sistema de evaluación de Caltech, muestran que el SA-SSVM
mejora ligeramente respecto al A-SSVM y mejora en 15 puntos respecto al detector
no adaptado. El modelo jerárquico entrenado mediante el HA-SSVM todavía mejora
más los resultados de la adaptación de dominio. Finalmente, el método secuencial de
adaptación de domino ha demostrado que puede obtener resultados comparables a
la adaptación por lotes pero sin necesidad de etiquetar manualmente ningún ejemplo
del dominio de destino. La adaptación de domino aplicada a la detección de peatones
es de gran importancia y es un área que se encuentra relativamente sin explorar.
Deseamos que esta tesis pueda sentar las bases del trabajo futuro en esta área. / On-board pedestrian detection is crucial for Advanced Driver Assistance Systems
(ADAS). An accurate classi cation is fundamental for vision-based pedestrian detection.
The underlying assumption for learning classi ers is that the training set and the
deployment environment (testing) follow the same probability distribution regarding
the features used by the classi ers. However, in practice, there are di erent reasons
that can break this constancy assumption. Accordingly, reusing existing classi ers by
adapting them from the previous training environment (source domain) to the new
testing one (target domain) is an approach with increasing acceptance in the computer
vision community. In this thesis we focus on the domain adaptation of deformable
part-based models (DPMs) for pedestrian detection. As a prof of concept, we use a
computer graphic based synthetic dataset, i.e. a virtual world, as the source domain,
and adapt the virtual-world trained DPM detector to various real-world dataset.
We start by exploiting the maximum detection accuracy of the virtual-world
trained DPM. Even though, when operating in various real-world datasets, the virtualworld
trained detector still su er from accuracy degradation due to the domain gap
of virtual and real worlds. We then focus on domain adaptation of DPM. At the rst
step, we consider single source and single target domain adaptation and propose two
batch learning methods, namely A-SSVM and SA-SSVM. Later, we further consider
leveraging multiple target (sub-)domains for progressive domain adaptation and propose
a hierarchical adaptive structured SVM (HA-SSVM) for optimization. Finally,
we extend HA-SSVM for the challenging online domain adaptation problem, aiming
at making the detector to automatically adapt to the target domain online, without
any human intervention. All of the proposed methods in this thesis do not require
revisiting source domain data. The evaluations are done on the Caltech pedestrian
detection benchmark. Results show that SA-SSVM slightly outperforms A-SSVM
and avoids accuracy drops as high as 15 points when comparing with a non-adapted
detector. The hierarchical model learned by HA-SSVM further boosts the domain
adaptation performance. Finally, the online domain adaptation method has demonstrated
that it can achieve comparable accuracy to the batch learned models while not
requiring manually label target domain examples. Domain adaptation for pedestrian
detection is of paramount importance and a relatively unexplored area. We humbly
hope the work in this thesis could provide foundations for future work in this area.
Identifer | oai:union.ndltd.org:TDX_UAB/oai:www.tdx.cat:10803/290266 |
Date | 24 April 2015 |
Creators | Xu, Jiaolong |
Contributors | López Peña, Antonio M. (Antonio Manuel), Universitat Autònoma de Barcelona. Departament de Ciències de la Computació |
Publisher | Universitat Autònoma de Barcelona |
Source Sets | Universitat Autònoma de Barcelona |
Language | English |
Detected Language | Spanish |
Type | info:eu-repo/semantics/doctoralThesis, info:eu-repo/semantics/publishedVersion |
Format | 139 p., application/pdf |
Source | TDX (Tesis Doctorals en Xarxa) |
Rights | L'accés als continguts d'aquesta tesi queda condicionat a l'acceptació de les condicions d'ús establertes per la següent llicència Creative Commons: http://creativecommons.org/licenses/by-nc-nd/3.0/es/, info:eu-repo/semantics/openAccess |
Page generated in 0.0026 seconds