[pt] Esta dissertação propõe e avalia estratégias baseadas nos Stacked Supervised Auto-encoders (SSAE) para representação de imagens faciais em aplicações de vídeo vigilância. O estudo foca na identificação de faces a partir de uma amostra por pessoa na galeria (single sample per person - SSPP). Variações em termos de pose, expressão facial, iluminação e oclusão são abordadas de duas formas. Primeiro, o SSAE extrai atributos das imagens de faces que são robustos contra tais variações. Segundo, exploram-se as múltiplas amostras que podem ser coletadas nas sequências de vídeo de uma pessoa (multiple samples per person probe - MSPPP). Os métodos propostos foram avaliados e comparados usando os bancos de vídeos Honda/UCSD e VIDTIMIT. Adicionalmente, foi estudada a influência de parâmetros relacionados com a arquitetura do SSAE utilizando o banco de imagens estáticas Extended Yale B. Os resultados demonstraram que as estratégias que exploram as MSPPP em combinação com o SSAE podem superar o desempenho de outros métodos SSPP, como os Padrões Binários Locais (LBP), para reconhecimento de faces em vídeos. / [en] This work proposes and evaluates strategies based on Stacked Supervised Auto-encoders (SSAE) for face representation in video surveillance applications. The study focuses on the identification task with a single sample per person (SSPP) in the gallery. Variations in terms of pose, facial expression, illumination and occlusion are approached in two ways. First, the SSAE extracts features from face images, which are robust to such variations. Second, multiple samples per persons probes (MSPPP) that can be extracted from video sequences are exploited to improve recognition accuracy. The proposed methods were compared upon Honda/UCSD and VIDTIMIT video datasets. Additionally, the influence of the parameters related to SSAE architecture was studied using the Extended Yale B dataset. The experimental results demonstrated that strategies combining SSAE and MSPPP are able to outperform other SSPP methods, such as local binary patterns, in face recognition from video.
Identifer | oai:union.ndltd.org:puc-rio.br/oai:MAXWELL.puc-rio.br:28102 |
Date | 23 November 2016 |
Creators | PEDRO JUAN SOTO VEGA |
Contributors | RAUL QUEIROZ FEITOSA |
Publisher | MAXWELL |
Source Sets | PUC Rio |
Language | Portuguese |
Detected Language | Portuguese |
Type | TEXTO |
Page generated in 0.0015 seconds