Combinação de múltiplos classificadores para reconhecimento de face humana

Made available in DSpace on 2016-06-02T19:05:35Z (GMT). No. of bitstreams: 1
2559.pdf: 3778790 bytes, checksum: 6c638e612ae760d51fad8def01969ed1 (MD5)
Previous issue date: 2009-07-24 / Universidade Federal de Sao Carlos / Lately, the human face object has been exploited by the advent of systems involving biometrics, especially for applications in security. One of the most challenging applications is the problem of human face recognition, which consists of determining the correspondence between an input face and an individual from a database of known persons. The process of face recognition consists of two steps: feature extraction and classification. In the literature of face recognition, different techniques have been used, and they can be divided into holistic techniques (implicit feature extraction), feature-based techniques (explicit feature extraction) and hybrid techniques (involving the two previous). In many articles, holistic techniques have proved to be most efficient and generally they involve methods of statistical pattern recognition as Principal Component Analysis (PCA), Independent Component Analysis (ICA), Linear Discriminant Analysis (LDA), Support Vector Machines (SVM), and Neural Networks. For problems such as human face recognition in digital images, a crucial point is the ability to generalize. The solution for this problem is complex due to the high dimensionality of data and the small number of samples per person. Using a single classifier would reduce the ability of recognition, since it is difficult to design a single classifier in these conditions that capture all variability that span the human faces spaces. Thus, this work proposes to investigate the combination of multiple classifiers applied to the problem of face recognition, defining a new scheme to resolve this problem, varying the feature extraction with PCA and some its variants and LDA, K-Nearest Neighbor (K-NN) and Maximum Likelihood (MaxLike) classifiers and several trainable or not trainable methods for combining classifiers. Still, to mitigate the problem of small sample size (SSS), a technique for regularizing the covariance matrix was used. Finally, to assess the classification performance, Holdout and Resubstitution methods were used to partition the data set and the Kappa coefficient and Z and T statistics were used to measure the performance of the proposed scheme. From the experiments it was concluded that the best sub-schemes were the RBPCA/MaxLike-PCA/NN-KL5/NN classifiers combined by the Majorite Vote Rule for the ORL database and the RLDA+RPCA/MaxLike-KL4/NNKL5/ NN classifiers combined by the Sum Rule for the AR database, obtaining Kappa coefficients of 0.956 (mean) and 0.839, respectively. Besides that, it has been determined that these sub-schemes are robust to pose (ORL database), illumination and small change of the facial expression, but they were affected by occlusions (AR database). / Nas últimas décadas, o objeto face humana tem sido muito explorado graças ao advento dos sistemas envolvendo biometria, especialmente para aplicações nas áreas de segurança. Uma das aplicações mais desafiadoras é o problema de reconhecimento de face humana, que consiste em determinar a qual indivíduo em um banco de dados de pessoas conhecidas uma imagem de face corresponde. O processo de reconhecimento de face consiste basicamente em duas etapas: extração de atributos e classificação. Na literatura de reconhecimento de faces, diversas técnicas foram utilizadas, podendo ser divididas em técnicas holísticas (extração de atributos implícita), técnicas baseadas em características (extração de atributos explícita) e técnicas híbridas (envolvem as duas anteriores). Em maior número na literatura, as técnicas holísticas demonstraram ser mais eficientes e envolvem em geral, métodos de reconhecimento de padrões estatísticos como Principal Component Analysis (PCA), Independent Component Analysis (ICA), Linear Discriminant Analysis (LDA), Support Vector Machines (SVM), além de Redes Neurais. Para problemas como o reconhecimento de face humana em imagens digitais, um ponto determinante é a capacidade de generalização. Por esse problema ser complexo de ser resolvido, devido à alta dimensionalidade dos dados e ao número pequeno de amostras por pessoa, utilizar um único classificador tornaria reduzida a capacidade de reconhecimento, já que é difícil projetar um único classificador nestas condições que capture todas as variações que formam o espaço de faces humanas. Dessa forma, este trabalho se propôs à investigação de combinação de múltiplos classificadores aplicados ao problema do reconhecimento de face, obtendo um novo esquema para solução do mesmo, variando a extração de atributos com PCA e algumas variantes e LDA, classificadores K Vizinhos Mais Próximos e Máxima Verossimilhança e diversos combinadores treináveis ou não. Ainda, para amenizar o problema de poucas amostras, uma técnica de regularização de matrizes de covariância foi utilizada. Finalmente, para avaliação de desempenho utilizou-se Holdout e Resubstitution para particionar o conjunto de dados, assim como o coeficiente Kappa e testes de significância Z e T foram utilizados para medir o desempenho do esquema proposto. Dos experimentos concluiu-se que os melhores subesquemas foram o RBPCA/MaxVer-PCA/NN-KL5/NN → Votação por Maioria para o banco de dados ORL e o RLDA+RPCA/MaxVer-KL4/NN-KL5/NN → Soma para o banco de dados AR com coeficientes Kappa 0,956 (médio) e 0,839, respectivamente. Além disso, foi determinado que estes subesquemas são robustos à pose (ORL), iluminação e à pequenas variações de expressão facial, mas sofreram influência de oclusões (AR).

Identiferoai:union.ndltd.org:IBICT/oai:repositorio.ufscar.br:ufscar/402
Date24 July 2009
CreatorsSalvadeo, Denis Henrique Pinheiro
ContributorsMascarenhas, Nelson Delfino d'Ávila
PublisherUniversidade Federal de São Carlos, Programa de Pós-graduação em Ciência da Computação, UFSCar, BR
Source SetsIBICT Brazilian ETDs
LanguagePortuguese
Detected LanguagePortuguese
Typeinfo:eu-repo/semantics/publishedVersion, info:eu-repo/semantics/masterThesis
Formatapplication/pdf
Sourcereponame:Repositório Institucional da UFSCAR, instname:Universidade Federal de São Carlos, instacron:UFSCAR
Rightsinfo:eu-repo/semantics/openAccess

Page generated in 0.0026 seconds