Spelling suggestions: "subject:"[een] FACE RECOGNITIONS"" "subject:"[enn] FACE RECOGNITIONS""
1 |
[en] A STUDY OF CLASSIFIERS FOR AUTOMATIC FACE RECOGNITION / [pt] ESTUDO DE CLASSIFICADORES PARA O RECONHECIMENTO AUTOMÁTICO DE FACES04 November 2005 (has links)
[pt] Identificar um indivíduo a partir de uma imagem de face é
uma tarefa simples para seres humanos e extremamente
difícil para a Visão Computacional. Esta questão tem
motivado diversos grupos de pesquisa em todo o mundo,
especialmente a partir de 1993. Inúmeros trabalhos
realizados até o momento encaram uma imagem digital de n
pixels como um vetor num espaço n-dimensional, onde n é em
geral muito grande. Imagens de rostos humanos possuem,
contudo, grande redundância: todas contém dois olhos, um
nariz, uma boca, e etc. É possível, portanto, trabalhar em
uma base deste espaço em que faces possam ser
adequadamente caracterizadas a partir de um conjunto de p
componentes, onde p é muito menor quen. É com este enfoque
que o presente trabalho estuda sistemas de reconhecimento
de faces que consistem de um estágio de redução de
dimensionalidade, realizado pela técnica de Análise de
Componentes Principais (PCA), seguido de um modelo
classificador. No estágio da PCA, as imagens de n pixels
são transformadas em vetores de p características a partir
de um conjunto de treinamento. Três classificadores
conhecidos na literatura são estudados: os classificadores
de distância (EUclideana e de Mahalanobis), a rede neural
de Funções Base Radiais (RBF), e o classificador de
Fisher. Este trabalho propõe, ainda, um novo classificador
que introduz o conceito de Matrizes de Covariança
Misturadas (MPM) no classificador gaussiano de Máxima
Probabilidade. Os quatros classificadores são avaliados
através da variação de seus respectivos parâmetros e
utilizam como imagens o banco de faces da Olivetti. Nos
experimentos realizados para comparar tais abordagens, o
novo classificador proposto atingiu as maiores taxas de
reconhecimento e apresentou menorsensibilidade à escolha
do conjunto de faces de treinamento. / [en] Identifying an individual based on a face image is a
simple task for humans to perform and a very difficult one
for Vision Computing. Since 1993, several research groups
in all over the world have been studied this problem. Most
of the methods proposed for recognizing the identity of an
individual represent a n intensity pixel image as a n-
dimensional vector, when, in general, n is a very large
number value. Face images are highly redundant, since
every individual has two eyes, one nose, one mouth and so
on. Then, instead of using n intensity values, it is
generally possible to characterize an image instance by a
set of p features, for p < < n. This work studies face
recognition systems consisting of a PCA stage for
dimensionality reduction followed by a classifier. The PCA
stage takes the n-pixels face images and produces the
corresponding p most expensive features, based on the
whole available training set. Three classifiers proposed
in the literature are studied: the Euclidean and
Mahalanobis distances, the RBF neural network, and the
Fisher classifier. This work also proposes a new
classifier, which introduces the concept of Mixture
Covariance Matrices (MPM) in the Minimum Total Probality
of Misclassification rule for normal populations. The four
classifiers are evaluated using the Olivetti Face Database
varying their parameters in a wide range. In the
experiments carried out to compare those approaches the
new proposed classifier reached the best recognition rates
and showed to be less sensitive to the choice of the
training set.
|
2 |
[en] A ROBUST WORKFLOW FOR PERSON TRACKING AND META-DATA GENERATION IN VIDEOS / [pt] UMA METODOLOGIA ROBUSTA PARA RASTREAMENTO DE PESSOAS E GERAÇÃO DE META-DADOS EM VÍDEOSRAFAEL ANTONIO PINTO PENA 23 June 2021 (has links)
[pt] A quantidade de vídeos gravados no mundo cresce muito, não somente devido aos interesses e hábitos humanos em relação a esse tipo de mídia, mas também pela diversidade de dispositivos utilizados para criação de vídeos. No entanto, faltam informações sobre conteúdos em vídeo porque a geração de
metadados é complexa e requer muito tempo para ser executado por humanos. Do ponto de vista da tecnologia, não é fácil superar os obstáculos relacionados à grande quantidade e diversidade de frames de vídeo. O trabalho propõe um sistema automatizado de reconhecimento facial para detectar personagens em vídeos. Ele foi desenvolvido para reconhecer personagens, a fim de aumentar os metadados de vídeo. Ele combina técnicas padrão de visão computacional para melhorar a precisão, processando os dados de saída dos modelos existentes de maneira complementar. O modelo teve um desempenho satisfatório usando um
conjunto de dados da vida real de uma grande empresa de mídia. / [en] The amount of recorded video in the world is increasing a lot due not only to the humans interests and habits regarding this kind of media, but also the diversity of devices used to create them. However, there is a lack of information about video content because generating video meta-data is complex. It demands too much time to be performed by humans, and from the technology perspective, it is not easy to overcome obstacles regarding the huge amount and diversity of video frames. In this work we propose an automated face recognition system to detect and recognize humans within videos. It was developed to recognize characters,in order to increase video meta-data. It combines standard computer vision techniques to improved accuracy by processing existing models output data in a complementary manner. We evaluated the performance of the system in a real data set from a large media company.
|
3 |
[pt] RECONHECIMENTO FACIAL EM VÍDEO COM UMA AMOSTRA POR PESSOA UTILIZANDO STACKED SUPERVISED AUTO-ENCODER / [en] SINGLE SAMPLE FACE RECOGNITION FROM VIDEO VIA SATCKED SUPERVISED AUTO-ENCODERPEDRO JUAN SOTO VEGA 23 November 2016 (has links)
[pt] Esta dissertação propõe e avalia estratégias baseadas nos Stacked Supervised Auto-encoders (SSAE) para representação de imagens faciais em aplicações de vídeo vigilância. O estudo foca na identificação de faces a partir de uma amostra por pessoa na galeria (single sample per person - SSPP). Variações em termos de pose, expressão facial, iluminação e oclusão são abordadas de duas formas. Primeiro, o SSAE extrai atributos das imagens de faces que são robustos contra tais variações. Segundo, exploram-se as múltiplas amostras que podem ser coletadas nas sequências de vídeo de uma pessoa (multiple samples per person probe - MSPPP). Os métodos propostos foram avaliados e comparados usando os bancos de vídeos Honda/UCSD e VIDTIMIT. Adicionalmente, foi estudada a influência de parâmetros relacionados com a arquitetura do SSAE utilizando o banco de imagens estáticas Extended Yale B. Os resultados demonstraram que as estratégias que exploram as MSPPP em combinação com o SSAE podem superar o desempenho de outros métodos SSPP, como os Padrões Binários Locais (LBP), para reconhecimento de faces em vídeos. / [en] This work proposes and evaluates strategies based on Stacked Supervised Auto-encoders (SSAE) for face representation in video surveillance applications. The study focuses on the identification task with a single sample per person (SSPP) in the gallery. Variations in terms of pose, facial expression, illumination and occlusion are approached in two ways. First, the SSAE extracts features from face images, which are robust to such variations. Second, multiple samples per persons probes (MSPPP) that can be extracted from video sequences are exploited to improve recognition accuracy. The proposed methods were compared upon Honda/UCSD and VIDTIMIT video datasets. Additionally, the influence of the parameters related to SSAE architecture was studied using the Extended Yale B dataset. The experimental results demonstrated that strategies combining SSAE and MSPPP are able to outperform other SSPP methods, such as local binary patterns, in face recognition from video.
|
4 |
[en] THE OTHER RACE EFFECT IN FACE PERCEPTION IN JAPANESE AND NON JAPANESE CHILDREN FROM TWO AGE RANGES IN BRASIL. / [pt] EFEITO DA RAÇA NA PERCEPÇÃO DE FACES EM CRIANÇAS DE ORIGEM JAPONESAS E NÃO JAPONESAS NO BRASIL EM DUAS FAIXAS ETÁRIASANA CAROLINA MONNERAT FIORAVANTI BASTOS 16 August 2018 (has links)
[pt] A presente tese de doutorado aborda a temática: Efeito da Outra Raça (EOR) na percepção de faces em crianças de origem japonesas e não japonesas. O EOR diz respeito ao melhor desempenho ao reconhecer faces da mesma raça. O trabalho é composto por dois estudos: um teórico e outro empírico. O estudo
teórico teve como objetivo revisar a literatura dos últimos anos em busca de um panorama sobre modelos teóricos que buscam explicar o EOR na percepção de faces. Os resultados desse estudo apresentaram dois modelos de codificação de faces que explicam as diferenças no desempenho ao reconhecer faces de outros
grupos raciais. A influência do contato com faces de raças diferentes na magnitude do efeito foi apresentada. A perspectiva da Psicologia Evolucionista foi usada como base para os modelos cognitivos estudados. O estudo empírico visou investigar o desenvolvimento do EOR em, 37 crianças de origem Japonesas e 37 crianças de origem não japonesas, que vivem na cidade do Rio de Janeiro, dividias em duas faixas etárias. As crianças Japonesas não demonstraram o EOR em relação a faces de sua raça, ao passo que crianças não japonesas o apresentaram em ambas as faixas etária. Esses achados sugerem que o EOR
emerge cedo no desenvolvimento e que a experiência com faces de outra raça no contexto visual da criança é crucial para modular o sistema de processamento de faces, resultando em diferenças na precisão ao reconhecer faces do outra raça, mesmo quando a cultura desempenha um importante papel no desenvolvimento. / [en] This doctoral thesis addresses the theme: The Other Race Effect (ORE) in face perception in children of Japanese and non-Japanese origin. The ORE is related to better performance in recognizing faces of the same race. The work consists of two studies: one theoretical and one empirical. The theoretical study
aimed to review the recent literature in search of an overview of theoretical models that explains the ORE in face perception. The results of this study presented two coding faces models that explain the differences in performance in recognizing faces of other racial groups. The influence of contact with faces of different races in the magnitude of the ORE was presented. The perspective of Evolutionary Psychology was used as the basis for the cognitive models studied. The empirical study aimed to investigate the development of EOR in 37 Japanese and 37 non-Japanese children, living in the city of Rio de Janeiro, divided into two age groups. Japanese children showed no EOR in recognizinhg their own race faces, while the non Japanese children presented the ORE in both age groups. These findings suggest that the EOR emerges early in development and that experience with faces of another race in the visual context of the child is crucial to
modulate the face processing system, resulting in differences in accuracy in recognizing faces of another race, even when the culture plays an important role in the development.
|
5 |
[pt] DETECÇÃO DE PADRÕES EM IMAGENS BIDIMENSIONAIS: ESTUDO DE CASOS / [en] PATTERN DETECTION IN BIDIMENSIONAL IMAGENS: CASES STUDYGUILHERME LUCIO ABELHA MOTA 10 November 2005 (has links)
[pt] A presente dissertação estudo dois problemas de detecção
de padrões em imagens com fundo complexo, casos onde os
algoritmos de segmentação convencionais não podem
proporcionar bons resultados: a localização de Unidades
Estruturais (UE`s) em imagens obtidas por Microscópio
Eletrônico de Transmissão em Alta Resolução, e a detecção
de faces frontais na posição vertical em imagens. Apesar
de serem abordados problemas diferentes, as metodologias
empregadas na solução de ambos os problemas possuem
semelhanças. Uma operação de vizinhança é aplicada a
imagem de entrada em busca de padrões de interesse. Sendo
cada região extraída desta imagem submetida a um operador
matemático composto por etapas de pré-processamento,
redução de dimensionalidade e classificação.
Na detecção de UE`s foram empregados três métodos
distintos de redução de dimensionalidade - Análise de
Componentes Principais (PCA), PCA do conjunto de
treinamento equilibrado (PCAEq), e um método inédito,
eixos que maximizam a distância ao centróide de uma classe
(MAXDIST) - e dois modelos de classificador -
classificador baseado na distância euclideana (EUC) e rede
neural back-propagation (RN). A combinação PCAEq/RN
forneceu taxa de detecção de 88% para 25 componentes. Já a
combinação MAXDIST/EUC com apenas uma atributo forneceu
82% de detecção com menos falsas detecções. Na detecção de
faces foi empregada uma nova abordagem, que utiliza uma
rede neural back-propagation como classificador. Aplica-se
a sua entrada recebe a representação no subespaço das
faces e o erro de reconstrução. Em comparação com os
resultados de referência da literatura na área, o método
proposto atingiu taxas de detecção similares. / [en] This dissertation studies two pattern detection problems
in images with complex background, in which standard
segmentation techniques do not provide good results: the
detection of structural units (SU`s) in images obtained
through High resolution transmission Electron Microscopy
and the detection of frontal human faces in images.
The methods employed in the solution of both
problems have many similarities - a neighborhood operator,
basically composed of pre-processing, dimensionality
reduction and classification steps, scans the input image
searching for the patterns of interest.
For SU detection three dimensionality reduction
methods - Principal Component Analysis (PCA), PCA of the
balanced training set (PACEq), and a new method, axis that
maximize the distance to a given class centroid
(MAXDIST) -, and two classifiers - Euclidean Distance
(EUC) and back-propagation neural network (RN). The
MAXDIST/EUC combination, with just one component, provided
a detection rate of 82% with less false detections.
For face detection a new approach was employed,
using a back-propagation neural network as classifier. It
takes as input a representation in the so-called face
space and the reconstruction error (DFFS). In comparison
with benchmark results from the literature, the proposed
method reached similar detection rates.
|
Page generated in 0.0363 seconds