• Refine Query
  • Source
  • Publication year
  • to
  • Language
  • 4
  • 1
  • Tagged with
  • 5
  • 5
  • 5
  • 5
  • 5
  • 2
  • 2
  • 2
  • 2
  • 1
  • 1
  • 1
  • 1
  • 1
  • 1
  • About
  • The Global ETD Search service is a free service for researchers to find electronic theses and dissertations. This service is provided by the Networked Digital Library of Theses and Dissertations.
    Our metadata is collected from universities around the world. If you manage a university/consortium/country archive and want to be added, details can be found on the NDLTD website.
1

[en] A STUDY OF CLASSIFIERS FOR AUTOMATIC FACE RECOGNITION / [pt] ESTUDO DE CLASSIFICADORES PARA O RECONHECIMENTO AUTOMÁTICO DE FACES

04 November 2005 (has links)
[pt] Identificar um indivíduo a partir de uma imagem de face é uma tarefa simples para seres humanos e extremamente difícil para a Visão Computacional. Esta questão tem motivado diversos grupos de pesquisa em todo o mundo, especialmente a partir de 1993. Inúmeros trabalhos realizados até o momento encaram uma imagem digital de n pixels como um vetor num espaço n-dimensional, onde n é em geral muito grande. Imagens de rostos humanos possuem, contudo, grande redundância: todas contém dois olhos, um nariz, uma boca, e etc. É possível, portanto, trabalhar em uma base deste espaço em que faces possam ser adequadamente caracterizadas a partir de um conjunto de p componentes, onde p é muito menor quen. É com este enfoque que o presente trabalho estuda sistemas de reconhecimento de faces que consistem de um estágio de redução de dimensionalidade, realizado pela técnica de Análise de Componentes Principais (PCA), seguido de um modelo classificador. No estágio da PCA, as imagens de n pixels são transformadas em vetores de p características a partir de um conjunto de treinamento. Três classificadores conhecidos na literatura são estudados: os classificadores de distância (EUclideana e de Mahalanobis), a rede neural de Funções Base Radiais (RBF), e o classificador de Fisher. Este trabalho propõe, ainda, um novo classificador que introduz o conceito de Matrizes de Covariança Misturadas (MPM) no classificador gaussiano de Máxima Probabilidade. Os quatros classificadores são avaliados através da variação de seus respectivos parâmetros e utilizam como imagens o banco de faces da Olivetti. Nos experimentos realizados para comparar tais abordagens, o novo classificador proposto atingiu as maiores taxas de reconhecimento e apresentou menorsensibilidade à escolha do conjunto de faces de treinamento. / [en] Identifying an individual based on a face image is a simple task for humans to perform and a very difficult one for Vision Computing. Since 1993, several research groups in all over the world have been studied this problem. Most of the methods proposed for recognizing the identity of an individual represent a n intensity pixel image as a n- dimensional vector, when, in general, n is a very large number value. Face images are highly redundant, since every individual has two eyes, one nose, one mouth and so on. Then, instead of using n intensity values, it is generally possible to characterize an image instance by a set of p features, for p < < n. This work studies face recognition systems consisting of a PCA stage for dimensionality reduction followed by a classifier. The PCA stage takes the n-pixels face images and produces the corresponding p most expensive features, based on the whole available training set. Three classifiers proposed in the literature are studied: the Euclidean and Mahalanobis distances, the RBF neural network, and the Fisher classifier. This work also proposes a new classifier, which introduces the concept of Mixture Covariance Matrices (MPM) in the Minimum Total Probality of Misclassification rule for normal populations. The four classifiers are evaluated using the Olivetti Face Database varying their parameters in a wide range. In the experiments carried out to compare those approaches the new proposed classifier reached the best recognition rates and showed to be less sensitive to the choice of the training set.
2

[en] A ROBUST WORKFLOW FOR PERSON TRACKING AND META-DATA GENERATION IN VIDEOS / [pt] UMA METODOLOGIA ROBUSTA PARA RASTREAMENTO DE PESSOAS E GERAÇÃO DE META-DADOS EM VÍDEOS

RAFAEL ANTONIO PINTO PENA 23 June 2021 (has links)
[pt] A quantidade de vídeos gravados no mundo cresce muito, não somente devido aos interesses e hábitos humanos em relação a esse tipo de mídia, mas também pela diversidade de dispositivos utilizados para criação de vídeos. No entanto, faltam informações sobre conteúdos em vídeo porque a geração de metadados é complexa e requer muito tempo para ser executado por humanos. Do ponto de vista da tecnologia, não é fácil superar os obstáculos relacionados à grande quantidade e diversidade de frames de vídeo. O trabalho propõe um sistema automatizado de reconhecimento facial para detectar personagens em vídeos. Ele foi desenvolvido para reconhecer personagens, a fim de aumentar os metadados de vídeo. Ele combina técnicas padrão de visão computacional para melhorar a precisão, processando os dados de saída dos modelos existentes de maneira complementar. O modelo teve um desempenho satisfatório usando um conjunto de dados da vida real de uma grande empresa de mídia. / [en] The amount of recorded video in the world is increasing a lot due not only to the humans interests and habits regarding this kind of media, but also the diversity of devices used to create them. However, there is a lack of information about video content because generating video meta-data is complex. It demands too much time to be performed by humans, and from the technology perspective, it is not easy to overcome obstacles regarding the huge amount and diversity of video frames. In this work we propose an automated face recognition system to detect and recognize humans within videos. It was developed to recognize characters,in order to increase video meta-data. It combines standard computer vision techniques to improved accuracy by processing existing models output data in a complementary manner. We evaluated the performance of the system in a real data set from a large media company.
3

[pt] RECONHECIMENTO FACIAL EM VÍDEO COM UMA AMOSTRA POR PESSOA UTILIZANDO STACKED SUPERVISED AUTO-ENCODER / [en] SINGLE SAMPLE FACE RECOGNITION FROM VIDEO VIA SATCKED SUPERVISED AUTO-ENCODER

PEDRO JUAN SOTO VEGA 23 November 2016 (has links)
[pt] Esta dissertação propõe e avalia estratégias baseadas nos Stacked Supervised Auto-encoders (SSAE) para representação de imagens faciais em aplicações de vídeo vigilância. O estudo foca na identificação de faces a partir de uma amostra por pessoa na galeria (single sample per person - SSPP). Variações em termos de pose, expressão facial, iluminação e oclusão são abordadas de duas formas. Primeiro, o SSAE extrai atributos das imagens de faces que são robustos contra tais variações. Segundo, exploram-se as múltiplas amostras que podem ser coletadas nas sequências de vídeo de uma pessoa (multiple samples per person probe - MSPPP). Os métodos propostos foram avaliados e comparados usando os bancos de vídeos Honda/UCSD e VIDTIMIT. Adicionalmente, foi estudada a influência de parâmetros relacionados com a arquitetura do SSAE utilizando o banco de imagens estáticas Extended Yale B. Os resultados demonstraram que as estratégias que exploram as MSPPP em combinação com o SSAE podem superar o desempenho de outros métodos SSPP, como os Padrões Binários Locais (LBP), para reconhecimento de faces em vídeos. / [en] This work proposes and evaluates strategies based on Stacked Supervised Auto-encoders (SSAE) for face representation in video surveillance applications. The study focuses on the identification task with a single sample per person (SSPP) in the gallery. Variations in terms of pose, facial expression, illumination and occlusion are approached in two ways. First, the SSAE extracts features from face images, which are robust to such variations. Second, multiple samples per persons probes (MSPPP) that can be extracted from video sequences are exploited to improve recognition accuracy. The proposed methods were compared upon Honda/UCSD and VIDTIMIT video datasets. Additionally, the influence of the parameters related to SSAE architecture was studied using the Extended Yale B dataset. The experimental results demonstrated that strategies combining SSAE and MSPPP are able to outperform other SSPP methods, such as local binary patterns, in face recognition from video.
4

[en] THE OTHER RACE EFFECT IN FACE PERCEPTION IN JAPANESE AND NON JAPANESE CHILDREN FROM TWO AGE RANGES IN BRASIL. / [pt] EFEITO DA RAÇA NA PERCEPÇÃO DE FACES EM CRIANÇAS DE ORIGEM JAPONESAS E NÃO JAPONESAS NO BRASIL EM DUAS FAIXAS ETÁRIAS

ANA CAROLINA MONNERAT FIORAVANTI BASTOS 16 August 2018 (has links)
[pt] A presente tese de doutorado aborda a temática: Efeito da Outra Raça (EOR) na percepção de faces em crianças de origem japonesas e não japonesas. O EOR diz respeito ao melhor desempenho ao reconhecer faces da mesma raça. O trabalho é composto por dois estudos: um teórico e outro empírico. O estudo teórico teve como objetivo revisar a literatura dos últimos anos em busca de um panorama sobre modelos teóricos que buscam explicar o EOR na percepção de faces. Os resultados desse estudo apresentaram dois modelos de codificação de faces que explicam as diferenças no desempenho ao reconhecer faces de outros grupos raciais. A influência do contato com faces de raças diferentes na magnitude do efeito foi apresentada. A perspectiva da Psicologia Evolucionista foi usada como base para os modelos cognitivos estudados. O estudo empírico visou investigar o desenvolvimento do EOR em, 37 crianças de origem Japonesas e 37 crianças de origem não japonesas, que vivem na cidade do Rio de Janeiro, dividias em duas faixas etárias. As crianças Japonesas não demonstraram o EOR em relação a faces de sua raça, ao passo que crianças não japonesas o apresentaram em ambas as faixas etária. Esses achados sugerem que o EOR emerge cedo no desenvolvimento e que a experiência com faces de outra raça no contexto visual da criança é crucial para modular o sistema de processamento de faces, resultando em diferenças na precisão ao reconhecer faces do outra raça, mesmo quando a cultura desempenha um importante papel no desenvolvimento. / [en] This doctoral thesis addresses the theme: The Other Race Effect (ORE) in face perception in children of Japanese and non-Japanese origin. The ORE is related to better performance in recognizing faces of the same race. The work consists of two studies: one theoretical and one empirical. The theoretical study aimed to review the recent literature in search of an overview of theoretical models that explains the ORE in face perception. The results of this study presented two coding faces models that explain the differences in performance in recognizing faces of other racial groups. The influence of contact with faces of different races in the magnitude of the ORE was presented. The perspective of Evolutionary Psychology was used as the basis for the cognitive models studied. The empirical study aimed to investigate the development of EOR in 37 Japanese and 37 non-Japanese children, living in the city of Rio de Janeiro, divided into two age groups. Japanese children showed no EOR in recognizinhg their own race faces, while the non Japanese children presented the ORE in both age groups. These findings suggest that the EOR emerges early in development and that experience with faces of another race in the visual context of the child is crucial to modulate the face processing system, resulting in differences in accuracy in recognizing faces of another race, even when the culture plays an important role in the development.
5

[pt] DETECÇÃO DE PADRÕES EM IMAGENS BIDIMENSIONAIS: ESTUDO DE CASOS / [en] PATTERN DETECTION IN BIDIMENSIONAL IMAGENS: CASES STUDY

GUILHERME LUCIO ABELHA MOTA 10 November 2005 (has links)
[pt] A presente dissertação estudo dois problemas de detecção de padrões em imagens com fundo complexo, casos onde os algoritmos de segmentação convencionais não podem proporcionar bons resultados: a localização de Unidades Estruturais (UE`s) em imagens obtidas por Microscópio Eletrônico de Transmissão em Alta Resolução, e a detecção de faces frontais na posição vertical em imagens. Apesar de serem abordados problemas diferentes, as metodologias empregadas na solução de ambos os problemas possuem semelhanças. Uma operação de vizinhança é aplicada a imagem de entrada em busca de padrões de interesse. Sendo cada região extraída desta imagem submetida a um operador matemático composto por etapas de pré-processamento, redução de dimensionalidade e classificação. Na detecção de UE`s foram empregados três métodos distintos de redução de dimensionalidade - Análise de Componentes Principais (PCA), PCA do conjunto de treinamento equilibrado (PCAEq), e um método inédito, eixos que maximizam a distância ao centróide de uma classe (MAXDIST) - e dois modelos de classificador - classificador baseado na distância euclideana (EUC) e rede neural back-propagation (RN). A combinação PCAEq/RN forneceu taxa de detecção de 88% para 25 componentes. Já a combinação MAXDIST/EUC com apenas uma atributo forneceu 82% de detecção com menos falsas detecções. Na detecção de faces foi empregada uma nova abordagem, que utiliza uma rede neural back-propagation como classificador. Aplica-se a sua entrada recebe a representação no subespaço das faces e o erro de reconstrução. Em comparação com os resultados de referência da literatura na área, o método proposto atingiu taxas de detecção similares. / [en] This dissertation studies two pattern detection problems in images with complex background, in which standard segmentation techniques do not provide good results: the detection of structural units (SU`s) in images obtained through High resolution transmission Electron Microscopy and the detection of frontal human faces in images. The methods employed in the solution of both problems have many similarities - a neighborhood operator, basically composed of pre-processing, dimensionality reduction and classification steps, scans the input image searching for the patterns of interest. For SU detection three dimensionality reduction methods - Principal Component Analysis (PCA), PCA of the balanced training set (PACEq), and a new method, axis that maximize the distance to a given class centroid (MAXDIST) -, and two classifiers - Euclidean Distance (EUC) and back-propagation neural network (RN). The MAXDIST/EUC combination, with just one component, provided a detection rate of 82% with less false detections. For face detection a new approach was employed, using a back-propagation neural network as classifier. It takes as input a representation in the so-called face space and the reconstruction error (DFFS). In comparison with benchmark results from the literature, the proposed method reached similar detection rates.

Page generated in 0.0363 seconds