Global ETD Search

Return to search

Estudo dimensional de características aplicadas à leitura labial automática

Coordenação de Aperfeiçoamento de Pessoal de Nível Superior - CAPES / This work is a study of the relationship between the intrinsic dimension of feature vectors
applied to the classification of video signals in order to perform lip reading. In pattern
recognition tasks, the extraction of relevant features is crucial for a good performance
of the classifiers. The starting point of this work was the reproduction of the work of
J.R. Movellan [1], which classifies lips gestures with HMM using only the video signal
from the Tulips1 database. The database consists of videos of volunteers’ mouths while
they utter the first 4 numerals in English. The original work uses feature vectors of high
dimensionality in relation to the size of the database. Consequently, the adjustment of
HMM classifiers has become problematic and the maximum accuracy was only 66.67%.
Alternative strategies for feature extraction and classification schemes were proposed in
order to analyze the influence of the intrinsic dimension in the performance of classifiers.
The best solution, in terms of results, achieved an accuracy of approximately 83%. / Este trabalho é um estudo da relação entre a dimensão intrínseca de vetores de características
aplicados à classificação de sinais de vídeo no intuito de realizar-se a leitura
labial. Nas tarefas de reconhecimento de padrões, a extração de características relevantes
é crucial para um bom desempenho dos classificadores. O ponto de partida deste trabalho
foi a reprodução do trabalho de J.R. Movellan [1], que realiza a classificação de gestos
labiais com HMM na base de dados Tulips1, utilizando somente o sinal de vídeo. A base é
composta por vídeos das bocas de voluntários enquanto esses pronunciam os primeiros 4
numerais em inglês. O trabalho original utiliza vetores de características de dimensão muito
alta em relação ao tamanho da base. Consequentemente, o ajuste de classificadores HMM
se tornou problemático e só se alcançou 66,67% de acurácia. Estratégias de extração de
características e esquemas de classificação alternativos foram propostos, a fim de analisar
a influência da dimensão intrínseca no desempenho de classificadores. A melhor solução,
em termos de resultados, obteve uma acurácia de aproximadamente 83%. / São Cristóvão, SE

Engenharia elétrica

Surdos

Comunicação oral

Sistemas de reconhecimento de padrões

Dimensão intrínseca

Extração de características

Leitura labial

Hidden Markov Model (HMM)

Intrinsic dimension

Feature extraction

Lip-reading

ENGENHARIAS::ENGENHARIA ELETRICA

Identifer	oai:union.ndltd.org:IBICT/oai:ri.ufs.br:riufs/9567
Date	31 August 2018
Creators	Madureira, Fillipe Levi Guedes
Contributors	Montalvão Filho, Jugurta Rosa
Publisher	Pós-Graduação em Engenharia Elétrica, UFS
Source Sets	IBICT Brazilian ETDs
Language	Portuguese
Detected Language	Portuguese
Type	info:eu-repo/semantics/publishedVersion, info:eu-repo/semantics/masterThesis
Source	reponame:Repositório Institucional da UFS, instname:Universidade Federal de Sergipe, instacron:UFS
Rights	info:eu-repo/semantics/openAccess

Page generated in 0.0021 seconds

Estudo dimensional de características aplicadas à leitura labial automática

Description

Links & Downloads

Tags

Additional Fields