Spelling suggestions: "subject:"histograma dde gradiente"" "subject:"histograma dee gradiente""
1 |
Reconhecimento de sinais da libras utilizando descritores de forma e redes neurais artificiaisBastos, Igor Leonardo Oliveira 15 May 2015 (has links)
Submitted by Mayara Nascimento (mayara.nascimento@ufba.br) on 2016-05-31T14:15:01Z
No. of bitstreams: 1
Igor Bastos - Dissertação VFinal.pdf: 3703212 bytes, checksum: a00013910865dacb8025d56659076abb (MD5) / Approved for entry into archive by Alda Lima da Silva (sivalda@ufba.br) on 2016-06-03T23:17:29Z (GMT) No. of bitstreams: 1
Igor Bastos - Dissertação VFinal.pdf: 3703212 bytes, checksum: a00013910865dacb8025d56659076abb (MD5) / Made available in DSpace on 2016-06-03T23:17:29Z (GMT). No. of bitstreams: 1
Igor Bastos - Dissertação VFinal.pdf: 3703212 bytes, checksum: a00013910865dacb8025d56659076abb (MD5) / Gestos são ações corporais não-verbais voltadas para a expressão de algum significado. Estes
incluem movimentos de mãos, face, braços, dedos, entre outros, sendo abordados por trabalhos
que visam reconhecê-los para promover interações humanas com sistemas computacionais.
Devido à grande aplicabilidade do reconhecimento de gestos, tem-se notado que estes trabalhos
estão se tornando mais comuns, utilizando técnicas e metodologias mais elaboradas e capazes de
prover resultados cada vez melhores. A opção por quais técnicas aplicar para o reconhecimento
de gestos varia de acordo com a estratégia empregada em cada trabalho e quais aspectos são
utilizados para este reconhecimento. Tem-se, por exemplo, trabalhos baseados no uso de
modelos estatísticos. Outros optam pela aquisição de características geométricas de mãos
e partes do corpo, enquanto outros, dentre os quais se enquadra o presente trabalho, optam
pelo uso de descritores e classificadores, responsáveis por extrair características das imagens
relevantes para o seu reconhecimento e; por realizar a classificação efetiva dos gestos baseado
nestas informações. Neste âmbito, o presente trabalho visa elaborar, aplicar e apresentar uma
abordagem para o reconhecimento de gestos, embasando-se em uma revisão da literatura a
respeito das principais técnicas e metodologias empregadas para este fim e escolhendo como
campo prático, a Língua Brasileira de Sinais (Libras). Para a extração de informações das
imagens, optou-se pelo uso de um vetor de características resultante da aplicação dos descritores
Histograma de Gradientes Orientados (HOG) e Momentos Invariantes de Zernike (MIZ), os
quais voltam-se para as formas e contornos presentes nas imagens. Para o reconhecimento, foi
utilizado o classificador Perceptron Multicamada, sendo este disposto em uma arquitetura onde
o processo de classificação é dividido em 2 estágios. Devido à inexistência de datasets públicos
da Libras, fez-se necessária, com o auxílio de especialistas da língua e alunos surdos, a criação
de um dataset de 9600 imagens, as quais referem-se a 40 sinais da Libras. Isso fez com que
a presente abordagem partisse desta criação do dataset até a etapa final de classificação dos
sinais. Por fim, testes foram realizados e obteve-se 96,77% de taxa de acerto, evidenciando um
alto índice de acerto. Este resultado foi validado considerando possíveis ameaças à abordagem,
como a realização de testes considerando um indivíduo não-presente no conjunto de treinamento
do classificador e a aplicação da abordagem em um dataset público de gestos.
|
2 |
Descritor de movimento baseado em tensor e histograma de gradientesPerez, Eder de Almeida 24 August 2012 (has links)
Submitted by Renata Lopes (renatasil82@gmail.com) on 2017-03-06T15:14:46Z
No. of bitstreams: 1
ederdealmeidaperez.pdf: 749381 bytes, checksum: 7338f694cc850057100e730b520d74eb (MD5) / Approved for entry into archive by Adriana Oliveira (adriana.oliveira@ufjf.edu.br) on 2017-03-06T20:25:35Z (GMT) No. of bitstreams: 1
ederdealmeidaperez.pdf: 749381 bytes, checksum: 7338f694cc850057100e730b520d74eb (MD5) / Made available in DSpace on 2017-03-06T20:25:35Z (GMT). No. of bitstreams: 1
ederdealmeidaperez.pdf: 749381 bytes, checksum: 7338f694cc850057100e730b520d74eb (MD5)
Previous issue date: 2012-08-24 / CAPES - Coordenação de Aperfeiçoamento de Pessoal de Nível Superior / O reconhecimento de padrões de movimentos tem se tornado um campo de pesquisa muito
atrativo nos últimos anos devido, entre outros fatores, à grande massificação de dados em
vídeos e a tendência na criação de interfaces homem-máquina que utilizam expressões
faciais e corporais. Esse campo pode ser considerado um dos requisitos chave para análise
e entendimento de vídeos.
Neste trabalho é proposto um descritor de movimentos baseado em tensores de 2a
ordem e histogramas de gradientes (HOG - Histogram of Oriented Gradients). O cálculo
do descritor é rápido, simples e eficaz. Além disso, nenhum aprendizado prévio é necessário
sendo que a adição de novas classes de movimentos ou novos vídeos não necessita de
mudanças ou que se recalculem os descritores já existentes. Cada quadro do vídeo é
particionado e em cada partição calcula-se o histograma de gradientes no espaço e no
tempo. A partir daí calcula-se o tensor do quadro e o descritor final é formado por uma
série de tensores de cada quadro.
O descritor criado é avaliado classificando-se as bases de vídeos KTH e Hollywood2,
utilizadas na literatura atual, com um classificador Máquina Vetor Suporte (SVM). Os
resultados obtidos na base KTH são próximos aos descritores do estado da arte que utilizam
informação local do vídeo. Os resultados obtidos na base Hollywood2 não superam
o estado da arte, mas são próximos o suficiente para concluirmos que o método proposto
é eficaz. Apesar de a literatura apresentar descritores que possuem resultados superiores
na classificação, suas abordagens são complexas e de alto custo computacional. / The motion pattern recognition has become a very attractive research field in recent years
due to the large amount of video data and the creation of human-machine interfaces that
use facial and body expressions. This field can be considered one of the key requirements
for analysis and understanding in video.
This thesis proposes a motion descriptor based on second order tensor and histograms
of oriented gradients. The calculation of the descriptor is fast, simple and effective.
Furthermore, no prior knowledge of data basis is required and the addition of new classes
of motion and videos do not need to recalculate the existing descriptors. The frame of a
video is divided into a grid and the histogram of oriented gradients is computed in each
cell. After that, the frame tensor is computed and the final descriptor is built by a series
of frame tensors.
The descriptor is evaluated in both KTH and Hollywood2 data basis, used in the
current literature, with a Support Vector Machine classifier (SVM). The results obtained
on the basis KTH are very close to the descriptors of the state-of-the-art that use local
information of the video. The results obtained on the basis Hollywood2 not outweigh the
state-of-the-art but are close enough to conclude that the proposed method is effective.
Although the literature presents descriptors that have superior results, their approaches
are complex and with computational cost.
|
Page generated in 0.1013 seconds