Programa de Pós-Graduação em Ciência da Computação. Departamento de Ciência da Computação, Instituto de Ciências Exatas e Biológicas, Universidade Federal de Ouro Preto. / Submitted by Oliveira Flávia (flavia@sisbin.ufop.br) on 2015-10-20T16:44:07Z
No. of bitstreams: 2
license_rdf: 21174 bytes, checksum: b98541e59f955f816d2d78f2222e44c8 (MD5)
DISSERTAÇÃO_DesenvolvimentoAbordagemReconhecimento.pdf: 9631210 bytes, checksum: b858c7551bb89d16b01138519d6a070d (MD5) / Approved for entry into archive by Gracilene Carvalho (gracilene@sisbin.ufop.br) on 2015-10-26T13:01:04Z (GMT) No. of bitstreams: 2
license_rdf: 21174 bytes, checksum: b98541e59f955f816d2d78f2222e44c8 (MD5)
DISSERTAÇÃO_DesenvolvimentoAbordagemReconhecimento.pdf: 9631210 bytes, checksum: b858c7551bb89d16b01138519d6a070d (MD5) / Made available in DSpace on 2015-10-26T13:01:04Z (GMT). No. of bitstreams: 2
license_rdf: 21174 bytes, checksum: b98541e59f955f816d2d78f2222e44c8 (MD5)
DISSERTAÇÃO_DesenvolvimentoAbordagemReconhecimento.pdf: 9631210 bytes, checksum: b858c7551bb89d16b01138519d6a070d (MD5)
Previous issue date: 2015 / Durante os últimos anos, têm sido desenvolvidas diversas abordagens para o reconhecimento de gestos manuais, tanto estáticos como dinâmicos. Todas com o objetivo de melhorar a interação homem-computador. Muitas dessas abordagens, inicialmente baseados nas informações de intensidade, não fornecem dados suficientes para uma boa caracterização. Devido ao avanço da tecnologia, novos dispositivos estão surgindo como é o caso do sensor Kinect o qual, além da informação de intensidade, provê as informações de profundidade e posições das articulações do corpo. Dessa maneira, obtém-se uma maior vantagem no desenvolvimento de um modelo para reconhecimento de gestos, pois ajuda reduzindo alguns processos complexos como é o caso da segmentação e localização da mão. Contudo as novas informações de profundidade e posição podem também ser usadas para a geração de novas características e melhorar as taxas de reconhecimento. Nesta dissertação apresentamos dois modelos para o reconhecimento de gestos, tanto estáticos como dinâmicos, usando as informações de intensidade e profundidade (RGBD), além da informação das posições das principais articulações do corpo. No modelo para reconhecer gestos estáticos, usou-se a informação de profundidade, propondo um método baseado na representação da mão em uma nuvem de pontos. Logo, usando a teoria de cossenos de direção, gerou-se um vetor de Histogramas de Magnitudes Acumuladas, o qual representa as novas características locais da mão. Finalmente, usando o classificador SVM (Support Vector Machine), geraram-se resultados superiores a outros modelos da literatura, sendo o melhor resultado de 99.21% de acurácia media. No modelo para reconhecer gestos dinâmicos, usou-se a informação das posições da mão para gerar a trajetória do gesto e propor um algoritmo de extração de quadros principais, evitando assim o uso reiterado de técnicas invariáveis ao tempo como os Hidden Markov Models (HMM) ou Dinamyc Time Warping (DTW). Depois, geraram-se três vetores: o vetor de informação espacial VSI , o vetor de informação temporal VTI e o vetor de mudanças da posição da mão VHC, os quais representam as características globais do gesto. Também, o descritor local SIFT foi usado nas imagens de intensidade e profundidade para obter características das mãos. A partir dessas características, foram gerados atributos de nível médio usando a técnica Bag-of-Words (BoW), gerando o vetor de características locais. Esse modelo foi testado usando o classificador SVM (Support Vector Machine) usando três bases de dados diferentes, gerando resultados superiores a outros modelos da literatura em cada caso (100%, 88.38% e 98.28%). _______________________________________________________________________________________ / ABSTRACT: During the last years, different approaches have been developed for hand gestures recognition, both static and dynamic. All with the goal of improving the human-computer interaction. Many of these approaches, initially based on the intensity information, do not provide sufficient data for a good characterization. Due to advancement in technology, new devices are emerging such as the Kinect sensor which, in addition to intensity information, provides information and depth positions of the joints of the body. Thus, we obtain a greater advantage in developing a model for gesture recognition, it helps reduce some complex processes such as the segmentation and hand location. However the new depth and position information can also be used for new features generation and improved recognition rates. In this thesis we present two models for gesture recognition, both static and dynamic, using the intensity and depth of information (RGB-D), and the positions information of the main joints of the body. In the model to recognize static gestures, was used the depth information, proposing a method based on hand representation in a point cloud. Thus, using the theory of direction cosines, was generated a Accumulated Magnitude Histogram vector, which represents the new hand local characteristics. Finally, using the SVM classifier (Support Vector Machine ), the results are superior results to other models in the literature, the average accuracy best result was 99.21%. In the model for recognizing dynamic gestures, was used information from the hand positions to generate the trajectory of gesture and propose a key frames extraction algorithm, avoiding the repeated use of invariable techniques to time as the Hidden Markov Models (HMM) or Dinamyc Time Warping (DTW). Then, three vectors were generated: the spatial information vectorVSI , the temporal information vector VTI and the vector of hand position changes VHC , which represent global gesture features. Also, the local descriptor SIfT was used in the intensity and depth images for the hands characteristics. As from these characteristics, were generated mid-level attributes using the technique Bag-of-Words (BoW), generating the local characteristics vector. This model was tested using the SVM classifier (Support Vector Machine) using three different databases, generating superior results to other published models in each case (100%, 88.38% and 98.28%).
Identifer | oai:union.ndltd.org:IBICT/oai:localhost:123456789/5687 |
Date | January 2015 |
Creators | Escobedo Cárdenas, Edwin Jonathan |
Contributors | Cámara Chávez, Guillermo |
Source Sets | IBICT Brazilian ETDs |
Language | Portuguese |
Detected Language | Portuguese |
Type | info:eu-repo/semantics/publishedVersion, info:eu-repo/semantics/masterThesis |
Source | reponame:Repositório Institucional da UFOP, instname:Universidade Federal de Ouro Preto, instacron:UFOP |
Rights | Autorização concedida ao Repositório Institucional da UFOP pelo autor, 13/10/2015, com as seguintes condições: disponível sob Licença Creative Commons 4.0, que permite copiar, distribuir e transmitir o trabalho, desde que seja citado o autor e licenciante., info:eu-repo/semantics/openAccess |
Page generated in 0.0022 seconds