Return to search

Reconhecimento das configurações de mão da língua brasileira de sinais - LIBRAS em imagens de profundidade através da análise de componentes principais e do classificador k-vizinhos mais próximos

Submitted by Divisão de Documentação/BC Biblioteca Central (ddbc@ufam.edu.br) on 2016-06-07T20:26:42Z
No. of bitstreams: 1
Dissertação - Robson Silva de Souza.pdf: 3200975 bytes, checksum: 8b96480a153b189d6471670ee9257ef8 (MD5) / Approved for entry into archive by Divisão de Documentação/BC Biblioteca Central (ddbc@ufam.edu.br) on 2016-06-07T20:30:33Z (GMT) No. of bitstreams: 1
Dissertação - Robson Silva de Souza.pdf: 3200975 bytes, checksum: 8b96480a153b189d6471670ee9257ef8 (MD5) / Approved for entry into archive by Divisão de Documentação/BC Biblioteca Central (ddbc@ufam.edu.br) on 2016-06-07T20:34:52Z (GMT) No. of bitstreams: 1
Dissertação - Robson Silva de Souza.pdf: 3200975 bytes, checksum: 8b96480a153b189d6471670ee9257ef8 (MD5) / Made available in DSpace on 2016-06-07T20:34:52Z (GMT). No. of bitstreams: 1
Dissertação - Robson Silva de Souza.pdf: 3200975 bytes, checksum: 8b96480a153b189d6471670ee9257ef8 (MD5)
Previous issue date: 2015-09-11 / Não informada / According to Brazilian Institute of Geography and Statistic IBGE – Instituto Brasileiro de Geografia e Estatística (Censo 2010), Brazil has 9.7 million Brazilians with some degree of hearing impairment or deafness, more than five per cent of the population. For the majority of those persons the main natural communication method is the Brazilian Sign Language (LIBRAS – Língua Brasileira de Sinais), instead of the spoken Portuguese. The computer-aided recognition of signs aims to expand the social and digital inclusion of the deaf community by means of those signs translation into audio or text format.
This work presents one of the global LIBRAS parameters recognition, the hand gestures, using k-nearest neighbor’s classifier and 2D²PCA dimensionality reduction technique. A robust and representative data set of daily conditions, with 12.200 depth images from 61 hand gesture, captured by Kinect® sensor, was built. Initially the images were segmented in a preprocessing step, which isolated the region of the right hand from the rest of the body. Seeking to eliminate the data set redundancy, the images were submitted to a dimensionality reduction by (2D) dimensional 2PCA technique determining the most representative forms of data from original pixels linear combination. The classifier k-nearest neighbors was the technique in the final stage in the hand gesture automatic recognition. This classifier could correctly categorize 96.31% of test samples (k = 1 and 10x10 feature matrix). Six hand gesture sets were correctly classified obtaining 100% successful rates / De acordo com o IBGE (Censo 2010), o Brasil possui 9,7 milhões de brasileiros com algum grau de deficiência auditiva, mais de cinco por cento da população. Para a maior parte destas pessoas a língua natural principal utilizada para sua comunicação é a LIBRAS (Língua Brasileira de Sinais) e não o português. O reconhecimento de sinais visa permitir uma maior inserção sócio digital da comunidade surda através da interpretação da língua de sinais pelo computador em formato de áudio ou texto. Esta dissertação apresenta o reconhecimento de um dos parâmetros globais da LIBRAS, as configurações de mão, utilizando o classificador k-vizinhos mais próximos e a técnica de redução de dimensionalidade 2D²PCA. Um conjunto de dados, robusto e representativo das condições do cotidiano, constituído de 12.200 imagens de profundidade das 61 configurações de mão, capturadas pelo sensor Kinect® foi construído. Todas as imagens foram submetidas inicialmente a uma etapa de segmentação que buscou isolar a região da mão direita do resto do corpo. Buscando a eliminação de redundância no conjunto de dados foi implementado uma etapa de extração de características, através da técnica 2D2PCA que determina as formas mais representativas de dados a partir de combinações lineares dos pixels originais. O classificador “k-vizinhos mais próximos” foi a técnica utilizada para a etapa final de reconhecimento automático das configurações de mão. O referido classificador, implementado com k=1 e matriz de característica de 10x10, conseguiu o melhor desempenho, classificando corretamente 96,31% das amostras de testes. Foram obtidas taxas de acerto de 100% para seis configurações de mão.

Identiferoai:union.ndltd.org:IBICT/oai:http://localhost:tede/5012
Date11 September 2015
CreatorsSouza, Robson Silva de
ContributorsCosta, Marly Guimarães Fernandes, Costa Filho, Cícero Ferreira Fernandes
PublisherUniversidade Federal do Amazonas, Programa de Pós-graduação em Engenharia Elétrica, UFAM, Brasil, Faculdade de Tecnologia
Source SetsIBICT Brazilian ETDs
LanguagePortuguese
Detected LanguagePortuguese
Typeinfo:eu-repo/semantics/publishedVersion, info:eu-repo/semantics/masterThesis
Formatapplication/pdf
Sourcereponame:Biblioteca Digital de Teses e Dissertações da UFAM, instname:Universidade Federal do Amazonas, instacron:UFAM
Rightsinfo:eu-repo/semantics/openAccess
Relation-161377036298529205, 600, 600, -5930111888266832212

Page generated in 0.0021 seconds