Return to search

Reconhecimento de voz atrav?s de unidades menores do que a palavra, utilizando Wavelet Packet e SVM, em uma nova estrutura hier?rquica de decis?o

Made available in DSpace on 2014-12-17T14:54:51Z (GMT). No. of bitstreams: 1
AdrianoAB.pdf: 2240966 bytes, checksum: d9e93de6b9ef6f0023ed591b4d760ff9 (MD5)
Previous issue date: 2008-12-02 / The automatic speech recognition by machine has been the target of researchers in the past five decades. In this period have been numerous advances, such as in the field of recognition of isolated words (commands), which has very high rates of recognition, currently. However, we are still far from developing a system that could have a performance similar to the human being (automatic continuous speech recognition). One of the great challenges of searches for continuous speech recognition is the large amount of pattern. The modern languages such as English, French, Spanish and Portuguese
have approximately 500,000 words or patterns to be identified. The purpose of this study is to use smaller units than the word such as phonemes, syllables and difones units as the basis for the speech recognition, aiming to recognize any words without necessarily using them. The main goal is to reduce the restriction imposed by the excessive amount of patterns. In order to validate this proposal, the system was tested in the isolated word recognition in dependent-case. The phonemes characteristics of the Brazil s Portuguese language were used to developed the hierarchy decision system. These decisions are made through the use of neural networks SVM (Support Vector Machines). The main speech features used were obtained from the Wavelet Packet Transform. The descriptors MFCC (Mel-Frequency Cepstral Coefficient) are also used in this work. It was concluded that the method proposed in this work, showed good results in the
steps of recognition of vowels, consonants (syllables) and words when compared with other existing methods in literature / O reconhecimento autom?tico da voz por m?quinas inteligentes tem sido a meta de muitos pesquisadores nas ?ltimas cinco d?cadas. Neste per?odo, in?meros avan?os foram alcan?ados, como por exemplo no campo de reconhecimento de palavras isoladas (comandos), o qual atualmente apresenta taxas de reconhecimento muito altas. No entanto, ainda se est? longe de desenvolver um sistema que possa ter um desempenho parecido com o ser humano, ou seja, reconhecimento autom?tico de voz em modo cont?nuo. Um dos grandes desafios das pesquisas de reconhecimento de voz cont?nuo ? a grande quantidade de padr?es existentes, pois as linguagens modernas tais como: Ingl?s, Franc?s,
Espanhol e Portugu?s possuem aproximadamente 500.000 palavras ou padr?es a serem identificados.
A proposta deste trabalho ? utilizar unidades menores do que a palavra tais como: fonemas, difones e s?labas como unidades base para o reconhecimento da voz, visando o
reconhecimento quaisquer palavras sem necessariamente utiliz?-las. O objetivo principal deste trabalho ? reduzir a restri??o imposta pela quantidade excessiva de padr?es
existentes, ou seja, a quantidade excessiva de palavras. Com o objetivo de validar esta proposta, o sistema foi desenvolvido e testado para o reconhecimento de palavras isoladas no modo dependente do locutor.
O sistema apresentado neste trabalho foi desenvolvido com uma l?gica de reconhecimento hier?rquica baseada nas caracter?sticas de produ??o dos fonemas da l?ngua
Portuguesa do Brasil. Estas decis?es s?o feitas atrav?s da utiliza??o de redes neurais do tipo M?quinas de Vetor de Suporte agrupadas na forma de M?quinas de C?mite.
Os principais descritores do sinal de voz utilizados, foram obtidos atrav?s da Transformada Wavelet Packet. Os descritores MFCC (Mel-Frequency Cepstral Coefficient)
tamb?m s?o utilizados neste trabalho. Pode-se concluir que o m?todo proposto apresentou bons resultados nas etapas de reconhecimento de vogais, consoantes (s?labas) e palavras se comparado com outros m?todos existentes na literatura

Identiferoai:union.ndltd.org:IBICT/oai:repositorio.ufrn.br:123456789/15124
Date02 December 2008
CreatorsBresolin, Adriano de Andrade
ContributorsCPF:10749896434, http://lattes.cnpq.br/1987295209521433, Seixas, Jos? Manoel de, CPF:36078107704, http://lattes.cnpq.br/1404632471755241, Fechine, Joseana Mac?do, CPF:71349324434, http://lattes.cnpq.br/7179691582151907, Alsina, Pablo Javier, D?ria Neto, Adri?o Duarte
PublisherUniversidade Federal do Rio Grande do Norte, Programa de P?s-Gradua??o em Engenharia El?trica, UFRN, BR, Automa??o e Sistemas; Engenharia de Computa??o; Telecomunica??es
Source SetsIBICT Brazilian ETDs
LanguagePortuguese
Detected LanguagePortuguese
Typeinfo:eu-repo/semantics/publishedVersion, info:eu-repo/semantics/doctoralThesis
Formatapplication/pdf
Sourcereponame:Repositório Institucional da UFRN, instname:Universidade Federal do Rio Grande do Norte, instacron:UFRN
Rightsinfo:eu-repo/semantics/openAccess

Page generated in 0.0019 seconds