Return to search

Detecção de desvios vocais utilizando modelos auto regressivos e o algoritmo KNN

Submitted by Automação e Estatística (sst@bczm.ufrn.br) on 2018-05-02T22:45:42Z
No. of bitstreams: 1
WinnieDeLimaTorres_DISSERT.pdf: 1538022 bytes, checksum: ad6fc16589291a27b8b718b755afdf44 (MD5) / Approved for entry into archive by Arlan Eloi Leite Silva (eloihistoriador@yahoo.com.br) on 2018-05-07T21:40:35Z (GMT) No. of bitstreams: 1
WinnieDeLimaTorres_DISSERT.pdf: 1538022 bytes, checksum: ad6fc16589291a27b8b718b755afdf44 (MD5) / Made available in DSpace on 2018-05-07T21:40:35Z (GMT). No. of bitstreams: 1
WinnieDeLimaTorres_DISSERT.pdf: 1538022 bytes, checksum: ad6fc16589291a27b8b718b755afdf44 (MD5)
Previous issue date: 2018-01-30 / Alguns campos da ciência propõem-se a estudar distúrbios no trato vocal a partir de
análises sobre padrões de vibração da voz. Em geral, a importância dessas pesquisas está
na identificação, em uma fase mais específica, de doenças de maior ou menor gravidade,
a serem sanadas com terapia vocal ou que requerem maior atenção, gerando inclusive a
necessidade de procedimentos cirúrgicos para o seu controle. Embora, já exista na literatura
indicações de que o processamento digital de sinais permite diagnosticar, de um
modo não invasivo, patologias laríngeas, como doenças vocais que ocasionem edema, nódulo
e paralisia, não existe definição do método mais indicado e das características, ou
parâmetros, mais adequados para detectar a presença de desvios vocais. Sendo assim,
neste trabalho é proposto um algoritmo para detecção de desvios vocais por meio da análise
de sinais de voz. Para a realização deste trabalho, utilizou-se dados constantes no
banco de dados Disordered Voice Database, desenvolvido pelo Massachusetts Eye and
Ear Infirmary (MEEI), devido sua utilização em pesquisas na área acústica de voz. Foram
utilizados 166 sinais contidos nessa base de dados, com sinais de vozes saudáveis e
de vozes patológicas afetadas por edema, por nódulo e por paralisia nas pregas vocais. A
partir dos sinais de voz, foram gerados modelos Auto Regressivos (AR e ARMA) para
representação desses sinais e, utilizando os parâmetros dos modelos obtidos, foi utilizado
o algoritmo K-Nearest Neighbors (KNN) para a classificação dos sinais analisados. Com
o intuito de analisar a eficiência do algoritmo proposto neste estudo, os resultados obtidos
desse algoritmo foram comparados com um método de detecção considerando apenas
distância euclidiana entre os sinais. Os resultados encontrados apontam que o método
proposto neste trabalho apresenta um bom resultado, gerando uma taxa de acerto na classificação
acima de 71% (maior que os 31% a partir do uso da distância euclidiana). Além
disso, o método utilizado é de fácil implementação, podendo ser utilizado em hardwares
mais simples. Logo, essa pesquisa tem potencial para gerar um classificador barato
e acessível para a utilização em larga escala por profissionais de saúde, como uma alternativa
de pré análise não invasiva para detecção de patologias otorrinolaringológicas que
afetem a voz. / Some fields in Science propose to study vocal tract disorders from an analysis about
voice vibration patterns. Generally, the weight of those researches is given by the identification
– in a more specific level – of diseases in different stages of severity, which would
be redressed through voice therapy or means that require more attention, hence generating
the need of surgical procedures for its control. Although there are evidences in literature
that the Digital Signal Processing allows a non-invasive diagnosis of laryngeal pathologies,
such as vocal cord disorders, which provoke swelling, nodules, and paralyses, there
is no definition of any most indicated method, and characteristics or appropriated parameters
to detect voice deviations. Thus, the present paper proposes an algorithm to detect
vocal deviances through the Voice Signal Analysis. In order to complete this study, it
had been used data from the Disordered Voice Database, developed by the Massachusetts
Eye and Ear Infirmary (MEEI) due to their wide use in researches regarding the voice and
speech. A total of 166 signals from this database were used, including healthy voices and
pathologic voices affected by swelling, nodule, and vocal fold paralysis. From the voice
signals, autoregressive processes of order (AR and ARMA) were generated for a representation
of those signals, and – by using the models’ parameters obtained – it had been
used the KNN algorithm for a classification of the signals analyzed. Seeking an analysis
of the efficiency of the algorithm proposed in this study, the results obtained from this
algorithm were compared to a detection method, which only considers the Euclidian distance
between the signals. The results found point that the propositioned method in this
work presents a satisfactory result, generating a hit rate on the classification above 71%
(more than the 31% from the use of the Euclidian distance). Moreover, the method used is
easy to implement, so that it can be used along with simpler hardware. Consequently, this
research has the potential to generate a cheap and accessible sorter for wide-scale use by
health care professionals as a non-invasive pre-analysis to detect otorhinolaryngological
pathologies that affect the voice.

Identiferoai:union.ndltd.org:IBICT/oai:repositorio.ufrn.br:123456789/25105
Date30 January 2018
CreatorsTorres, Winnie de Lima
Contributors10829741453, Costa Júnior, Ademar Gonçalves da, 02314337433, Martins, Allan de Medeiros, Araújo, Aldayr Dantas de
PublisherPROGRAMA DE PÓS-GRADUAÇÃO EM ENGENHARIA ELÉTRICA E DE COMPUTAÇÃO, UFRN, Brasil
Source SetsIBICT Brazilian ETDs
LanguagePortuguese
Detected LanguagePortuguese
Typeinfo:eu-repo/semantics/publishedVersion, info:eu-repo/semantics/masterThesis
Sourcereponame:Repositório Institucional da UFRN, instname:Universidade Federal do Rio Grande do Norte, instacron:UFRN
Rightsinfo:eu-repo/semantics/openAccess

Page generated in 0.0022 seconds