Spelling suggestions: "subject:"aminais dde voz"" "subject:"aminais dee voz""
11 |
Classificação de sinais de voz utilizando a transformada Wavelet Packet e redes neurais artificiaisCrovato, César David Paredes January 2004 (has links)
Este trabalho apresenta um sistema de classificação de voz disfônica utilizando a Transformada Wavelet Packet (WPT) e o algoritmo Best Basis (BBA) como redutor de dimensionalidade e seis Redes Neurais Artificiais (ANN) atuando como um conjunto de sistemas denominados “especialistas”. O banco de vozes utilizado está separado em seis grupos de acordo com as similaridades patológicas (onde o 6o grupo é o dos pacientes com voz normal). O conjunto de seis ANN foi treinado, com cada rede especializando-se em um determinado grupo. A base de decomposição utilizada na WPT foi a Symlet 5 e a função custo utilizada na Best Basis Tree (BBT) gerada com o BBA, foi a entropia de Shannon. Cada ANN é alimentada pelos valores de entropia dos nós da BBT. O sistema apresentou uma taxa de sucesso de 87,5%, 95,31%, 87,5%, 100%, 96,87% e 89,06% para os grupos 1 ao 6 respectivamente, utilizando o método de Validação Cruzada Múltipla (MCV). O poder de generalização foi medido utilizando o método de MCV com a variação Leave-One-Out (LOO), obtendo erros em média de 38.52%, apontando a necessidade de aumentar o banco de vozes disponível.
|
12 |
An?lise Ac?stica de Desvios Vocais Infantis utilizando a Transformada WaveletSantos, Mikaelle Oliveira 24 November 2016 (has links)
Submitted by Thiago Oliveira (thiago.oliveira@ifpb.edu.br) on 2016-11-24T19:13:07Z
No. of bitstreams: 1
Mikaelle Oliveira Santos - An?lise Ac?stica de Desvios Vocais Infantis utilizando a Transformada Wavelet.pdf: 675138 bytes, checksum: e0ca5f454819efa373454dd7dc2bc511 (MD5) / Approved for entry into archive by Thiago Oliveira (thiago.oliveira@ifpb.edu.br) on 2016-11-24T19:15:03Z (GMT) No. of bitstreams: 1
Mikaelle Oliveira Santos - An?lise Ac?stica de Desvios Vocais Infantis utilizando a Transformada Wavelet.pdf: 675138 bytes, checksum: e0ca5f454819efa373454dd7dc2bc511 (MD5) / Made available in DSpace on 2016-11-24T19:15:03Z (GMT). No. of bitstreams: 1
Mikaelle Oliveira Santos - An?lise Ac?stica de Desvios Vocais Infantis utilizando a Transformada Wavelet.pdf: 675138 bytes, checksum: e0ca5f454819efa373454dd7dc2bc511 (MD5)
Previous issue date: 2016-11-24 / Dist?rbios da voz podem atingir diferentes faixas et?rias, afetando a qualidade vocal,prejudicando a comunica??o por meio da voz. T?cnicas de processamento digital de sinais de vozpodem ser empregadas para auxiliar outros m?todos de avalia??o de dist?rbios da voz, tais como an?liseotorrinolaringol?gica e an?lise perceptivo-auditiva. Crian?as com dist?rbios de voz podem apresentarefeitos negativos no seu desenvolvimento social, educacional e f?sico. A investiga??o e o diagn?sticoprecoce do desvio vocal infantil permite maior efic?cia no tratamento. Entretanto, a avalia??o de desordensvocais em crian?as apresenta alguns desafios relacionados ?s dificuldades de coopera??o das mesmasdurante os exames tradicionais. Nesta pesquisa, as medidas de energia e entropia dos coeficientes dedetalhe da transformada wavelet s?o empregadas na avalia??o da qualidade vocal em crian?as. Doisestudos de caso s?o abordados nesta pesquisa: 1) An?lise ac?stica do grau da intensidade do desviovocal; e 2) An?lise ac?stica da qualidade vocal predominante (rugosidade e soprosidade). As medidas deenergia e entropia dos coeficientes de detalhe da transformada wavelet s?o utilizadas de maneira individuale combinada a fim de se obter uma maior efic?cia na classifica??o dos sinais. Para o primeiro estudode caso, utilizando-se de um vetor h?brido de medidas combinadas, foram obtidas acur?cias acima de95% e, para o segundo, utilizando-se tamb?m do vetor de medidas combinadas, as medidas de acur?ciaforam superiores a 90%. Os sinais das vozes desviadas apresentaram eleva??o em suas frequ?ncias dosformantes, comparados ?s vozes sem desvio. Os resultados obtidos nesta pesquisa indicam que o usodas medidas de energia e entropia dos coeficientes de detalhe da transformada wavelet mostra-se comouma t?cnica promissora, que pode ser considerada para ser empregada como uma ferramenta para an?liseac?stica da qualidade vocal em crian?as.
|
13 |
An?lise Ac?stica de Desvios Vocais Infantis utilizando a Transformada WaveletSantos, Mikaelle Oliveira 06 December 2016 (has links)
Submitted by Alex Sandro R?go (alex@ifpb.edu.br) on 2016-12-06T12:22:35Z
No. of bitstreams: 1
10- Mikaelle Oliveira Santos - An?lise Ac?stica de Desvios Vocais Infantis utilizando a Transformada Wavelet_f.pdf: 2034795 bytes, checksum: 8f9412d47b44fb50df0277e9049e8a5e (MD5) / Approved for entry into archive by Alex Sandro R?go (alex@ifpb.edu.br) on 2016-12-06T12:23:23Z (GMT) No. of bitstreams: 1
10- Mikaelle Oliveira Santos - An?lise Ac?stica de Desvios Vocais Infantis utilizando a Transformada Wavelet_f.pdf: 2034795 bytes, checksum: 8f9412d47b44fb50df0277e9049e8a5e (MD5) / Made available in DSpace on 2016-12-06T12:23:23Z (GMT). No. of bitstreams: 1
10- Mikaelle Oliveira Santos - An?lise Ac?stica de Desvios Vocais Infantis utilizando a Transformada Wavelet_f.pdf: 2034795 bytes, checksum: 8f9412d47b44fb50df0277e9049e8a5e (MD5)
Previous issue date: 2016-12-06 / Dist?rbios da voz podem atingir diferentes faixas et?rias, afetando a qualidade vocal, prejudicando a comunica??o por meio da voz. T?cnicas de processamento digital de sinais de voz podem ser empregadas para auxiliar outros m?todos de avalia??o de dist?rbios da voz, tais como an?lise otorrinolaringol?gica e an?lise perceptivo-auditiva. Crian?as com dist?rbios de voz podem apresentar
efeitos negativos no seu desenvolvimento social, educacional e f?sico. A investiga??o e o diagn?stico precoce do desvio vocal infantil permite maior efic?cia no tratamento. Entretanto, a avalia??o de desordens vocais em crian?as apresenta alguns desafios relacionados ?s dificuldades de coopera??o das mesmas durante os exames tradicionais. Nesta pesquisa, as medidas de energia e entropia dos coeficientes de detalhe da transformada wavelet s?o empregadas na avalia??o da qualidade vocal em crian?as. Dois estudos de caso s?o abordados nesta pesquisa: 1) An?lise ac?stica do grau da intensidade do desvio vocal; e 2) An?lise ac?stica da qualidade vocal predominante (rugosidade e soprosidade). As medidas de energia e entropia dos coeficientes de detalhe da transformada wavelet s?o utilizadas de maneira individual e combinada a fim de se obter uma maior efic?cia na classifica??o dos sinais. Para o primeiro estudo de caso, utilizando-se de um vetor h?brido de medidas combinadas, foram obtidas acur?cias acima de 95% e, para o segundo, utilizando-se tamb?m do vetor de medidas combinadas, as medidas de acur?cia foram superiores a 90%. Os sinais das vozes desviadas apresentaram eleva??o em suas frequ?ncias dos formantes, comparados ?s vozes sem desvio. Os resultados obtidos nesta pesquisa indicam que o uso das medidas de energia e entropia dos coeficientes de detalhe da transformada wavelet mostra-se como uma t?cnica promissora, que pode ser considerada para ser empregada como uma ferramenta para an?lise ac?stica da qualidade vocal em crian?as.
|
14 |
AVALIA??O DE DESORDENS VOCAIS POR MEIO DE CARACTER?STICAS DO ESPA?O DE FASE RECONSTRU?DOPINHO, PABLO HENRIQUE URSULINO DE 02 1900 (has links)
Submitted by Thiago Oliveira (thiago.oliveira@ifpb.edu.br) on 2017-03-23T17:46:20Z
No. of bitstreams: 1
30- Pablo Henrique Ursulino de Pinho - AVALIA??O DE DESORDENS VOCAIS POR MEIO DE CARACTER?STICAS DO ESPA?O DE FASE RECONSTRU?DO.pdf: 4933195 bytes, checksum: c175f30de500600fd832b0b50b1f7308 (MD5) / Approved for entry into archive by Thiago Oliveira (thiago.oliveira@ifpb.edu.br) on 2017-03-23T17:48:09Z (GMT) No. of bitstreams: 1
30- Pablo Henrique Ursulino de Pinho - AVALIA??O DE DESORDENS VOCAIS POR MEIO DE CARACTER?STICAS DO ESPA?O DE FASE RECONSTRU?DO.pdf: 4933195 bytes, checksum: c175f30de500600fd832b0b50b1f7308 (MD5) / Made available in DSpace on 2017-03-23T17:48:09Z (GMT). No. of bitstreams: 1
30- Pablo Henrique Ursulino de Pinho - AVALIA??O DE DESORDENS VOCAIS POR MEIO DE CARACTER?STICAS DO ESPA?O DE FASE RECONSTRU?DO.pdf: 4933195 bytes, checksum: c175f30de500600fd832b0b50b1f7308 (MD5)
Previous issue date: 2017-02 / Neste trabalho, s?o empregadas t?cnicas de processamento digital de sinais baseadas na an?lise din?mica n?o linear para analisar altera??es vocais causadas por patologias lar?ngeas e desvios vocais. S?o utilizadas informa??es das imagens do espa?o de fase reconstru?do dos sinais de voz, pois o comportamento do tra?ado do espa?o de fase representa a din?mica do sistema vocal. Pretende-se investigar a desordem vocal provocada pela presen?a de patologia e/ou desvios vocais, a partir das modifica??es no espa?o de fase dos sinais analisados. S?o utilizados quatro m?todos de extra??o de caracter?sticas para obter medidas das imagens do espa?o de fase que mostram o comportamento da din?mica vocal do sistema: o m?todo da contagem de caixas, o m?todo da diferen?a, o m?todo da similaridade e o m?todo da contagem de caixas ponderadas. Com o aux?lio de um classificador MLP (Multilayer Perceptron ? Perceptron Multicamadas) ? realizada a classifica??o com as medidas extra?das individualmente e de forma combinada. Os m?todos que obtiveram melhor desempenho foram o da contagem de caixas ponderadas e da similaridade tanto com medidas individuais como tamb?m combinadas que, no segundo caso, obteve-se acur?cia de 99% na classifica??o de vozes patol?gicas. Os resultados obtidos com o m?todo da similaridade foram satisfat?rios na classifica??o, principalmente na distin??o entre patologias (edema e paralisia nas pregas vocais) e vozes saud?veis, com acur?cia de 99%. Na classifica??o dos desvios vocais, o melhor resultado foi encontrado para a distin??o entre vozes soprosas e saud?veis com taxa de acur?cia de 88% utilizando o m?todo da similaridade, sendo que, em alguns casos, a classifica??o dos desvios vocais com os m?todos empregados n?o foi t?o efetiva. Os m?todos empregados se mostram promissores e podem ser vi?veis na implementa??o de um sistema de avalia??o da qualidade vocal, na detec??o de altera??es vocais provocadas pela presen?a ou n?o de patologias lar?ngeas.
|
15 |
CLASSIFICA??O DE DESVIOS VOCAIS UTILIZANDO CARACTER?STICAS BASEADAS NO MODELO LINEAR DE PRODU??O DA FALACOURAS, MARIA DE F?TIMA KALLYNNA BEZERRA 02 1900 (has links)
Submitted by Thiago Oliveira (thiago.oliveira@ifpb.edu.br) on 2017-03-23T17:51:30Z
No. of bitstreams: 1
31- Maria de F?tima de Kallynna Bezerra Couras - CLASSIFICA??O DE DESVIOS VOCAIS UTILIZANDO CARACTER?STICAS BASEADAS NO MODELO LINEAR DE PRODU??O DA FALA.pdf: 4019202 bytes, checksum: 06d0b1b292ae0bd918d5b8358ca11b0f (MD5) / Approved for entry into archive by Thiago Oliveira (thiago.oliveira@ifpb.edu.br) on 2017-03-23T17:53:11Z (GMT) No. of bitstreams: 1
31- Maria de F?tima de Kallynna Bezerra Couras - CLASSIFICA??O DE DESVIOS VOCAIS UTILIZANDO CARACTER?STICAS BASEADAS NO MODELO LINEAR DE PRODU??O DA FALA.pdf: 4019202 bytes, checksum: 06d0b1b292ae0bd918d5b8358ca11b0f (MD5) / Made available in DSpace on 2017-03-23T17:53:11Z (GMT). No. of bitstreams: 1
31- Maria de F?tima de Kallynna Bezerra Couras - CLASSIFICA??O DE DESVIOS VOCAIS UTILIZANDO CARACTER?STICAS BASEADAS NO MODELO LINEAR DE PRODU??O DA FALA.pdf: 4019202 bytes, checksum: 06d0b1b292ae0bd918d5b8358ca11b0f (MD5)
Previous issue date: 2017-02 / A avalia??o perceptivo-auditiva tem papel fundamental na avalia??o da qualidade vocal. No entanto, por ser uma avalia??o subjetiva, est? sujeita a imprecis?es e varia??es, sendo necess?ria a utiliza??o de t?cnicas que tragam maior confiabilidade aos resultados. A an?lise ac?stica surge como uma ferramenta que proporciona a avalia??o da qualidade vocal de forma objetiva. Neste trabalho, s?o empregadas t?cnicas de processamento digital de sinais, baseadas no modelo linear de produ??o da fala, para analisar a qualidade vocal. ? avaliado o desempenho de medidas tradicionalmente empregadas na an?lise ac?stica, tais como frequ?ncia fundamental, medidas de perturba??o (jitter e shimmer), GNE (Glottal to Noise Excitation Ratio) e frequ?ncias form?nticas. Tambem ? avaliado o potencial discriminativo dos coeficientes da an?lise de predi??o linear (Linear Predictive Coding- LPC), coeficientes cepstrais e mel-cepstrais na classifica??o de desvios vocais (rugosidade, soprosidade e tens?o). Com o aux?lio de um classificador, baseado em redes neurais artificiais MLP
(Multilayer Perceptron), ? realizada a classifica??o dos sinais utilizando as medidas extra?das individualmente e de forma combinada. Foram obtidas taxas de classifica??o de 86% na discrimina??o entre vozes soprosas e vozes saud?veis.
|
16 |
Modelagem de sinais de voz via PPM, aplicada ao reconhecimento de padrões vocais patológicos. / Modeling of voice signals via PPM, applied to the recognition of pathological vocal patterns.BARBOSA, Hildegard Paulino. 03 August 2018 (has links)
Submitted by Johnny Rodrigues (johnnyrodrigues@ufcg.edu.br) on 2018-08-03T19:45:39Z
No. of bitstreams: 1
HIDELGARD PAULINO BARBOSA - DISSERTAÇÃO PPGCC 2013..pdf: 11966764 bytes, checksum: 077a69b5088eea2f7109e71871f4e57d (MD5) / Made available in DSpace on 2018-08-03T19:45:39Z (GMT). No. of bitstreams: 1
HIDELGARD PAULINO BARBOSA - DISSERTAÇÃO PPGCC 2013..pdf: 11966764 bytes, checksum: 077a69b5088eea2f7109e71871f4e57d (MD5)
Previous issue date: 2013-08 / A voz é o meio de comunicação mais utilizado pelo ser humano. Porém, o sistema fonador humano é suscetível a diversos tipos de patologias que podem prejudicar a produção da voz e, consequentemente, a comunicação. Alguns tipos de exames têm sido utilizados para detectar estas patologias. Porém, eles apresentam desvantagens referentes à acurácia e ao conforto do paciente durante a aplicação, que podem desestimular a busca por tratamento. Por essa razão, técnicas computacionais têm sido
empregadas com o intuito de detectar de modo confortável e preciso a presença e o tipo de patologia apresentada pelo sistema fonador. No entanto, os resultados obtidos ainda não possibilitam sua aplicação nas clínicas, principalmente pelo fato de ainda ser considerado um número reduzido de patologias. Visando a contornar esse problema, esta pesquisa propõe uma abordagem fundamentada em um método ainda não utilizado neste
contexto: a Predição por Casamento Parcial (Prediction by Partial Matching - PPM), concebida originalmente com fins à compressão de dados. O modelo criado e mantido a partir deste método é alimentado com características acústicas, temporais e estatísticas extraídas dos sinais de voz e permite sua classificação no que se refere à identificação da
presença e do tipo de patologia a um baixo custo computacional (velocidade e recursos de armazenamento). Foram obtidos resultados satisfatórios no tocante à presença de patologias. Quanto à discriminação de patologias, os resultados sugerem um potencial do método, embora a sua aplicação ainda necessite de investigações mais aprofundadas / Voice is the most widely used means of communication of mankind. However, speech organs are susceptible to several sort of pathologies, which may harm voice production and, therefore, communication. Several techniques have been used to detect these pathologies. However, they present drawbacks related to accuracy and comfort of patients during the application, which may discourage search for treatment. Thence, computational techniques have been used in order to detect the presence and type of speech pathology comfortably and accurately. But, results are still not good enough for its application in clinics, due to the fact it is considered a small number of distinct pathologies. Aiming to solve this problem, this research proposes using a method not previously employed in classification of vocal tract diseases: Prediction by Partial Matching (PPM), originally conceived for data compression purposes. The PPM model is fed with acoustical, temporal, and statistical features, ali of them extracted from voice signals. This method allowed a satisfactory classification, concerning presence and type of pathology while requiring a low computational cost (speed and storage resources). It were obtained satisfactory results regarding presence of speech pathologies. With regard to pathologies discrimination, the results suggest that this is a highly promising technique, although its application still needs deeper investigations.
|
17 |
Redução adaptativa de eco e de ruído para terminais viva-voz. / Speech enhancement and acoustic echo cancellation for hands-free sets.Carezia, André Horácio Camargo 09 August 2002 (has links)
Há um grande interesse hoje em desenvolver terminais viva-voz que permitam aos participantes de uma conversa à distância contarem com um bom grau de naturalidade e inteligibilidade. O objetivo deste trabalho é apresentar solução para dois impedimentos que surgem quando se deseja projetar um terminal viva-voz para ser utilizado em automóveis: o eco acústico resultante do acoplamento entre microfone e alto-falante do terminal; e o ruído ambiente produzido por exemplo pelo vento, pneus e motor do veículo. A solução proposta envolve o uso de filtros adaptativos e alterações no espectro do sinal de voz para minimizar os problemas mencionados. Os aspectos teóricos são abordados de forma breve, sem deixar no entanto que nenhum detalhe importante fique de fora. Uma implementação prática e eficiente em processador digital de sinais é um dos destaques do trabalho. / There is currently great motivation in developing hands-free devices which offer users, engaged in a telephone conversation, a good level of naturalness and intelligibility. In this work, the goal is to present a solution for two well-known problems that occur when designing a hands-free device for use in automobile environments: (1) the acoustic echo coupling between microphone and speaker, and (2) the background noise generated for example by wind, tires and vehicle engine. The proposed solution includes adaptive filtering techniques and modifications in the speech signal spectrum, in order to minimize the two problems above. Theoretical issues are briefly analyzed, however the author believes no relevant detail is kept out. Highlighted in the report is a practical and efficient implementation of the algorithms in a modern digital signal processor.
|
18 |
Implementação de um sistema de alteração no retorno auditivo de vozBortoletto, Antonio Carlos January 2014 (has links)
Orientador: Prof. Dr. Celso Setsuo Kurashima / Dissertação (mestrado) - Universidade Federal do ABC, Programa de Pós-Graduação em Engenharia da Informação, 2014. / Alteração no Retorno Auditivo é um tipo de terapia fonoaudiológica destinada
a pessoas que sofrem de gagueira enquanto distúrbio de fala. Neste sistema faz-se
a pessoa ouvir sua própria voz no momento em que está falando, criando
artificialmente uma fala em coro. A utilização deste tipo de terapia é investigada há
mais de 50 anos, e tem demonstrado resultados de melhora na fluência da fala em
grande parcela de pessoas que sofrem de gagueira. Diversos outros estudos
relatam a diferença do uso de Alteração no Retorno Auditivo em ambiente
laboratorial em relação às situações de vida diária. Estas diferenças ocorrem devido
às condições laboratoriais de dispositivos de Retorno Auditivo serem livres de ruídos
do ambiente, enquanto que em condições de vida diária a pessoa que gagueja está
sujeita a todo tipo de ruído de um ambiente real. Este trabalho de pesquisa avaliou
uma implementação de sistema de Alteração de Retorno Auditivo, e investigou o
efeito da melhoria de voz com ruído para esses sistemas. O sistema foi simulado
computacionalmente e implementado em plataforma DSP de ponto fixo. Verificou-se
que o filtro de ruído aplicado ao sistema resultou em melhora perceptual da
qualidade de voz. Verificou-se também que o sistema é viável para execução em
tempo real na plataforma DSP de ponto fixo utilizada na pesquisa. Este trabalho traz
as seguintes contribuições: a confirmação da viabilidade de implementação de
sistema de Alteração no Retorno Auditivo numa plataforma DSP de ponto fixo; e
resultados da avaliação da melhora perceptual da qualidade de voz na presença de
ruído ambiente para esses sistemas. / Altered Auditory Feedback is a speech therapy aimed to people who suffer
from stuttering. The person who stutters hears his own voice when he is talking. This
artificially creates a chorus speech effect. This type of therapy has been investigated
for over 50 years, and the results have demonstrated improved speech fluency in a
large portion of people who suffer from stuttering. However, several other studies on
the usage of Altered Auditory Feedback devices have reported differences of results
between quiet laboratory environments and daily life conditions. These differences
occur mainly because the laboratory test conditions for Altered Auditory Feedback
devices are free of ambient noise, while in conditions of daily life the stutterer is
subject to all kinds of noise in a real environment. This research evaluated an
implementation of Altered Auditory Feedback system, and investigated the effect of
enhancement on noisy speech for these systems. The system was computationally
simulated and also was implemented in fixed-point DSP platform. It is noticeable that
the noise filter applied to the system resulted in perceptual speech enhancement
quality. It is also noticeable that the system is viable for real-time execution in the
fixed-point DSP platform used in the research. This work presents the following
contributions: confirmation of the viability of implementing Altered Auditory Feedback
system in a fixed-point DSP platform; and analysis results of the perceptual quality of
enhanced speech in the presence of environmental noise for these systems.
|
19 |
Redução adaptativa de eco e de ruído para terminais viva-voz. / Speech enhancement and acoustic echo cancellation for hands-free sets.André Horácio Camargo Carezia 09 August 2002 (has links)
Há um grande interesse hoje em desenvolver terminais viva-voz que permitam aos participantes de uma conversa à distância contarem com um bom grau de naturalidade e inteligibilidade. O objetivo deste trabalho é apresentar solução para dois impedimentos que surgem quando se deseja projetar um terminal viva-voz para ser utilizado em automóveis: o eco acústico resultante do acoplamento entre microfone e alto-falante do terminal; e o ruído ambiente produzido por exemplo pelo vento, pneus e motor do veículo. A solução proposta envolve o uso de filtros adaptativos e alterações no espectro do sinal de voz para minimizar os problemas mencionados. Os aspectos teóricos são abordados de forma breve, sem deixar no entanto que nenhum detalhe importante fique de fora. Uma implementação prática e eficiente em processador digital de sinais é um dos destaques do trabalho. / There is currently great motivation in developing hands-free devices which offer users, engaged in a telephone conversation, a good level of naturalness and intelligibility. In this work, the goal is to present a solution for two well-known problems that occur when designing a hands-free device for use in automobile environments: (1) the acoustic echo coupling between microphone and speaker, and (2) the background noise generated for example by wind, tires and vehicle engine. The proposed solution includes adaptive filtering techniques and modifications in the speech signal spectrum, in order to minimize the two problems above. Theoretical issues are briefly analyzed, however the author believes no relevant detail is kept out. Highlighted in the report is a practical and efficient implementation of the algorithms in a modern digital signal processor.
|
20 |
Análise dinâmica não linear de sinais de voz para detecção de patologias laríngeas. / Dynamic nonlinear analysis of voice signals for the detection of laryngeal pathologies.COSTA, Washington César de Almeida. 13 August 2018 (has links)
Submitted by Johnny Rodrigues (johnnyrodrigues@ufcg.edu.br) on 2018-08-13T16:22:35Z
No. of bitstreams: 1
WASHINGTON CÉSAR DE ALMEIDA COSTA - TESE PPGEE 2012..pdf: 6463355 bytes, checksum: 40d8703ef8a6dd3ef05acde3025cf628 (MD5) / Made available in DSpace on 2018-08-13T16:22:35Z (GMT). No. of bitstreams: 1
WASHINGTON CÉSAR DE ALMEIDA COSTA - TESE PPGEE 2012..pdf: 6463355 bytes, checksum: 40d8703ef8a6dd3ef05acde3025cf628 (MD5)
Previous issue date: 2012-11-09 / Patologias na laringe podem afetar a qualidade vocal, prejudicando a comunicação humana. As técnicas objetivas tradicionais para o diagnóstico dessas patologias fazem uso de exames considerados invasivos, causando certo desconforto ao paciente. Análise acústica, utilizando técnicas de processamento digital de sinais de voz, pode ser utilizada para o desenvolvimento de ferramentas não invasivas de auxílio ao diagnóstico de patologias laríngeas. A precisão do diagnóstico, contudo, depende da escolha das características e parâmetros da fala que melhor representem a desordem vocal provocada por uma determinada patologia. Este trabalho trata da caracterização e da classificação de sinais de vozes saudáveis e vozes afetadas por diferentes patologias laríngeas (edema, paralisia e nódulos nas pregas vocais), por meio da análise dinâmica não linear (e teoria do caos), como também por meio da análise de quantificação de recorrência. No processo de caracterização é investigado, por meio de testes estatísticos,
o potencial de cada característica em discriminar os tipos de sinais de voz considerados. Para a classificação é empregada a técnica de análise discriminante com as funções linear ou quadrática, com validação cruzada, sendo considerado um intervalo de confiança de 95% para as médias das taxas de acuraria do classificador. A partir da combinação de características dos conjuntos das medidas de análise não linear (MNL) e das medidas de quantificação de recorrência (MQR), as médias da taxa de acurácia obtidas variaram nos intervalos de confiança: [95,44%; 100%) para a classificação entre vozes saudáveis e patológicas; [94,75%; 100%] entre vozes saudáveis e afetadas por edema, e entre saudáveis e nódulos. Para a classificação entre saudável e paralisia, obteve-se uma acurácia de 100% . Também são avaliados os efeitos do uso de vetores híbridos formados por características MNL, MQR e coeficientes extraídos da
análise preditiva linear (LPC). Neste caso. as taxas de acurácia variaram nos intervalos de confiança: [95,02%; 97,62%] na discriminação entre vozes afetadas por paralisia e edema; [98,29%; 99,93%] para paralisia versus nódulos e [97,98%; 99,84%] para edema versus nódulos. Os resultados encontrados indicam que o método utilizado é promissor, podendo ser empregado no desenvolvimento de uma ferramenta computacional para apoio ao diagnóstico de patologias laríngeas. / Laryngeal pathologies may affect the voice quality, harniing human communication.
The traditional objective techniques for diagnosing these pathologies make use of exams, considered invasive, causing discomfort to the patient. Acoustic analysis, using digital speech signal processing techniques. can be used for the development of non-invasive tools in order to aid laryngeal diseases diagnosis. The accuracy of diagnosis, however. depends on the choice of parameters and the speech characteristics diat better represent the voice disorder caused by a given pathology. This work deals with the characterization and classification of healthy voice signals and voices affecied by different laryngeal diseases (edema, paralysis and vocal fold nodules), by means of nonlinear dynamic analysis (and chãos theory) as well as recurrence quantification analysis. In the characterization process, the potential of each feature is investigated to discriminate the types of voice signals considered, by means of statistical tests. For the classification,
the technique of discriminam analysis is employed with linear or quadratic functions,
with cross-validation. A 95% confidence levei was considered for the average of accuracy rates of the classifier performance. From the feature combination of the set of nonlinear analysis measures (MNL) and the quantification recurrence measures (MQR). the average of accuracy rates varied in the following confidence intervals: [95.44%; 100%] for healthy and pathologícal classification: [94.75%; 100%] between healdiy and edema voices, and also between healthy and nodules. The accuracy rate was 100% between healthy and paralysis. We also evaluated the effects of using hybrid vectors formed by MNL, MQR and linear predictive coding (LPC) coefficients. In this case, the accuracy rates ranged in the confidence intervals: [95.02%; 97.62%] in the paralysis versus edema voices discrimination; [98.29%; 99.93%] for paralysis versus nodules and [97.98%; 99.84%] for edema versus nodules. Obtained results indicate that the used method is promising and it can even be used to develop a computational tool to support diagnosis of laryngeal diseases.
|
Page generated in 0.0867 seconds