Spelling suggestions: "subject:"processamento digital dde sinais dde voz"" "subject:"processamento digital dde sinais dee voz""
1 |
An?lise Ac?stica de Desvios Vocais Infantis utilizando a Transformada WaveletSantos, Mikaelle Oliveira 24 November 2016 (has links)
Submitted by Thiago Oliveira (thiago.oliveira@ifpb.edu.br) on 2016-11-24T19:13:07Z
No. of bitstreams: 1
Mikaelle Oliveira Santos - An?lise Ac?stica de Desvios Vocais Infantis utilizando a Transformada Wavelet.pdf: 675138 bytes, checksum: e0ca5f454819efa373454dd7dc2bc511 (MD5) / Approved for entry into archive by Thiago Oliveira (thiago.oliveira@ifpb.edu.br) on 2016-11-24T19:15:03Z (GMT) No. of bitstreams: 1
Mikaelle Oliveira Santos - An?lise Ac?stica de Desvios Vocais Infantis utilizando a Transformada Wavelet.pdf: 675138 bytes, checksum: e0ca5f454819efa373454dd7dc2bc511 (MD5) / Made available in DSpace on 2016-11-24T19:15:03Z (GMT). No. of bitstreams: 1
Mikaelle Oliveira Santos - An?lise Ac?stica de Desvios Vocais Infantis utilizando a Transformada Wavelet.pdf: 675138 bytes, checksum: e0ca5f454819efa373454dd7dc2bc511 (MD5)
Previous issue date: 2016-11-24 / Dist?rbios da voz podem atingir diferentes faixas et?rias, afetando a qualidade vocal,prejudicando a comunica??o por meio da voz. T?cnicas de processamento digital de sinais de vozpodem ser empregadas para auxiliar outros m?todos de avalia??o de dist?rbios da voz, tais como an?liseotorrinolaringol?gica e an?lise perceptivo-auditiva. Crian?as com dist?rbios de voz podem apresentarefeitos negativos no seu desenvolvimento social, educacional e f?sico. A investiga??o e o diagn?sticoprecoce do desvio vocal infantil permite maior efic?cia no tratamento. Entretanto, a avalia??o de desordensvocais em crian?as apresenta alguns desafios relacionados ?s dificuldades de coopera??o das mesmasdurante os exames tradicionais. Nesta pesquisa, as medidas de energia e entropia dos coeficientes dedetalhe da transformada wavelet s?o empregadas na avalia??o da qualidade vocal em crian?as. Doisestudos de caso s?o abordados nesta pesquisa: 1) An?lise ac?stica do grau da intensidade do desviovocal; e 2) An?lise ac?stica da qualidade vocal predominante (rugosidade e soprosidade). As medidas deenergia e entropia dos coeficientes de detalhe da transformada wavelet s?o utilizadas de maneira individuale combinada a fim de se obter uma maior efic?cia na classifica??o dos sinais. Para o primeiro estudode caso, utilizando-se de um vetor h?brido de medidas combinadas, foram obtidas acur?cias acima de95% e, para o segundo, utilizando-se tamb?m do vetor de medidas combinadas, as medidas de acur?ciaforam superiores a 90%. Os sinais das vozes desviadas apresentaram eleva??o em suas frequ?ncias dosformantes, comparados ?s vozes sem desvio. Os resultados obtidos nesta pesquisa indicam que o usodas medidas de energia e entropia dos coeficientes de detalhe da transformada wavelet mostra-se comouma t?cnica promissora, que pode ser considerada para ser empregada como uma ferramenta para an?liseac?stica da qualidade vocal em crian?as.
|
2 |
An?lise Ac?stica de Desvios Vocais Infantis utilizando a Transformada WaveletSantos, Mikaelle Oliveira 06 December 2016 (has links)
Submitted by Alex Sandro R?go (alex@ifpb.edu.br) on 2016-12-06T12:22:35Z
No. of bitstreams: 1
10- Mikaelle Oliveira Santos - An?lise Ac?stica de Desvios Vocais Infantis utilizando a Transformada Wavelet_f.pdf: 2034795 bytes, checksum: 8f9412d47b44fb50df0277e9049e8a5e (MD5) / Approved for entry into archive by Alex Sandro R?go (alex@ifpb.edu.br) on 2016-12-06T12:23:23Z (GMT) No. of bitstreams: 1
10- Mikaelle Oliveira Santos - An?lise Ac?stica de Desvios Vocais Infantis utilizando a Transformada Wavelet_f.pdf: 2034795 bytes, checksum: 8f9412d47b44fb50df0277e9049e8a5e (MD5) / Made available in DSpace on 2016-12-06T12:23:23Z (GMT). No. of bitstreams: 1
10- Mikaelle Oliveira Santos - An?lise Ac?stica de Desvios Vocais Infantis utilizando a Transformada Wavelet_f.pdf: 2034795 bytes, checksum: 8f9412d47b44fb50df0277e9049e8a5e (MD5)
Previous issue date: 2016-12-06 / Dist?rbios da voz podem atingir diferentes faixas et?rias, afetando a qualidade vocal, prejudicando a comunica??o por meio da voz. T?cnicas de processamento digital de sinais de voz podem ser empregadas para auxiliar outros m?todos de avalia??o de dist?rbios da voz, tais como an?lise otorrinolaringol?gica e an?lise perceptivo-auditiva. Crian?as com dist?rbios de voz podem apresentar
efeitos negativos no seu desenvolvimento social, educacional e f?sico. A investiga??o e o diagn?stico precoce do desvio vocal infantil permite maior efic?cia no tratamento. Entretanto, a avalia??o de desordens vocais em crian?as apresenta alguns desafios relacionados ?s dificuldades de coopera??o das mesmas durante os exames tradicionais. Nesta pesquisa, as medidas de energia e entropia dos coeficientes de detalhe da transformada wavelet s?o empregadas na avalia??o da qualidade vocal em crian?as. Dois estudos de caso s?o abordados nesta pesquisa: 1) An?lise ac?stica do grau da intensidade do desvio vocal; e 2) An?lise ac?stica da qualidade vocal predominante (rugosidade e soprosidade). As medidas de energia e entropia dos coeficientes de detalhe da transformada wavelet s?o utilizadas de maneira individual e combinada a fim de se obter uma maior efic?cia na classifica??o dos sinais. Para o primeiro estudo de caso, utilizando-se de um vetor h?brido de medidas combinadas, foram obtidas acur?cias acima de 95% e, para o segundo, utilizando-se tamb?m do vetor de medidas combinadas, as medidas de acur?cia foram superiores a 90%. Os sinais das vozes desviadas apresentaram eleva??o em suas frequ?ncias dos formantes, comparados ?s vozes sem desvio. Os resultados obtidos nesta pesquisa indicam que o uso das medidas de energia e entropia dos coeficientes de detalhe da transformada wavelet mostra-se como uma t?cnica promissora, que pode ser considerada para ser empregada como uma ferramenta para an?lise ac?stica da qualidade vocal em crian?as.
|
3 |
AN?LISE DIN?MICA N?O LINEAR E AN?LISE DE QUANTIFICA??O DE RECORR?NCIA APLICADAS NA CLASSIFICA??O DE DESVIOS VOCAISQueiroz, Giulliana Karla Lacerda Pereira de 27 March 2018 (has links)
Submitted by Programa de P?s-Gradua??o Engenharia El?trica (ppgee@ifpb.edu.br) on 2018-03-27T13:16:45Z
No. of bitstreams: 1
36- Giulliana Karla Lacerda Pereira de Queiroz - AN?LISE DIN?MICA N?O LINEAR E AN?LISE DE QUANTIFICA??O DE RECORR?NCIA APLICADAS NA CLASSIFICA??O DE DESVIOS VOCAIS.pdf: 2447855 bytes, checksum: 4d6f1915d45e04e18c97b0d760f5a8ae (MD5) / Approved for entry into archive by Alex Sandro R?go (alex@ifpb.edu.br) on 2018-04-05T19:22:26Z (GMT) No. of bitstreams: 1
36- Giulliana Karla Lacerda Pereira de Queiroz - AN?LISE DIN?MICA N?O LINEAR E AN?LISE DE QUANTIFICA??O DE RECORR?NCIA APLICADAS NA CLASSIFICA??O DE DESVIOS VOCAIS.pdf: 2447855 bytes, checksum: 4d6f1915d45e04e18c97b0d760f5a8ae (MD5) / Made available in DSpace on 2018-04-05T19:22:26Z (GMT). No. of bitstreams: 1
36- Giulliana Karla Lacerda Pereira de Queiroz - AN?LISE DIN?MICA N?O LINEAR E AN?LISE DE QUANTIFICA??O DE RECORR?NCIA APLICADAS NA CLASSIFICA??O DE DESVIOS VOCAIS.pdf: 2447855 bytes, checksum: 4d6f1915d45e04e18c97b0d760f5a8ae (MD5)
Previous issue date: 2018-03-27 / PRPIPG - IFPB / Disfonia representa qualquer dificuldade na emiss?o vocal que prejudique a produ??o
natural da voz. T?cnicas de processamento digital de sinais v?m sendo empregadas
como ferramenta auxiliar na avalia??o de desvios vocais, trazendo maior conforto ao
paciente. Algumas medidas n?o lineares, baseadas na teoria do caos, foram empregadas,neste trabalho, em conjunto com medidas de quantifica??o de recorr?ncia para a an?lise discriminativa destes desvios. Dois estudos de caso foram realizados nesta pesquisa. No caso 1 foi feita a discrimina??o de vozes adultas saud?veis e desviadas (rugosidade, soprosidade e tens?o) e no caso 2 foi avaliada a discrimina??o da intensidade dos graus dos desvios vocais de vozes adultas (Grau 1-voz normal, Grau 2 - voz considerada com desvio leve e Grau 3 - voz considerada com desvio moderado). As caracter?sticas da an?lise din?mica n?o linear empregada no processo de classifica??o foram a Dimens?o de Correla??o e o Primeiro M?nimo da Fun??o de Informa??o M?tua. As medidas de quantifica??o empregadas foram o Determinismo, a Entropia de Shannon, o Comprimento M?dio das Linhas Diagonais, o Comprimento M?ximo das Linhas Verticais e a Transitividade. O Passo de Reconstru??o tamb?m foi utilizado no processo de classifica??o. Por meio dos testes estat?sticos, foi avaliado o potencial de cada caracter?stica em discriminar os tipos de sinais de voz considerados. Foi utilizada a rede neural MLP (Multilayer Perceptron), com o algoritmo de aprendizado supervisionado Gradiente Conjugado Escalonado (SCG), no processo de classifica??o. Avaliando o desempenho do classificador utilizando as medidas, de forma individual e combinada, foram obtidos, como melhores resultados, uma acur?cia m?dia de 91,17% na distin??o entre as vozes saud?veis e soprosas com as medidas Transitividade e Passo de reconstru??o. Com rela??o ? discrimina??o entre a intensidade dos graus dos desvios, obteve-se uma acur?cia m?dia de 94,5% entre os Graus 1 e 3, com a combina??o das medidas Determinismo, Entropia, Transitividade, Primeiro M?nimo da Fun??o de Informa??o M?tua e o Comprimento m?ximo das linhas verticais. Os resultados encontrados, nesta pesquisa, indicam que as medidas n?o lineares, baseadas na teoria do caos, com as medidas de quantifica??o de recorr?ncia foram eficientes para detectar a presen?a e o grau dos desvios vocais, podendo ser empregada em m?todos de avalia??o, triagem e monitoramento vocal.
|
4 |
Estudo de técnicas para classificação de vozes afetadas por patologias. / Study of techniques to classify voices affected by pathologies.MARINUS, João Vilian de Moraes Lima. 17 August 2018 (has links)
Submitted by Johnny Rodrigues (johnnyrodrigues@ufcg.edu.br) on 2018-08-17T14:06:04Z
No. of bitstreams: 1
JOÃO VIVLIAN DE MORAES LIMA MARINUS - DISSERTAÇÃO PPGCC 2010..pdf: 2343869 bytes, checksum: 46e0a7984b1b956fbea2bfcba9e1f631 (MD5) / Made available in DSpace on 2018-08-17T14:06:04Z (GMT). No. of bitstreams: 1
JOÃO VIVLIAN DE MORAES LIMA MARINUS - DISSERTAÇÃO PPGCC 2010..pdf: 2343869 bytes, checksum: 46e0a7984b1b956fbea2bfcba9e1f631 (MD5)
Previous issue date: 2010-11-29 / Nos últimos anos, várias pesquisas na área de processamento digital de voz estão sendo
feitas, no sentido de criar técnicas que auxiliem o diagnóstico preciso por um especialista
de patologias do trato vocal de maneira não invasiva, fazendo com que o paciente se sinta
confortável na hora do exame. Este trabalho trata da investigação de técnicas para a classificação de vozes afetadas por patologias da laringe, em especial edema de Reinke, visando a construção de um sistema de apoio ao especialista. O sistema de auxílio ao diagnóstico de patologias da laringe, proposto nesta dissertação, é constituido de 3 etapas principais: pré-processamento do sinal de voz, extração de características e classificação. A etapa de pré-processamento consiste na aquisição do sinal de voz, na aplicação de um filtro de pré ênfase para a minimização dos efeitos da radiação dos lábios e da variação da área da glote, seguido da segmentação e janelamento do sinal. Também foi investigada a não utilização da pré-ênfase nessa etapa. Na fase de extração de características, são utilizados coeficientes obtidos a partir da análise por predição linear (coeficientes LPC), coeficientes cepstrais, coeficientes delta-cepstrais e um vetor de características combinando coeficientes LPC e coeficientes cepstrais. A etapa de classificação é dividida em duas partes: classificação entre voz normal e voz afetada por patologia, sem especificar qual patologia, e caso o sinal seja classificado como voz afetada por patologia, tem-se uma segunda parte, a qual é realizada a classificação entre voz afetada por edema de Reinke e voz afetada por outra patologia. Para as duas partes, foram testados 3 diferentes classificadores: Redes Neurais Multilayer Perceptron - MLP, Modelos de Misturas de Gaussianas e Quantização Vetorial. Para diferenciar
entre voz normal e voz afetada por patologia, os melhores resultados foram obtidos
utilizando Redes Neurais. Para diferenciar entre voz afetada por edema e voz afetada por
outra patologia, os melhores resultados foram obtidos utilizando Quantização Vetorial. Em
ambos os casos, os melhores resultados foram obtidos ao se utilizar coeficientes cepstrais e sem utilização da pré-ênfase. / In recent years, several studies in digital voice processing are being made in order to create techniques to support a noninvasive accurate diagnosis of vocal tract diseases by aspecialist, making the patient feel comfortable during examination. This work deals with the investigation of techniques for classification of voices affected by laryngeal pathologies, especially Reinke’s edema, aiming to build a support system to the specialist. The system for the diagnosis of laryngeal pathologies, proposed here, consists of three main steps: preprocessing the speech signal, feature extraction and classification. Preprocessing corresponds the acquisition of voice signal, the application of a pre-emphasis filter for minimizing the radiation effects from the lips and from variation in glottal area, and the signal segmentation and windowing. The non-use of pre-emphasis was also investigated at this point. In the feature extraction step, we use coefficients obtained from the linear prediction analysis (LPC coefficients), cepstral coefficients, delta-cepstral coefficients, and afeature vectorc ombining LPC and cepstral coefficients. The classification is divided into two parts: classification of normal voice versus voice affected by pathology, without specifying which pathology, and if the signal is classified as voice affected by pathology, second part happens, which is performed by the classification between voice affected by Reinke’s edema and voice affected by other pathology. For both parties, 3 different classifiers were tested: Neural Networks Multilayer Perceptron - MLP, Gaussian Mixture Models and Vector Quantization. To differentiate between normal voice and voice affected by pathology, the best results were obtained using Neural Networks. To differentiate between voice affected by edema and voice affected by pathology, the best results were obtained using vector quantization. In both cases, the best results were obtained when usingcepstral coefficients and withoutuse of pre-emphasis.
|
5 |
Análise dinâmica não linear de sinais de voz para detecção de patologias laríngeas. / Dynamic nonlinear analysis of voice signals for the detection of laryngeal pathologies.COSTA, Washington César de Almeida. 13 August 2018 (has links)
Submitted by Johnny Rodrigues (johnnyrodrigues@ufcg.edu.br) on 2018-08-13T16:22:35Z
No. of bitstreams: 1
WASHINGTON CÉSAR DE ALMEIDA COSTA - TESE PPGEE 2012..pdf: 6463355 bytes, checksum: 40d8703ef8a6dd3ef05acde3025cf628 (MD5) / Made available in DSpace on 2018-08-13T16:22:35Z (GMT). No. of bitstreams: 1
WASHINGTON CÉSAR DE ALMEIDA COSTA - TESE PPGEE 2012..pdf: 6463355 bytes, checksum: 40d8703ef8a6dd3ef05acde3025cf628 (MD5)
Previous issue date: 2012-11-09 / Patologias na laringe podem afetar a qualidade vocal, prejudicando a comunicação humana. As técnicas objetivas tradicionais para o diagnóstico dessas patologias fazem uso de exames considerados invasivos, causando certo desconforto ao paciente. Análise acústica, utilizando técnicas de processamento digital de sinais de voz, pode ser utilizada para o desenvolvimento de ferramentas não invasivas de auxílio ao diagnóstico de patologias laríngeas. A precisão do diagnóstico, contudo, depende da escolha das características e parâmetros da fala que melhor representem a desordem vocal provocada por uma determinada patologia. Este trabalho trata da caracterização e da classificação de sinais de vozes saudáveis e vozes afetadas por diferentes patologias laríngeas (edema, paralisia e nódulos nas pregas vocais), por meio da análise dinâmica não linear (e teoria do caos), como também por meio da análise de quantificação de recorrência. No processo de caracterização é investigado, por meio de testes estatísticos,
o potencial de cada característica em discriminar os tipos de sinais de voz considerados. Para a classificação é empregada a técnica de análise discriminante com as funções linear ou quadrática, com validação cruzada, sendo considerado um intervalo de confiança de 95% para as médias das taxas de acuraria do classificador. A partir da combinação de características dos conjuntos das medidas de análise não linear (MNL) e das medidas de quantificação de recorrência (MQR), as médias da taxa de acurácia obtidas variaram nos intervalos de confiança: [95,44%; 100%) para a classificação entre vozes saudáveis e patológicas; [94,75%; 100%] entre vozes saudáveis e afetadas por edema, e entre saudáveis e nódulos. Para a classificação entre saudável e paralisia, obteve-se uma acurácia de 100% . Também são avaliados os efeitos do uso de vetores híbridos formados por características MNL, MQR e coeficientes extraídos da
análise preditiva linear (LPC). Neste caso. as taxas de acurácia variaram nos intervalos de confiança: [95,02%; 97,62%] na discriminação entre vozes afetadas por paralisia e edema; [98,29%; 99,93%] para paralisia versus nódulos e [97,98%; 99,84%] para edema versus nódulos. Os resultados encontrados indicam que o método utilizado é promissor, podendo ser empregado no desenvolvimento de uma ferramenta computacional para apoio ao diagnóstico de patologias laríngeas. / Laryngeal pathologies may affect the voice quality, harniing human communication.
The traditional objective techniques for diagnosing these pathologies make use of exams, considered invasive, causing discomfort to the patient. Acoustic analysis, using digital speech signal processing techniques. can be used for the development of non-invasive tools in order to aid laryngeal diseases diagnosis. The accuracy of diagnosis, however. depends on the choice of parameters and the speech characteristics diat better represent the voice disorder caused by a given pathology. This work deals with the characterization and classification of healthy voice signals and voices affecied by different laryngeal diseases (edema, paralysis and vocal fold nodules), by means of nonlinear dynamic analysis (and chãos theory) as well as recurrence quantification analysis. In the characterization process, the potential of each feature is investigated to discriminate the types of voice signals considered, by means of statistical tests. For the classification,
the technique of discriminam analysis is employed with linear or quadratic functions,
with cross-validation. A 95% confidence levei was considered for the average of accuracy rates of the classifier performance. From the feature combination of the set of nonlinear analysis measures (MNL) and the quantification recurrence measures (MQR). the average of accuracy rates varied in the following confidence intervals: [95.44%; 100%] for healthy and pathologícal classification: [94.75%; 100%] between healdiy and edema voices, and also between healthy and nodules. The accuracy rate was 100% between healthy and paralysis. We also evaluated the effects of using hybrid vectors formed by MNL, MQR and linear predictive coding (LPC) coefficients. In this case, the accuracy rates ranged in the confidence intervals: [95.02%; 97.62%] in the paralysis versus edema voices discrimination; [98.29%; 99.93%] for paralysis versus nodules and [97.98%; 99.84%] for edema versus nodules. Obtained results indicate that the used method is promising and it can even be used to develop a computational tool to support diagnosis of laryngeal diseases.
|
Page generated in 0.1409 seconds