A voz humana apresenta flutuações na frequência, amplitude e formato de onda. Esse comportamento característico pode ser estudado usando técnicas de análise não linear, além das técnicas convencionais. O objetivo desse trabalho é analisar sinais de vozes normais e patológicas (com nódulos e edemas) usando seção de Poincaré de vários trechos do espaço de fase reconstruído e calcular a dispersão em relação ao ponto médio da seção e em relação à distribuição dos pontos sobre os eixos coordenados. Essa dispersão será calculada utilizando o conceito estatístico de desvio padrão. Foram analisados 48 sinais de voz humanas, divididos em 3 grupos (16 normais, 16 com nódulo e 16 com edema de Reinke). Foram selecionados trechos de 500m do sinal temporal nas regiões de maior estacionariedade, descartando os trechos iniciais e finais do sinal para evitar possíveis transitórios. A partir do espaço de fase bidimensional, a seção de Poincaré foi traçada em 10 trechos distintos da trajetória. Em seguida, foi gerado o espaço de fase em 3 dimensões contendo os pontos da seção. Foi feita uma rotação tridimensional dos pontos utilizando a reta tangente à trajetória de modo que a seção ficasse paralela ao plano x = O. Da seção resultante foram extraídas as componentes principais e em seguida calculado o desvio padrão da dispersão e o desvio padrão dos pontos projetados no plano em relação aos eixos coordenados (y;z). A validação da ferramenta desenvolvida para esse estudo foi realizada utilizando um sinal senoidal inserindo gradativamente Jitter e Shimmer, onde se verificou uma variação proporcional da média da dispersão. Os resultados obtidos para esse conjunto de vozes mostraram que o desvio padrão da dispersão e o desvio padrão em relação aos eixos coordenados dos pontos de vozes normais é menor do que os encontrados para vozes com edema e com nódulo. Concluiu-se que a ferramenta proposta conseguiu diferenciar vozes normais das vozes patológicas. Portanto, a ferramenta é promissora para análise e avaliação desse grupo vozes. / The human voice, normal or pathological, has fluctuations in the frequency, amplitude and waveform. This characteristic behavior can be studied using techniques of nonlinear analysis, in addition to conventional techniques. The aim of this study is to analyze signals of normal and pathological voices (with nodules and edema) using the Poincaré section of several parts of the reconstructed phase space and calculate the dispersion in relation to the midpoint of the section and in relation to the distribution of points on coordinate axes. This dispersion is calculated using the statistical concept of standard deviation. We analyzed 48 human voice signals divided into 3 groups (16 normal, 16 with nodules and 16 with Reinke\'s edema). It was selected 500m signal frames presenting good stationarity, discarding the initial and final portions of the signal to avoid possible transient. From the two-dimensional phase space, the Poincaré section was drawn on 10 different stretches of the path. It was then generated the three-dimensional phase space containing the points of the section. We conducted a three dimensional rotation of the points using the tangent to the trajectory so that the section stayed parallel to the plane. From the resulting section, principal components were extracted and then calculated the standard deviation of the dispersion and the standard deviation of the coordinate axes of the projected points of the section in the plan. The validation tool developed for this study was performed using a sinusoidal signal gradually inserting jitter and shimmer, where there was a proportional variation of the dispersion media. The results for this set of voices showed that the standard deviation of the dispersion and the standard deviation related to the coordinate axes of the points of normal voices is smaller than those found for voices with edema and nodule. It was concluded that the proposal was promising tool for analyzing and evaluating this group voices.
Identifer | oai:union.ndltd.org:IBICT/oai:teses.usp.br:tde-08062011-151518 |
Date | 06 May 2011 |
Creators | Fernando Araujo de Andrade Sobrinho |
Contributors | Jose Carlos Pereira, Marcelo Basilio Joaquim, Lidia Cristina da Silva Teles |
Publisher | Universidade de São Paulo, Engenharia Elétrica, USP, BR |
Source Sets | IBICT Brazilian ETDs |
Language | Portuguese |
Detected Language | English |
Type | info:eu-repo/semantics/publishedVersion, info:eu-repo/semantics/masterThesis |
Source | reponame:Biblioteca Digital de Teses e Dissertações da USP, instname:Universidade de São Paulo, instacron:USP |
Rights | info:eu-repo/semantics/openAccess |
Page generated in 0.0021 seconds