Spelling suggestions: "subject:"locais"" "subject:"focais""
91 |
Descrição de periodicidade do sinal eletroglotográfico durante a emissão dos exercícios de vibração sonorizada de língua e lábios comparados à vogal sustentada /E/ / Comparison of tongue and lip trills with phonation of the sustained vowel /E/ regarding the periodicity of the electroglottographic waveform and the amplitude of the electroglottographic signalCordeiro, Gislaine Ferro 28 August 2013 (has links)
INTRODUÇÃO: Os exercícios de vibração sonorizada de lábios e língua têm-se se mostrado eficientes quando utilizados tanto no tratamento de pacientes disfônicos como no aquecimento ou preparação vocal. Há grande variação do coeficiente de contato de um mesmo sinal eletroglotográfico e dificuldade na sincronização da luz estroboscópica durante a emissão dos exercícios de vibração sonorizada de língua e lábios, sendo levantada a possibilidade de aperiodicidade de vibração das pregas vocais durante a execução desses exercícios. OBJETIVO: descrever a vibração das pregas vocais durante a emissão de vibrações sonorizadas de língua e lábios comparando-as com a emissão da vogal /E/ sustentada quanto à regularidade e amplitude dos ciclos vibratórios na eletroglotografia, em cantores eruditos profissionais. METODOLOGIA: Participaram desse estudo 10 cantores eruditos profissionais, que emitiram a vogal /E/ sustentada e os exercícios de vibração sonorizados de língua e de lábios na mesma frequência e intensidade durante a execução da eletroglotografia. Foi realizada a inspeção visual da onda eletroglotográfica, quanto à periodicidade e amplitude, além do espectrograma do sinal quanto aos harmônicos presentes em cada amostra. As amostras foram randomizadas e analisadas por 3 avaliadoras. Além disso, foram extraídas as medidas de jitter e shimmer do sinal eletroglotográfico para confirmação dos resultados, além da frequência da variação de vibração dos exercícios de vibração sonorizada. RESULTADOS: Os avaliadores tiveram coeficiente alfa de Cronbach em mais de 0,9 na maior parte das amostras, indicando alto grau de concordância. Na inspeção visual do sinal eletroglotográfico foi considerada na vogal /E/ sustentada: onda periódica com amplitude regular e harmônicos múltiplos da frequência fundamental. Durante o exercício de vibração sonorizada de língua e lábios foram consideradas onda quase-periódica com amplitude oscilante (frequencia aproximada de 23Hz e 24Hz) e harmônicos múltiplos de 23 Hz e 24Hz,aproximadamente. CONCLUSÃO: os exercícios de vibração sonorizada de língua e de lábios assemelham-se entre si e se diferenciam da emissão da vogal /E/ sustentada tanto nas fortes, quanto nas fracas intensidades. A vibração das pregas vocais são mais periódicas durante a emissão da vogal sustentada do que na produção dos exercícios. Nas vibrações sonorizadas de lábios e de língua a forma e a amplitude da onda Lx se diferenciam entre si, mas com padrão de repetição ao longo do tempo, próximo aos 24 Hz. Esse comportamento gera parciais de harmônicos que sugerem movimentação de onda mucosa concomitante à vibração do ponto articulatório (língua ou lábios) / INTRODUCTION: Lip and tongue trills have been effectively used as vocal warmups in the treatment of dysphonia and in the training of professional voice users. In a previous study, we found that the closed quotient varied widely during tongue and lip trills. We encountered difficulty in synchronizing the stroboscopic illumination with the vocal fold vibration during the trill exercises. We hypothesize that there is aperiodicity of vocal fold vibration during tongue and lip trills. AIM: to compare the vocal fold vibration seen during lip and tongue trills with that seen during phonation of the sustained vowel /E/, in terms of the periodicity of the EGG wave form and the amplitude of the EGG signal, in professional voice users. METHODS: We used electroglottography (EGG) to compare the vocal fold vibration seen during tongue and lip trills with that seen during phonation of the sustained vowel /E/, in terms of the EGG waveform periodicity and signal amplitude, in 10 classically trained, professional singers. The participants produced the sustained vowel /E/ and performed tongue and lip trills at the same frequency and intensity. The periodicity of the waveform and the amplitude of the signal were visually analyzed by three blinded, experienced readers. To confirm the visual analysis results, we measured the jitter and shimmer of the signal and the frequency of variation in vocal fold vibration during the trill exercises. RESULTS: Cronbach\'s alpha coefficient values were high (>0,9), indicating high inter-rater reliability. In sustained vowel /E/ was considered periodic wave and regular amplitude. In tongue and lip trills the waveform EGG was considered quasi-periodic and the amplitude of the EGG signal was classified as oscillating. The mean amplitude was as follows: 24.4 Hz during lip trills performed at high intensity; 24.7 Hz during tongue trills performed at high intensity; 23.3 Hz during lip trills performed at low intensity; and 24.3 Hz during tongue trills performed at low intensity. The jitter and shimmer were higher in lip and tongue trills. The harmonics seen on the narrow-band spectrograms were classified as being multiples of the fundamental frequency for the sustained vowel phonation task and as being below the fundamental frequency for lip and tongue trills, the mean frequency of the harmonics being as follows: 23.7 Hz during lip trills performed at high intensity; 24 Hz during tongue trills performed at high intensity; 23.7 Hz during lip trills performed at low intensity; and 23.2 Hz during tongue trills performed at low intensity. CONCLUSION: In terms of the EGG waveform, tongue trills and lip trills are similar regardless of the intensity at which they are performed (i.e., high or low), differing, however, from the sustained vowel /E/. The vibration of the vocal folds is modified according to the supraglottic movement in trills exercices
|
92 |
Descrição de periodicidade do sinal eletroglotográfico durante a emissão dos exercícios de vibração sonorizada de língua e lábios comparados à vogal sustentada /E/ / Comparison of tongue and lip trills with phonation of the sustained vowel /E/ regarding the periodicity of the electroglottographic waveform and the amplitude of the electroglottographic signalGislaine Ferro Cordeiro 28 August 2013 (has links)
INTRODUÇÃO: Os exercícios de vibração sonorizada de lábios e língua têm-se se mostrado eficientes quando utilizados tanto no tratamento de pacientes disfônicos como no aquecimento ou preparação vocal. Há grande variação do coeficiente de contato de um mesmo sinal eletroglotográfico e dificuldade na sincronização da luz estroboscópica durante a emissão dos exercícios de vibração sonorizada de língua e lábios, sendo levantada a possibilidade de aperiodicidade de vibração das pregas vocais durante a execução desses exercícios. OBJETIVO: descrever a vibração das pregas vocais durante a emissão de vibrações sonorizadas de língua e lábios comparando-as com a emissão da vogal /E/ sustentada quanto à regularidade e amplitude dos ciclos vibratórios na eletroglotografia, em cantores eruditos profissionais. METODOLOGIA: Participaram desse estudo 10 cantores eruditos profissionais, que emitiram a vogal /E/ sustentada e os exercícios de vibração sonorizados de língua e de lábios na mesma frequência e intensidade durante a execução da eletroglotografia. Foi realizada a inspeção visual da onda eletroglotográfica, quanto à periodicidade e amplitude, além do espectrograma do sinal quanto aos harmônicos presentes em cada amostra. As amostras foram randomizadas e analisadas por 3 avaliadoras. Além disso, foram extraídas as medidas de jitter e shimmer do sinal eletroglotográfico para confirmação dos resultados, além da frequência da variação de vibração dos exercícios de vibração sonorizada. RESULTADOS: Os avaliadores tiveram coeficiente alfa de Cronbach em mais de 0,9 na maior parte das amostras, indicando alto grau de concordância. Na inspeção visual do sinal eletroglotográfico foi considerada na vogal /E/ sustentada: onda periódica com amplitude regular e harmônicos múltiplos da frequência fundamental. Durante o exercício de vibração sonorizada de língua e lábios foram consideradas onda quase-periódica com amplitude oscilante (frequencia aproximada de 23Hz e 24Hz) e harmônicos múltiplos de 23 Hz e 24Hz,aproximadamente. CONCLUSÃO: os exercícios de vibração sonorizada de língua e de lábios assemelham-se entre si e se diferenciam da emissão da vogal /E/ sustentada tanto nas fortes, quanto nas fracas intensidades. A vibração das pregas vocais são mais periódicas durante a emissão da vogal sustentada do que na produção dos exercícios. Nas vibrações sonorizadas de lábios e de língua a forma e a amplitude da onda Lx se diferenciam entre si, mas com padrão de repetição ao longo do tempo, próximo aos 24 Hz. Esse comportamento gera parciais de harmônicos que sugerem movimentação de onda mucosa concomitante à vibração do ponto articulatório (língua ou lábios) / INTRODUCTION: Lip and tongue trills have been effectively used as vocal warmups in the treatment of dysphonia and in the training of professional voice users. In a previous study, we found that the closed quotient varied widely during tongue and lip trills. We encountered difficulty in synchronizing the stroboscopic illumination with the vocal fold vibration during the trill exercises. We hypothesize that there is aperiodicity of vocal fold vibration during tongue and lip trills. AIM: to compare the vocal fold vibration seen during lip and tongue trills with that seen during phonation of the sustained vowel /E/, in terms of the periodicity of the EGG wave form and the amplitude of the EGG signal, in professional voice users. METHODS: We used electroglottography (EGG) to compare the vocal fold vibration seen during tongue and lip trills with that seen during phonation of the sustained vowel /E/, in terms of the EGG waveform periodicity and signal amplitude, in 10 classically trained, professional singers. The participants produced the sustained vowel /E/ and performed tongue and lip trills at the same frequency and intensity. The periodicity of the waveform and the amplitude of the signal were visually analyzed by three blinded, experienced readers. To confirm the visual analysis results, we measured the jitter and shimmer of the signal and the frequency of variation in vocal fold vibration during the trill exercises. RESULTS: Cronbach\'s alpha coefficient values were high (>0,9), indicating high inter-rater reliability. In sustained vowel /E/ was considered periodic wave and regular amplitude. In tongue and lip trills the waveform EGG was considered quasi-periodic and the amplitude of the EGG signal was classified as oscillating. The mean amplitude was as follows: 24.4 Hz during lip trills performed at high intensity; 24.7 Hz during tongue trills performed at high intensity; 23.3 Hz during lip trills performed at low intensity; and 24.3 Hz during tongue trills performed at low intensity. The jitter and shimmer were higher in lip and tongue trills. The harmonics seen on the narrow-band spectrograms were classified as being multiples of the fundamental frequency for the sustained vowel phonation task and as being below the fundamental frequency for lip and tongue trills, the mean frequency of the harmonics being as follows: 23.7 Hz during lip trills performed at high intensity; 24 Hz during tongue trills performed at high intensity; 23.7 Hz during lip trills performed at low intensity; and 23.2 Hz during tongue trills performed at low intensity. CONCLUSION: In terms of the EGG waveform, tongue trills and lip trills are similar regardless of the intensity at which they are performed (i.e., high or low), differing, however, from the sustained vowel /E/. The vibration of the vocal folds is modified according to the supraglottic movement in trills exercices
|
93 |
Impacto da mitomicina-C tópica na deposição de colágeno em torno de enxerto de gordura na prega vogal de coelhos: estudo histológico e morfométrico / Impact of topical mitomycin-C in the deposition of collagen around fat grafts in vocal folds of rabbits: histologic and morphometric studySocher, Jan Alessandro 01 April 2009 (has links)
Desde o início de 1990, a enxertia de gordura na prega vocal é descrita como um método para reparar a insuficiência glótica. O objetivo deste estudo é avaliar os efeitos da aplicação tópica de mitomicina-C no processo cicatricial de enxertos autólogos de gorduras inseridos em pregas vocais de coelhos através da medida da deposição de colágeno. Vinte e oito coelhos foram submetidos a enxertia de gordura em ambas pregas vocais. As pregas vocais direitas recebeu previamente a aplicação tópica de mitomicina-C (0,4mg/ml) durante cinco minutos enquanto que as pregas vocais esquerdas formavam o grupo controle (sem mitomicina-C). Quatro grupos com 6 coelhos cada foram sacrificados com 7, 14, 30 e 90 dias após a cirurgia de enxertia. As pregas vocais foram removidas para estudo histológico com a intenção de quantificar a deposição de colágeno através da coloração por Picrossírius Red sob microscopia polarizada. A deposição de colágeno foi menor em todos os grupos de pregas vocais que receberam aplicação tópica de mitomicina-C quando comparada com as pregas vocais do grupo controle. No presente estudo, a aplicação tópica de mitomicina-C antes da enxertia de gordura reduziu significativamente a deposição de colágeno (p = 0,05). / Since the early 1990s, fat implantation in the vocal fold is described as a method of repairing glottal insufficiency. The aim of this study was to evaluate the effect of topical application of mitomycin in the healing process with collagen deposition measurement around of autologous fat implants inserted in rabbits vocal folds. Twenty-eight rabbits were submitted to a fat implant in the both vocal folds. The right vocal folds received previously topical application of mitomycin (0,4mg/ml) for five minutes and the left vocal folds were the control group (without mitomycin). Four groups of 6 rabbits each were sacrificed 7, 14, 30 and 90 days after the implantation. The samples of the vocal folds were collected for histological analysis with the purpose of quantifying the collagen deposition by Picrosirius Red stain under polarization microscopy. The collagen deposition was lower in all groups of vocal folds with topical application of mitomycin than in control groups. In the present study, the topical application of mitomycin before the fat grafts reduced significantly the collagen deposition (p = 0,05).
|
94 |
Estimação do sinal glotal para padrões acústicos de doenças da laringe / not availableAparecida de Cássia Guerra 03 May 2005 (has links)
Muitas pesquisas tem sido feitas em processamento digital de sinais (PDS) na tentativa de se avaliar o sinal de fala para diagnosticar doenças da laringe. Medidas acústicas têm sido propostas de forma a avaliar indiretamente o trato glotal por meio do sinal de voz coletado através de microfone convencional. Para isso, o modelo paramétrico Liljencrants-Fant (LF) foi desenvolvido para representar o sinal glotal em condições normais e patológicas. Tais parâmetros apresentam vantagens sobre medidas acústicas por possuírem características fisiológicas reais das pregas vocais. Assim, podendo ser empregados para identificação de doenças da laringe. Além da estimação dos parâmetros LF, no domínio do tempo (parâmetros T), a forma de onda da derivativa glotal também pôde ser quantificada através dos parâmetros identificados na literatura por parâmetros R (Rd, Ra, Rk e Rg), parâmetros quocientes Q (SQ, OQ, CQ, AQ e NAQ), parâmetros B1 e B2 que são as extensões de bandas do pulso derivativo LF, e o parâmetro ece, que relaciona os parâmetros β e Ta. Os parâmetros B1 e B2 e ece apesar de serem propostos na literatura, não são encontrados resultados diferentes a essas duas medidas. Os resultados mostraram que os parâmetros B não foram confiáveis na discriminação entre as vozes, por outro lado, o parâmetro ece mostrou-se ser opção na discriminação entre as vozes normais, nódulo e Reinke. O objetivo deste trabalho é direcionar a atenção sobre o sinal glotal, estimando-o automaticamente mediante técnicas de PDS aplicadas ao sinal de fala, visando extrair parâmetros que identifiquem as condições normais e patológicas da laringe. Por fim foram propostos os parâmetros TRp e TRs, visando dissociar os efeitos de primeira ordem dos de ordem superior na fase de retorno do pulso glotal com a finalidade de estimar a real não-linearidade do sub-sistema glotal, retratando as condições normais e patológicas da laringe. Por fim foram propostos os parâmetros TRp e TRs, visando dissociar os efeitos de primeira ordem dos de ordem superior na fase de retorno do pulso glotal com a finalidade de estimar a real não-linearidade do sub-sistema glotal, retratando as condições fisiológicas do movimento das pregas vocais. Com um nível de confiança de 95%, o parâmetro de primeira ordem (TRp) é efetivo na discriminação do Edema de Reinke, porém mostrou-se ineficaz na detecção do nódulo. Em relação ao parâmetro de ordem superior, conclui-se que o TRs é um excelente detetor de vozes patológicas (nódulo e Edema de Reinke), porém não é capaz de discriminar as patologias. / Many researches has been conducted in digital signal processing (DSP) atempting to evaluate the physiological conditions of larynx. Acoustical parameters have been proposed to evaluate the glotal tract from voice signal. One technique proposed is the Liljencrants-Fant model (LF) developed to represent normal and pathologic conditions of the larynx. Those parameters compare favourably as far as real physiologic characteristic of vocal folds is concerned. So, a primary use of the model is the larynx pathologic identification. Beyond LF parameters estimation, (T parameters in the time domain), the waveform of glotal pulse derivative also can be quantified through, R parameters (Rd, Ra, Rk and Rg), quocient parameters (SQ, OQ, CQ, AQ and NAQ), B parameters (B1 and B2) that are band extension of the LF glotal pulse derivative and the ece parameter that in fact, is a relationship between β and Ta. Although proposed in the literature, no results are found, related to B and ece parameters. Our founds show that B parameters do not present good results in voice discrimination, however, ece parameter seems to be good option to discriminate normal voice, nodulo and Reinke edema. The main purpose of this work is to estimate the glotal signal from the voice signal using DSP techniques in order to obtain parameters that identifies the physiological larynx condition. In order to estimate the shape of return phase of glotal pulse, twoparameters have been proposed in this work. The first one evaluates the pulse (TRp, in other words, the first order component of the return phase. The second is responsible to evaluate superior orders components of the return phase (TRs), i.e, the non-linear component of the glotal pulse. With 95% of confidence level, TRp is effective in Reinke edema discrimination however it is inefficient for nodule e dection. By the other hand, the TRs parameter works well to detect pathologic voice however is unable to discriminated them.
|
95 |
Impacto da mitomicina-C tópica na deposição de colágeno em torno de enxerto de gordura na prega vogal de coelhos: estudo histológico e morfométrico / Impact of topical mitomycin-C in the deposition of collagen around fat grafts in vocal folds of rabbits: histologic and morphometric studyJan Alessandro Socher 01 April 2009 (has links)
Desde o início de 1990, a enxertia de gordura na prega vocal é descrita como um método para reparar a insuficiência glótica. O objetivo deste estudo é avaliar os efeitos da aplicação tópica de mitomicina-C no processo cicatricial de enxertos autólogos de gorduras inseridos em pregas vocais de coelhos através da medida da deposição de colágeno. Vinte e oito coelhos foram submetidos a enxertia de gordura em ambas pregas vocais. As pregas vocais direitas recebeu previamente a aplicação tópica de mitomicina-C (0,4mg/ml) durante cinco minutos enquanto que as pregas vocais esquerdas formavam o grupo controle (sem mitomicina-C). Quatro grupos com 6 coelhos cada foram sacrificados com 7, 14, 30 e 90 dias após a cirurgia de enxertia. As pregas vocais foram removidas para estudo histológico com a intenção de quantificar a deposição de colágeno através da coloração por Picrossírius Red sob microscopia polarizada. A deposição de colágeno foi menor em todos os grupos de pregas vocais que receberam aplicação tópica de mitomicina-C quando comparada com as pregas vocais do grupo controle. No presente estudo, a aplicação tópica de mitomicina-C antes da enxertia de gordura reduziu significativamente a deposição de colágeno (p = 0,05). / Since the early 1990s, fat implantation in the vocal fold is described as a method of repairing glottal insufficiency. The aim of this study was to evaluate the effect of topical application of mitomycin in the healing process with collagen deposition measurement around of autologous fat implants inserted in rabbits vocal folds. Twenty-eight rabbits were submitted to a fat implant in the both vocal folds. The right vocal folds received previously topical application of mitomycin (0,4mg/ml) for five minutes and the left vocal folds were the control group (without mitomycin). Four groups of 6 rabbits each were sacrificed 7, 14, 30 and 90 days after the implantation. The samples of the vocal folds were collected for histological analysis with the purpose of quantifying the collagen deposition by Picrosirius Red stain under polarization microscopy. The collagen deposition was lower in all groups of vocal folds with topical application of mitomycin than in control groups. In the present study, the topical application of mitomycin before the fat grafts reduced significantly the collagen deposition (p = 0,05).
|
96 |
Modelagem de sinais de voz via PPM, aplicada ao reconhecimento de padrões vocais patológicos. / Modeling of voice signals via PPM, applied to the recognition of pathological vocal patterns.BARBOSA, Hildegard Paulino. 03 August 2018 (has links)
Submitted by Johnny Rodrigues (johnnyrodrigues@ufcg.edu.br) on 2018-08-03T19:45:39Z
No. of bitstreams: 1
HIDELGARD PAULINO BARBOSA - DISSERTAÇÃO PPGCC 2013..pdf: 11966764 bytes, checksum: 077a69b5088eea2f7109e71871f4e57d (MD5) / Made available in DSpace on 2018-08-03T19:45:39Z (GMT). No. of bitstreams: 1
HIDELGARD PAULINO BARBOSA - DISSERTAÇÃO PPGCC 2013..pdf: 11966764 bytes, checksum: 077a69b5088eea2f7109e71871f4e57d (MD5)
Previous issue date: 2013-08 / A voz é o meio de comunicação mais utilizado pelo ser humano. Porém, o sistema fonador humano é suscetível a diversos tipos de patologias que podem prejudicar a produção da voz e, consequentemente, a comunicação. Alguns tipos de exames têm sido utilizados para detectar estas patologias. Porém, eles apresentam desvantagens referentes à acurácia e ao conforto do paciente durante a aplicação, que podem desestimular a busca por tratamento. Por essa razão, técnicas computacionais têm sido
empregadas com o intuito de detectar de modo confortável e preciso a presença e o tipo de patologia apresentada pelo sistema fonador. No entanto, os resultados obtidos ainda não possibilitam sua aplicação nas clínicas, principalmente pelo fato de ainda ser considerado um número reduzido de patologias. Visando a contornar esse problema, esta pesquisa propõe uma abordagem fundamentada em um método ainda não utilizado neste
contexto: a Predição por Casamento Parcial (Prediction by Partial Matching - PPM), concebida originalmente com fins à compressão de dados. O modelo criado e mantido a partir deste método é alimentado com características acústicas, temporais e estatísticas extraídas dos sinais de voz e permite sua classificação no que se refere à identificação da
presença e do tipo de patologia a um baixo custo computacional (velocidade e recursos de armazenamento). Foram obtidos resultados satisfatórios no tocante à presença de patologias. Quanto à discriminação de patologias, os resultados sugerem um potencial do método, embora a sua aplicação ainda necessite de investigações mais aprofundadas / Voice is the most widely used means of communication of mankind. However, speech organs are susceptible to several sort of pathologies, which may harm voice production and, therefore, communication. Several techniques have been used to detect these pathologies. However, they present drawbacks related to accuracy and comfort of patients during the application, which may discourage search for treatment. Thence, computational techniques have been used in order to detect the presence and type of speech pathology comfortably and accurately. But, results are still not good enough for its application in clinics, due to the fact it is considered a small number of distinct pathologies. Aiming to solve this problem, this research proposes using a method not previously employed in classification of vocal tract diseases: Prediction by Partial Matching (PPM), originally conceived for data compression purposes. The PPM model is fed with acoustical, temporal, and statistical features, ali of them extracted from voice signals. This method allowed a satisfactory classification, concerning presence and type of pathology while requiring a low computational cost (speed and storage resources). It were obtained satisfactory results regarding presence of speech pathologies. With regard to pathologies discrimination, the results suggest that this is a highly promising technique, although its application still needs deeper investigations.
|
97 |
Estudo de técnicas para classificação de vozes afetadas por patologias. / Study of techniques to classify voices affected by pathologies.MARINUS, João Vilian de Moraes Lima. 17 August 2018 (has links)
Submitted by Johnny Rodrigues (johnnyrodrigues@ufcg.edu.br) on 2018-08-17T14:06:04Z
No. of bitstreams: 1
JOÃO VIVLIAN DE MORAES LIMA MARINUS - DISSERTAÇÃO PPGCC 2010..pdf: 2343869 bytes, checksum: 46e0a7984b1b956fbea2bfcba9e1f631 (MD5) / Made available in DSpace on 2018-08-17T14:06:04Z (GMT). No. of bitstreams: 1
JOÃO VIVLIAN DE MORAES LIMA MARINUS - DISSERTAÇÃO PPGCC 2010..pdf: 2343869 bytes, checksum: 46e0a7984b1b956fbea2bfcba9e1f631 (MD5)
Previous issue date: 2010-11-29 / Nos últimos anos, várias pesquisas na área de processamento digital de voz estão sendo
feitas, no sentido de criar técnicas que auxiliem o diagnóstico preciso por um especialista
de patologias do trato vocal de maneira não invasiva, fazendo com que o paciente se sinta
confortável na hora do exame. Este trabalho trata da investigação de técnicas para a classificação de vozes afetadas por patologias da laringe, em especial edema de Reinke, visando a construção de um sistema de apoio ao especialista. O sistema de auxílio ao diagnóstico de patologias da laringe, proposto nesta dissertação, é constituido de 3 etapas principais: pré-processamento do sinal de voz, extração de características e classificação. A etapa de pré-processamento consiste na aquisição do sinal de voz, na aplicação de um filtro de pré ênfase para a minimização dos efeitos da radiação dos lábios e da variação da área da glote, seguido da segmentação e janelamento do sinal. Também foi investigada a não utilização da pré-ênfase nessa etapa. Na fase de extração de características, são utilizados coeficientes obtidos a partir da análise por predição linear (coeficientes LPC), coeficientes cepstrais, coeficientes delta-cepstrais e um vetor de características combinando coeficientes LPC e coeficientes cepstrais. A etapa de classificação é dividida em duas partes: classificação entre voz normal e voz afetada por patologia, sem especificar qual patologia, e caso o sinal seja classificado como voz afetada por patologia, tem-se uma segunda parte, a qual é realizada a classificação entre voz afetada por edema de Reinke e voz afetada por outra patologia. Para as duas partes, foram testados 3 diferentes classificadores: Redes Neurais Multilayer Perceptron - MLP, Modelos de Misturas de Gaussianas e Quantização Vetorial. Para diferenciar
entre voz normal e voz afetada por patologia, os melhores resultados foram obtidos
utilizando Redes Neurais. Para diferenciar entre voz afetada por edema e voz afetada por
outra patologia, os melhores resultados foram obtidos utilizando Quantização Vetorial. Em
ambos os casos, os melhores resultados foram obtidos ao se utilizar coeficientes cepstrais e sem utilização da pré-ênfase. / In recent years, several studies in digital voice processing are being made in order to create techniques to support a noninvasive accurate diagnosis of vocal tract diseases by aspecialist, making the patient feel comfortable during examination. This work deals with the investigation of techniques for classification of voices affected by laryngeal pathologies, especially Reinke’s edema, aiming to build a support system to the specialist. The system for the diagnosis of laryngeal pathologies, proposed here, consists of three main steps: preprocessing the speech signal, feature extraction and classification. Preprocessing corresponds the acquisition of voice signal, the application of a pre-emphasis filter for minimizing the radiation effects from the lips and from variation in glottal area, and the signal segmentation and windowing. The non-use of pre-emphasis was also investigated at this point. In the feature extraction step, we use coefficients obtained from the linear prediction analysis (LPC coefficients), cepstral coefficients, delta-cepstral coefficients, and afeature vectorc ombining LPC and cepstral coefficients. The classification is divided into two parts: classification of normal voice versus voice affected by pathology, without specifying which pathology, and if the signal is classified as voice affected by pathology, second part happens, which is performed by the classification between voice affected by Reinke’s edema and voice affected by other pathology. For both parties, 3 different classifiers were tested: Neural Networks Multilayer Perceptron - MLP, Gaussian Mixture Models and Vector Quantization. To differentiate between normal voice and voice affected by pathology, the best results were obtained using Neural Networks. To differentiate between voice affected by edema and voice affected by pathology, the best results were obtained using vector quantization. In both cases, the best results were obtained when usingcepstral coefficients and withoutuse of pre-emphasis.
|
Page generated in 0.0231 seconds