Spelling suggestions: "subject:"acoustic analysis off voice"" "subject:"acoustic analysis oof voice""
1 |
Produção de vogais do português brasileiro (pb) em pacientes laringectomizados totais: análise acústicaAna Carolina Calheiros de Moraes 11 August 2008 (has links)
A partir da análise fonético-acústica dos sons da fala (espectrograma), esta dissertação busca descrever os padrões vocálicos do português brasileiro (PB) em pacientes laringectomizados totais, realizada no início e após quatro meses de intervenção fonoaudiológica, como também comparar esses padrões vocálicos dos laringectomizados totais com outros padrões vocálicos estabelecidos em sujeitos sem alterações de acordo com os padrões nos estudos referidos por Behlau (1984), e ainda verificar se este método de mensuração de análise acústica através do espectrograma será ou não um facilitador, um recurso adequado, para o prognóstico no processo de reabilitação na emissão da produção vocálica dos laringectomizados totais com a terapia instituída. As medidas acústicas analisadas foram freqüência dos formantes (em Hz) e duração e intensidade da produção vocálica do português brasileiro (PB) nos pacientes laringectomizados. Para este estudo, foram selecionados 10 sujeitos em tratamento no Hospital do Câncer de Pernambuco, sendo sete do sexo masculino e três do sexo feminino, submetidos à retirada total do órgão laríngeo. As vogais analisadas do português brasileiro foram as orais, apresentadas oralmente aos participantes para repetição, já que a maioria dos participantes era de analfabetos, combinados com a consoante /k/ injetora, ou seja, facilitadora da emissão esofágica e solicitada à repetição em forma de stacatto (repetição consecutiva da sílaba). As gravações foram realizadas em ambiente silencioso. A taxa de amostragem utilizada foi de 11025 Hz e resolução de 16 bits. Para a realização da análise acústica das amostras, foram utilizados os programas Fonoview, versão 1.1, Voxmetria, versão 2.7 e o Praat, versão 4.6.22. Os resultados foram discutidos e fundamentados na teoria acústica da produção de fala. Os resultados constataram que a análise acústica espectrográfica permite o monitoramento dos parâmetros acústicos possibilitando um feedback do tratamento e o acompanhamento, sendo um meio objetivo e útil para o estudo da voz esofágica. Verificaram-se valores agudos para a freqüência dos formantes, aumento de 37,29% de intensidade após treino fonoterápico e menor duração de produção espontânea das sílabas e vogais à medida que se consegue melhor controle da voz esofagiana, a produção torna-se mais rápida. A partir desse estudo, espera-se que a análise acústica espectrográfica seja utilizada e adaptada à prática clínica como um método de referência para o prognóstico dos pacientes laringectomizados totais no processo de reabilitação fonoterápica / From the acoustic-phonetic analysis of the sounds of speech (spectrogram), this dissertation aims to describe vocalic patterns of Brazilian Portuguese (BP) in patients without larynx, held at the beginning and after four months of phonological intervention but also compare these vocalics patterns of the total laryngectomized with other standards established in vocalics subject unchanged in accordance with the standards in the studies referred by Behlau (1984), and also verify that this method of measurement of acoustic analysis through the spectrogram would be a facilitator, an action appropriate, the prognosis for the process of rehabilitation in the issuance of vocalic production of total laryngectomized with therapy instituted. The measures were analyzed acoustic frequency of formants (in Hz), and duration and intensity of vocalic production of Brazilian Portuguese (BP) in patients laryngectomized. For this study, 10 subjects were selected in treatment at the Hospital Cancer of Pernambuco, with seven males and three females, submitted to the total withdrawal of the body laryngeal. The vowels analyzed the Brazilian Portuguese were the oral, presented orally to the participants to repeat, since the majority of the participants was illiterate, combined with the on / k / injector, or facilitating the issuance esophageal and required to repeat the form of stacatto (repetition of consecutive syllable). The recordings were performed in quiet environment. The sampling rate used was 11025 Hz and resolution of 16 bits. For the realization of the acoustic analysis of the samples, were used programs Fonoview, version 1.1, Voxmetria, version 2.7 and Praat, version 4.6.22. The results were discussed and substantiated in the theory of the production of speech acoustics. The results found that the acoustic spectrografic analysis allows the tracking of acoustic parameters allowing a feedback treatment and monitoring, and a means objective and useful for the study of esophageal voice. There were figures for the frequency of acute formants, an increase of 37.29% in intensity after training phonological and shorter duration of spontaneous production of vowels and syllables as you can better control the esophagic voice , production becomes faster . From this study, it is expected that the acoustic spectrografic analysis adapted to be used in clinical practice as a reference method for the prognosis of patients totals laryngectomized in the process of phonological rehabilitation
|
2 |
Detecção de patologias em pregas vocais utilizando a seção Poincaré do espaço de fase tridimensional de um sinal de voz / Detection of pathologies in vocal fold by means of Poincaré section of the tridimensional phase space of a voice signalAndrade Sobrinho, Fernando Araujo de 02 September 2016 (has links)
Diversos estudos foram realizados para detecção de patologias na laringe. Essas patologias causam alteração na frequência, amplitude e formato de onda do sinal de voz e podem ser estudadas através dos parâmetros convencionais de análise como jitter e shimmer, ou sob o enfoque da dinâmica não linear. Essas técnicas são não invasivas e servem de apoio ao especialista da área de fonoaudiologia para o diagnóstico de patologias nas pregas vocais. As técnicas de análise acústica baseiam-se no formato de onda vocal no domínio do tempo e domínio da frequência, enquanto que a técnica de análise não linear utilizada nesse trabalho baseia-se no atrator reconstruído do sinal de voz. O objetivo dessa tese é diferenciar vozes normais e patológicas e entre patologias usando a técnica de análise não linear conhecida como Seção de Poincaré. Foram analisados 48 sinais de vozes humanas, divididos em 3 grupos (16 normais, 16 com nódulo e 16 com edema de Reinke). Em seguida foram selecionados 3 trechos de 500 ms nos intervalos 0.5s-1.0s, 2.0s-2.5s e 4.0s-4.5s chamado de primeiro critério e um trecho 500ms no trecho de maior variação de pitch, chamado de segundo critério. Em seguida, o atrator foi reconstruído em 3 dimensões, determinado o atrator médio, e de cada ponto do atrator médio foi extraída a seção de Poincaré. De cada seção de Poincaré foi calculada a dispersão dos pontos do atrator no plano através da média e desvio padrão das dispersão dos pontos da seção de Poincaré em relação ao ponto médio da seção. A validação da ferramenta desenvolvida para essa tese foi realizada utilizando um sinal senoidal inserindo jitter gradativamente, onde verificou-se uma variação proporcional da média da dispersão. Os resultados obtidos mostraram que não foi possível diferenciar patologias mas foi possível classificar vozes normais das patológicas. O melhor intervalo para classificar as vozes normais das patológicas utilizando o primeiro critério foi entre 0.5s-1.0s pois nesse intervalo todas as vozes normais foram classificadas corretamente. No entanto, 6 vozes patológicas foram classificadas como normais com 2 vozes patológicas na fronteira que separa as vozes normais das patológicas. O segundo critério classificou todas as vozes normais corretamente e apenas uma voz patológica foi classificada como patológica. Concluiu-se que a ferramenta proposta utilizando o segundo critério mostrou-se superior em relação ao primeiro critério para diferenciar vozes normais das patológicas. / Several studies have been performed to detect pathologies of the larynx. These pathologies cause changes in the frequency, amplitude, and waveform of the voice signal. They can be studied by means of conventional analysis parameters such as jitter and shimmer, or from nonlinear dynamics concepts. These techniques are noninvasive and can help the speech therapist to better diagnose the pathologies in the vocal folds. The acoustic analysis techniques are based on the voice waveform in the time and frequency domains, while the non-linear analysis techniques are based on the attractor reconstructed from the speech signal.The aim of this thesis is to differentiate normal and pathological voices using a nonlinear analysis technique named Poincaré section. We analyzed 48 human voice signals divided into 3 groups (16 normal, 16 nodule and 16 Reinke\'s edema). Then, we analyzed 3 stretches of 500ms in the intervals 0.5s-1.0s, 2.0s-2.5s e 4.0-4.5s, denominated first criteria, and a stretch of 500ms in a higher variation in pitch, denominated second criteria. The attractor was then reconstructed in three dimensions, the average attractor was determined, and at each point of the average attractor, a Poincaré section was extracted. From each Poincaré section, the dispersion of the points of the attractor was calculated in the plane by means of the statistical average and standard deviation related to the medium point of the section. The validation of the tool developed for this thesis was achieved by inserting jitter gradually in a sinusoidal wave, where there was a proportional variation of average\'s dispersion was observed. The results obtained for this set of voices showed that the average and standard deviation of dispersion of the points in the Poincaré section differentiate the groups of voices, but not the pathological groups. The Statistical tests of Anova and Tukey were used to analyze the 3 groups and all group pairings, two by two, with a statistical significance of 5%. The best interval to classify normal voices from pathological voices by means of the first criteria was between 0.5s-1.0s, given the fact that in this interval, all normal voices were correctly classified. However, 6 pathological voices were classified as normal voices, with 2 voices border lining the frontier between normal voices from pathological voices. The second criteria classified all normal voices correctly, with only one pathological voice incorrectly classified. In conclusion, the second criteria tool proposed by this thesis was proven superior to differentiate normal voices from pathological ones.
|
3 |
Produção de vogais do português brasileiro (pb) em pacientes laringectomizados totais: análise acústicaMoraes, Ana Carolina Calheiros de 11 August 2008 (has links)
Made available in DSpace on 2017-06-01T18:24:25Z (GMT). No. of bitstreams: 1
dissertacao_ana_carolina.pdf: 1620660 bytes, checksum: e0aa908548b1510131eddb6ac5addd3d (MD5)
Previous issue date: 2008-08-11 / From the acoustic-phonetic analysis of the sounds of speech (spectrogram), this dissertation aims to describe vocalic patterns of Brazilian Portuguese (BP) in patients without larynx, held at the beginning and after four months of phonological intervention but also compare these vocalics patterns of the total laryngectomized with other standards established in vocalics subject unchanged in accordance with the standards in the studies referred by Behlau (1984), and also verify that this method of measurement of acoustic analysis through the spectrogram would be a facilitator, an action appropriate, the prognosis for the process of rehabilitation in the issuance of vocalic production of total laryngectomized with therapy instituted. The measures were analyzed acoustic frequency of formants (in Hz), and duration and intensity of vocalic production of Brazilian Portuguese (BP) in patients laryngectomized. For this study, 10 subjects were selected in treatment at the Hospital Cancer of Pernambuco, with seven males and three females, submitted to the total withdrawal of the body laryngeal. The vowels analyzed the Brazilian Portuguese were the oral, presented orally to the participants to repeat, since the majority of the participants was illiterate, combined with the on / k / injector, or facilitating the issuance esophageal and required to repeat the form of stacatto (repetition of consecutive syllable). The recordings were performed in quiet environment. The sampling rate used was 11025 Hz and resolution of 16 bits. For the realization of the acoustic analysis of the samples, were used programs Fonoview, version 1.1, Voxmetria, version 2.7 and Praat, version 4.6.22. The results were discussed and substantiated in the theory of the production of speech acoustics. The results found that the acoustic spectrografic analysis allows the tracking of acoustic parameters allowing a feedback treatment and monitoring, and a means objective and useful for the study of esophageal voice. There were figures for the frequency of acute formants, an increase of 37.29% in intensity after training phonological and shorter duration of spontaneous production of vowels and syllables as you can better control the esophagic voice , production becomes faster . From this study, it is expected that the acoustic spectrografic analysis adapted to be used in clinical practice as a reference method for the prognosis of patients totals laryngectomized in the process of phonological rehabilitation / A partir da análise fonético-acústica dos sons da fala (espectrograma), esta dissertação busca descrever os padrões vocálicos do português brasileiro (PB) em pacientes laringectomizados totais, realizada no início e após quatro meses de intervenção fonoaudiológica, como também comparar esses padrões vocálicos dos laringectomizados totais com outros padrões vocálicos estabelecidos em sujeitos sem alterações de acordo com os padrões nos estudos referidos por Behlau (1984), e ainda verificar se este método de mensuração de análise acústica através do espectrograma será ou não um facilitador, um recurso adequado, para o prognóstico no processo de reabilitação na emissão da produção vocálica dos laringectomizados totais com a terapia instituída. As medidas acústicas analisadas foram freqüência dos formantes (em Hz) e duração e intensidade da produção vocálica do português brasileiro (PB) nos pacientes laringectomizados. Para este estudo, foram selecionados 10 sujeitos em tratamento no Hospital do Câncer de Pernambuco, sendo sete do sexo masculino e três do sexo feminino, submetidos à retirada total do órgão laríngeo. As vogais analisadas do português brasileiro foram as orais, apresentadas oralmente aos participantes para repetição, já que a maioria dos participantes era de analfabetos, combinados com a consoante /k/ injetora, ou seja, facilitadora da emissão esofágica e solicitada à repetição em forma de stacatto (repetição consecutiva da sílaba). As gravações foram realizadas em ambiente silencioso. A taxa de amostragem utilizada foi de 11025 Hz e resolução de 16 bits. Para a realização da análise acústica das amostras, foram utilizados os programas Fonoview, versão 1.1, Voxmetria, versão 2.7 e o Praat, versão 4.6.22. Os resultados foram discutidos e fundamentados na teoria acústica da produção de fala. Os resultados constataram que a análise acústica espectrográfica permite o monitoramento dos parâmetros acústicos possibilitando um feedback do tratamento e o acompanhamento, sendo um meio objetivo e útil para o estudo da voz esofágica. Verificaram-se valores agudos para a freqüência dos formantes, aumento de 37,29% de intensidade após treino fonoterápico e menor duração de produção espontânea das sílabas e vogais à medida que se consegue melhor controle da voz esofagiana, a produção torna-se mais rápida. A partir desse estudo, espera-se que a análise acústica espectrográfica seja utilizada e adaptada à prática clínica como um método de referência para o prognóstico dos pacientes laringectomizados totais no processo de reabilitação fonoterápica
|
4 |
Detecção de patologias em pregas vocais utilizando a seção Poincaré do espaço de fase tridimensional de um sinal de voz / Detection of pathologies in vocal fold by means of Poincaré section of the tridimensional phase space of a voice signalFernando Araujo de Andrade Sobrinho 02 September 2016 (has links)
Diversos estudos foram realizados para detecção de patologias na laringe. Essas patologias causam alteração na frequência, amplitude e formato de onda do sinal de voz e podem ser estudadas através dos parâmetros convencionais de análise como jitter e shimmer, ou sob o enfoque da dinâmica não linear. Essas técnicas são não invasivas e servem de apoio ao especialista da área de fonoaudiologia para o diagnóstico de patologias nas pregas vocais. As técnicas de análise acústica baseiam-se no formato de onda vocal no domínio do tempo e domínio da frequência, enquanto que a técnica de análise não linear utilizada nesse trabalho baseia-se no atrator reconstruído do sinal de voz. O objetivo dessa tese é diferenciar vozes normais e patológicas e entre patologias usando a técnica de análise não linear conhecida como Seção de Poincaré. Foram analisados 48 sinais de vozes humanas, divididos em 3 grupos (16 normais, 16 com nódulo e 16 com edema de Reinke). Em seguida foram selecionados 3 trechos de 500 ms nos intervalos 0.5s-1.0s, 2.0s-2.5s e 4.0s-4.5s chamado de primeiro critério e um trecho 500ms no trecho de maior variação de pitch, chamado de segundo critério. Em seguida, o atrator foi reconstruído em 3 dimensões, determinado o atrator médio, e de cada ponto do atrator médio foi extraída a seção de Poincaré. De cada seção de Poincaré foi calculada a dispersão dos pontos do atrator no plano através da média e desvio padrão das dispersão dos pontos da seção de Poincaré em relação ao ponto médio da seção. A validação da ferramenta desenvolvida para essa tese foi realizada utilizando um sinal senoidal inserindo jitter gradativamente, onde verificou-se uma variação proporcional da média da dispersão. Os resultados obtidos mostraram que não foi possível diferenciar patologias mas foi possível classificar vozes normais das patológicas. O melhor intervalo para classificar as vozes normais das patológicas utilizando o primeiro critério foi entre 0.5s-1.0s pois nesse intervalo todas as vozes normais foram classificadas corretamente. No entanto, 6 vozes patológicas foram classificadas como normais com 2 vozes patológicas na fronteira que separa as vozes normais das patológicas. O segundo critério classificou todas as vozes normais corretamente e apenas uma voz patológica foi classificada como patológica. Concluiu-se que a ferramenta proposta utilizando o segundo critério mostrou-se superior em relação ao primeiro critério para diferenciar vozes normais das patológicas. / Several studies have been performed to detect pathologies of the larynx. These pathologies cause changes in the frequency, amplitude, and waveform of the voice signal. They can be studied by means of conventional analysis parameters such as jitter and shimmer, or from nonlinear dynamics concepts. These techniques are noninvasive and can help the speech therapist to better diagnose the pathologies in the vocal folds. The acoustic analysis techniques are based on the voice waveform in the time and frequency domains, while the non-linear analysis techniques are based on the attractor reconstructed from the speech signal.The aim of this thesis is to differentiate normal and pathological voices using a nonlinear analysis technique named Poincaré section. We analyzed 48 human voice signals divided into 3 groups (16 normal, 16 nodule and 16 Reinke\'s edema). Then, we analyzed 3 stretches of 500ms in the intervals 0.5s-1.0s, 2.0s-2.5s e 4.0-4.5s, denominated first criteria, and a stretch of 500ms in a higher variation in pitch, denominated second criteria. The attractor was then reconstructed in three dimensions, the average attractor was determined, and at each point of the average attractor, a Poincaré section was extracted. From each Poincaré section, the dispersion of the points of the attractor was calculated in the plane by means of the statistical average and standard deviation related to the medium point of the section. The validation of the tool developed for this thesis was achieved by inserting jitter gradually in a sinusoidal wave, where there was a proportional variation of average\'s dispersion was observed. The results obtained for this set of voices showed that the average and standard deviation of dispersion of the points in the Poincaré section differentiate the groups of voices, but not the pathological groups. The Statistical tests of Anova and Tukey were used to analyze the 3 groups and all group pairings, two by two, with a statistical significance of 5%. The best interval to classify normal voices from pathological voices by means of the first criteria was between 0.5s-1.0s, given the fact that in this interval, all normal voices were correctly classified. However, 6 pathological voices were classified as normal voices, with 2 voices border lining the frontier between normal voices from pathological voices. The second criteria classified all normal voices correctly, with only one pathological voice incorrectly classified. In conclusion, the second criteria tool proposed by this thesis was proven superior to differentiate normal voices from pathological ones.
|
Page generated in 0.0859 seconds