Spelling suggestions: "subject:"análise acústica dde voz"" "subject:"análise acústica dee voz""
1 |
Perfis acústicos para caracterização de patologias da laringe / not availableMori, Ricardo Naoki 16 June 2005 (has links)
A caracterização das patologias da laringe até o presente momento é predominantemente realizada de forma qualitativa. Alguns trabalhos recentes têm quantificados parâmetros acústicos no intuito de discriminar as diversas patologias. Este trabalho verifica os valores médios das diversas medidas acústicas da voz e as relaciona com as diferentes patologias. Desta forma, futuramente será possível utilizar estes valores para quantificar e acompanhar diferentes estágios do tratamento da patologia. O conjunto de valores médios compõem o que chamamos de perfil acústico. / Until now the characterization of larynx pathologies has been done in a subjective manner. Recently some researches have been conducted in order to quantify acoustic parameters mainly to discriminate the larynx pathologies. In this work several acoustic parameters of voice was evaluated and their correlation with the pathologies were established. In the future, would be possible to use these parameters to quantify and to follow the therapy procedures. These values constitute the acoustic profile of the pathologies.
|
2 |
Estudo sobre o "VOT" na aquisição das plosivas do português brasileiroMILHEIRA, Raquel Vaz 22 May 2017 (has links)
Submitted by Cristiane Chim (cristiane.chim@ucpel.edu.br) on 2017-12-19T10:56:48Z
No. of bitstreams: 1
Tese Raquel Vaz Milheira.pdf: 1884697 bytes, checksum: 35ee30e38b6f26db68afe1d551d96ed3 (MD5) / Made available in DSpace on 2017-12-19T10:56:48Z (GMT). No. of bitstreams: 1
Tese Raquel Vaz Milheira.pdf: 1884697 bytes, checksum: 35ee30e38b6f26db68afe1d551d96ed3 (MD5)
Previous issue date: 2017-05-22 / This study aims to investigate the role that VOT (Voice Onset Time) fulfills in process
of acquisition of the voicing contrast between the stop segments that integrate the phonology
of Brasilian Portuguese (PB). Children studied belong to a community in Rio Grande do Sul,
Vista Alegre do Prata, which uses a variant of PB that still maintains contact with Polish and
Italian, languages spoken by the older generations and that permeate the linguistic
environment of family and regional contact. The research focuses on the VOT as a phonetic
clue that can be used in the process of language acquisition, mainly for the establishment of
the phonological value of the feature [voice], but which can also support the determination of
the contrast between the place feature [ labial], [coronal] and [dorsal] in the class of stop
consonants. In the discussion of the phonetic and phonological development process, through
the analysis of VOT values in the class of stop consonants of PB the relationship between the
linguistic forms of the children and those of their Caregivers is addressed. The corpus of this
research consisted of linguistic data from four children aged 1: 4 to 2: 2, two boys and two
girls; they are data of spontaneous speech that belong to the bank constituted by Souza
(2015). From the corpus, all the target words that presented stop consonants were transcribed
and submitted to acoustic analysis in the Praat program. The VOT values of each segment for
each child were recorded, as well as the VOT values of the stop produced by their Caregivers.
The analysis of the results showed that the children of Vista Alegre do Prata, in the process of
acquiring Portuguese stops, suffer a preponderant influence of their Caregivers and that the
VOT can be used as the primary clue for the acquisition of the phonological value of the
feature [± voice] and can still be used as a secondary clue for the acquisition of place contrast
in phonology of PB stop consonant class.
Key words: Phonological acquisition; Portuguese stops; VOT; Acoustic analysis; [voicing]
Feature; Place features. / Este estudo visa a investigar o papel que o VOT (Voice Onset Time) cumpre no
processo de aquisição do contraste de vozeamento entre os segmentos plosivos que integram a
fonologia do português brasileiro (PB). As crianças pesquisadas pertencem a uma
comunidade do Rio Grande do Sul, Vista Alegre do Prata, que utiliza uma variante do PB que
ainda mantém contato com o polonês e o italiano, línguas faladas pelas gerações de idade
mais avançada e que permeiam o ambiente linguístico das crianças pelo contato familiar e
regional. A investigação tem o foco no VOT como pista fonética que pode ser utilizada, no
processo de aquisição da linguagem, principalmente para o estabelecimento do valor
fonológico do traço [voz], mas que também pode subsidiar a determinação do contraste entre
os traços de ponto [labial], [coronal] e [dorsal] na classe das consoantes plosivas. Na
discussão do processo de desenvolvimento fonético e fonológico, por meio da análise dos
valores de VOT na classe das plosivas do PB, é abordada a relação entre as formas
linguísticas das crianças e as de seus Cuidadores. O corpus desta pesquisa foi constituído por
dados linguísticos de quatro crianças acompanhadas desde 1:4 até 2:2 de idade, dois meninos
e duas meninas; são dados de fala espontânea que pertencem ao banco constituído por Souza
(2015). Do corpus, todas as palavras-alvo que apresentavam consoantes plosivas foram
transcritas e submetidas à análise acústica no programa Praat. Foram registrados os valores
de VOT de cada segmento para cada criança, assim como os valores de VOT das plosivas
produzidas por seus Cuidadores. A análise dos resultados mostrou que as crianças de Vista
Alegre do Prata, no processo de aquisição das plosivas do português, sofrem preponderante
influência dos seus Cuidadores e que o VOT pode ser por elas utilizado como pista primária
para a aquisição do valor fonológico do traço [±voz] e pode ainda ser utilizado como pista
secundária para a aquisição do contraste de ponto na fonologia da classe das consoantes
plosivas do PB.
|
3 |
Perfis acústicos para caracterização de patologias da laringe / not availableRicardo Naoki Mori 16 June 2005 (has links)
A caracterização das patologias da laringe até o presente momento é predominantemente realizada de forma qualitativa. Alguns trabalhos recentes têm quantificados parâmetros acústicos no intuito de discriminar as diversas patologias. Este trabalho verifica os valores médios das diversas medidas acústicas da voz e as relaciona com as diferentes patologias. Desta forma, futuramente será possível utilizar estes valores para quantificar e acompanhar diferentes estágios do tratamento da patologia. O conjunto de valores médios compõem o que chamamos de perfil acústico. / Until now the characterization of larynx pathologies has been done in a subjective manner. Recently some researches have been conducted in order to quantify acoustic parameters mainly to discriminate the larynx pathologies. In this work several acoustic parameters of voice was evaluated and their correlation with the pathologies were established. In the future, would be possible to use these parameters to quantify and to follow the therapy procedures. These values constitute the acoustic profile of the pathologies.
|
4 |
Produção de vogais do português brasileiro (pb) em pacientes laringectomizados totais: análise acústicaAna Carolina Calheiros de Moraes 11 August 2008 (has links)
A partir da análise fonético-acústica dos sons da fala (espectrograma), esta dissertação busca descrever os padrões vocálicos do português brasileiro (PB) em pacientes laringectomizados totais, realizada no início e após quatro meses de intervenção fonoaudiológica, como também comparar esses padrões vocálicos dos laringectomizados totais com outros padrões vocálicos estabelecidos em sujeitos sem alterações de acordo com os padrões nos estudos referidos por Behlau (1984), e ainda verificar se este método de mensuração de análise acústica através do espectrograma será ou não um facilitador, um recurso adequado, para o prognóstico no processo de reabilitação na emissão da produção vocálica dos laringectomizados totais com a terapia instituída. As medidas acústicas analisadas foram freqüência dos formantes (em Hz) e duração e intensidade da produção vocálica do português brasileiro (PB) nos pacientes laringectomizados. Para este estudo, foram selecionados 10 sujeitos em tratamento no Hospital do Câncer de Pernambuco, sendo sete do sexo masculino e três do sexo feminino, submetidos à retirada total do órgão laríngeo. As vogais analisadas do português brasileiro foram as orais, apresentadas oralmente aos participantes para repetição, já que a maioria dos participantes era de analfabetos, combinados com a consoante /k/ injetora, ou seja, facilitadora da emissão esofágica e solicitada à repetição em forma de stacatto (repetição consecutiva da sílaba). As gravações foram realizadas em ambiente silencioso. A taxa de amostragem utilizada foi de 11025 Hz e resolução de 16 bits. Para a realização da análise acústica das amostras, foram utilizados os programas Fonoview, versão 1.1, Voxmetria, versão 2.7 e o Praat, versão 4.6.22. Os resultados foram discutidos e fundamentados na teoria acústica da produção de fala. Os resultados constataram que a análise acústica espectrográfica permite o monitoramento dos parâmetros acústicos possibilitando um feedback do tratamento e o acompanhamento, sendo um meio objetivo e útil para o estudo da voz esofágica. Verificaram-se valores agudos para a freqüência dos formantes, aumento de 37,29% de intensidade após treino fonoterápico e menor duração de produção espontânea das sílabas e vogais à medida que se consegue melhor controle da voz esofagiana, a produção torna-se mais rápida. A partir desse estudo, espera-se que a análise acústica espectrográfica seja utilizada e adaptada à prática clínica como um método de referência para o prognóstico dos pacientes laringectomizados totais no processo de reabilitação fonoterápica / From the acoustic-phonetic analysis of the sounds of speech (spectrogram), this dissertation aims to describe vocalic patterns of Brazilian Portuguese (BP) in patients without larynx, held at the beginning and after four months of phonological intervention but also compare these vocalics patterns of the total laryngectomized with other standards established in vocalics subject unchanged in accordance with the standards in the studies referred by Behlau (1984), and also verify that this method of measurement of acoustic analysis through the spectrogram would be a facilitator, an action appropriate, the prognosis for the process of rehabilitation in the issuance of vocalic production of total laryngectomized with therapy instituted. The measures were analyzed acoustic frequency of formants (in Hz), and duration and intensity of vocalic production of Brazilian Portuguese (BP) in patients laryngectomized. For this study, 10 subjects were selected in treatment at the Hospital Cancer of Pernambuco, with seven males and three females, submitted to the total withdrawal of the body laryngeal. The vowels analyzed the Brazilian Portuguese were the oral, presented orally to the participants to repeat, since the majority of the participants was illiterate, combined with the on / k / injector, or facilitating the issuance esophageal and required to repeat the form of stacatto (repetition of consecutive syllable). The recordings were performed in quiet environment. The sampling rate used was 11025 Hz and resolution of 16 bits. For the realization of the acoustic analysis of the samples, were used programs Fonoview, version 1.1, Voxmetria, version 2.7 and Praat, version 4.6.22. The results were discussed and substantiated in the theory of the production of speech acoustics. The results found that the acoustic spectrografic analysis allows the tracking of acoustic parameters allowing a feedback treatment and monitoring, and a means objective and useful for the study of esophageal voice. There were figures for the frequency of acute formants, an increase of 37.29% in intensity after training phonological and shorter duration of spontaneous production of vowels and syllables as you can better control the esophagic voice , production becomes faster . From this study, it is expected that the acoustic spectrografic analysis adapted to be used in clinical practice as a reference method for the prognosis of patients totals laryngectomized in the process of phonological rehabilitation
|
5 |
Análise acústica da voz para pré-diagnóstico de patologias da laringe / Acoustical analysis of voice for pre-diagnosis of laryngeal pathologiesRosa, Marcelo de Oliveira 09 March 1998 (has links)
\"Ver o corpo humano por dentro\" sem a necessidade de intervenção cirurgica é objetivo que motivou a criação de diversos instrumentos como eletrocardiogramas, eletroencefalogramas, equipamentos de ressonância magnética e raio-X. Através daavaliação de imagens ou resultados numéricos, pode-se detectar patologias nos primeiros estágios, permitindo uma ação decisiva de especialistas médicos na cura destas. Especialistas da fala normalmente empregam instrumentos comovideolaringoscopia e videoestroboscopia para avaliar qualitativamente o comportamento da laringe e pregas vocais. Comprendendo que a voz transmite informações sobre alterações orgânicas ou funcionais nas estruturas de vocalização, este trabalhoapresenta um conjunto de medidas acústicas neste sinal que evidenciam alterações na periodicidade do movimento das cordas vocais e quantidade de ruído turbulento que atravessa a glote. A partir de avaliação estatística da capacidadedescriminatória destes índices acústicos e empregando-se redes neurais artificiais, define-se um método automático para identificação probabilística das patologias que afetam as estruturas da laringe. / \"To see the inside of the human body\" without the necessity of surgical intervention is the objective that motivates the conception of several instruments like electrocardiogram, electroencephalongram, magnetic resonance and X-ray equipments. Through the image analysis or numerical results, it is possible to identify pathologies, allowing a decisive action of physician specialists in cure of these. Voice specialists, normally, use instruments as videolaryngoscopy and videostroboscopy to assess the vocal folds and larynx comportment, qualitatively. Understanding that the voice transmits information upon functional or organic alterations in vocalization structures, this work presents a set of acoustic measurements, based on this signal, that evidences alterations on vocal folds movement periodicity and quantify of turbulent noise throught the glottis. From the statistic evaluation of discriminatory capacity of these acoustic indexes and using artificial neural networks, it defines an automatic method for the probabilistic identification of pathologies that affect the laryngeal structures.
|
6 |
Detecção de patologias em pregas vocais utilizando a seção Poincaré do espaço de fase tridimensional de um sinal de voz / Detection of pathologies in vocal fold by means of Poincaré section of the tridimensional phase space of a voice signalAndrade Sobrinho, Fernando Araujo de 02 September 2016 (has links)
Diversos estudos foram realizados para detecção de patologias na laringe. Essas patologias causam alteração na frequência, amplitude e formato de onda do sinal de voz e podem ser estudadas através dos parâmetros convencionais de análise como jitter e shimmer, ou sob o enfoque da dinâmica não linear. Essas técnicas são não invasivas e servem de apoio ao especialista da área de fonoaudiologia para o diagnóstico de patologias nas pregas vocais. As técnicas de análise acústica baseiam-se no formato de onda vocal no domínio do tempo e domínio da frequência, enquanto que a técnica de análise não linear utilizada nesse trabalho baseia-se no atrator reconstruído do sinal de voz. O objetivo dessa tese é diferenciar vozes normais e patológicas e entre patologias usando a técnica de análise não linear conhecida como Seção de Poincaré. Foram analisados 48 sinais de vozes humanas, divididos em 3 grupos (16 normais, 16 com nódulo e 16 com edema de Reinke). Em seguida foram selecionados 3 trechos de 500 ms nos intervalos 0.5s-1.0s, 2.0s-2.5s e 4.0s-4.5s chamado de primeiro critério e um trecho 500ms no trecho de maior variação de pitch, chamado de segundo critério. Em seguida, o atrator foi reconstruído em 3 dimensões, determinado o atrator médio, e de cada ponto do atrator médio foi extraída a seção de Poincaré. De cada seção de Poincaré foi calculada a dispersão dos pontos do atrator no plano através da média e desvio padrão das dispersão dos pontos da seção de Poincaré em relação ao ponto médio da seção. A validação da ferramenta desenvolvida para essa tese foi realizada utilizando um sinal senoidal inserindo jitter gradativamente, onde verificou-se uma variação proporcional da média da dispersão. Os resultados obtidos mostraram que não foi possível diferenciar patologias mas foi possível classificar vozes normais das patológicas. O melhor intervalo para classificar as vozes normais das patológicas utilizando o primeiro critério foi entre 0.5s-1.0s pois nesse intervalo todas as vozes normais foram classificadas corretamente. No entanto, 6 vozes patológicas foram classificadas como normais com 2 vozes patológicas na fronteira que separa as vozes normais das patológicas. O segundo critério classificou todas as vozes normais corretamente e apenas uma voz patológica foi classificada como patológica. Concluiu-se que a ferramenta proposta utilizando o segundo critério mostrou-se superior em relação ao primeiro critério para diferenciar vozes normais das patológicas. / Several studies have been performed to detect pathologies of the larynx. These pathologies cause changes in the frequency, amplitude, and waveform of the voice signal. They can be studied by means of conventional analysis parameters such as jitter and shimmer, or from nonlinear dynamics concepts. These techniques are noninvasive and can help the speech therapist to better diagnose the pathologies in the vocal folds. The acoustic analysis techniques are based on the voice waveform in the time and frequency domains, while the non-linear analysis techniques are based on the attractor reconstructed from the speech signal.The aim of this thesis is to differentiate normal and pathological voices using a nonlinear analysis technique named Poincaré section. We analyzed 48 human voice signals divided into 3 groups (16 normal, 16 nodule and 16 Reinke\'s edema). Then, we analyzed 3 stretches of 500ms in the intervals 0.5s-1.0s, 2.0s-2.5s e 4.0-4.5s, denominated first criteria, and a stretch of 500ms in a higher variation in pitch, denominated second criteria. The attractor was then reconstructed in three dimensions, the average attractor was determined, and at each point of the average attractor, a Poincaré section was extracted. From each Poincaré section, the dispersion of the points of the attractor was calculated in the plane by means of the statistical average and standard deviation related to the medium point of the section. The validation of the tool developed for this thesis was achieved by inserting jitter gradually in a sinusoidal wave, where there was a proportional variation of average\'s dispersion was observed. The results obtained for this set of voices showed that the average and standard deviation of dispersion of the points in the Poincaré section differentiate the groups of voices, but not the pathological groups. The Statistical tests of Anova and Tukey were used to analyze the 3 groups and all group pairings, two by two, with a statistical significance of 5%. The best interval to classify normal voices from pathological voices by means of the first criteria was between 0.5s-1.0s, given the fact that in this interval, all normal voices were correctly classified. However, 6 pathological voices were classified as normal voices, with 2 voices border lining the frontier between normal voices from pathological voices. The second criteria classified all normal voices correctly, with only one pathological voice incorrectly classified. In conclusion, the second criteria tool proposed by this thesis was proven superior to differentiate normal voices from pathological ones.
|
7 |
Análise acústica da voz para pré-diagnóstico de patologias da laringe / Acoustical analysis of voice for pre-diagnosis of laryngeal pathologiesMarcelo de Oliveira Rosa 09 March 1998 (has links)
\"Ver o corpo humano por dentro\" sem a necessidade de intervenção cirurgica é objetivo que motivou a criação de diversos instrumentos como eletrocardiogramas, eletroencefalogramas, equipamentos de ressonância magnética e raio-X. Através daavaliação de imagens ou resultados numéricos, pode-se detectar patologias nos primeiros estágios, permitindo uma ação decisiva de especialistas médicos na cura destas. Especialistas da fala normalmente empregam instrumentos comovideolaringoscopia e videoestroboscopia para avaliar qualitativamente o comportamento da laringe e pregas vocais. Comprendendo que a voz transmite informações sobre alterações orgânicas ou funcionais nas estruturas de vocalização, este trabalhoapresenta um conjunto de medidas acústicas neste sinal que evidenciam alterações na periodicidade do movimento das cordas vocais e quantidade de ruído turbulento que atravessa a glote. A partir de avaliação estatística da capacidadedescriminatória destes índices acústicos e empregando-se redes neurais artificiais, define-se um método automático para identificação probabilística das patologias que afetam as estruturas da laringe. / \"To see the inside of the human body\" without the necessity of surgical intervention is the objective that motivates the conception of several instruments like electrocardiogram, electroencephalongram, magnetic resonance and X-ray equipments. Through the image analysis or numerical results, it is possible to identify pathologies, allowing a decisive action of physician specialists in cure of these. Voice specialists, normally, use instruments as videolaryngoscopy and videostroboscopy to assess the vocal folds and larynx comportment, qualitatively. Understanding that the voice transmits information upon functional or organic alterations in vocalization structures, this work presents a set of acoustic measurements, based on this signal, that evidences alterations on vocal folds movement periodicity and quantify of turbulent noise throught the glottis. From the statistic evaluation of discriminatory capacity of these acoustic indexes and using artificial neural networks, it defines an automatic method for the probabilistic identification of pathologies that affect the laryngeal structures.
|
8 |
Produção de vogais do português brasileiro (pb) em pacientes laringectomizados totais: análise acústicaMoraes, Ana Carolina Calheiros de 11 August 2008 (has links)
Made available in DSpace on 2017-06-01T18:24:25Z (GMT). No. of bitstreams: 1
dissertacao_ana_carolina.pdf: 1620660 bytes, checksum: e0aa908548b1510131eddb6ac5addd3d (MD5)
Previous issue date: 2008-08-11 / From the acoustic-phonetic analysis of the sounds of speech (spectrogram), this dissertation aims to describe vocalic patterns of Brazilian Portuguese (BP) in patients without larynx, held at the beginning and after four months of phonological intervention but also compare these vocalics patterns of the total laryngectomized with other standards established in vocalics subject unchanged in accordance with the standards in the studies referred by Behlau (1984), and also verify that this method of measurement of acoustic analysis through the spectrogram would be a facilitator, an action appropriate, the prognosis for the process of rehabilitation in the issuance of vocalic production of total laryngectomized with therapy instituted. The measures were analyzed acoustic frequency of formants (in Hz), and duration and intensity of vocalic production of Brazilian Portuguese (BP) in patients laryngectomized. For this study, 10 subjects were selected in treatment at the Hospital Cancer of Pernambuco, with seven males and three females, submitted to the total withdrawal of the body laryngeal. The vowels analyzed the Brazilian Portuguese were the oral, presented orally to the participants to repeat, since the majority of the participants was illiterate, combined with the on / k / injector, or facilitating the issuance esophageal and required to repeat the form of stacatto (repetition of consecutive syllable). The recordings were performed in quiet environment. The sampling rate used was 11025 Hz and resolution of 16 bits. For the realization of the acoustic analysis of the samples, were used programs Fonoview, version 1.1, Voxmetria, version 2.7 and Praat, version 4.6.22. The results were discussed and substantiated in the theory of the production of speech acoustics. The results found that the acoustic spectrografic analysis allows the tracking of acoustic parameters allowing a feedback treatment and monitoring, and a means objective and useful for the study of esophageal voice. There were figures for the frequency of acute formants, an increase of 37.29% in intensity after training phonological and shorter duration of spontaneous production of vowels and syllables as you can better control the esophagic voice , production becomes faster . From this study, it is expected that the acoustic spectrografic analysis adapted to be used in clinical practice as a reference method for the prognosis of patients totals laryngectomized in the process of phonological rehabilitation / A partir da análise fonético-acústica dos sons da fala (espectrograma), esta dissertação busca descrever os padrões vocálicos do português brasileiro (PB) em pacientes laringectomizados totais, realizada no início e após quatro meses de intervenção fonoaudiológica, como também comparar esses padrões vocálicos dos laringectomizados totais com outros padrões vocálicos estabelecidos em sujeitos sem alterações de acordo com os padrões nos estudos referidos por Behlau (1984), e ainda verificar se este método de mensuração de análise acústica através do espectrograma será ou não um facilitador, um recurso adequado, para o prognóstico no processo de reabilitação na emissão da produção vocálica dos laringectomizados totais com a terapia instituída. As medidas acústicas analisadas foram freqüência dos formantes (em Hz) e duração e intensidade da produção vocálica do português brasileiro (PB) nos pacientes laringectomizados. Para este estudo, foram selecionados 10 sujeitos em tratamento no Hospital do Câncer de Pernambuco, sendo sete do sexo masculino e três do sexo feminino, submetidos à retirada total do órgão laríngeo. As vogais analisadas do português brasileiro foram as orais, apresentadas oralmente aos participantes para repetição, já que a maioria dos participantes era de analfabetos, combinados com a consoante /k/ injetora, ou seja, facilitadora da emissão esofágica e solicitada à repetição em forma de stacatto (repetição consecutiva da sílaba). As gravações foram realizadas em ambiente silencioso. A taxa de amostragem utilizada foi de 11025 Hz e resolução de 16 bits. Para a realização da análise acústica das amostras, foram utilizados os programas Fonoview, versão 1.1, Voxmetria, versão 2.7 e o Praat, versão 4.6.22. Os resultados foram discutidos e fundamentados na teoria acústica da produção de fala. Os resultados constataram que a análise acústica espectrográfica permite o monitoramento dos parâmetros acústicos possibilitando um feedback do tratamento e o acompanhamento, sendo um meio objetivo e útil para o estudo da voz esofágica. Verificaram-se valores agudos para a freqüência dos formantes, aumento de 37,29% de intensidade após treino fonoterápico e menor duração de produção espontânea das sílabas e vogais à medida que se consegue melhor controle da voz esofagiana, a produção torna-se mais rápida. A partir desse estudo, espera-se que a análise acústica espectrográfica seja utilizada e adaptada à prática clínica como um método de referência para o prognóstico dos pacientes laringectomizados totais no processo de reabilitação fonoterápica
|
9 |
Detecção de patologias em pregas vocais utilizando a seção Poincaré do espaço de fase tridimensional de um sinal de voz / Detection of pathologies in vocal fold by means of Poincaré section of the tridimensional phase space of a voice signalFernando Araujo de Andrade Sobrinho 02 September 2016 (has links)
Diversos estudos foram realizados para detecção de patologias na laringe. Essas patologias causam alteração na frequência, amplitude e formato de onda do sinal de voz e podem ser estudadas através dos parâmetros convencionais de análise como jitter e shimmer, ou sob o enfoque da dinâmica não linear. Essas técnicas são não invasivas e servem de apoio ao especialista da área de fonoaudiologia para o diagnóstico de patologias nas pregas vocais. As técnicas de análise acústica baseiam-se no formato de onda vocal no domínio do tempo e domínio da frequência, enquanto que a técnica de análise não linear utilizada nesse trabalho baseia-se no atrator reconstruído do sinal de voz. O objetivo dessa tese é diferenciar vozes normais e patológicas e entre patologias usando a técnica de análise não linear conhecida como Seção de Poincaré. Foram analisados 48 sinais de vozes humanas, divididos em 3 grupos (16 normais, 16 com nódulo e 16 com edema de Reinke). Em seguida foram selecionados 3 trechos de 500 ms nos intervalos 0.5s-1.0s, 2.0s-2.5s e 4.0s-4.5s chamado de primeiro critério e um trecho 500ms no trecho de maior variação de pitch, chamado de segundo critério. Em seguida, o atrator foi reconstruído em 3 dimensões, determinado o atrator médio, e de cada ponto do atrator médio foi extraída a seção de Poincaré. De cada seção de Poincaré foi calculada a dispersão dos pontos do atrator no plano através da média e desvio padrão das dispersão dos pontos da seção de Poincaré em relação ao ponto médio da seção. A validação da ferramenta desenvolvida para essa tese foi realizada utilizando um sinal senoidal inserindo jitter gradativamente, onde verificou-se uma variação proporcional da média da dispersão. Os resultados obtidos mostraram que não foi possível diferenciar patologias mas foi possível classificar vozes normais das patológicas. O melhor intervalo para classificar as vozes normais das patológicas utilizando o primeiro critério foi entre 0.5s-1.0s pois nesse intervalo todas as vozes normais foram classificadas corretamente. No entanto, 6 vozes patológicas foram classificadas como normais com 2 vozes patológicas na fronteira que separa as vozes normais das patológicas. O segundo critério classificou todas as vozes normais corretamente e apenas uma voz patológica foi classificada como patológica. Concluiu-se que a ferramenta proposta utilizando o segundo critério mostrou-se superior em relação ao primeiro critério para diferenciar vozes normais das patológicas. / Several studies have been performed to detect pathologies of the larynx. These pathologies cause changes in the frequency, amplitude, and waveform of the voice signal. They can be studied by means of conventional analysis parameters such as jitter and shimmer, or from nonlinear dynamics concepts. These techniques are noninvasive and can help the speech therapist to better diagnose the pathologies in the vocal folds. The acoustic analysis techniques are based on the voice waveform in the time and frequency domains, while the non-linear analysis techniques are based on the attractor reconstructed from the speech signal.The aim of this thesis is to differentiate normal and pathological voices using a nonlinear analysis technique named Poincaré section. We analyzed 48 human voice signals divided into 3 groups (16 normal, 16 nodule and 16 Reinke\'s edema). Then, we analyzed 3 stretches of 500ms in the intervals 0.5s-1.0s, 2.0s-2.5s e 4.0-4.5s, denominated first criteria, and a stretch of 500ms in a higher variation in pitch, denominated second criteria. The attractor was then reconstructed in three dimensions, the average attractor was determined, and at each point of the average attractor, a Poincaré section was extracted. From each Poincaré section, the dispersion of the points of the attractor was calculated in the plane by means of the statistical average and standard deviation related to the medium point of the section. The validation of the tool developed for this thesis was achieved by inserting jitter gradually in a sinusoidal wave, where there was a proportional variation of average\'s dispersion was observed. The results obtained for this set of voices showed that the average and standard deviation of dispersion of the points in the Poincaré section differentiate the groups of voices, but not the pathological groups. The Statistical tests of Anova and Tukey were used to analyze the 3 groups and all group pairings, two by two, with a statistical significance of 5%. The best interval to classify normal voices from pathological voices by means of the first criteria was between 0.5s-1.0s, given the fact that in this interval, all normal voices were correctly classified. However, 6 pathological voices were classified as normal voices, with 2 voices border lining the frontier between normal voices from pathological voices. The second criteria classified all normal voices correctly, with only one pathological voice incorrectly classified. In conclusion, the second criteria tool proposed by this thesis was proven superior to differentiate normal voices from pathological ones.
|
10 |
Análise acústica para classificação de patologias da voz empregando análise de Componentes Principais, Redes Neurais Artificiais e Máquina de vetores de Suporte.ESPINOLA, Sérgio de Brito. 19 September 2017 (has links)
Submitted by Johnny Rodrigues (johnnyrodrigues@ufcg.edu.br) on 2017-09-19T15:36:01Z
No. of bitstreams: 1
Dissertacao_SergioEspinola_CEEI_UFCG.pdf: 59559230 bytes, checksum: 045a4738e365ab656e17da8b2185cb9b (MD5) / Made available in DSpace on 2017-09-19T15:36:01Z (GMT). No. of bitstreams: 1
Dissertacao_SergioEspinola_CEEI_UFCG.pdf: 59559230 bytes, checksum: 045a4738e365ab656e17da8b2185cb9b (MD5)
Previous issue date: 2014-03-12 / Estima-se que um terço da força de trabalho humana dependa da voz para
realização de seus ofícios. Procedimentos médicos avaliam a qualidade vocal do
indivíduo sendo os mais usados aqueles baseados na escuta da voz (subjetivo)
ou na inspeção das dobras (ou pregas) vocais por exames sofisticados
(objetivos, porém invasivos e caros). A análise acústica da voz busca extrair
medidas robustas para descrever vários fenômenos associados à produção da
fala ou características intrínsecas do ser humano como frequência fundamental,
timbre, etc. O presente estudo consiste na caracterização de um modelo de
processamento digital de Voz para apoio ao diagnóstico no contexto da
construção de sistemas de identificação automatizados de patologias da fala.
Para análise da técnica proposta foi utilizada uma base de dados (base KAY) que
foi estruturada por especialistas num arranjo de seis grupos de Patologias. A
esse, acrescentado também um de vozes “Normal”. Assim, 182 vozes foram
escolhidas, as quais dispunham de um catálogo indexado de cerca de 33
descritores, para cada voz, calculados da elocução da vogal \a\ sustentada. Ao
selecionar combinações desses descritores – como perturbações em frequência
(jitter), em amplitude (shimmer) etc, este estudo encontrou evidências
estatísticas e mostrou ser possível: a) Separar vozes normais das patológicas –
esperado, b) Separar patologias específicas (Paralisia, Edema de Reinke,
Nódulos) com acurácia de 100% (para a grande maioria dessas combinações) e
cerca de 92% (para Nódulos contra Reinke); c) Discriminá-las por meio de
classificadores (redes neurais artificiais e máquina de vetores de suporte) e
reduzir a dimensionalidade e complexidade (quantidade de dados) via técnica de
análise de componentes principais (ACP) sobre esses descritores para a
separação intra patologias; e d) Testes estatísticos com os grupos locais
confirmaram também limiares de indícios de Anormalidade presentes na
literatura. A utilização de menor quantidade de descritores – obtida pós ACP
(compressão) – mostrou-se também eficiente (mesmas taxas de acurácia). / It is estimated one-third of the work force relies on the use the voice in their jobs. The clinical diagnostic may be performed on voice listening by a specialist (subjective perspective) or through invasive and often not cheaper exams to
check vocal structures. The area of Voice Acoustic analyses aims to extract
robust measurements to describe several phenomena associated with voice
production, or human being particular characteristics like fundamental frequency,
timbre, etc. This study consisted of a model characterizing the digital voice
processing for support in building automatic systems for the identification of
disorders of speech (to aid diagnosis of pathologies). To support this
investigation and proposed model, a commercial voice database (KAY base) was
used with the endorsement from medical specialists. Derived acoustic analyses of
those speech samples data records were presented to professionals for
classification and six “severities groups” case-studied were built. After these
analyses, one Normal group was added and, at the end, 182 voices have been
selected. Their refined audio database contain, among other things, an indexed
list of vocal descriptors calculated on the presence of the utterance of the vowel
\a\ sustained speech. Statistical evidences were found: a) Difference between
pathological groups vocal descriptors to normal (expected); b) It was achieved
100% from true positive, most cases, among Paralysis, Reinke's Edema and
Nodules separations; c) from few cases, there were detected minor distinctions:
Paralysis, Reinke's Edema, Nodules and Edema (pair comparison) with
disordered groups; c) Among Machine Learning Algorithms (artificial neural
networks "RN" and support vector machine "SVM"), the technique of Principal
Components Analyses (PCA) and main statistics performed, it was found facts to
help to structure some automated recognition systems. These Supervised
learning methods showed that it could be possible to generate classification
predictions (disordered presence) for the response to new data; and d) Inner
tests also confirmed literature established reference thresholds. Hence
considering suitable combinations of descriptors with two machine learning
classifiers, as showed, is sufficient suitable and worthy.
|
Page generated in 0.0774 seconds