Spelling suggestions: "subject:"epeech production measure"" "subject:"cpeech production measure""
1 |
Avaliação de qualidade vocal com motivação fonética: análise integrada de dados de percepção e acústica / Vocal quality evaluation with phonetical motivation: integrated analisys of perception and acoustic dataSilva, Maria Fabiana Bonfim de Lima 22 June 2012 (has links)
Made available in DSpace on 2016-04-28T18:22:31Z (GMT). No. of bitstreams: 1
Maria Fabiana Bonfim de Lima Silva.pdf: 10169308 bytes, checksum: 0cc84e0e17f2254fc5039a44b84c1664 (MD5)
Previous issue date: 2012-06-22 / Coordenação de Aperfeiçoamento de Pessoal de Nível Superior / AIM: to verify whether the phonetic nature script Vocal Profile Analysis Scheme can be applied to
Brazilian Portuguese (VPAS-BP) or not, for the perceptive evaluation of quality and vocal dynamics
of speech samples in a group of teachers with vocal disturbs and laryngeal changes from two public
schools in Sorocaba city (SP), as well as to discuss the correspondence with acoustic analysis data.
METHODOLOGY: The above mentioned group was formed by 25 female teachers with complaints
or voice disturbs and medical diagnosis of laryngeal changes. The stimuli used for the auditoryperceptive
analysis refer to records of semi-spontaneous speech (interview and class simulation) and
to reading standard texts, totalizing 75 stimuli taken from data banks of previous researches. Those
samples were selected on the basis of perceptive experiments (nature and duration of samples) and
values in the relationship signal/noise. After the experiments, the samples were edited and analyzed by
means of acoustic and perceptive procedures. From the auditory-perceptive point of view, the samples
were evaluated by 5 judges; from those, 4 participated in a 15 hour workshop on how to use the
VPAS-BP. The 90 samples (75 plus 15 repetitions) were randomly presented through the script
Experiment MFC 3.2, applied to the software PRAAT (version 5143). From the acoustic point of
view, the same samples were edited through the script SG Expression Evaluator, and it was possible
to extract f0, intensity, spectral slope and the long term spectrum (LTS).The perceptive and acoustic
data were statistically analyzed: comparison of the average and analysis of multiple correlations
(canonic analysis, cluster analysis and discriminant). Features like the agreement and trustfulness inter
and intra judges in the VPAS-BP were treated by means of the Cochran and Snedecor test to analyze
the behavior of the judges group. It was also made the analysis of the vocal quality profile in the
studied samples, the agglomerative cluster hierarchical analysis, the vocal qualities adjustments and
vocal dynamics aspects. The acoustic data were analyzed through the agglomerative cluster
hierarchical analysis. The procedures of canonical correlation and discriminant analysis were applied
to the study of the correlations among perceptive data and acoustic measures. RESULTS: the most
frequent adjustments of vocal quality in the studied group were, in decreasing order: laryngeal
hyperfunction, harsh voice, lifted larynx, vocal tract hyperfunction, closed jaw, pharynx constriction,
lifted tongue body and air escape. The features of vocal dynamics, in decreasing order, were:
inadequate breathing support, less variety in pitch, lifted usual pitch, lifted usual loudness, fast
elocution rate and raised variety in loudness. The acoustic measures that showed extreme
combinations were: mean and absolute deviation of spectral slope and ELT absolute deviation, in one
extreme, and in the other, f0 median and quantile of 99,5%. Concerning the correspondence between
the perceptive and acoustic data, it was found that the f0 measures (median) and ETL measures
(absolute deviation) were close to phonatory adjustments. In one hand, the f0 measures (asymmetry
and semi amplitude between quarts) and the intensity (asymmetry) were in the same group of lifted
larynx adjustments, less extension of jaw and less variety of loudness, whereas the f0 measures
(99,5% quantile) and the spectral slope measures (media, absolute deviation and asymmetry) were in a
group with the biggest concentration of adjustments. The most frequent were: laryngeal
hyperfunction, closed jaw and lifted tongue body, as well as the dynamic vocal aspects related to
inadequate breathing support, lifted usual pitch and loudness, less variety of pitch and loudness.
CONCLUSIONS: it was verified that the VPAS-BP was totally applicable to the group of teachers in
this study, for the findings of vocal quality and vocal dynamics were compatible with the voice
disturbs and laryngeal changes (physiological level) and with the acoustic measures, according to the
inclusion criteria in the samples / OBJETIVO: Verificar a aplicabilidade do roteiro de natureza fonética Vocal Profile Analysis Scheme
para o Português Brasileiro (VPAS-PB), para a avaliação perceptiva de qualidade e dinâmica vocal de
amostras de fala de um grupo de professores com distúrbio de voz e alteração laríngea de duas escolas
da rede pública do ensino fundamental e médio do município de Sorocaba (SP); e discutir a
correspondência a dados de análise acústica. MÉTODOS: A casuística refere-se a 25 professores do
sexo feminino com queixas ou manifestações de distúrbio de voz e diagnóstico otorrinolaringológico
de alteração laríngea. Os estímulos utilizados para a análise perceptivo-auditiva referem-se a
gravações de trechos de fala semiespontânea (entrevista e simulação de aula) e de leitura de texto
padronizado, totalizando 75 estímulos retirados de banco de dados de pesquisa anterior. Tais amostras
foram selecionadas com base em experimentos de percepção (natureza e duração das amostras) e
valores da relação sinal-ruído. Após os experimentos, as amostras foram editadas e analisadas por
meio de procedimentos acústico e perceptivo. Do ponto de vista perceptivo-auditivo, as amostras
foram avaliadas por cinco juízes, dos quais quatro participaram de Workshop de 15 horas no uso do
roteiro VPAS-PB. As 90 amostras (75, somadas 15 repetições) foram apresentadas aleatoriamente por
meio de script Experiment MFC 3.2 aplicável ao software PRAAT (versão 5143). Do ponto de vista
acústico, as mesmas amostras foram analisadas por meio do script SG Expression Evaluator,
propiciando a extração de medidas de frequência fundamental (f0), intensidade, declínio espectral e
espectro de longo termo (ELT). Os dados perceptivos e acústicos foram analisados estatisticamente:
comparação de médias e análises de correlações múltiplas (análise canônica, de cluster, e
discriminante). Aspectos como a concordância e a confiabilidade inter e intrajuízes no roteiro VPASPB
foram tratados por meio dos testes de Cochran e Snedecor para análise do comportamento do
grupo de juízes. Também foi realizada a análise do perfil da qualidade vocal das amostras estudadas,
além da análise aglomerativa hierárquica de cluster, dos ajustes de qualidade vocal e aspectos de
dinâmica vocal. Os dados acústicos foram analisados por meio da análise aglomerativa hierárquica de
cluster. Os procedimentos de análise de correlação canônica e de análise discriminante foram
aplicados ao estudo das correlações entre dados perceptivos e medidas acústicas. RESULTADOS: Os
ajustes de qualidade vocal mais frequentes no grupo estudado, em ordem decrescente de ocorrência
foram: hiperfunção laríngea, voz áspera, laringe elevada, hiperfunção do trato vocal, mandíbula
fechada, constrição faríngea, corpo de língua elevado e escape de ar. Quanto aos aspectos da dinâmica
vocal, em ordem decrescente, destacaram-se: suporte respiratório inadequado, diminuição da
variabilidade de pitch, pitch habitual elevado, loudness habitual elevado, taxa de elocução rápida e
variabilidade de loudness aumentado. As medidas acústicas que mostraram combinações extremas
foram: média e desvio-padrão de declínio espectral e desvio-padrão de ELT, num extremo, e no outro,
mediana de f0 e quantil de 99,5% de f0. Com relação à correspondência entre os dados perceptivos e
os acústicos foi encontrado que as medidas de f0 (mediana) e de ELT (desvio-padrão) estiveram
próximas a ajustes fonatórios. De um lado, as medidas de f0 (assimetria e semiamplitude entre
quartis), bem como a intensidade (assimetria), estiveram em grupo com ajustes de laringe elevada,
extensão diminuída de mandíbula e variabilidade diminuída de loudness. De outro lado, as medidas de
f0 (quantil 99,5%) e de declínio espectral (média, desvio-padrão e assimetria) estiveram localizadas
em grupo com a maior concentração de ajustes, dentre os quais, dos mais frequentes, destacaram-se
hiperfunção laríngea, hiperfunção de trato vocal, constrição faríngea, mandíbula fechada e corpo de
língua elevado, além dos aspectos de dinâmica vocal relativos a suporte respiratório inadequado, pitch
e loudness habitual elevados, pitch e loudness variabilidade diminuída. CONCLUSÕES: O roteiro
de avaliação de qualidade vocal de base fonética VPAS-PB mostrou-se justamente aplicável ao grupo
de professores do presente estudo uma vez que os achados de qualidade vocal e de dinâmica vocal
apresentaram-se compatíveis com os quadros de distúrbio de voz e alteração laríngea (plano
fisiológico) e com as medidas acústicas, conforme critérios de inclusão na amostra
|
2 |
Qualidade vocal: análise acústica de ajustes fonatórios e de tensão laríngeaQueiroz, Renata de Moraes 03 September 2012 (has links)
Made available in DSpace on 2016-04-28T18:22:34Z (GMT). No. of bitstreams: 1
Renata de Moraes Queiroz.pdf: 893616 bytes, checksum: e926dd0ae8b857c85deec1808dbd3dd3 (MD5)
Previous issue date: 2012-09-03 / Conselho Nacional de Desenvolvimento Científico e Tecnológico / Each speaker carries a set of specific speaking signal, which can be detailed by
means of description of vocal quality. Changes occurred in the dynamic of vocal tract
structures influence in vocal quality, being liable of evaluation by means of script known as
Vocal Profile Analysis Scheme (VPAS). Aim: Describing acoustic correlation of vocal quality
adjustment from phonatory sphere and frequent tension in VPAS guide. Methodology: 29
speakers were selected, divided in two groups of gender, being one group of 11 subjects of
masculine gender and another group of 18 subjects of feminine gender. The data gathering
procedure was conducted by means of sample recordings in the audio format of corpus
involving semi-spontaneous issuance excerpts and reading of 3 sentences (five repetitions)
formulated for vocal quality evaluation. The audio samples were submitted to auditory
perceptual analysis (VPAS guide) and (acoustic automatic measures extracted from
application of Script Expression EvaluatorBySG and different measures of intensity between
the two first harmonics: H1-H2). The results were statistically treated via multivariated analysis,
in this way seeking the correspondence between perception and acoustic in the masculine and
feminine gender speaking groups. Results: The feminine gender speaking group revealed
predominance in laryngeal hyperfunction adjustments, besides the combinations of air escape
and harsh voice. In the masculine group, there were hypofunction laryngeal associations,
modal settings crackling and breathy voice. From the acoustic point of view, the measures
related to f0 and its first derivative differed neutral adjustments and not neutral phonatory
sphere, while spectral decline measures and the long term spectral mixed laryngeal tension
adjustments and the high laryngeal position. The H1-H2 measures where associated to
differentiation of laryngeal tension adjustments (hyperfunction and hypofunction) and
phonatory adjustments relative to aperiodicity of vocal signal, which were distinguished by
groups of masculine and feminine speaking gender. Conclusion: Measures related to f0, first
derived to f0, spectral decline, long term spectral and differences of intensity between
harmonics revealed the condition of distinguished neutral adjustment groups and not of vocal
quality neutrals from the point of view of phonatory and tension / Cada falante carrega um conjunto de particularidades no sinal de fala, o qual
pode ser detalhado por meio da descrição da qualidade vocal. Modificações ocorridas na
dinâmica das estruturas do aparelho fonador influenciam a qualidade vocal, sendo passíveis
de avaliação por meio de roteiro conhecido como Vocal Profile Analysis Scheme (VPAS).
Objetivo: descrever correlatos acústicos dos ajustes de qualidade vocal da esfera fonatória e
de tensão constantes no roteiro VPAS. Metodologia: foram selecionados 29 falantes,
divididos em dois grupos por gênero, sendo um grupo com 11 sujeitos do gênero masculino e
o outro grupo com 18 sujeitos do gênero feminino. O procedimento de coleta de dados foi
conduzido por meio de registro de amostras em formato áudio de corpus envolvendo trechos
de emissão semi-espontânea e leitura de 3 sentenças (cinco repetições) elaboradas para
avaliação da qualidade vocal. As amostras de áudio foram submetidas às análises perceptivoauditiva
(roteiro VPAS) e acústica (medidas automáticas extraídas a partir da aplicação do
script ExpressionEvaluatorbySG e medidas de diferença de intensidade entre os dois primeiro
harmônicos: H1-H2). Os resultados foram tratados estatisticamente por meio de análise
multivariada, de forma a buscar por correspondências entre percepção e acústica nos grupos
de falantes dos gêneros masculino e feminino. Resultados: o grupo de falantes do gênero
feminino revelou o predomínio de ajustes de hiperfunção laríngea, além de combinação de
escape de ar e voz áspera. No grupo masculino, houve associação de hipofunção laríngea,
ajuste modal, voz crepitante e voz soprosa. Do ponto de vista acústico, as medidas relativas à
f0 e sua primeira derivada diferenciaram ajustes neutros e não neutros de esferas fonatória,
enquanto as medidas de declínio espectral e de espectro de longo termo associaram-se a
ajustes de tensão laríngea e de posição de laringe elevada. As medidas de H1-H2 estiveram
associadas à diferenciação de ajustes de tensão laríngea (hiperfunção e hipofunção) e de
ajustes fonatórios relativos à aperiodicidade do sinal vocal, os quais foram distintos por grupos
de falantes dos gêneros masculino e feminino. Conclusão: medidas referentes a f0, primeira
derivada de f0, declínio espectral, espectro de longo termo e diferença de intensidade entre
harmônicos revelaram a condição de diferenciar grupos de ajustes neutros e não neutros de
qualidade vocal do ponto de vista fonatório e de tensão
|
3 |
Análise fonético-acústica do contraste fônico de vozeamento em criançasGregio, Fabiana Nogueira 29 October 2013 (has links)
Made available in DSpace on 2016-04-28T18:22:45Z (GMT). No. of bitstreams: 1
Fabiana Nogueira Gregio.pdf: 8922809 bytes, checksum: f6ac6109f66660225823a90550f58c46 (MD5)
Previous issue date: 2013-10-29 / Conselho Nacional de Desenvolvimento Científico e Tecnológico / Objective: to investigate implementation strategies for phonic voicing contrast in
Brazilian Portuguese in a study group of children with speech alteration in
comparison to a control group of children without alteration. Methods: we selected
six subjects ranging from 7-10 years old, three with diagnosis of alterations in the
production of voicing contrast in speech and three as controls. Six carrier sentences
with target disyllabic words in a CVCV structure, containing voice and voiceless pairs
of plosive consonants in Brazilian Portuguese in contexts of tonic and post-tonic
syllables, were audio recorded (five random repetitions). The collected samples were
acoustically investigated, labeled and submitted to procedures to extract caustic
measures of fundamental frequency (f0) in the beginning and in the stationary point
of the vowel following the plosive consonant, frequency of first formant (F1) in the
beginning and in the stationary point of the vowel following the plosive consonant and
duration measures of: plosive consonant, vowel preceding the the plosive consonant,
vowel following the plosive consonant, voice-onset-time (VOT) in the plosive
consonant, voicing period, voiceless period, voicing redemption, total pre-plosion
and plosion times. We also measured the VCV excerpt of the target word to calculate
relative duration. Speech samples were then submitted to a perception experiment
for auditive judgment (vocable identification) by a group of 35 judges. Acoustic
measure results were submitted to sample comparison test, hierarchical cluster
analysis and discriminate analysis. Tasks in the auditive judgment were presented by
means of confusion matrices and calculation of auditive distances. Correspondence
data between acoustic and perceptive findings were submitted to logistics regression
analysis. The research project was approved by the Research Ethics Committee
(119/09). Results: acoustic measures were compared between voiceless and voiced
plosive consonant pairs and, in general, showed significant differences. However,
voiceless and voiced plosive consonants were grouped differently in the different
contexts in each group studied and also showed predictive capacity to identify control
and study groups. With regard to perception, auditive distances showed to be smaller
for the study group samples in comparison to the control group in the tonic context. In
the post-tonic context, auditive differences were similar between the two groups.
Consonant duration, from voiceless and total pre-plosion periods (tonic context) and
total pre-plosion duration and voicing period (post-tonic context) showed predictive
power in the auditive judgment of voicing contrast in speech alterations of voiced
plosive consonants. For voiceless plosive consonants, influent measures included f0
in the beginning of the vowel and duration of previous vowel (tonic context) and f0 in
the beginning of the vowel and duration of plosive consonant (post-tonic context).
Conclusion: investigation of implementations found in children s speech signal
showed that duration measures were influent in identifying speech with voicing
contrast alterations, signaling traces of implementation of more than one action to
analyze voicing contrast / Objetivo: investigar as estratégias de implementação do contraste fônico de
vozeamento no português brasileiro em um grupo de crianças com alteração da fala
em comparação a um grupo de crianças sem alteração. Métodos: foram
selecionados seis sujeitos, na faixa etária de 7-10 anos, sendo três com diagnóstico
fonoaudiológico de alteração na produção do contraste de vozeamento na fala e três
atuando como referência. Seis sentenças-veículo com palavras-alvo, dissílabas com
estrutura CVCV, contendo os pares vozeados e não vozeados das consoantes
plosivas do português brasileiro, em contextos de sílaba tônica e pós-tônica, foram
audiogravadas (cinco repetições aleatorizadas). As amostras coletadas foram
inspecionadas acusticamente, etiquetadas e submetidas a procedimentos de
extração das medidas acústicas de frequência fundamental (f0) no início e no ponto
estacionário da vogal seguinte à consoante plosiva, frequência do primeiro formante
(F1) no início e no ponto estacionário da vogal seguinte à consoante plosiva e
medidas de duração de consoante plosiva, vogal anterior à consoante plosiva, vogal
seguinte à consoante plosiva, voice-onset-time (VOT) na consoante plosiva, período
de vozeamento, período sem vozeamento, retomada do vozeamento, total préplosão
e plosão e medida do trecho VCV da palavra-alvo, para finalidade de cálculo
da duração relativa. Na sequência, as amostras de fala foram submetidas a
experimento de percepção para julgamento auditivo (identificação de vocábulos) por
um grupo de 35 juízes. Os resultados das medidas acústicas foram submetidos a
teste de comparação de amostras, análise hierárquica de cluster e análise
discriminante. As respostas do julgamento auditivo foram apresentadas por meio de
matrizes de confusão e de cálculo das distâncias auditivas. Os dados de
correspondências entre achados acústicos e perceptivos foram submetidos à análise
de regressão logística. O projeto da pesquisa foi aprovado pelo Comitê de Ética em
Pesquisa (119/09). Resultados: as medidas acústicas foram comparadas entre os
pares de consoantes plosivas não vozeadas e vozeadas e, no geral, revelaram
diferenças significativas. Contudo, agruparam-se diferentemente para as consoantes
plosivas não vozeadas e vozeadas para cada grupo estudado nos distintos
contextos, e ainda apresentaram capacidade preditiva em classificar os grupos com
alteração e referência. Em termos de percepção, as distâncias auditivas
apresentaram-se menores para as amostras do grupo com alteração em
comparação com o grupo referência no contexto tônico. Para o contexto pós-tônico,
as distâncias auditivas foram similares entre os dois grupos. A duração da
consoante, do período sem vozeamento e do total pré-plosão (contexto tônico) e a
duração do total pré-plosão e o período de vozeamento (contexto pós-tônico)
revelaram poder preditivo do julgamento auditivo do contraste de vozeamento de
fala alterada para as consoantes plosivas vozeadas. Para as consoantes plosivas
não vozeadas as medidas influentes foram f0 no início da vogal e duração da vogal
anterior (contexto tônico) e f0 no início da vogal e duração da consoante plosiva
(contexto pós-tônico). Conclusão: a investigação das implementações encontradas
no sinal de fala das crianças revelou que as medidas de duração foram influentes na
identificação da fala com contraste de vozeamento alterado, sinalizando os indícios
de implementação de mais de uma ação para a análise do contraste de vozeamento
|
Page generated in 0.1214 seconds