1 |
Determinação dos limiares de normalidade dos parâmetros acústicos da voz / Determination of the thresholds of normality of the acoustic parameters of the voiceAndrade, Luciana Mara de Oliveira 25 July 2003 (has links)
Existe uma gama de pesquisas destinada à análise digital da voz, cujo intento é o de propiciar ferramentas que possam auxiliar no processo diagnóstico e terapêutico. O intercâmbio entre engenharia e áreas da saúde, como medicina e fonoaudiologia, tem apresentado expansiva importância para um melhor entendimento e aprimoramento de um saber" mais comum, onde a aplicabilidade de dados quantitativos associados a dados qualitativos acresce conhecimentos nestas duas vertentes. O intuito deste trabalho é o de utilizar dados quantitativos através de uma ferramenta de análise acústica da voz e avaliar sua acuracidade. Para tanto, fez-se exames clínicos e avaliações perceptivas em 130 voluntários. Os resultados obtidos conjuminam com a proposição deste estudo, sendo expressivamente promissores com a exatidão da inter-relação dos achados, com o qual pode-se concluir a veracidade da ferramenta utilizada / The diagnosis and therapeutic process of the voice has incorporated digital voice analysis as a useful tool for the specialists. The interchange between engineering and health sciences has improved the understanding of this interface area and the association between quantitative data and qualitative evaluation enhanced both. The purpose of this work is to use the acoustical analysis of voice in order to evaluate how accurate is that tool compared with clinical and perceptual diagnostics. A set of 130 subjects was used to evaluate this comparison. The results are consistent and match favorably the clinic and perceptual achievements
|
2 |
"Julgamento do comportamento vocal de jornalistas em diferentes estilos de notícias e seus correlatos acústicos". / Judgment of the vocal behavior of journalists in different styles of news and its acoustic correlationsPanico, Adriana Campos Balieiro 29 April 2005 (has links)
Investigaram-se a identificação de diferentes estilos de emissões do telejornalismo classificados em: neutro, sério e descontraído, e seus correlatos acústicos. Apresentadores experientes, de ambos os sexos, com atuação constante em telejornais de rede, gravaram um texto, de mesmo conteúdo semântico, por três vezes, nos três estilos de emissão. A partir dessa gravação, foi separado o áudio em CD, em formato wave, para que se procedesse à análise acústica da amostragem, avaliando os parâmetros acústicos de freqüência, intensidade e duração da emissão; por meio do software Dr. Speech 4.0. Em outro CD, em formato áudio, as amostras foram randomizadas e julgadas por trinta sujeitos, que tiveram a tarefa de identificar os estilos. Os parâmetros acústicos que diferiram significativamente entre os estilos foram a Fo média, a Fo máxima, a variação de Fo e o tempo de fala. Os telespectadores foram capazes de identificar os diferentes estilos. Posteriormente as amostras foram separadas, por estilo, em três CDs, em formato áudio, e apresentadas por meio do Método de Comparação aos Pares a leigos, para que fossem julgadas em função de cada um dos estilos de emissão. Estes resultados foram submetidos à análise multidimensional (MDS-Multidimensional Scaling) para que fossem determinadas as dimensões em que se encontravam os diferentes estilos de emissão. Duas dimensões foram determinadas para cada estilo. No estilo descontraído, a primeira dimensão não teve parâmetro acústico significativamente correlacionado. Na segunda, sem distinção de gênero, foi significativo o número de semitons; para as vozes femininas a Fo mínima, a variação de Fo e o número de semitons; e para as vozes masculinas, nenhum parâmetro correlacionado foi significativo. No estilo neutro, a primeira dimensão, sem distinção de gênero, dois parâmetros foram significativamente correlacionados: Fo mínima e o número de semitons; para as vozes femininas, foi correlacionada significativamente a variação de Fo; e para as vozes masculinas, a Io máxima. Na dimensão dois, nenhum parâmetro foi correlacionado significativamente. No estilo sério, a primeira dimensão foi correlacionada significativamente com o parâmetro acústico tempo de fala, somente para as vozes masculinas. A dimensão dois apresentou os seguintes parâmetros correlacionados significativamente: sem considerar a distinção de gênero, a Fo média, Fo mínima e Io mínima; para as vozes femininas, a Io mínima; e para as vozes masculinas nenhum parâmetro acústico foi correlacionado significativamente. A partir desses resultados discutem-se possibilidades de intervenção com indivíduos que usam a comunicação profissionalmente. / Acoustic correlations were investigated and the identification of different emission styles in TV newscasts was rated in the following manner: neutral, serious and relaxed. Experienced presenters, from both genders, with constant appearances in network TV newscasts recorded a text with the same semantic content three times in the same emission styles. Based on this recording, the audio was separated in a CD in the wave format in order to perform the acoustic analysis of the sample assessing the acoustic parameters of frequency, intensity and duration of the emission through the Dr. Speech 4.0 software. In another CD, in the audio format, the samples were randomized and judged by 30 subjects with the task of identifying the styles. The acoustic parameters that differed significantly among the styles were the average Fo, maximum Fo, the Fo variation and the speech time. The spectators were capable of identifying the different styles. Later, the samples were separated by styles in three CDs in the audio format and presented by means of a Pair Comparison Method to lay individuals to be judged in function of each one of the emission styles. These data were submitted to a multidimensional analysis (MDS-Multidimensional Scaling) in order to determine the dimensions in which the different emission styles were. Two dimensions were determined for each style. In the relaxed style, the first dimension did not have a significantly correlated acoustic parameter. In the second one, without distinguishing the type, the number of semitones was significant; for the female voices, the minimum Fo, the Fo variation and the number of semitones; and for the male voices, there was no significant correlated pattern. In the neutral style, the first dimension, without distinguishing the type, two parameters were significantly correlated: minimum Fo and the number of semitones; for the female voices, the Fo variation had a significant correlation; and for the male voices, the maximum Io. In dimension two, no parameter presented a significant correlation. In the serious style, the first dimension was significantly correlated with the time of speech acoustic parameter, only for the male voices. Dimension two presented the following significantly correlated parameters: without considering the distinction of the type, average Fo, minimum Fo and minimum Io; for the female voices, the minimum Io; and for the male voices no acoustic parameter was significantly correlated. Based on these results, intervention possibilities with individuals that use communication professionally are discussed.
|
3 |
Normatização dos parâmetros acústicos vocais em crianças em idade escolar / Standardization of the vocal acoustic parameters in children in pertaining to school ageVanzella, Thaís Peres 04 August 2006 (has links)
A voz é uma das formas mais diretas de expressão da nossa personalidade, sentimentos, desejos e estado de espírito. Pode-se observar em relação à criança, que o uso da voz ocorre de maneira mais intensa, justificável até pelo fato, que a todo instante as descobertas acontecem e a necessidade de exteriorizar todo esse conhecimento sucede-se através do uso voraz da voz. A laringe infantil é de configuração cônica, com cartilagens delicadas e ligamentos frouxos; os tecidos epiteliais são densos, abundantes e mais vascularizados, com tendência a edema e obstrução. Em função de suas características, a laringe infantil é um excelente instrumento de respiração, deglutição e proteção de vias aéreas superiores, porém, não para a fonação devido à sua dimensão vertical encurtada, reduzida capacidade de ressonância e possibilidade de movimentação restrita. A análise acústica da voz humana tem sido de grande importância principalmente por ser uma medida objetiva, contribuindo objetivamente na compreensão do mecanismo fisiológico do aparato vocal. Os objetivos deste estudo são: estabelecer um perfil acústico da voz mais abrangente que os apresentados na literatura atual; verificar a correlação entre os parâmetros acústicos da voz e estudar a correlação dos parâmetros acústicos da voz com a utilização da voz pelas crianças nas atividades diárias. Foram convidadas 182 crianças de escolas públicas e particulares da cidade de São Carlos SP. Os participantes foram de ambos os gêneros com uma faixa etária de 7 a 10 anos de idade. O protocolo de gravação das vozes foi realizado a partir da gravação da vogal sustentada /a/ em tom e intensidade adequada, com duração de até 5 segundos em ambiente silencioso e diretamente no programa Análise de Voz 5.0. Os parâmetros acústicos analisados foram: freqüência fundamental (F0), jitter; shimmer; nivelamento espectral de resíduos (SFR), nivelamento de filtro (SFF); amplitude de pitch (PA); coeficiente de excesso (EX). Os achados mostraram: a média dos valores de F0 foi 237,15 Hz; o valor médio de jitter foi de 1,21%; o valor médio de shimmer foi de 7,01%; a média dos valores de SFR foi 9,53 dB; o SFF foi 11,09 dB; a média de PA encontrada nessa amostra foi 0,55 e a média do EX foi 7,46 dB. Foram sugeridos limiares mais pertinentes a voz infantil no programa utilizado (Análise de Voz 5.0) e são eles os valores: jitter = 1%; shimmer = 8%; SFR = - 6dB; SFF = -10dB; PA = 0,3; EX = 2,0dB. Dos limiares propostos temos que shimmer, PA e EX são idênticos aos limiares para adultos. Já o jitter e os parâmetros relacionados à suavidade espectral, SFR e SFF, variaram demonstrando as diferenças fisiológicas das crianças em relação aos adultos. Os resultados deste estudo trazem importantes implicações para conhecer a voz infantil de maneira mais profunda, ajudar na elaboração de programas de prevenção e tratamento da voz e disfonias infantis, além de levantar padrões de normalidade dessa população. / The voice is one of the most direct expressions of our personality and feelings. In the childhood the use of voice is intense mainly by their need to exteriorize the knowledge acquired in a so rapidly manner. The child larynx has a conic shape with tiny cartilages and loose ligaments. The epithelial tissues are dense, abundants and more vascularized, which can cause edemas and obstruction. Considering its characteristics, a child larynx is an excellent tool for breathing, swallowing and for protection of superior aerial via, however its not well adapted for phonation due to its short vertical dimension, small resonance, capability and restricted vertical movement. The acoustic analysis of the human voice has been quite useful to quantify acoustic parameters of voice as well as in the studies of physiological mechanism of voice apparatus. The aim of this work is to establish a larger acoustic profile of childrens voice, during natural daily activities, compared to the actual literature. One hundred and eighty two voice signal samples of sustained vowel /a/ from brazilian portuguese, in normal conversation level, were acquired from children at public and particular schools of São Carlos city, both male and female, ranging in age from 07 to 10 years old. Voice signals were recorded at 22,05 KHz sampling rate during 5 seconds and digitalized in a personal computer through Análise de Voz 5.0 software. The acoustic parameters evaluated were: fundamental frequency (F0), jitter; shimmer; spectral flatness of the residue (SFR); spectral flatness of the filter (SFF); pitch amplitude (PA) and excess coefficient (EX). The results show the following mean values: FO = 237,15 Hz; jitter = 1.21%; shimmer = 7.01%; SFR = -9.53 dB; SFF = -11.09 dB; PA = 0.55 and EX = 7.46 dB. The suggested thresholds values for this age are: jitter = 1%; shimmer = 8%; SFR = -6 dB; SFF = - 6 dB; PA = 0.3 and EX = 2.0 dB. From these proposed values, three of them agree with normal adult thresholds, namely shimmer, PA and EX. The jitter and spectral flatness parameters, SFR and SFF, varied showing the physiological differences between children and adults. The results found here bring some important knowledge about childrens voices and would be useful in voice therapy and could provide programs to prevent voice dysfunction. Another important result is the establishment of acoustic profile of the children voices.
|
4 |
"Julgamento do comportamento vocal de jornalistas em diferentes estilos de notícias e seus correlatos acústicos". / Judgment of the vocal behavior of journalists in different styles of news and its acoustic correlationsAdriana Campos Balieiro Panico 29 April 2005 (has links)
Investigaram-se a identificação de diferentes estilos de emissões do telejornalismo classificados em: neutro, sério e descontraído, e seus correlatos acústicos. Apresentadores experientes, de ambos os sexos, com atuação constante em telejornais de rede, gravaram um texto, de mesmo conteúdo semântico, por três vezes, nos três estilos de emissão. A partir dessa gravação, foi separado o áudio em CD, em formato wave, para que se procedesse à análise acústica da amostragem, avaliando os parâmetros acústicos de freqüência, intensidade e duração da emissão; por meio do software Dr. Speech 4.0. Em outro CD, em formato áudio, as amostras foram randomizadas e julgadas por trinta sujeitos, que tiveram a tarefa de identificar os estilos. Os parâmetros acústicos que diferiram significativamente entre os estilos foram a Fo média, a Fo máxima, a variação de Fo e o tempo de fala. Os telespectadores foram capazes de identificar os diferentes estilos. Posteriormente as amostras foram separadas, por estilo, em três CDs, em formato áudio, e apresentadas por meio do Método de Comparação aos Pares a leigos, para que fossem julgadas em função de cada um dos estilos de emissão. Estes resultados foram submetidos à análise multidimensional (MDS-Multidimensional Scaling) para que fossem determinadas as dimensões em que se encontravam os diferentes estilos de emissão. Duas dimensões foram determinadas para cada estilo. No estilo descontraído, a primeira dimensão não teve parâmetro acústico significativamente correlacionado. Na segunda, sem distinção de gênero, foi significativo o número de semitons; para as vozes femininas a Fo mínima, a variação de Fo e o número de semitons; e para as vozes masculinas, nenhum parâmetro correlacionado foi significativo. No estilo neutro, a primeira dimensão, sem distinção de gênero, dois parâmetros foram significativamente correlacionados: Fo mínima e o número de semitons; para as vozes femininas, foi correlacionada significativamente a variação de Fo; e para as vozes masculinas, a Io máxima. Na dimensão dois, nenhum parâmetro foi correlacionado significativamente. No estilo sério, a primeira dimensão foi correlacionada significativamente com o parâmetro acústico tempo de fala, somente para as vozes masculinas. A dimensão dois apresentou os seguintes parâmetros correlacionados significativamente: sem considerar a distinção de gênero, a Fo média, Fo mínima e Io mínima; para as vozes femininas, a Io mínima; e para as vozes masculinas nenhum parâmetro acústico foi correlacionado significativamente. A partir desses resultados discutem-se possibilidades de intervenção com indivíduos que usam a comunicação profissionalmente. / Acoustic correlations were investigated and the identification of different emission styles in TV newscasts was rated in the following manner: neutral, serious and relaxed. Experienced presenters, from both genders, with constant appearances in network TV newscasts recorded a text with the same semantic content three times in the same emission styles. Based on this recording, the audio was separated in a CD in the wave format in order to perform the acoustic analysis of the sample assessing the acoustic parameters of frequency, intensity and duration of the emission through the Dr. Speech 4.0 software. In another CD, in the audio format, the samples were randomized and judged by 30 subjects with the task of identifying the styles. The acoustic parameters that differed significantly among the styles were the average Fo, maximum Fo, the Fo variation and the speech time. The spectators were capable of identifying the different styles. Later, the samples were separated by styles in three CDs in the audio format and presented by means of a Pair Comparison Method to lay individuals to be judged in function of each one of the emission styles. These data were submitted to a multidimensional analysis (MDS-Multidimensional Scaling) in order to determine the dimensions in which the different emission styles were. Two dimensions were determined for each style. In the relaxed style, the first dimension did not have a significantly correlated acoustic parameter. In the second one, without distinguishing the type, the number of semitones was significant; for the female voices, the minimum Fo, the Fo variation and the number of semitones; and for the male voices, there was no significant correlated pattern. In the neutral style, the first dimension, without distinguishing the type, two parameters were significantly correlated: minimum Fo and the number of semitones; for the female voices, the Fo variation had a significant correlation; and for the male voices, the maximum Io. In dimension two, no parameter presented a significant correlation. In the serious style, the first dimension was significantly correlated with the time of speech acoustic parameter, only for the male voices. Dimension two presented the following significantly correlated parameters: without considering the distinction of the type, average Fo, minimum Fo and minimum Io; for the female voices, the minimum Io; and for the male voices no acoustic parameter was significantly correlated. Based on these results, intervention possibilities with individuals that use communication professionally are discussed.
|
5 |
Radialista : análise acústica da variação entoacional na fala profissional e na fala coloquial / Radio : acoustic analysis of the variation in speech intonation in colloquial and professionalCampos, Luana Caroline Pereira, 1986- 21 August 2018 (has links)
Orientador: Plínio Almeida Barbosa / Dissertação (mestrado) - Universidade Estadual de Campinas, Instituto de Estudos da Linguagem / Made available in DSpace on 2018-08-21T11:44:42Z (GMT). No. of bitstreams: 1
Campos_LuanaCarolinePereira_M.pdf: 561404 bytes, checksum: 9141e55bb8da299032441577a649fcf3 (MD5)
Previous issue date: 2012 / Resumo: O objetivo deste trabalho é estudar a diferença entre a fala coloquial e a fala profissional do locutor de rádio, analisando, em um primeiro momento, sua entoação através dos parâmetros de gama tonal, valor absoluto de frequência fundamental (f0), forma melódica do foco e alinhamento tonal. O sujeito da pesquisa foi um locutor de rádio, do sexo masculino, de 39 anos de idade, de uma emissora AM de Campinas, com um programa diário local de variedades. As gravações foram feitas em sala silenciosa, com microfone profissional, diretamente no computador através de placa de som. Os dados foram analisados acusticamente, utilizando o programa de análise acústica PRAAT (www.praat.org), focalizando a entoação por meio do correlato acústico da entoação: o parâmetro f0. A coleta de dados foi realizada por meio de uma entrevista semiestruturada informal (entrevista) com o locutor, solicitando-se que produzisse uma fala coloquial de diversos assuntos usualmente abordados na mídia na época da gravação. Durante a entrevista o locutor, espontaneamente, narrou um trecho de um gol do seu time, sendo esse trecho uma simulação de locução de jogo de futebol (simulação). A transcrição ortográfica por completo da entrevista foi realizada, e foram selecionados 10 trechos, que foram transcritos para formato de texto formal. De cada um dos 10 trechos selecionados foram elaboradas 5 frases no estilo de manchetes jornalísticas, sendo utilizadas as mais similares à locução radiofônica, somando um total de 29 manchetes. Após um tempo, foi solicitada ao locutor a leitura dos trechos transcritos e reescritos de forma profissional, como se estivesse atuando no rádio. Essa leitura foi realizada em taxa de elocução habitual (leitura normal), em taxa de elocução rápida (leitura rápida), e imitando o estilo profissional de narração futebolística (leitura futebol). Para validação dos estilos foi realizado um teste de percepção auditiva, a fim de verificar se o locutor foi eficiente nas tarefas solicitadas: leitura normal em comparação com a entrevista, e leitura futebol em comparação com leitura normal. A finalidade foi observar as diferenças e estratégias usadas pelos locutores para atrair a atenção dos ouvintes durante sua emissão. Após análise dos dados, concluímos que, como estratégia para diferenciar os estilos de locução, o locutor utiliza, quando a frequência fundamental (f0) é semelhante, primeiramente da variação da taxa de elocução, e em seguida a variação da duração das pausas silenciosas e da taxa de produção de proeminências. Quando a taxa de elocução é semelhante - como na leitura rápida e na leitura futebol- a estratégia utilizada pelo locutor para diferenciação do estilo de fala é, primeiramente, a variação da média de f0, assim como da duração das pausas silenciosas, e dos intervalos entre as proeminências / Abstract: The main purpose of this work is to study the prosodic differences between the colloquial and professional speech of a radio announcer by analyzing some intonational and rhythmic parameters such as tonal range, median fundamental frequency (f0), pitch accent shape and tonal alignment, as well as speech rate and pauses. The research subject was an AM radio announcer, male, 39 years old, working in an AM station in Campinas, where he has a daily program of local varieties. The recordings were made in a quiet room, with a professional microphone, directly through the computer sound card. Data were analyzed acoustically, using acoustic analysis software PRAAT (www.praat.org). Data collection was conducted through an informal semi-structured interview (interview) with the announcer, where the experimenter asked him to talk about different subjects usually covered in the media at the time of recording. During the interview, the announcer spontaneously narrated a snippet of a goal during a game of his soccer team. This part was separately analyzed as a simulation of a football game (simulation). The entire interview was orthographically transcribed and 10 excerpts were selected for analysis. These excerpts were slightly modified in order to obtain a formal text for a reading task. In each of the 10 excerpts 5 sentences were drawn in the style of journalistic headlines, from which 29 headlines most similar to real radio headlines were selected for reading as headlines. The speaker was asked to read the 10 excerpts of the transcription in a professional manner, as if he was in the radio station. This reading was performed in normal speech rate (normal reading), in fast speech rate (speed reading), and a part of it imitating the style of the narration of a soccer game (soccer game reading). For validating the different speaking styles, we conducted an auditory perception test in order to check if the speaker was efficient in producing the tasks. Listeners compared normal reading with the interview, and soccer-game style reading compared to normal reading. The purpose of the study was to observe the differences and strategies used by speakers to attract the attention of listeners during broadcasting. After analyzing the data, we conclude that, as a strategy to differentiate the styles of speech when the fundamental frequency (f0) is similar, the announcer varies speech rate, and then varies the duration of silent pauses as well as the rate of pitch accent production. When speech rate is similar in the case of rapid reading and soccer game reading, the strategy used by the announcer for distinguishing these speech styles is the variation of the median f0, as well as the variation of silent pauses duration and the pitch accent rate / Mestrado / Linguistica / Mestra em Linguística
|
6 |
Normatização dos parâmetros acústicos vocais em crianças em idade escolar / Standardization of the vocal acoustic parameters in children in pertaining to school ageThaís Peres Vanzella 04 August 2006 (has links)
A voz é uma das formas mais diretas de expressão da nossa personalidade, sentimentos, desejos e estado de espírito. Pode-se observar em relação à criança, que o uso da voz ocorre de maneira mais intensa, justificável até pelo fato, que a todo instante as descobertas acontecem e a necessidade de exteriorizar todo esse conhecimento sucede-se através do uso voraz da voz. A laringe infantil é de configuração cônica, com cartilagens delicadas e ligamentos frouxos; os tecidos epiteliais são densos, abundantes e mais vascularizados, com tendência a edema e obstrução. Em função de suas características, a laringe infantil é um excelente instrumento de respiração, deglutição e proteção de vias aéreas superiores, porém, não para a fonação devido à sua dimensão vertical encurtada, reduzida capacidade de ressonância e possibilidade de movimentação restrita. A análise acústica da voz humana tem sido de grande importância principalmente por ser uma medida objetiva, contribuindo objetivamente na compreensão do mecanismo fisiológico do aparato vocal. Os objetivos deste estudo são: estabelecer um perfil acústico da voz mais abrangente que os apresentados na literatura atual; verificar a correlação entre os parâmetros acústicos da voz e estudar a correlação dos parâmetros acústicos da voz com a utilização da voz pelas crianças nas atividades diárias. Foram convidadas 182 crianças de escolas públicas e particulares da cidade de São Carlos SP. Os participantes foram de ambos os gêneros com uma faixa etária de 7 a 10 anos de idade. O protocolo de gravação das vozes foi realizado a partir da gravação da vogal sustentada /a/ em tom e intensidade adequada, com duração de até 5 segundos em ambiente silencioso e diretamente no programa Análise de Voz 5.0. Os parâmetros acústicos analisados foram: freqüência fundamental (F0), jitter; shimmer; nivelamento espectral de resíduos (SFR), nivelamento de filtro (SFF); amplitude de pitch (PA); coeficiente de excesso (EX). Os achados mostraram: a média dos valores de F0 foi 237,15 Hz; o valor médio de jitter foi de 1,21%; o valor médio de shimmer foi de 7,01%; a média dos valores de SFR foi 9,53 dB; o SFF foi 11,09 dB; a média de PA encontrada nessa amostra foi 0,55 e a média do EX foi 7,46 dB. Foram sugeridos limiares mais pertinentes a voz infantil no programa utilizado (Análise de Voz 5.0) e são eles os valores: jitter = 1%; shimmer = 8%; SFR = - 6dB; SFF = -10dB; PA = 0,3; EX = 2,0dB. Dos limiares propostos temos que shimmer, PA e EX são idênticos aos limiares para adultos. Já o jitter e os parâmetros relacionados à suavidade espectral, SFR e SFF, variaram demonstrando as diferenças fisiológicas das crianças em relação aos adultos. Os resultados deste estudo trazem importantes implicações para conhecer a voz infantil de maneira mais profunda, ajudar na elaboração de programas de prevenção e tratamento da voz e disfonias infantis, além de levantar padrões de normalidade dessa população. / The voice is one of the most direct expressions of our personality and feelings. In the childhood the use of voice is intense mainly by their need to exteriorize the knowledge acquired in a so rapidly manner. The child larynx has a conic shape with tiny cartilages and loose ligaments. The epithelial tissues are dense, abundants and more vascularized, which can cause edemas and obstruction. Considering its characteristics, a child larynx is an excellent tool for breathing, swallowing and for protection of superior aerial via, however its not well adapted for phonation due to its short vertical dimension, small resonance, capability and restricted vertical movement. The acoustic analysis of the human voice has been quite useful to quantify acoustic parameters of voice as well as in the studies of physiological mechanism of voice apparatus. The aim of this work is to establish a larger acoustic profile of childrens voice, during natural daily activities, compared to the actual literature. One hundred and eighty two voice signal samples of sustained vowel /a/ from brazilian portuguese, in normal conversation level, were acquired from children at public and particular schools of São Carlos city, both male and female, ranging in age from 07 to 10 years old. Voice signals were recorded at 22,05 KHz sampling rate during 5 seconds and digitalized in a personal computer through Análise de Voz 5.0 software. The acoustic parameters evaluated were: fundamental frequency (F0), jitter; shimmer; spectral flatness of the residue (SFR); spectral flatness of the filter (SFF); pitch amplitude (PA) and excess coefficient (EX). The results show the following mean values: FO = 237,15 Hz; jitter = 1.21%; shimmer = 7.01%; SFR = -9.53 dB; SFF = -11.09 dB; PA = 0.55 and EX = 7.46 dB. The suggested thresholds values for this age are: jitter = 1%; shimmer = 8%; SFR = -6 dB; SFF = - 6 dB; PA = 0.3 and EX = 2.0 dB. From these proposed values, three of them agree with normal adult thresholds, namely shimmer, PA and EX. The jitter and spectral flatness parameters, SFR and SFF, varied showing the physiological differences between children and adults. The results found here bring some important knowledge about childrens voices and would be useful in voice therapy and could provide programs to prevent voice dysfunction. Another important result is the establishment of acoustic profile of the children voices.
|
7 |
Determinação dos limiares de normalidade dos parâmetros acústicos da voz / Determination of the thresholds of normality of the acoustic parameters of the voiceLuciana Mara de Oliveira Andrade 25 July 2003 (has links)
Existe uma gama de pesquisas destinada à análise digital da voz, cujo intento é o de propiciar ferramentas que possam auxiliar no processo diagnóstico e terapêutico. O intercâmbio entre engenharia e áreas da saúde, como medicina e fonoaudiologia, tem apresentado expansiva importância para um melhor entendimento e aprimoramento de um saber mais comum, onde a aplicabilidade de dados quantitativos associados a dados qualitativos acresce conhecimentos nestas duas vertentes. O intuito deste trabalho é o de utilizar dados quantitativos através de uma ferramenta de análise acústica da voz e avaliar sua acuracidade. Para tanto, fez-se exames clínicos e avaliações perceptivas em 130 voluntários. Os resultados obtidos conjuminam com a proposição deste estudo, sendo expressivamente promissores com a exatidão da inter-relação dos achados, com o qual pode-se concluir a veracidade da ferramenta utilizada / The diagnosis and therapeutic process of the voice has incorporated digital voice analysis as a useful tool for the specialists. The interchange between engineering and health sciences has improved the understanding of this interface area and the association between quantitative data and qualitative evaluation enhanced both. The purpose of this work is to use the acoustical analysis of voice in order to evaluate how accurate is that tool compared with clinical and perceptual diagnostics. A set of 130 subjects was used to evaluate this comparison. The results are consistent and match favorably the clinic and perceptual achievements
|
8 |
Fala espontânea e leitura oral no português do Brasil: comparação por meio de análise acústica / Spontaneous speech and oral reading in portuguese of Brazil: comparison by means of acoustic analysisSilva, Carmen Lucianna Miranda e 13 April 2009 (has links)
A fala espontânea, também nomeada como discurso espontâneo, compõe a investigação de várias pesquisas nas áreas da fonética e da fonologia. Pesquisas relevantes na área podem ser observadas no Journal of the International Phonetic Association (JIPA), referência base para a nossa pesquisa e publicação onde constam estudos que investigam diferentes línguas nos aspectos fonético- acústicos da fala espontânea. O objetivo geral desta pesquisa é investigar aspectos fonético-acústicos da fala espontânea no português do Brasil e comparar a leitura oral tendo como justificativa principal o desafio que este estudo propõe diante da escassez de pesquisas em relação à fala espontânea com o português do Brasil. Nossas hipóteses basearam-se em estudos de alguns autores que estudaram a fala espontânea em diferentes línguas, como Barry e Andreeva; Shriberg (2001) e que chegaram a algumas definições para fala espontânea. Segundo esses autores, a fala espontânea se opõe ao discurso lido por ser uma fala despreparada e não treinada, além de apresentar duração de discurso mais longa e maior ocorrência de disfluência do que a leitura oral. Barry e Andreeva (2001) destacam também mudanças na prosódia, já que a função das palavras é diferente em cada uma dessas modalidades de fala. A partir destes trabalhos, surge o objetivo específico da pesquisa: verificar os aspectos estudados nos trabalhos acima citados no português do Brasil e caracterizar cada modalidade de fala (fala espontânea e a leitura oral) por meio da identificação de possíveis similaridades ou possíveis diferenças nos aspectos de: duração das frases, pausas (duração e número de ocorrências), freqüência fundamental (F0 inicial e F0 final e F0 máxima e F0 mínima) e medidas de Voice Onset Time (VOT) de consoantes oclusivas surdas. A coleta das amostras de fala espontânea e de leitura oral foi realizada a partir da observação dos métodos sugeridos por Local e Walker (2005) e da aplicação de provas semi-dirigidas por meio da gravação de diálogos quase-espontâneos, observadas em Nicolaidis (2001) e Andreeva e Barry (2001) em pesquisas com a fala espontânea. O corpus constitui a participação de quatro homens com idade média de trinta e seis anos. Os critérios para a seleção dos sujeitos foram: sujeitos do sexo masculino, falantes do português do Brasil, monolíngues, com nível superior (completo ou incompleto), bons leitores, não profissionais da voz, sem queixa e/ou alteração de fala e voz e que não fizessem uso de drogas. Na pesquisa consta a avaliação de 48 (quarenta e oito) frases de todos os sujeitos, sendo 12 (doze) de cada sujeito, 6 (seis) frases de fala espontânea e 6 (seis) de leitura oral do mesmo texto. Além destes dados, para as medidas de Voice Onset Time VOT, foram realizadas medidas de 60 (sessenta) consoantes oclusivas surdas, 10 (dez) de cada tipo de oclusiva (velar, alveolar e bilabial, com medidas na modalidade espontânea e na versão lida. As consoantes oclusivas analisadas foram retiradas das frases selecionadas e também colhidas de forma aleatória de outras frases do discurso. O programa para gravação e medidas acústicas foi o Winpitch Prow 1.0. Os resultados mostraram algumas particularidades de cada tipo de fala, porém vale ressaltar os aspectos obtivemos dados com significância estatística: maior ocorrência e durações mais longas de pausas na fala espontânea, F0 inicial mais alta do que e F0 final na leitura oral, F0 final mais alta em fala espontânea e medidas de VOT mais longas em leitura oral. / Spontaneous speech, also known as spontaneous speech constitutes the investigation of research in the fields of Phonetics and Phonology. The relevant research in the field has been published in the Journal of the International Phonetic Association (JIPA) and is reference of our research. The main objective of this study is to investigate the phonetic acoustic aspects of Brazilian Portuguese speech and to compare it to oral reading. The major challenge of this study is the lack of research related to the spontaneous speech in Brazilian Portuguese language. Our hypothesizes are based on the works of some authors who have studied the spontaneous speech in different languages. Barry, Andreeva and Shriberg (2001) and developed some definitions of spontaneous speech. According to these authors, spontaneous speech is much different than oral reading because it is unprepared and unrehearsed. Spontaneous speech typically results in a longer discourse duration and has a greater occurrence of disfluency than oral reading. Barry and Andreeva(2001), also studied the prosody changes, since the function of words is different in each of these speech modalities. From these studies is born the specific objective of this research; to examine the aspects studied in the research above as it relates to Brazilian Portuguese and to characterize each speech modality (spontaneous speech and oral reading) through the identification of possible similarities or possible differences in the following aspects: duration of the sentences, pauses (duration and number of occurrences), fundamental frequencies (F0 initial and F0 final and F0 maximum and F0 minimum) and Voice Onset Time (VOT) measurements of unvoiced occlusive consonants. The collection of spontaneous speech and oral reading samples was carried out through the observation of methods suggested by Local and Walker (2005) and the application of semi-directed proofs, through the record of nearly spontaneous dialogs, observed by Nicolaidis (2001), Andreeva and Barry(2001) in their research on spontaneous speech. The corpus was conducted with the participation of four men all 36 years old. The criteria used to select the subjects were that they be male individuals; Brazilian, monolingual, Portuguese speakers; graduation (complete or incomplete); good readers; amateur speakers; have no speech or voice alteration and non drug users. The study consists of the valuation of 48 sentences in total. Twelve sentences from each individual consisting of six spontaneous sentences and six oral readings of the same texts. In conjunction with these data Voice Onset Time measurements - Vot, were carried out in measurements of 60 unvoiced occlusive consonants, 10 of each kind of occlusive (velar, alveolar, and bilabial) along with measurements in the spontaneous modality and reading versions. The occlusive consonants analyzed were obtained from the selected sentences and also obtained in an aleatory way from another sentences of the discourse. The program used to record and acoustic measurements was Winpitch Prow 1.0. The results show some particularities of each kind of speech. It is striking we obtained significant the results aspects : pauses bigger (duration and number of occurrences) in the spontaneous speech, F0 initial increase than F0 final of the oral reading; F0 final increase in spontaneous speech and VOT measurements of longer duration than occurred in the oral readings.
|
9 |
Perfis acústicos para caracterização de patologias da laringe / not availableMori, Ricardo Naoki 16 June 2005 (has links)
A caracterização das patologias da laringe até o presente momento é predominantemente realizada de forma qualitativa. Alguns trabalhos recentes têm quantificados parâmetros acústicos no intuito de discriminar as diversas patologias. Este trabalho verifica os valores médios das diversas medidas acústicas da voz e as relaciona com as diferentes patologias. Desta forma, futuramente será possível utilizar estes valores para quantificar e acompanhar diferentes estágios do tratamento da patologia. O conjunto de valores médios compõem o que chamamos de perfil acústico. / Until now the characterization of larynx pathologies has been done in a subjective manner. Recently some researches have been conducted in order to quantify acoustic parameters mainly to discriminate the larynx pathologies. In this work several acoustic parameters of voice was evaluated and their correlation with the pathologies were established. In the future, would be possible to use these parameters to quantify and to follow the therapy procedures. These values constitute the acoustic profile of the pathologies.
|
10 |
Aspectos psicológicos da voz e seus correlatos acústicos. / Correlation between psychological aspects of professional voice and acoustic analysisPanico, Adriana Campos Balieiro 04 May 2001 (has links)
Neste estudo investigou-se a relação entre aspectos psicológicos (agradabilidade, confiabilidade e naturalidade) de vozes profissionais e parâmetros acústicos (intensidade, freqüência e duração). Os aspectos psicológicos foram previamente definidos através de um questionário aplicado a profissionais da voz. Trechos de fala de repórteres e apresentadores de rádio e televisão (masculinas e femininas) foram gravados em estúdio profissional e analisados acusticamente por meio do programa de computador Dr. Speech 3.0. Posteriormente as gravações foram apresentadas pelo método de comparação aos pares a ouvintes leigos para que estimassem o quão agradável, confiável e natural eram as vozes preferidas em relação às preteridas. As somas das pontuações dos julgamentos estabeleceram escalas decrescentes que ordenavam as vozes mais agradáveis, mais confiáveis e mais naturais; e os valores destas escalas foram correlacionadas com os parâmetros acústicos. Também, para cada aspecto psicológico, foi determinada uma matriz de índices de correlação de Pearson entre as somatórias das pontuações das vozes, que foi submetida a uma análise de escala multidimensional (MDS). Esta análise indicou que as vozes podem ser descritas adequadamente por três dimensões em cada aspecto psicológico. Os valores das escalas dessas dimensões também foram correlacionados com os parâmetros acústicos. Concluiu-se que os julgamentos de agradabilidade, confiabilidade e naturalidade das vozes guardam interdependência entre si. O aspecto confiabilidade teve duas dimensões fortemente correlacionadas com freqüência e intensidade. Para agradabilidade e naturalidade houve concorrência de vários parâmetros acústicos. Sugere-se que no trabalho de impostação de voz se considerem os parâmetros acústicos que se correlacionam fortemente com as dimensões dos aspectos psicológicos. / This study investigated the relation between the psychological aspects (pleasantness, reliability and naturalness) of professional voices and acoustic parameters (intensity, frequency and duration). The psychological aspects were previously determined through a questionary applied to those who use their voices professionally. Parts of the speeches of reporters and radio and television presenters (male and female) were recorded in a professional studio and analyzed acoustically by means of the computer program Dr. Speech 3.0. Subsequently the recordings were presented, by the comparison method, in pairs, to laymen so that they could estimate how pleasant, reliable and natural were the preferred voices in relation to the neglected ones. The sum of the ratings established increasing scales that assorted the most pleasant, most reliable and most natural voices; and the values of those scales were correlated with the acoustic parameters. For each psychological aspect, as well, a Pearson correlation index matrix was determined between the total amounts of the voice ratings, and was submitted to a multidimensional scale analysis (MDS). This analysis indicated that three dimensions in each psychological aspect might adequately describe the voices. The values of the scales of these dimensions were also correlated with the acoustic parameters. The conclusion was that the pleasantness, reliability and naturalness ratings of the voices maintain interdependence among them. The reliability aspect had two dimensions that were strongly correlated with frequency and intensity. For pleasantness and naturalness aspects there was a balance among several of the acoustic parameters. It is suggested that the acoustic parameters that strongly correlate with the dimensions of the psychological aspects should be considered on the voice placement work.
|
Page generated in 0.0624 seconds