• Refine Query
  • Source
  • Publication year
  • to
  • Language
  • 2
  • 1
  • Tagged with
  • 4
  • 4
  • 2
  • 2
  • 2
  • 2
  • 2
  • 2
  • 2
  • 2
  • 2
  • 1
  • 1
  • 1
  • 1
  • About
  • The Global ETD Search service is a free service for researchers to find electronic theses and dissertations. This service is provided by the Networked Digital Library of Theses and Dissertations.
    Our metadata is collected from universities around the world. If you manage a university/consortium/country archive and want to be added, details can be found on the NDLTD website.
1

Probabilistic acoustic modelling for parametric speech synthesis

Shannon, Sean Matthew January 2014 (has links)
No description available.
2

Análise perceptivo-auditiva e acústica da voz relacionada ao tempo de execução do exercício de vibração sonorizada de língua em mulheres com nódulos vocais / Auditory perceptual and acoustic analysis related to tongue trills performance time in dysphonic women with vocal nodules

Menezes, Marcia Helena Moreira 31 March 2010 (has links)
A presente pesquisa teve como objetivo verificar se o tempo de execução do exercício de vibração sonorizada de língua interfere nas respostas perceptivoauditivas e acústicas da voz em mulheres com nódulos vocais. Além disso, se propôs identificar em qual momento há predomínio de respostas vocais positivas e negativas ao longo de sete minutos de execução deste exercício. Para tanto, participaram da pesquisa 27 mulheres, com idade entre 18 e 45 anos, disfônicas, com nódulos de pregas vocais. Todos os sujeitos da pesquisa foram incluídos no Grupo Experimental (GE), o qual realizou o Exercício de Vibração Sonorizada de Língua (EVSL) e apenas dez deles participaram também do Grupo-Controle (GC), onde foi feito o exercício placebo. Ambos foram realizados por sete minutos. As vozes foram registradas antes e após o primeiro, terceiro, quinto e sétimo minutos de execução dos exercícios e analisadas perceptivo- auditiva e acusticamente. Na análise perceptivo-auditiva, elas foram estudadas individualmente por meio do Protocolo CAPEV e aos pares, de forma comparativa, com a identificação da melhor voz para cada par examinado. Na análise acústica, utilizou-se o software VoxMetria versão 2.7h da CTS Informática na função Qualidade Vocal. Foram considerados os valores de frequência fundamental, jitter, shimmer, Glottal to Noise Excitation (GNE), irregularidade e ruído. De acordo com os resultados do CAPEV, o Exercício de Vibração Sonorizada de Língua (EVSL) provocou mudanças estatisticamente significantes em sete dos nove parâmetros investigados. A aplicação do teste estatístico ANOVA mostrou que no momento 5 (após o quinto minuto de execução do EVSL), a voz apresentou-se com melhor grau geral (p = 0,0004), menor rugosidade (p = 0,007), menor soprosidade (p < 0,001) e pitch agudo (p < 0,001). Porém, no momento 7 (após o sétimo minuto), a tensão apresentou-se significativamente mais alta (p = 0,016) em comparação a todos os outros momentos. Na análise pareada, houve prevalência de melhora vocal no pós-exercício em todos os momentos, com exceção do 7°. Não houve diferença estatisticamente significante entre os momentos 1 e 3. As vozes no momento 5 foram consideradas melhores do que nos momentos 3 (p = 0,013) e 7 (p = 0,013) no Grupo Experimental. Na análise acústica do grupo experimental houve aumento gradativo da frequência fundamental (p = 0,0030) e do GNE (p = 0,0011) após o terceiro minuto e diminuição do ruído (p = 0,0013) a partir do primeiro. Tanto na análise perceptivo-auditiva quanto na acústica, os resultados do Grupo Experimental foram superiores aos encontrados no Grupo-Controle no que diz respeito às melhoras vocais. Os resultados da presente pesquisa demonstram que o tempo de realização do EVSL interfere nas respostas vocais em mulheres disfônicas, sendo que no momento 5 há predomínio de respostas positivas em comparação aos momentos 1, 3 e 7. No 7, há aumento de tensão vocal e queda no desempenho do exercício. / The aim of this study was to assess whether tongue trills trill performance time interferes in the auditory perception and acoustic in women with vocal nodules. Furthermore, it was intended to identify at which moment during the 7-minute performance time the positive and negative responses predominate. This study comprised twenty-seven dysphonic women, who have vocal nodules, ranging from 18 to 45 years old. All subjects of this study were included in the experiment group which underwent tongue trills; only ten of these were also in the control group which underwent the placebo exercise. Both groups carried out the 7- minute performance time. The voices were recorded pre and post experimental and placebo exercises at the first, third, fifth and seventh minute of performance and auditory perception and acoustic were analyzed. In the auditory perception analysis the voices were analyzed individually according to the CAPEV protocol and in pairs, by comparison, to identify the better voice of the pair. The Voxmetria® program, version 2.7h by CTS Informática, was used to assess the vocal quality function. Fundamental frequency, jitter, shimmer, GNE, irregularity and noise were considered. According to the CAPEV results, the tongue trills caused statistically significant changes in seven out of the nine parameters analyzed. The use of the ANOVA analysis of variance showed that at moment 5 (after the fifth minute of experiment exercise) the voice presented the best overall rating, the least roughness, the least breathiness and high pitch. However, at moment 7 (after the seventh minute) the tension was significantly higher than at any other moment. In the paired comparison analysis, there was predominance of improved vocal in the post tongue trills at all moments, except the 7th. There was no statistically significant difference between moments 1 and 3. The voices at moment 5 were considered better that those at moment 3 and at moment 7 in the experiment group. In acoustic analysis of the experiment group there was gradual increase in the fundamental frequency and in the GNE after the 3rd minute and a decrease in noise as of the 1st minute. In the auditory perception analysis as well as in the acoustic analysis, the ratings for the experiment group were higher than those of the control group in relation to vocal improvement. The results of this study show the tongue trill performance time interferes in the vocal response of dysphonic women with positive response predominance at moment 5 compared to moments 1, 3 and 7. At moment 7 there is an increase of vocal tension and a drop in performance during tongue trills.
3

Análise perceptivo-auditiva e acústica da voz relacionada ao tempo de execução do exercício de vibração sonorizada de língua em mulheres com nódulos vocais / Auditory perceptual and acoustic analysis related to tongue trills performance time in dysphonic women with vocal nodules

Marcia Helena Moreira Menezes 31 March 2010 (has links)
A presente pesquisa teve como objetivo verificar se o tempo de execução do exercício de vibração sonorizada de língua interfere nas respostas perceptivoauditivas e acústicas da voz em mulheres com nódulos vocais. Além disso, se propôs identificar em qual momento há predomínio de respostas vocais positivas e negativas ao longo de sete minutos de execução deste exercício. Para tanto, participaram da pesquisa 27 mulheres, com idade entre 18 e 45 anos, disfônicas, com nódulos de pregas vocais. Todos os sujeitos da pesquisa foram incluídos no Grupo Experimental (GE), o qual realizou o Exercício de Vibração Sonorizada de Língua (EVSL) e apenas dez deles participaram também do Grupo-Controle (GC), onde foi feito o exercício placebo. Ambos foram realizados por sete minutos. As vozes foram registradas antes e após o primeiro, terceiro, quinto e sétimo minutos de execução dos exercícios e analisadas perceptivo- auditiva e acusticamente. Na análise perceptivo-auditiva, elas foram estudadas individualmente por meio do Protocolo CAPEV e aos pares, de forma comparativa, com a identificação da melhor voz para cada par examinado. Na análise acústica, utilizou-se o software VoxMetria versão 2.7h da CTS Informática na função Qualidade Vocal. Foram considerados os valores de frequência fundamental, jitter, shimmer, Glottal to Noise Excitation (GNE), irregularidade e ruído. De acordo com os resultados do CAPEV, o Exercício de Vibração Sonorizada de Língua (EVSL) provocou mudanças estatisticamente significantes em sete dos nove parâmetros investigados. A aplicação do teste estatístico ANOVA mostrou que no momento 5 (após o quinto minuto de execução do EVSL), a voz apresentou-se com melhor grau geral (p = 0,0004), menor rugosidade (p = 0,007), menor soprosidade (p < 0,001) e pitch agudo (p < 0,001). Porém, no momento 7 (após o sétimo minuto), a tensão apresentou-se significativamente mais alta (p = 0,016) em comparação a todos os outros momentos. Na análise pareada, houve prevalência de melhora vocal no pós-exercício em todos os momentos, com exceção do 7°. Não houve diferença estatisticamente significante entre os momentos 1 e 3. As vozes no momento 5 foram consideradas melhores do que nos momentos 3 (p = 0,013) e 7 (p = 0,013) no Grupo Experimental. Na análise acústica do grupo experimental houve aumento gradativo da frequência fundamental (p = 0,0030) e do GNE (p = 0,0011) após o terceiro minuto e diminuição do ruído (p = 0,0013) a partir do primeiro. Tanto na análise perceptivo-auditiva quanto na acústica, os resultados do Grupo Experimental foram superiores aos encontrados no Grupo-Controle no que diz respeito às melhoras vocais. Os resultados da presente pesquisa demonstram que o tempo de realização do EVSL interfere nas respostas vocais em mulheres disfônicas, sendo que no momento 5 há predomínio de respostas positivas em comparação aos momentos 1, 3 e 7. No 7, há aumento de tensão vocal e queda no desempenho do exercício. / The aim of this study was to assess whether tongue trills trill performance time interferes in the auditory perception and acoustic in women with vocal nodules. Furthermore, it was intended to identify at which moment during the 7-minute performance time the positive and negative responses predominate. This study comprised twenty-seven dysphonic women, who have vocal nodules, ranging from 18 to 45 years old. All subjects of this study were included in the experiment group which underwent tongue trills; only ten of these were also in the control group which underwent the placebo exercise. Both groups carried out the 7- minute performance time. The voices were recorded pre and post experimental and placebo exercises at the first, third, fifth and seventh minute of performance and auditory perception and acoustic were analyzed. In the auditory perception analysis the voices were analyzed individually according to the CAPEV protocol and in pairs, by comparison, to identify the better voice of the pair. The Voxmetria® program, version 2.7h by CTS Informática, was used to assess the vocal quality function. Fundamental frequency, jitter, shimmer, GNE, irregularity and noise were considered. According to the CAPEV results, the tongue trills caused statistically significant changes in seven out of the nine parameters analyzed. The use of the ANOVA analysis of variance showed that at moment 5 (after the fifth minute of experiment exercise) the voice presented the best overall rating, the least roughness, the least breathiness and high pitch. However, at moment 7 (after the seventh minute) the tension was significantly higher than at any other moment. In the paired comparison analysis, there was predominance of improved vocal in the post tongue trills at all moments, except the 7th. There was no statistically significant difference between moments 1 and 3. The voices at moment 5 were considered better that those at moment 3 and at moment 7 in the experiment group. In acoustic analysis of the experiment group there was gradual increase in the fundamental frequency and in the GNE after the 3rd minute and a decrease in noise as of the 1st minute. In the auditory perception analysis as well as in the acoustic analysis, the ratings for the experiment group were higher than those of the control group in relation to vocal improvement. The results of this study show the tongue trill performance time interferes in the vocal response of dysphonic women with positive response predominance at moment 5 compared to moments 1, 3 and 7. At moment 7 there is an increase of vocal tension and a drop in performance during tongue trills.
4

Dynamický dekodér pro rozpoznávání řeči / Dynamic Decoder for Speech Recognition

Veselý, Michal January 2017 (has links)
The result of this work is a fully working and significantly optimized implementation of a dynamic decoder. This decoder is based on dynamic recognition network generation and decoding by a modified version of the Token Passing algorithm. The implemented solution provides very similar results to the original static decoder from BSCORE (API of Phonexia company). Compared to BSCORE this implementation offers significant reduction of memory usage. This makes use of more complex language models possible. It also facilitates integration the speech recognition to some mobile devices or dynamic adding of new words to the system.

Page generated in 0.0744 seconds