• Refine Query
  • Source
  • Publication year
  • to
  • Language
  • 1045
  • 113
  • 23
  • 10
  • 5
  • 5
  • 5
  • 5
  • 4
  • 3
  • 2
  • 2
  • 1
  • 1
  • 1
  • Tagged with
  • 1211
  • 631
  • 225
  • 189
  • 173
  • 163
  • 159
  • 145
  • 129
  • 122
  • 121
  • 105
  • 102
  • 101
  • 101
  • About
  • The Global ETD Search service is a free service for researchers to find electronic theses and dissertations. This service is provided by the Networked Digital Library of Theses and Dissertations.
    Our metadata is collected from universities around the world. If you manage a university/consortium/country archive and want to be added, details can be found on the NDLTD website.
41

Análise perceptivo-auditiva e acústica da voz relacionada ao tempo de execução do exercício de vibração sonorizada de língua em mulheres com nódulos vocais / Auditory perceptual and acoustic analysis related to tongue trills performance time in dysphonic women with vocal nodules

Marcia Helena Moreira Menezes 31 March 2010 (has links)
A presente pesquisa teve como objetivo verificar se o tempo de execução do exercício de vibração sonorizada de língua interfere nas respostas perceptivoauditivas e acústicas da voz em mulheres com nódulos vocais. Além disso, se propôs identificar em qual momento há predomínio de respostas vocais positivas e negativas ao longo de sete minutos de execução deste exercício. Para tanto, participaram da pesquisa 27 mulheres, com idade entre 18 e 45 anos, disfônicas, com nódulos de pregas vocais. Todos os sujeitos da pesquisa foram incluídos no Grupo Experimental (GE), o qual realizou o Exercício de Vibração Sonorizada de Língua (EVSL) e apenas dez deles participaram também do Grupo-Controle (GC), onde foi feito o exercício placebo. Ambos foram realizados por sete minutos. As vozes foram registradas antes e após o primeiro, terceiro, quinto e sétimo minutos de execução dos exercícios e analisadas perceptivo- auditiva e acusticamente. Na análise perceptivo-auditiva, elas foram estudadas individualmente por meio do Protocolo CAPEV e aos pares, de forma comparativa, com a identificação da melhor voz para cada par examinado. Na análise acústica, utilizou-se o software VoxMetria versão 2.7h da CTS Informática na função Qualidade Vocal. Foram considerados os valores de frequência fundamental, jitter, shimmer, Glottal to Noise Excitation (GNE), irregularidade e ruído. De acordo com os resultados do CAPEV, o Exercício de Vibração Sonorizada de Língua (EVSL) provocou mudanças estatisticamente significantes em sete dos nove parâmetros investigados. A aplicação do teste estatístico ANOVA mostrou que no momento 5 (após o quinto minuto de execução do EVSL), a voz apresentou-se com melhor grau geral (p = 0,0004), menor rugosidade (p = 0,007), menor soprosidade (p < 0,001) e pitch agudo (p < 0,001). Porém, no momento 7 (após o sétimo minuto), a tensão apresentou-se significativamente mais alta (p = 0,016) em comparação a todos os outros momentos. Na análise pareada, houve prevalência de melhora vocal no pós-exercício em todos os momentos, com exceção do 7°. Não houve diferença estatisticamente significante entre os momentos 1 e 3. As vozes no momento 5 foram consideradas melhores do que nos momentos 3 (p = 0,013) e 7 (p = 0,013) no Grupo Experimental. Na análise acústica do grupo experimental houve aumento gradativo da frequência fundamental (p = 0,0030) e do GNE (p = 0,0011) após o terceiro minuto e diminuição do ruído (p = 0,0013) a partir do primeiro. Tanto na análise perceptivo-auditiva quanto na acústica, os resultados do Grupo Experimental foram superiores aos encontrados no Grupo-Controle no que diz respeito às melhoras vocais. Os resultados da presente pesquisa demonstram que o tempo de realização do EVSL interfere nas respostas vocais em mulheres disfônicas, sendo que no momento 5 há predomínio de respostas positivas em comparação aos momentos 1, 3 e 7. No 7, há aumento de tensão vocal e queda no desempenho do exercício. / The aim of this study was to assess whether tongue trills trill performance time interferes in the auditory perception and acoustic in women with vocal nodules. Furthermore, it was intended to identify at which moment during the 7-minute performance time the positive and negative responses predominate. This study comprised twenty-seven dysphonic women, who have vocal nodules, ranging from 18 to 45 years old. All subjects of this study were included in the experiment group which underwent tongue trills; only ten of these were also in the control group which underwent the placebo exercise. Both groups carried out the 7- minute performance time. The voices were recorded pre and post experimental and placebo exercises at the first, third, fifth and seventh minute of performance and auditory perception and acoustic were analyzed. In the auditory perception analysis the voices were analyzed individually according to the CAPEV protocol and in pairs, by comparison, to identify the better voice of the pair. The Voxmetria® program, version 2.7h by CTS Informática, was used to assess the vocal quality function. Fundamental frequency, jitter, shimmer, GNE, irregularity and noise were considered. According to the CAPEV results, the tongue trills caused statistically significant changes in seven out of the nine parameters analyzed. The use of the ANOVA analysis of variance showed that at moment 5 (after the fifth minute of experiment exercise) the voice presented the best overall rating, the least roughness, the least breathiness and high pitch. However, at moment 7 (after the seventh minute) the tension was significantly higher than at any other moment. In the paired comparison analysis, there was predominance of improved vocal in the post tongue trills at all moments, except the 7th. There was no statistically significant difference between moments 1 and 3. The voices at moment 5 were considered better that those at moment 3 and at moment 7 in the experiment group. In acoustic analysis of the experiment group there was gradual increase in the fundamental frequency and in the GNE after the 3rd minute and a decrease in noise as of the 1st minute. In the auditory perception analysis as well as in the acoustic analysis, the ratings for the experiment group were higher than those of the control group in relation to vocal improvement. The results of this study show the tongue trill performance time interferes in the vocal response of dysphonic women with positive response predominance at moment 5 compared to moments 1, 3 and 7. At moment 7 there is an increase of vocal tension and a drop in performance during tongue trills.
42

Evaluación Automática de Habilidad Lectora con Tecnología de Voz

Ramírez Díaz, Adolfo Nicolás January 2011 (has links)
No autorizada por el autor a ser publicada a texto completo / En esta memoria se presenta un sistema que permite evaluar la velocidad lectora de un individuo. Para realizar tal medición, se utilizan cuatro indicadores objetivos: la última palabra que fue leída dentro de un texto determinado; el número de términos omitidos; el número de palabras insertadas; y el número de palabras sustituidas. Para conseguir estas cuatro variables se utiliza tecnología de reconocimiento de voz (ASR – Automatic Speech Recognition). Para ello, se proponen e implementan diversos modelos de lenguaje que toman en consideración los errores esenciales en velocidad de lectura. En efecto, por ejemplo se consideran modelos de lenguaje que permiten saltos entre palabras dentro de un texto, así como también, se permiten reemplazos de ciertos términos. Los experimentos realizados en esta memoria permiten observar que un modelo que sólo toma en consideración omisiones de palabras, es decir, sin incluir casos de sustitución ni de inserción, consigue un error en la estimación de la última palabra leída y de términos omitidos de un 1,8% y un 5,9% respectivamente. Para la detección de errores de lectura relativos a palabras insertadas y sustituidas se utilizan modelos de lenguaje que incluyen unidades acústico fonéticas genéricas denominadas filler. Sin embargo, la incorporación de dichos fillers provoca un incremento en el error al estimar la última palabra leída y los términos omitidos. En efecto, el aumento en la estimación de tales errores es de un 8,1% y un 6,2%, respectivamente. Por otra parte, este tipo de modelo consigue un error en la estimación de palabras insertadas y sustituidas de un 7.8%. Como trabajo a futuro, se propone mejorar el modelamiento que considera los errores productos de palabras insertadas o sustituidas.
43

Construcción de un mecanismo de procesamiento de patrones temporales aplicado al reconocimiento de voz

Valenzuela Ramírez, Manuel Aníbal January 2015 (has links)
Ingeniero Civil en Computación / En el área de desarrollo de software para el control de aplicaciones y dispositivos electrónicos por voz, ha sido cada vez más común implementar mecanismos que cumplan esta función, considerando el procesamiento de señales sonoras para finalmente descubrir patrones que permitan la identificación y el uso de instrucciones. El objetivo de este trabajo es la exploración de un mecanismo que implemente el procesamiento de la voz humana, extrayendo sus características fundamentales y utilizando estos datos para la identificación de patrones en el tiempo. La hipótesis fundamental es que en la voz humana existen patrones en el tiempo, que podemos obtener y utilizar para la elaboración de instrucciones a ser ejecutadas por componentes de software. Para lograr el objetivo se tomó como base la implementación de un mecanismo de obtención de espectros de frecuencias de la voz humana, considerando algoritmos y técnicas basadas en análisis espectral. Para el procesamiento de los patrones se desarrolló un mecanismo basado en redes neuronales, dada la naturaleza vectorial de los datos. El trabajo, por tanto, se divide en dos grandes tareas. La primera es la obtención de los datos relevantes a la voz, de acuerdo con espectros de frecuencias obtenidos a partir de filtros basados en Wavelet transformadas. La segunda tarea es la implementación de una red neuronal no supervisada, basada en mapas auto-organizativos (SOM), que permita el registro e identificación de patrones en el tiempo. El resultado de este trabajo es un mecanismo que cumple parcialmente sus objetivos, dados los niveles de identificación de los fonemas y el costo computacional requerido.
44

Efeito de diferentes estratégias de codificação dos processadores de fala na voz de crianças usuárias de implante coclear / Effect of different speech processors coding strategies on the voice of children with cochlear implants

Coelho, Ana Cristina de Castro 29 June 2011 (has links)
O implante coclear tem como objetivo promover a percepção auditiva de indivíduos com deficiência auditiva de grau severo e profundo. Seu uso resulta na otimização do desenvolvimento da linguagem, da fala e da produção vocal de seus usuários. Esse dispositivo tem se mostrado uma das tecnologias mais efetivas e promissoras para remediar a perda auditiva, sendo que seus resultados são altamente dependentes da estratégia de codificação selecionada no processador de fala. O objetivo deste trabalho foi comparar as características perceptivas e acústicas da voz de crianças deficientes auditivas usuárias de implante coclear que utilizam as estratégias de codificação de fala Advanced Combination Encoder (ACE) e Fine Structure Processing (FSP), bem como investigar se as vozes dessas crianças se diferenciam das de crianças ouvintes. Crianças de 3 anos a 5 anos e 11 meses de idade foram selecionadas. Foi realizada análise acústica da vogal /a/ por meio do Multi Dimentional Voice Program (MDVP), da fala encadeada e da conversa espontânea por meio do Real Time Pitch (RTP), e análise perceptiva das mesmas emissões por meio de escalas visuais analógicas de parâmetros pré-selecionados. Em comparação com os usuários da estratégia ACE, os usuários da estratégia FSP apresentaram maior valor da frequência fundamental (F0) na vogal sustentada (p=0,004), maior desvio padrão da F0 na vogal sustentada (p=0,008), maior coeficiente de variação da amplitude também na vogal sustentada (p= 0,019), e maior desvio do pitch para o agudo na conversa espontânea (0,011). Em relação ao grupo controle os usuários da estratégia FSP apresentaram, na vogal sustentada, maior valor da F0 (p=0,012), maior desvio padrão da F0 (p=0,000), maior coeficiente de variação da frequência (p=0,039), maior coeficiente de variação da amplitude (p= 0,039), maior desvio de ressonância (p=0,027), maior instabilidade (p=0,001) e maior desvio da loudness para o forte (p=0,029). Apresentaram também na fala encadeada maior média da F0 (p=0,002), maior frequência máxima (p=0,009), maior grau geral do impacto negativo da voz (p=0,003) e maior tensão (p=0,001). Na conversa espontânea apresentaram maior grau geral do impacto negativo da voz (p=0,001), maior tensão (p=0,012), maior desvio do pitch para o agudo (0,000) e maior desvio de ressonância (p=0,010). Em comparação com os usuários da estratégia FSP, os usuários da estratégia ACE apresentaram maior valor do índice de fonação suave (SPI) na vogal sustentada (p=0,013). Em relação ao grupo controle os usuários da estratégia ACE apresentaram maior instabilidade na vogal sustentada (p=0,001), maior extensão da frequência em Hertz (p=0,004) e em semitons (p=0,048) na fala encadeada, maior frequência máxima (p=0,011) também na fala encadeada, maior grau geral do impacto negativo da voz na conversa espontânea (p=0,009) e maior desvio da ressonância na conversa espontânea (p=0,021). A partir dos dados concluiu-se que os usuários da estratégia FSP apresentaram vozes mais agudas e instáveis do que os usuários da estratégia ACE, que apresentaram produção vocal mais suave. Em relação ao grupo controle, os usuários da estratégia ACE apresentaram valor mais elevado do grau geral do impacto negativo da voz, maior grau de desvio da ressonância e maior extensão vocal para o agudo. Os usuários da estratégia FSP apresentaram vozes com maior valor do desvio global do impacto da voz, voz mais aguda, com maior desvio de ressonância, maior grau de tensão, maior desvio da loudness e maior extensão vocal. / The cochlear implant has the pupose of providing hearing perception for individuals with severe and profound hearing loss. The implants use result on optimization of development of language, speech and voice production of its users. This device is one of the most promissing and effective technologies to remedy hearing loss, and its results depend highly on the speech coding strategy selected in the speech processor. The pupose of this study was to compare perceptual and acoustic characteristics of the voices of children who use the Advanced Combination Encoder (ACE) or Fine Structure Processing (FSP) speech coding strategies, and to investigate whether these characteristics differ from children with normal hearing. Children between 3 and 5 years and 11 months of age participated. Acoustic analysis of the sustained vowel /a/ was performed using the Multi Dimentional Voice Program. Analysis of sequential speech and spontaneous speech were performed using the Real Time Pitch. Perceptual analysis of these speech samples were performed using visual-analogic scales of pre-selected parameters. In comparison with the users of the ACE strategy, the users of the FSP strategy presented greater value of fundamental frequency (F0) for the sustained vowel (p=0,004), greater standard deviation of the F0 for the sustained vowel (p=0,008), greater amplitude variation coheficient, also for the sustaned vowel (p= 0,019), and greater pitch deviation for the spontaneous speech (p=0,011). In relation to the control group, the users of the FSP strategy presented, for the sustained vowel, greater F0 value (p=0,012), greater standard deviation of the F0 (p=0,000), greater frequency variation coheficient (p=0,039), grater amplitude variation coheficient (p= 0,039), greater ressonance deviation (p=0,027), greater instability (p=0,001) and greater loudness deviation (p=0,029). They also presented, for the sequential speech, greater F0 average (p=0,002), greater maximum frequency (p=0,009), greater overall severity of the voice (p=0,003) and greater strain (p=0,001). For the spontaneous speech, they presented greater overall severity (p=0,001), greater strain (p=0,012), greater pitch deviation (0,000) and greater ressonance deviation (p=0,010). In comparison the users of the FSP strategy, the users of the ACE strategy presented greater value of the Soft Phonation Index (SPI) for the sustained vowel (p=0,013). In relation to the control group, the users of the ACE strategy presented greater instability for the sustained vowel (p=0,001), greater frequency range in Hertz (p=0,004) and in semitones (p=0,048) for the sequential speech, greater maximum frequency (p=0,011) also for the sequential speech, greater overall severity for the spontaneous speech (p=0,009) and greater ressonance deviation for the spontaneous speech. (p=0,021). The study concluded that the users of the FSP strategy presented more high pitched and unstable voices than the users of the ACE strategy, who presented softer phonation. In relation to the control group, the users of the ACE strategy presented greater value of overall severity, greater ressonance deviation and greater frequency range. The users of the FSP strategy presented greater value of overall severity, more high pitched voices, greater ressonance deviation, greater vocal strain e and greater frequency range.
45

Desempenho vocal do professor: avalia??o multidimensional

Oliveira, I?ra Bittante de 06 December 1999 (has links)
Made available in DSpace on 2016-04-04T18:30:07Z (GMT). No. of bitstreams: 1 Iara Bittante de Oliveirar.pdf: 1518450 bytes, checksum: edddd389b63b9cb888bd698299d7dd2e (MD5) Previous issue date: 1999-12-06 / O objetivo deste estudo foi propor uma avalia??o multidimensional, de vari?veis influentes no desempenho vocal do professor do ensino fundamental. A amostra final, composta de 42 professores de ensino fundamental da cidade de campinas e subdividida em dois grupos, foi selecionada a partir de um grupo de 112 docentes, tendo-se como crit?rio principal, a queixa de tr?s ou mais sintomas vocais. O primeiro grupo foi composto por 22 docentes de escolas particulares e o segundo, por 20 sujeitos de escolas p?blicas. O estudo constou de tr?s etapas, com utiliza??o de quatro instrumentos. Na primeira, utilizou-se um question?rio sobre sintomas vocais a fim ed selecionarmos os sujeitos para compor a amostra final. Para a segunda etapa foi apresentado um question?rio de auto-avalia??o do desempenho vocal, composto de tr?s partes e, finalmente, para a terceira parte, foram elaborados dois protocolos: um para avalia??o da qualidade vocal dos sujeitos e o outro para avalia??o das imagens laringosc?picas. Para as an?lises estat?sticas foram utilizados Correla??o de Pearson, Teste t independente, An?lise de Vari?ncia (ANOVA) e Teste de Fisher.N?o foram encontradas diferen?as significativas entre professores de escolares particulares e p?blicas, no que se refere ? preval?ncia de sintomas vocais, altera??es de qualidade vocal e desordens lar?ngeas, as quais se mostraram bastante elevadas em ambos os grupos.N?o foram tamb?m encontradas diferen?as estatisticamente significantes, entre os dois grupos com rela??o ?s auto-avalia??es de desempenho vocal, com exce??o das diferen?as significativas encontradas, entre docentes de escola p?blica, que apresentaram pior avalia??o de suas condi??es f?sicas de trabalho e melhores avalia??es quanto a h?bitos de alimenta??o e hidrata??o, em rela??o aos da escola particular. Ressalta-se a rela??o de signific?ncia encontrada, entre a an?lise perceptivo-auditiva das vozes do sujeitos e as altera??es encontradas nas imagens laringosc?picas. Conclui-se da import?ncia de uma vis?o multidimensional para avalia??o vocal do professor.
46

Parâmetros acústicos e perceptivo-auditivos da voz de adultos e idosos / Acoustic and perceptual parameters of adults and elderly´s voice

Santos, Aline Oliveira 24 February 2012 (has links)
Estudos revelam que homens e mulheres apresentam modificações vocais em decorrência do envelhecimento, entretanto, a maioria compara indivíduos jovens e idosos, agrupando-os em grandes intervalos etários. Estudar indivíduos da faixa etária próximas à terceira idade e compará-los em menores intervalos etários pode ser mais sensível para evidenciar características importantes. Objetivou-se verificar: quais as diferenças dos parâmetros acústicos e perceptivo-auditivos da voz de homens e mulheres de diversas décadas etárias; quais características vocais modificam com o avanço da idade, e determinar a relação entre as características perceptivo-auditivas e acústicas nessa população. Participaram do estudo 125 homens e 140 mulheres, com idades entre 30 e 79 anos, agrupados por décadas etárias. Por meio de uma escala analógica visual, foram avaliados, por três juízes, o grau geral do desvio vocal (G), rugosidade (R) e soprosidade (S) de fala encadeada e vogal sustentada. Foram analisados por meio do programa Mult Dimension Voice Program (KayPentax) os parâmetros frequência fundamental (F0), desvio-padrão da F0 (dp F0), jitter (%), shimmer (%), proporção ruído-harmonico (NHR), índice de turbulência vocal (VTI) e índice de fonação suave (SPI). A comparação entre os grupos foi realizada por meio de ANOVA e Tukey, as correlações, por meio do teste de Pearson, (significância de 5%). Na fala, homens e mulheres de 30-49 anos apresentaram menor G e R que os de idade superior a 50 anos (p<0,000) e mulheres com idade entre 50-59 anos apresentaram maior S que as de 60-79 (p=0,026). Em ambos os gêneros, à medida que a idade aumentou, maiores foram G e R durante a fala, enquanto que S reduziu durante a vogal de mulheres (p=0,005). A análise acústica mostrou que VTI foi maior em sujeitos de 70-79 anos em relação aos de 40-49 (p<0,040). O SPI dos sujeitos de 40-49 anos foi o maior (p<0,000). Houve correlação positiva entre o avanço da idade e dp F0 e NHR nos homens (p<0,000 e 0,023), e negativa para SPI nas mulheres (p=0,025). Quanto mais elevada a F0 da voz masculina, maior S (p=0,043); quanto mais reduzida a F0 da voz feminina, maior R (p=0,006). Conclui-se que é importante estudar sujeitos da faixa de transição entre a fase adulta e idosa, visto as diferenças de qualidade vocal em sujeitos maiores de 50 anos em relação aos mais jovens. Agrupar os sujeitos entre décadas etárias colabora para a compreensão do envelhecimento vocal, haja vista os sujeitos da sétima década que apresentaram maior VTI que os da quarta, enquanto estes últimos apresentam maior SPI que os das demais faixas etárias, além de ter evidenciado as diferenças relacionadas à soprosidade, que foi maior nas mulheres de meia idade que em idosas. Para homens e mulheres, quanto maior o grau geral e a rugosidade, maiores são os valores relacionados à instabilidade de frequência, perturbação de frequência e intensidade e medidas de ruído. Já para a soprosidade, a correlação se deu apenas para a instabilidade de frequência, perturbação de frequência e intensidade e SPI. A F0 correlacionou-se com a qualidade vocal de forma distinta entre homens e mulheres da faixa etária estudada. / A number of studies have found that men and women can present vocal changes as a result of aging; meanwhile, most of the studies compare young and elderly people, grouping them in large age ranges. Reducing the subjects to adult and seniors age groups and comparing them in smaller age ranges can be more sensible to evidence significant characteristics. The purpose of this study was to verify differences on acoustic measures and perceptual analysis of the voice of adults and seniors, which of them are modified by aging and set the relation between perceptual analysis and acoustic measures on this population. Two hundred and sixty-five, men (n=125) and women (n=140) from 30 to 79 years-old, grouped into decade age ranges had their voice evaluated by 3 judges. Speech samples and sustained vowels were submitted to perceptive analysis consisted of the assessment of grade of overall deviation (G), roughness (R) and breathiness (B), using a visual-analog scale. Acoustic measures of speaking fundamental frequency (F0) and its standard deviation (sdF0), jitter (%),shimmer (%), noise-harmonic ratio (NHR), voice turbulence index (VTI) and soft phonation index (SPI) were assessed by Multi-Dimensional Voice Program (Kay Pentax). The comparison among the groups was held by ANOVA and Tukey and the correlations by Pearson\'s test (5% significance). During speech, men and women from 30-49 years-old have presented less G and R than the subjects 50-older (p<0,000) and women aged 50-59 had a greater B than women of 60-79 years-old (p=0,026). The parameters G and R increased with aging for men and women at the speech task, and B reduced in women at the sustained vowel task (p=0,005). About the acoustic measures, VTI was greater in subjects of 70-79 year-old than 40-49 ones (p<0,040). SPI of subjects from 40-49 years-old was the greatest. Positive correlation was found between aging, sdF0 and NHR in men (p<0,000 e 0,023), and negative for SPI in women (p=0,025). The higher F0 of mens voice, the greater is B (p=0,043); the more reduced F0 on women voice, the greater is R (p=0,006). Its relevant to study subjects on transition from adult to senior ages, since the differences on voice quality in subjects 50 or older are greater than in young people. Grouping the subjects by decade contributed to better understand of vocal aging. For instance, the 70 or older group have shown a greater VTI than people in their 40s, while this last group have shown a bigger SPI than others age ranges, in addition to evidenced differences related to breathiness that washigher in middle age women than in elderly. For both genders the bigger the general voice deviation, and the roughness, the bigger are parameters related to instability of frequency, its disturbance, intensity and noise ratios. With regard to breathiness, the correlation happens only to frequency instability, its disturbance, intensity and SPI. The correlation between F0 and vocal quality was different to men and women of the studied age ranges.
47

Efeito de diferentes estratégias de codificação dos processadores de fala na voz de crianças usuárias de implante coclear / Effect of different speech processors coding strategies on the voice of children with cochlear implants

Ana Cristina de Castro Coelho 29 June 2011 (has links)
O implante coclear tem como objetivo promover a percepção auditiva de indivíduos com deficiência auditiva de grau severo e profundo. Seu uso resulta na otimização do desenvolvimento da linguagem, da fala e da produção vocal de seus usuários. Esse dispositivo tem se mostrado uma das tecnologias mais efetivas e promissoras para remediar a perda auditiva, sendo que seus resultados são altamente dependentes da estratégia de codificação selecionada no processador de fala. O objetivo deste trabalho foi comparar as características perceptivas e acústicas da voz de crianças deficientes auditivas usuárias de implante coclear que utilizam as estratégias de codificação de fala Advanced Combination Encoder (ACE) e Fine Structure Processing (FSP), bem como investigar se as vozes dessas crianças se diferenciam das de crianças ouvintes. Crianças de 3 anos a 5 anos e 11 meses de idade foram selecionadas. Foi realizada análise acústica da vogal /a/ por meio do Multi Dimentional Voice Program (MDVP), da fala encadeada e da conversa espontânea por meio do Real Time Pitch (RTP), e análise perceptiva das mesmas emissões por meio de escalas visuais analógicas de parâmetros pré-selecionados. Em comparação com os usuários da estratégia ACE, os usuários da estratégia FSP apresentaram maior valor da frequência fundamental (F0) na vogal sustentada (p=0,004), maior desvio padrão da F0 na vogal sustentada (p=0,008), maior coeficiente de variação da amplitude também na vogal sustentada (p= 0,019), e maior desvio do pitch para o agudo na conversa espontânea (0,011). Em relação ao grupo controle os usuários da estratégia FSP apresentaram, na vogal sustentada, maior valor da F0 (p=0,012), maior desvio padrão da F0 (p=0,000), maior coeficiente de variação da frequência (p=0,039), maior coeficiente de variação da amplitude (p= 0,039), maior desvio de ressonância (p=0,027), maior instabilidade (p=0,001) e maior desvio da loudness para o forte (p=0,029). Apresentaram também na fala encadeada maior média da F0 (p=0,002), maior frequência máxima (p=0,009), maior grau geral do impacto negativo da voz (p=0,003) e maior tensão (p=0,001). Na conversa espontânea apresentaram maior grau geral do impacto negativo da voz (p=0,001), maior tensão (p=0,012), maior desvio do pitch para o agudo (0,000) e maior desvio de ressonância (p=0,010). Em comparação com os usuários da estratégia FSP, os usuários da estratégia ACE apresentaram maior valor do índice de fonação suave (SPI) na vogal sustentada (p=0,013). Em relação ao grupo controle os usuários da estratégia ACE apresentaram maior instabilidade na vogal sustentada (p=0,001), maior extensão da frequência em Hertz (p=0,004) e em semitons (p=0,048) na fala encadeada, maior frequência máxima (p=0,011) também na fala encadeada, maior grau geral do impacto negativo da voz na conversa espontânea (p=0,009) e maior desvio da ressonância na conversa espontânea (p=0,021). A partir dos dados concluiu-se que os usuários da estratégia FSP apresentaram vozes mais agudas e instáveis do que os usuários da estratégia ACE, que apresentaram produção vocal mais suave. Em relação ao grupo controle, os usuários da estratégia ACE apresentaram valor mais elevado do grau geral do impacto negativo da voz, maior grau de desvio da ressonância e maior extensão vocal para o agudo. Os usuários da estratégia FSP apresentaram vozes com maior valor do desvio global do impacto da voz, voz mais aguda, com maior desvio de ressonância, maior grau de tensão, maior desvio da loudness e maior extensão vocal. / The cochlear implant has the pupose of providing hearing perception for individuals with severe and profound hearing loss. The implants use result on optimization of development of language, speech and voice production of its users. This device is one of the most promissing and effective technologies to remedy hearing loss, and its results depend highly on the speech coding strategy selected in the speech processor. The pupose of this study was to compare perceptual and acoustic characteristics of the voices of children who use the Advanced Combination Encoder (ACE) or Fine Structure Processing (FSP) speech coding strategies, and to investigate whether these characteristics differ from children with normal hearing. Children between 3 and 5 years and 11 months of age participated. Acoustic analysis of the sustained vowel /a/ was performed using the Multi Dimentional Voice Program. Analysis of sequential speech and spontaneous speech were performed using the Real Time Pitch. Perceptual analysis of these speech samples were performed using visual-analogic scales of pre-selected parameters. In comparison with the users of the ACE strategy, the users of the FSP strategy presented greater value of fundamental frequency (F0) for the sustained vowel (p=0,004), greater standard deviation of the F0 for the sustained vowel (p=0,008), greater amplitude variation coheficient, also for the sustaned vowel (p= 0,019), and greater pitch deviation for the spontaneous speech (p=0,011). In relation to the control group, the users of the FSP strategy presented, for the sustained vowel, greater F0 value (p=0,012), greater standard deviation of the F0 (p=0,000), greater frequency variation coheficient (p=0,039), grater amplitude variation coheficient (p= 0,039), greater ressonance deviation (p=0,027), greater instability (p=0,001) and greater loudness deviation (p=0,029). They also presented, for the sequential speech, greater F0 average (p=0,002), greater maximum frequency (p=0,009), greater overall severity of the voice (p=0,003) and greater strain (p=0,001). For the spontaneous speech, they presented greater overall severity (p=0,001), greater strain (p=0,012), greater pitch deviation (0,000) and greater ressonance deviation (p=0,010). In comparison the users of the FSP strategy, the users of the ACE strategy presented greater value of the Soft Phonation Index (SPI) for the sustained vowel (p=0,013). In relation to the control group, the users of the ACE strategy presented greater instability for the sustained vowel (p=0,001), greater frequency range in Hertz (p=0,004) and in semitones (p=0,048) for the sequential speech, greater maximum frequency (p=0,011) also for the sequential speech, greater overall severity for the spontaneous speech (p=0,009) and greater ressonance deviation for the spontaneous speech. (p=0,021). The study concluded that the users of the FSP strategy presented more high pitched and unstable voices than the users of the ACE strategy, who presented softer phonation. In relation to the control group, the users of the ACE strategy presented greater value of overall severity, greater ressonance deviation and greater frequency range. The users of the FSP strategy presented greater value of overall severity, more high pitched voices, greater ressonance deviation, greater vocal strain e and greater frequency range.
48

Influência da hidratação sistêmica na voz de coristas sem e com o aquecimento vocal / Influence of systemic hydration on choristers voices whilst warmed and unwarmed

Xavier, Carla Marques de Sousa 12 December 2013 (has links)
Introdução: a água é componente vital para o desempenho das funções corporais e fundamental para a produção vocal. Sabe-se ainda que exercícios de aquecimento vocal preparam a voz para o canto. O propósito deste estudo foi investigar a influência da hidratação sistêmica na voz de coristas sem e com aquecimento vocal. Material e métodos: esta pesquisa teve a aprovação do CEP-FOB/USP, protocolo: 085/2011. Participaram 16 coristas, com média de idade de 49,38 anos, DP 14,74, sendo 12 do sexo feminino (75%) e quatro do sexo masculino (25%). Todos os coristas eram integrantes de coros há no mínimo um ano, saudáveis, sem queixas vocais e auditivas nos dias das avaliações e sem histórico de cirurgias laríngeas. Procedimentos: os participantes tiveram suas vozes avaliadas em dois dias não consecutivos, o primeiro na condição desidratado (D) e o segundo na condição hidratado (H). Em ambos os dias tiveram suas vozes gravadas antes (D1 e H1) e após a realização do aquecimento vocal (D2 e H2). Para a condição desidratado os coristas ficaram sem ingerir água durante as 12 horas que antecederam a primeira avaliação. Para a condição de hidratado houve a ingestão fracionada de três litros de água para os homens e dois litros para as mulheres no dia anterior ao dia da segunda avaliação. As condições hidratado e desidratado foram avaliadas por meio da coloração e gravidade específica da urina. Foi realizada a avaliação acústica dos parâmetros F0, jitter, shimmer e NHR, por meio do Multi Dimensional Voice Program (MDVP). A análise perceptivo-auditiva considerou o grau geral, a rugosidade, a soprosidade, a tensão, o pitch e o loudness da vogal /a/ sustentada por meio da escala visual analógica (EVA). As vozes foram analisadas pela fonoaudióloga que apresentou melhor análise intra-juiz (p=0,000 e r=0,77). Resultados: houve forte correlação entre os métodos da coloração e a gravidade específica da urina (r=0,807 e p<0,05). Na avaliação acústica houve redução da F0 e melhora do shimmer e na avaliação perceptivo-auditiva foi identificada melhora dos parâmetros da rugosidade, soprosidade, tensão e redução do pitch, nas vozes hidratadas sem aquecimento vocal. Nas vozes com aquecimento vocal a avaliação acústica revelou estabilidade da F0 e melhora do shimmer e na perceptivo-auditiva redução da rugosidade e do pitch. Conclusão: a hidratação sistêmica agiu positivamente na voz sem aquecimento vocal revelando na avaliação acústica redução da F0 e melhora do shimmer e na avaliação perceptivo-auditiva melhora dos parâmetros da rugosidade, soprosidade, tensão e redução do pitch. A hidratação sistêmica agiu positivamente na voz com aquecimento vocal revelando na avaliação acústica estabilidade da F0 e melhora do shimmer e na perceptivo-auditiva redução da rugosidade e do pitch. / Introduction: Water is a vital component for bodily functions and is fundamental for voice production. It is known that vocal warming exercises prepare the voice for singing. The purpose of this study was to investigate the influence of systemic hydration on choristers voices whilst warmed and unwarmed. Material and Methods: This research had the approval from CEP-FOB/USP protocol 085 2011. 16 choristers took part on the research, whose average age is 49.38 years (standard deviation 14,74), being 12 female (75%) and 4 male (25%). All choristers are healthy, do not present complaint on vocal or hearing issues during test days and do not possess history of laryngeal surgery. Procedure: the participants had their voices evaluated in two non-consecutive days, with hydrated voice (H) on the first day and with dehydrated voice (D) on the second. In both days, their voices were recorded before vocal warming (D1 and H1) and after vocal warming (D2 and H2.) For the dehydration condition, the choristers drank no water during the 12 preceding hours relative to the first test. For the hydration condition, fractioned water intake(3 liters for men and 2 liters for women) was held on the day before the second test. Hydrated and dehydrated conditions were determined by means of urine coloration and specific gravity. The acoustic evaluation was performed focusing in parameters F0, jitter, shimmer and NHR using the multidimensional voice program. The perceptual-auditory analysis considered the overall degree, rugosity, breathiness, tension, pitch and loudness of the sustained vowel a by visual analog scale. The voices were analyzed by the speech therapist who presented best intra-judge analysis (P = 0.000, R = 0.77). Results: The urine coloration and specific gravity have held strong correlation, with R = 0.807 and P < 0.05. On the acoustic evaluation, there has been reduction of F0 and shimmer improvement; and in the perceptive-auditory evaluation it was identified improvement on rugosity, breathiness, tension and reduction of pitch on hydrated unwarmed voices. On warmed voices, the acoustic evaluation revealed stability on F0 and improvement on shimmer; on the perceptive-auditory evaluation, rugosity and pitch have reduced. Conclusion: The systemic hydration acted positively on unwarmed voice revealing F0 reduction and shimmer improvement on the acoustic evaluation; and improvement on rugosity, breathiness, tension and pitch on the perceptive-auditory evaluation. Also, systemic hydration acted positively on the warmed voice, revealing F0 stability and shimmer improvement on the acoustic evaluation; and rugosity and pitch reduction on the perceptive-auditory evaluation.
49

Biofeedback da voz cantada

Ventura, José Alexandre Pinto dos Santos January 2011 (has links)
Tese de mestrado integrado. Engenharia Electrotécnica e de Computadores. Faculdade de Engenharia. Universidade do Porto. 2011
50

Classificação de sinais de voz utilizando a transformada Wavelet Packet e redes neurais artificiais

Crovato, César David Paredes January 2004 (has links)
Este trabalho apresenta um sistema de classificação de voz disfônica utilizando a Transformada Wavelet Packet (WPT) e o algoritmo Best Basis (BBA) como redutor de dimensionalidade e seis Redes Neurais Artificiais (ANN) atuando como um conjunto de sistemas denominados “especialistas”. O banco de vozes utilizado está separado em seis grupos de acordo com as similaridades patológicas (onde o 6o grupo é o dos pacientes com voz normal). O conjunto de seis ANN foi treinado, com cada rede especializando-se em um determinado grupo. A base de decomposição utilizada na WPT foi a Symlet 5 e a função custo utilizada na Best Basis Tree (BBT) gerada com o BBA, foi a entropia de Shannon. Cada ANN é alimentada pelos valores de entropia dos nós da BBT. O sistema apresentou uma taxa de sucesso de 87,5%, 95,31%, 87,5%, 100%, 96,87% e 89,06% para os grupos 1 ao 6 respectivamente, utilizando o método de Validação Cruzada Múltipla (MCV). O poder de generalização foi medido utilizando o método de MCV com a variação Leave-One-Out (LOO), obtendo erros em média de 38.52%, apontando a necessidade de aumentar o banco de vozes disponível.

Page generated in 0.4172 seconds