• Refine Query
  • Source
  • Publication year
  • to
  • Language
  • 1045
  • 118
  • 23
  • 10
  • 5
  • 5
  • 5
  • 5
  • 4
  • 3
  • 2
  • 2
  • 1
  • 1
  • 1
  • Tagged with
  • 1216
  • 631
  • 225
  • 189
  • 173
  • 163
  • 159
  • 145
  • 129
  • 122
  • 121
  • 105
  • 102
  • 101
  • 101
  • About
  • The Global ETD Search service is a free service for researchers to find electronic theses and dissertations. This service is provided by the Networked Digital Library of Theses and Dissertations.
    Our metadata is collected from universities around the world. If you manage a university/consortium/country archive and want to be added, details can be found on the NDLTD website.
201

Mulheres obesas: características vocais e medidas fonatórias / Obese women: vocal characteristics and phonation measurements

Rossi, Débora Cardoso 27 July 2010 (has links)
Made available in DSpace on 2016-04-27T18:12:46Z (GMT). No. of bitstreams: 1 Debora Cardoso Rossi.pdf: 663231 bytes, checksum: 4ed35aa419646722948d994b2276d1ff (MD5) Previous issue date: 2010-07-27 / Coordenação de Aperfeiçoamento de Pessoal de Nível Superior / INTRODUCTION: Grade III overweight is associated with health, respiratory and orofacial motility disorders. AIM: to describe the vocal characteristics and phonation measurements of a group of grade III overweight women. METHOD: The sample was composed of two groups, Study group (SG) composed of 30 women, in between 25 and 45 years of age, morbidly obese and candidates to bariatric surgery. The control group (CG) was selected by pairing with women of similar age groups, with no vocal signs and/or symptoms and with Body Mass Index (BMI) within normal values. The study was performed with volunteers from the city of Belo Horizonte (MG) and those subjects in the SG were followed by the Public health system in Belo Horizonte (MG). The recorded material was composed of sustained vowels /a/, /é/ e /i/ in the subject s habitual voice tone, chained speech composed of the months of the year and reading of a standard sentence. The perceptual-auditory evaluation was performed by judges and the acoustic analysis was done using software PRAAT. The mean fundamental frequency (f0), f0 variation, mean intensity, mean f0 of the segment /a/ of the word aves were extracted from the standard phrase and analyzed using the software. The same program was used to assess the mean f0 of the sustained vowel /a/. To obtain the maximum phonation time (MPT), the sustained emissions of /a/, /i/, /s/, and /z/ were measured. The data was analyzed using descriptive statistics, T-test and Mann-Whitney test. RESULTS: As far as the perceptual-auditory evaluation, for most subjects in the SG the results were: medium-high pitch, inadequate loudness levels (strong or weak), varied resonance types, though without balance, and GRBASI scale with General Grade (G) zero. The acoustic evaluation showed: mean f0 measurements above 204Hz and mean f0 in the segment /a/ of the word aves, below 204Hz. For MPT values: /s/ values were below 19.7s; /z/ values were below 18.5s; and vowels /a/ and /i/ were below 16.2 seconds. The results for the acoustic analysis for most subjects, in all speech samples for CG were: mean f0 values below 204Hz. All MPT values for the CG were higher than those in the SG. When comparing the SG and the CG, the following variables presented statistical significance: age group, weight, BMI, and in acoustics mean intensity and MPT. CONCLUSION: the grade 3 overweight women of the study group presented as vocal characteristics: medium-high pitch, inadequate loudness levels and unbalanced resonance. In acoustic evaluation the group presented higher fundamental frequency and lower maximum phonation times / INTRODUÇÃO: a obesidade grau III está associada a transtornos de saúde, respiratórios e de motricidade orofacial. OBJETIVO: descrever as características vocais e as medidas fonatórias de um grupo de mulheres obesas grau III. MÉTODO: a amostra foi composta por dois grupos, o de estudo (GE), composto por 30 mulheres, entre 25 e 45 anos, obesas grau III candidatas a cirurgia bariátrica. O grupo controle (GC) foi selecionado por pareamento com mulheres de faixa etária próxima, sem sinal e/ou sintoma vocal e com o índice de massa corpórea (IMC) dentro da normalidade. A pesquisa foi realizada com voluntárias da cidade de Belo Horizonte (MG) e no grupo GE todas eram atendidas pelo Sistema Único de Saúde (SUS) de Belo Horizonte (MG). A gravação foi composta por: vogais /a/, /é/ e /i/ sustentadas em tom habitual, fala encadeada com meses do ano e a leitura de uma frase padronizada. A avaliação perceptivo auditiva da voz foi realizada por juízes e a acústica por meio do programa PRAAT. Foi extraído da frase padronizada a média da freqüência fundamental (f0), a variação de f0 e a média da intensidade, além da média de f0 do segmento /a/ da palavra aves e a média da f0 da vogal /a/ sustentada aferidas pelo programa. Para o tempo máximo de fonação (TMF) foram medidas as emissões prolongadas de /a/, /i/, /s/ e /z/. Para analisar os dados foi aplicada uma estatística descritiva, o teste T e o de Mann-Whitney. RESULTADOS: nos resultados da avaliação perceptivo auditiva, no GE foi verificado na maioria do grupo: pitch médio para agudo, loudness considerado não adequado (forte ou fraco), ressonância variada, mas sem equilíbrio e escala GRBASI, com grau geral (G) igual à zero. Na acústica foi obtido: médias da f0 superiores a 204Hz e média de f0 do segmento /a/ da palavra aves, menor que 204Hz. Nos valores do TMF, obteve-se: /s/ com valores menores que 19,7s, /z/ com valores inferiores a 18,5s e /a/ e /i/ com valores menores que 16,2 segundos. Os resultados encontrados, na analise acústica, para a maioria dos sujeitos, em todas as amostragens de fala, do GC foram: médias da f0 menores que 204Hz. Todos os valores do TMF do GC foram maiores que os do GE. No cruzamento do GE com o GC apresentaram significância estatística: a faixa estaria, peso e IMC, na acústica a média da intensidade e TMF. CONCLUSÃO: as mulheres obesas grau III, do grupo estudado, apresentaram como característica da voz: pitch médio para agudo, loudness inadequado e ressonância não equilibrada. Na acústica foi encontrado pro grupo freqüência fundamental mais elevada e tempos máximos de fonação diminuídos
202

Voz do ator: condições ambientais e de organização de trabalho

Souza, Guilherme Zaramella de 29 April 2016 (has links)
Submitted by Filipe dos Santos (fsantos@pucsp.br) on 2017-01-10T13:02:12Z No. of bitstreams: 1 Guilherme Zaramella de Souza.pdf: 1207622 bytes, checksum: 8b8dd88eefb7724930fb6e7a7e7cf28c (MD5) / Made available in DSpace on 2017-01-10T13:02:12Z (GMT). No. of bitstreams: 1 Guilherme Zaramella de Souza.pdf: 1207622 bytes, checksum: 8b8dd88eefb7724930fb6e7a7e7cf28c (MD5) Previous issue date: 2016-04-26 / Conselho Nacional de Pesquisa e Desenvolvimento Científico e Tecnológico - CNPq / Introduction: The number of Speech Therapy publications regarding professional voice has recently grown noticeably. Differing from other voice professionals, though, not many protocols have been established to assess Actor’s vocal productions. Objective: Analyse environmental and organisational conditions for working actors, associating the former two to vocal symptom references. Method: One hundred actors with a theatrical experience of at least two years answered an adapted version of a survey named Condição de Produção Vocal do Professor (CPV-P) / Teacher’s Vocal Production Conditions which was conceived by experienced voice research professionals. The survey focused on environmental, organisational and functional aspects of actor’s voice production. All data was submitted to descriptive statistical analysis. For the "vocal symptoms" outcome analysis between independent variables the chi-square test was used. A multiple binary logistic regression analysis (p<0,05) was employed to some outcomes. Results: Amongst the respondents, 56% are male, average age of 30.8 years (sd = 8.6), 49% can’t provide for themselves with acting alone and resort to complimentary activities, often also vocally demanding. Phlegm was the primary symptom to be exposed (68.0%), followed by throat dryness (54.0%) and deep voice(45.0%). There was also a significant statistical link between stressful work rhythm, psychological abuse and weakened voice (p=0.030 and p=0.048 respectively). Actors mindful of health-impacting work issues relied on that as a protective factor to secretory coughing (OR=0.40; p=0.044), dry throat (OR=0.42; p=0.042) and hoarseness (OR=0.30; p=0.011). Shortness of breath was manifested as a symptom in a lower incidence amongst actors who habitually cool-down their voices (OR=0.19; p=0.034). Conclusion: Dust and noise were pointed as the main environmental issues whilst intense physical exertion and stressful work rhythm were pointed as organisational ones. The most prevalent symptoms were phlegm, dry throat, deep voice and dry cough. In this context phlegm was directly associated with noise / Introdução: o número de publicações sobre voz profissional realizados pela Fonoaudiologia têm aumentado. Entretanto, diferentemente de outros profissionais da voz pesquisados, poucos instrumentos são criados para avaliar produção vocal do ator. Objetivo: analisar as condições de aasm cboienndtiçeõ ees ddee oMrégtaondizoa:ç 1ã0o0 daoto rterasb caolhmo neom m íantiomreos d, oaiss saoncoisa ddaes viàv êrnecfeiar êtenactiara ld ree sspionntodmeraasm vào cuamisa. adaptação do questionário Condição de Produção Vocal do Professor (CPV-P), eplrainbcoipraadisa apsopre fcotnoosa duod ióalmogboiesn etex,p eorrigeannteizsa çnãao ádreoa t rdaeb aplehsoq eu isfuan ec iovnoazi,s c doam pforocdou çnãoos vaoncáalisl ed od ea atosrs.o cOiasç ãdoa deonst refo arasm va sriuábvemise tiinddoesp ean adneánltiesse aeos dtaetsísfeticcah od "essinctroitmivaa.s Pvoacraa isa" foi utilizado o teste do Qui-quadrado e para alguns desfechos aplicou-se a análise de regressão logística binária múltipla (p<0,05).. Resultados: dentre os participantes, c5o6n,0s%eg useãmo sdeo msaenxtoe r mfinaasncuceliniroa,m eidnatdee a pmeéndaisa cdoem 3a0 p,8r ofaisnsoãso (ddep =a8to,6r ),e 4p9ro%c urnaãmo uOm par iantcivipidaal dsein ctoommap levmoceanlt aarp qreusee nnata mdoa ioforiia od apsig vaerzroe s( 6e8x,ig0e% t)a, msebgéumid doe mpoarn dgaa rvgoacnatal. seca (54,0%) e voz grossa (45,0%) e houve relação estatística significativa entre ritmo de ep =tr0a,b0a4lh8o). eAstotrreesss asnetnes ieb ioliz aasdsoésd cioo mm oarsa lq cuoemst õae vso dze f rtaracbaa (lrheos pqeucet iivnatemrfeenrteem, pe=m0, 0su3a0 (sOaúRd=e0 ,c4o0n; tapr=am0,0 c4o4m), isgsaorg caonmtao sfaetcoar p(rOoRte=to0r, 4p2a; rap =o0s, 0s4in2t)o mea sr otuoqssueid ãcoo m( OseRc=r0e,ç3ã0o; cpo=s0t,u0m11a)m. Ore asliinzatorm dae sfaaqltuae cdiem eanrt oa p(OarRe=ce0u,1 9c;o pm= 0m,0e3n4o)r Cinocnidcêlunscãiao : epmo eairtao rees r uqíudeo foram os principais fatores ambientais citados, e esforço físico intenso e ritmo reesftererisdsoasn ftoer adme nptrigea rorso , rgealargcaionntaad soesc aa, voorgz agnriozsasçaã oe dtoos stera sbeaclhao, .s eOnsd os iqnutoem oa sp igmaarrios foi diretamente associado ao ruído
203

"A efetividade de um programa de treinamento vocal para operadores de telemarketing" / The effectiveness of a voice training for telemarketers

Oliveira, Andréa Gomes de 26 July 2005 (has links)
O objetivo deste estudo foi avaliar, de forma comparativa e multidimensional, a efetividade de um programa de treinamento vocal baseado em exercícios. Um total de 48 operadores, selecionados randomicamente, foram alocados em um grupo intervenção (N=14), que participou do treinamento durante oito semanas e um grupo controle (N=34). De acordo com as comparações pré e pós-treinamento, o grupo intervenção apresentou redução estatisticamente significante na medida de jitter (p=0,044). Não houve mudança significante no diagrama do desvio fonatório e na avaliação perceptivo-auditiva da qualidade vocal. Os resultados sugerem que o programa de treinamento produz uma melhora na dimensão acústica mas não chega a produzir mudanças na dimensão perceptivo-auditiva das vozes de operadores / The purpose of this study was to evaluate by a multidimendional and comparative way, the effectiveness of a voice training program based in vocal function exercises. Forty-eight telemarketers were randomly assigned to two groups: voice training group (n=14), that underwent training over a 8-week period and a non-trainining control group (n=34). Based on pre- and post-training comparisons, voice training group presented reduction on measures of percent jitter (p=0.044). There was no significant difference on graphics of the hoarseness diagram and on perceptual analysis. These findings suggest that the voice training improve acoustic dimension but do not change perceptual dimension of telemarketers`voices
204

Pastores evangélicos: sintomas vocais e laringofaríngeos, qualidade vocal e perfil de participação em atividades vocais

Martins Muniz, Perla do Nascimento 22 February 2013 (has links)
O presente estudo buscou: investigar sintomas vocais e laringofaríngeos, qualidade vocal, autorreferência a desconforto em trato vocal, e perfil de participação em atividades vocais de pastores evangélicos, comparando com os mesmos aspectos de homens não profissionais da voz; verificar a correlação entre o perfil de participação em atividades vocais e a qualidade vocal, autorreferência a sintomas vocais, sensações laringofaríngeas e desconforto em trato vocal, tanto para pastores quanto para não profissionais da voz. Foram avaliados 60 indivíduos, sexo masculino, divididos em grupos: experimental e controle. Foram aplicados os instrumentos: Condição de Produção Vocal (CPV) para caracterização da amostra e verificação dos sintomas vocais e sensações laringofaríngeas; Escala de Desconforto em Trato Vocal (EDTV) e Perfil de Participação em Atividades Vocais (PPAV), bem como a análise perceptivo-auditiva da voz dos participantes. Os resultados foram analisados estatisticamente, considerando o nível de significância 5%. Pastores evangélicos referiram, em maior frequência que homens não profissionais da voz: pigarro (p=0.019), tosse com catarro (p=0.015), ardor na garganta (p=0.028), secreção/catarro na garganta (p<0.001), garganta seca (p<0.001), cansaço ao falar (p<0.001), esforço ao falar (p<0.001), e secura mais frequente (p=0.009) e mais intensa (p=0.006). Na comparação entre os grupos, os pastores referiram valores mais elevados no PPAV: escore total (p=0.032), total de limitação nas atividades (p=0.037), efeitos no trabalho (p=0.014) e limitação das atividades profissionais (p=0.005). Não houve diferenças na análise perceptivo-auditiva da voz e nos sintomas vocais. No grupo dos pastores evangélicos, houve correlações positivas: entre sintomas vocais não especificados e o escore total; o total de restrição nas atividades e as sessões comunicação diária e comunicação social do PPAV; entre desconforto em trato vocal e todas as sessões do PPAV; entre a análise perceptivo-auditiva da voz e o escore total, o total de limitação e de restrição nas atividades; as sessões autopercepção da severidade, comunicação diária, comunicação social e emoções do PPAV. Correlações negativas foram observadas: entre as sensações laringofaríngeas e as sessões autopercepção da severidade; trabalho e comunicação social do PPAV. No grupo dos não profissionais da voz, houve correlações positivas: entre o sintoma voz fraca, o escore total do PPAV e o total de restrição nas atividades; entre sensações laringofaríngeas e as sessões autopercepção da severidade, efeitos no trabalho, comunicação diária e comunicação social do PPAV; entre desconforto em trato vocal e as sessões autopercepção da severidade, restrição da participação na comunicação diária e emoções do PPAV; entre análise perceptivo-auditiva da voz e a sessão comunicação social do PPAV. Correlações negativas ocorreram: entre o sintoma falha na voz e a restrição de participação na comunicação social do PPAV; análise perceptivo-auditiva da voz e as sessões efeitos no trabalho e comunicação social do PPAV. Pastores evangélicos apresentaram elevada ocorrência de sensações na laringofaríngeas e maior percepção do impacto de uma alteração vocal na qualidade de vida, quando comparados a homens não profissionais da voz. No caso dos pastores, quanto maior o desconforto em trato vocal e a presença de uma alteração vocal, maior é o impacto percebido nas atividades vocais. / The present study sought to investigate the vocal and laryngopharyngeal symptoms, vocal quality, self-perception to vocal tract discomfort, and voice activity and participation profile of Evangelical pastors comparing the same aspects with non-professional users of the voice; to verify the correlation measure, both for pastors and for the control group, between participation profile between voice activity and participation profile (VAPP) and vocal quality, self-perception of vocal symptoms, sensations in the throat, and vocal discomfort. Sixty individuals were evaluated, male, divided into experimental and control groups. The following instruments were applied: Condition of Vocal Production (CVP) for sample characterization and verification of vocal symptoms and sensations in the throat, Discomfort in the Vocal Tract (VTD) and Voice Activity and Participation Profile (VAPP), as well as the perceptual voice analysis of the participants. The results were statistically analyzed with a significance level 5%. Evangelical pastors demonstrated a higher frequency than non-professionals: throat clearing (p=0.019), coughing up phlegm (p=0.015), burning in the throat (p=0.028), secretion/phlegm in throat (p< 0.001), dry throat (p< 0.001), tiredness when talking (p< 0.001), effort to talk (p<0.001) and dryness, more frequent (p=0.009) and more intense (p=0.006). In the comparison between groups, pastors reported higher levels at PPAV: total score (p=0.032), total limitation in activities (p=0.037), effects (p=0.014) and limitation of professional activities (p=0.005). No significant differences were found in the perceptual voice analysis and vocal symptoms. In the group of Evangelical pastors, there were positive correlations between vocal symptoms not specified and the total score; total participation restriction and daily communication and social communication sessions of the PPAV; between discomfort in the vocal tract and all sessions of the PPAV; between the perceptual voice analysis and total score, the total activity limitation and participation restriction, and the sessions: severity self-perception, daily communication, social communication and finally emotions of the PPAV. Negative correlations were observed: between the sensations in the throat and the self-perception of the severity; in job and social communication the PPAV. In the Group of non-professionals were positive correlations: between voice the voice weak and symptom the total score of the PPAV and total participation restriction; between sensations in the throat, as well as self perception of the severity, in job, daily and social communication of the PPAV; between discomfort in the vocal tract and sessions: the self-perception of severity, restriction participation in daily communication and emotions of the PPAV; between perceptual voice analysis and social communication session of the PPAV. Negative correlations occurred: between the failure in voice symptom and participation restriction and social communication of the PPAV; perceptual voice analysis and the effects in job and social communication of the PPAV. Evangelical pastors showed high occurrence of sensations in the throat and greater awareness in the impact of a vocal change in the quality of life, when compared to non-professionals. In the case of the pastors, the greater the discomfort in the vocal tract and the presence of a vocal change, the greater impact observed on vocals activities.
205

Ferramentas e recursos livres para reconhecimento e síntese de voz em português brasileiro

SAMPAIO NETO, Nelson Cruz 17 June 2011 (has links)
Submitted by Samira Prince (prince@ufpa.br) on 2012-06-06T14:12:29Z No. of bitstreams: 2 Tese_FerramentasRecursosLivres.pdf: 1397799 bytes, checksum: d17f058a4d4705205300467cd7b7a59a (MD5) license_rdf: 23898 bytes, checksum: e363e809996cf46ada20da1accfcd9c7 (MD5) / Approved for entry into archive by Samira Prince(prince@ufpa.br) on 2012-06-06T14:13:13Z (GMT) No. of bitstreams: 2 Tese_FerramentasRecursosLivres.pdf: 1397799 bytes, checksum: d17f058a4d4705205300467cd7b7a59a (MD5) license_rdf: 23898 bytes, checksum: e363e809996cf46ada20da1accfcd9c7 (MD5) / Made available in DSpace on 2012-06-06T14:13:13Z (GMT). No. of bitstreams: 2 Tese_FerramentasRecursosLivres.pdf: 1397799 bytes, checksum: d17f058a4d4705205300467cd7b7a59a (MD5) license_rdf: 23898 bytes, checksum: e363e809996cf46ada20da1accfcd9c7 (MD5) Previous issue date: 2011 / FAPESPA - Fundação Amazônia de Amparo a Estudos e Pesquisas / Sistemas de reconhecimento e síntese de voz são constituídos por módulos que dependem da língua e, enquanto existem muitos recursos públicos para alguns idiomas (p.e. Inglês e Japonês), os recursos para Português Brasileiro (PB) ainda são escassos. Outro aspecto é que, para um grande número de tarefas, a taxa de erro dos sistemas de reconhecimento de voz atuais ainda é elevada, quando comparada à obtida por seres humanos. Assim, apesar do sucesso das cadeias escondidas de Markov (HMM), é necessária a pesquisa por novos métodos. Este trabalho tem como motivação esses dois fatos e se divide em duas partes. A primeira descreve o desenvolvimento de recursos e ferramentas livres para reconhecimento e síntese de voz em PB, consistindo de bases de dados de áudio e texto, um dicionário fonético, um conversor grafema-fone, um separador silábico e modelos acústico e de linguagem. Todos os recursos construídos encontram-se publicamente disponíveis e, junto com uma interface de programação proposta, têm sido usados para o desenvolvimento de várias novas aplicações em tempo-real, incluindo um módulo de reconhecimento de voz para a suíte de aplicativos para escritório OpenOffice.org. São apresentados testes de desempenho dos sistemas desenvolvidos. Os recursos aqui produzidos e disponibilizados facilitam a adoção da tecnologia de voz para PB por outros grupos de pesquisa, desenvolvedores e pela indústria. A segunda parte do trabalho apresenta um novo método para reavaliar (rescoring) o resultado do reconhecimento baseado em HMMs, o qual é organizado em uma estrutura de dados do tipo lattice. Mais especificamente, o sistema utiliza classificadores discriminativos que buscam diminuir a confusão entre pares de fones. Para cada um desses problemas binários, são usadas técnicas de seleção automática de parâmetros para escolher a representaçãao paramétrica mais adequada para o problema em questão. / Automatic speech recognition and text-to-speech systems have modules that depend on the language and, while there are many public resources for some languages (e.g. English and Japanese), the resources for Brazilian Portuguese (BP) are still limited. Another aspect is that for many tasks the current speech recognition system error rate is still high, when compared to that obtained by humans. Thus, despite the success of hidden Markov models (HMM), it is necessary to investigate new methods. This work has these two facts as motivation and is divided into two parts. The first part describes the resources and free tools developed for BP speech recognition and synthesis, consisting of text and audio databases, phonetic dictionary, grapheme-to-phone converter, syllabification module, language and acoustic models. All of them are publicly available and, together with a proposed application programming interface, have been used for the development of several new real-time applications, including a speech module for the OpenOffice suite. Performance tests are presented for evaluating the developed systems. The resources make easier the adoption of BP speech technologies by other academic groups, developers and industry. The second part of this work presents a new method for rescoring the recognition result obtained via HMMs, with the result being organized as a lattice. More specifically, the system uses discriminative classifiers that aim at reducing the confusability between pairs of phones. For each of these binary problems, automatic feature selection techniques are used to choose the proper parametric representation for the specific problem.
206

Desenvolvimento de aplicativos usando reconhecimento e síntese de voz

SAMPAIO NETO, Nelson Cruz 30 August 2006 (has links)
Submitted by Edisangela Bastos (edisangela@ufpa.br) on 2013-01-08T18:29:15Z No. of bitstreams: 2 license_rdf: 23898 bytes, checksum: e363e809996cf46ada20da1accfcd9c7 (MD5) Dissertacao_DesenvolvimentoAplicativosReconhecimento.pdf: 383779 bytes, checksum: 1bbfef9c6a7a070ce4816598bc9f3462 (MD5) / Approved for entry into archive by Ana Rosa Silva(arosa@ufpa.br) on 2013-01-17T14:10:48Z (GMT) No. of bitstreams: 2 license_rdf: 23898 bytes, checksum: e363e809996cf46ada20da1accfcd9c7 (MD5) Dissertacao_DesenvolvimentoAplicativosReconhecimento.pdf: 383779 bytes, checksum: 1bbfef9c6a7a070ce4816598bc9f3462 (MD5) / Made available in DSpace on 2013-01-17T14:10:49Z (GMT). No. of bitstreams: 2 license_rdf: 23898 bytes, checksum: e363e809996cf46ada20da1accfcd9c7 (MD5) Dissertacao_DesenvolvimentoAplicativosReconhecimento.pdf: 383779 bytes, checksum: 1bbfef9c6a7a070ce4816598bc9f3462 (MD5) Previous issue date: 2006 / A fala é um mecanismo natural para a interação homem-máquina. A tecnologia de processamento de fala (ou voz) encontra-se bastante avançada e, em escala mundial, existe vasta disponibilidade de software, tanto comercial quanto acadêmico. a maioria assume a disponibilidade de um reconhecedor e/ou sintetizador, que pode ser programado via API. Ao contrário do que ocorre, por exemplo, na língua inglesa, inexiste atualmente uma gama variada de recursos para o português brasileiro. O presente trabalho discute alguns esforços realizados nesse sentido, avaliando a utilização da SAPI E JSAPI, que são as APIs da Microsoft e Sun, respectivamente. Serão apresentados, outrossim, exemplos de aplicativos: uma aplicação CALL (baseada em SAPI) usando síntese em inglês e português, reconhecimento em inglês e agentes visuais; e uma proposta para agregar reconhecimento e síntese de voz ao chat IRC através de APIs Java. / Speech is a natural mechanism for human-machine interaction. Speech (or voice) technology is a well-developed field when one considers the international community. There is a wide variety of academic and industrial software. The majority of them assumes a recognizer or synthesizer is available, and can be programmed through an API. In contrast, there are no such resources in public domain for Brazilian Portuguese. This work discusses some of these issues and compares SAPI and JSAPI, which are APIs promoted by Microsoft and Sun, respectively. We also present two examples: a CALL application using SAPI-based speech synthesis in English and Portuguese, recognition in English, and visual agents; and a JSAPI-based software that incorporates speech synthesis and recognition to IRC through Java APIs.
207

Pastores evangélicos: sintomas vocais e laringofaríngeos, qualidade vocal e perfil de participação em atividades vocais

Perla do Nascimento Martins Muniz 22 February 2013 (has links)
O presente estudo buscou: investigar sintomas vocais e laringofaríngeos, qualidade vocal, autorreferência a desconforto em trato vocal, e perfil de participação em atividades vocais de pastores evangélicos, comparando com os mesmos aspectos de homens não profissionais da voz; verificar a correlação entre o perfil de participação em atividades vocais e a qualidade vocal, autorreferência a sintomas vocais, sensações laringofaríngeas e desconforto em trato vocal, tanto para pastores quanto para não profissionais da voz. Foram avaliados 60 indivíduos, sexo masculino, divididos em grupos: experimental e controle. Foram aplicados os instrumentos: Condição de Produção Vocal (CPV) para caracterização da amostra e verificação dos sintomas vocais e sensações laringofaríngeas; Escala de Desconforto em Trato Vocal (EDTV) e Perfil de Participação em Atividades Vocais (PPAV), bem como a análise perceptivo-auditiva da voz dos participantes. Os resultados foram analisados estatisticamente, considerando o nível de significância 5%. Pastores evangélicos referiram, em maior frequência que homens não profissionais da voz: pigarro (p=0.019), tosse com catarro (p=0.015), ardor na garganta (p=0.028), secreção/catarro na garganta (p<0.001), garganta seca (p<0.001), cansaço ao falar (p<0.001), esforço ao falar (p<0.001), e secura mais frequente (p=0.009) e mais intensa (p=0.006). Na comparação entre os grupos, os pastores referiram valores mais elevados no PPAV: escore total (p=0.032), total de limitação nas atividades (p=0.037), efeitos no trabalho (p=0.014) e limitação das atividades profissionais (p=0.005). Não houve diferenças na análise perceptivo-auditiva da voz e nos sintomas vocais. No grupo dos pastores evangélicos, houve correlações positivas: entre sintomas vocais não especificados e o escore total; o total de restrição nas atividades e as sessões comunicação diária e comunicação social do PPAV; entre desconforto em trato vocal e todas as sessões do PPAV; entre a análise perceptivo-auditiva da voz e o escore total, o total de limitação e de restrição nas atividades; as sessões autopercepção da severidade, comunicação diária, comunicação social e emoções do PPAV. Correlações negativas foram observadas: entre as sensações laringofaríngeas e as sessões autopercepção da severidade; trabalho e comunicação social do PPAV. No grupo dos não profissionais da voz, houve correlações positivas: entre o sintoma voz fraca, o escore total do PPAV e o total de restrição nas atividades; entre sensações laringofaríngeas e as sessões autopercepção da severidade, efeitos no trabalho, comunicação diária e comunicação social do PPAV; entre desconforto em trato vocal e as sessões autopercepção da severidade, restrição da participação na comunicação diária e emoções do PPAV; entre análise perceptivo-auditiva da voz e a sessão comunicação social do PPAV. Correlações negativas ocorreram: entre o sintoma falha na voz e a restrição de participação na comunicação social do PPAV; análise perceptivo-auditiva da voz e as sessões efeitos no trabalho e comunicação social do PPAV. Pastores evangélicos apresentaram elevada ocorrência de sensações na laringofaríngeas e maior percepção do impacto de uma alteração vocal na qualidade de vida, quando comparados a homens não profissionais da voz. No caso dos pastores, quanto maior o desconforto em trato vocal e a presença de uma alteração vocal, maior é o impacto percebido nas atividades vocais. / The present study sought to investigate the vocal and laryngopharyngeal symptoms, vocal quality, self-perception to vocal tract discomfort, and voice activity and participation profile of Evangelical pastors comparing the same aspects with non-professional users of the voice; to verify the correlation measure, both for pastors and for the control group, between participation profile between voice activity and participation profile (VAPP) and vocal quality, self-perception of vocal symptoms, sensations in the throat, and vocal discomfort. Sixty individuals were evaluated, male, divided into experimental and control groups. The following instruments were applied: Condition of Vocal Production (CVP) for sample characterization and verification of vocal symptoms and sensations in the throat, Discomfort in the Vocal Tract (VTD) and Voice Activity and Participation Profile (VAPP), as well as the perceptual voice analysis of the participants. The results were statistically analyzed with a significance level 5%. Evangelical pastors demonstrated a higher frequency than non-professionals: throat clearing (p=0.019), coughing up phlegm (p=0.015), burning in the throat (p=0.028), secretion/phlegm in throat (p< 0.001), dry throat (p< 0.001), tiredness when talking (p< 0.001), effort to talk (p<0.001) and dryness, more frequent (p=0.009) and more intense (p=0.006). In the comparison between groups, pastors reported higher levels at PPAV: total score (p=0.032), total limitation in activities (p=0.037), effects (p=0.014) and limitation of professional activities (p=0.005). No significant differences were found in the perceptual voice analysis and vocal symptoms. In the group of Evangelical pastors, there were positive correlations between vocal symptoms not specified and the total score; total participation restriction and daily communication and social communication sessions of the PPAV; between discomfort in the vocal tract and all sessions of the PPAV; between the perceptual voice analysis and total score, the total activity limitation and participation restriction, and the sessions: severity self-perception, daily communication, social communication and finally emotions of the PPAV. Negative correlations were observed: between the sensations in the throat and the self-perception of the severity; in job and social communication the PPAV. In the Group of non-professionals were positive correlations: between voice the voice weak and symptom the total score of the PPAV and total participation restriction; between sensations in the throat, as well as self perception of the severity, in job, daily and social communication of the PPAV; between discomfort in the vocal tract and sessions: the self-perception of severity, restriction participation in daily communication and emotions of the PPAV; between perceptual voice analysis and social communication session of the PPAV. Negative correlations occurred: between the failure in voice symptom and participation restriction and social communication of the PPAV; perceptual voice analysis and the effects in job and social communication of the PPAV. Evangelical pastors showed high occurrence of sensations in the throat and greater awareness in the impact of a vocal change in the quality of life, when compared to non-professionals. In the case of the pastors, the greater the discomfort in the vocal tract and the presence of a vocal change, the greater impact observed on vocals activities.
208

Identificação de locutor usando modelos de misturas de gaussianas. / Speaker identification using Gaussian mixture models.

Denis Pirttiaho Cardoso 03 April 2009 (has links)
A identificação de locutor está relacionada com a seleção de um locutor dentro de um conjunto de membros pré-definidos e neste trabalho os experimentos foram realizados utilizando um sistema de identificação de locutor independente de texto baseado em modelos de mistura de gaussianas. Para realizar os testes, foi empregado o banco de voz TIMIT e sua correspondente versão corrompida por ruído de canal telefônico, isto é, NTIMIT. O aparelho fonador pode ser representado por coeficientes mel-cepstrais obtidos por meio de banco de filtros ou, alternativamente, por coeficientes de predição linear. Adicionalmente, a técnica de subtração da média cepstral é aplicada quando o banco de voz NITMIT é utilizado com o intuito de minimizar a distorção de canal intrínseca a ele. A componente da locução para a qual os coeficientes mel-cepstrais são calculados é obtida através de um detector de atividade de voz (DAV). No entanto, os DAVs são em geral sensíveis à relação de sinal-ruído da locução, sendo necessário adaptá-los para as condições de operação do sistema. É sugerida a integração no DAV de um estimador da relação de sinal-ruído baseado no método Minima Controlled Recursive Average (MCRA), que é necessário para permitir o tratamento de sinais tanto limpos quanto ruidosos. É observado que em locuções de elevada relação de sinal-ruído, como aquelas provenientes do banco de voz TIMIT, o método mais apropriado de extração dos coeficientes mel-cepstrais foi o padrão, isto é, baseado em banco de filtros, enquanto que para sinais de voz ruidosos a técnica de subtração da média cepstral aliada à extração dos coeficientes mel-cepstrais a partir de coeficientes de predição linear revelou os melhores resultados. / Speaker identification is concerned with the selection of one speaker within a set of enrolled members and in this work the experiments were performed using a textindependent cohort Gaussian mixture model (GMM) speaker identification system. In order to perform the tests, TIMIT speech database is used and its corresponding version corrupted by a noisy telephone channel, i.e., NTIMIT. The vocal tract is represented by Mel-cepstral frequency coefficients with filter banks or, alternatively, by linear prediction cepstral coefficients. Additionally, the cepstral mean subtraction technique is applied when the NTIMIT database is used to minimize the channel distortion intrinsic to it. The utterance component for which the Mel-frequency cepstral coefficients is obtained using a voice activity detector (VAD). However, the VADs are generally sensitive to the signal-to-noise ratio of the utterance, making it necessary to adapt them to the system operating conditions. A signal-to-noise ratio estimator is included in the proposal VAD, which is based on Minima Controlled Recursive Average (MCRA), in order to be able to handle both clean and noisy speech. It is observed that in high signal-to-noise ratio utterances, such as those from the TIMIT database, the more appropriate extraction method for the Mel-frequency cepstral coefficients was the baseline one consisting of filter banks, while for noisy speech the technique of cepstral mean subtraction coupled with the extraction of Mel-frequency cepstral coefficients from linear prediction cepstral coefficients provided the best results.
209

Análise acústica não linear dos padrões visuais de dinâmica vocal (PVDV) de homens adultos / Nonlinear acoustic analysis of the vocal dynamic visual patterns (PVDV) in adults male

Debora Godoy Galdino 14 September 2012 (has links)
O objetivo deste trabalho foi descrever a dinâmica não linear das vozes de homens adultos sem queixas vocais por meio dos padrões visuais de dinâmica vocal (PVDV). Participaram 77 homens falantes nativos do português brasileiro com idades entre 20 a 40 anos (média 30 anos ± 5,54 anos). Para análise não linear foi adotado o método de reconstrução do espaço de fase e gerado um gráfico bidimensional a partir de uma rotina desenvolvida no MatLab® 10.0. Este gráfico foi analisado qualitativamente pela técnica dos PVDV que considera três aspectos da configuração: número de laços das órbitas, regularidade e espaçamento dos traçados. Cada aspecto foi classificado em uma escala de 4 a 0, da melhor para a pior configuração. Todos os indivíduos apresentaram qualidade de voz adaptada na variabilidade normal de acordo com os resultados da avaliação perceptivo-auditiva pelo protocolo CAPE-V e da análise acústica pelo programa MDVP-Kay Pentax. A avaliação do protocolo CAPE-V apresentou média de 18,07 mm (± 4,14 mm), no grau geral da vogal /a/. Na avaliação acústica as médias foram de 125,44 Hz (± 20,78 Hz) para F0; 0,85% (± 0,64%) para jitter; 3,23% (± 1,75%) para shimmer e 0,13 (± 0,02) para NHR. Os resultados da dinâmica não linear por meio dos PVDV se mostrou com número de laços em grau 4 (85,71% com média de 3,84 ± 0,40), regularidade em grau 3 e 4 (ambos com 40,26% e média de 3,12 ± 0,95) e espaçamento em grau 3 (58,44% e média de 2,95 ± 0,76). Concluiu-se que os PVDV da vogal /a/ de homens adultos brasileiros com vozes adaptadas dentro da variabilidade normal apresentou padrão visual caracterizado em sua maioria por presença de 4 ou mais laços, traçados regulares ou com discretas irregularidades e com espaçamento entre as linhas de médio a pequeno. / This work intended to describe the nonlinear dynamics of voices from adult men without vocal complaints using a qualitative analysis of Vocal Dynamics Visual Pattern (VDVP). 77 men speakers of Brazilian Portuguese, aged between 20-40 years old (mean 30 years ± 5.54 years), participated. For the nonlinear analysis a Phase Space Reconstruction was adopted and a two-dimensional graphic was generated from a routine developed on MatLab® 10.0. This graphic was qualitatively analyzed by a VDVP technique, which considers three aspects of the configuration: orbits loop numbers, regularity and spacing of the traces. Each aspect was classified in a scale ranging from 4 to 0, from the better to the worst configuration. All subjects had voice quality adapted on normal variability according to the results of the perceptual evaluation protocol for CAPE-V and acoustic analysis by the program MDVP Kay-Pentax. The perceptual analysis using CAPE-V protocol showed an average of 18,07 mm (± 4,14 mm), in Overall Severity of vowel /a/. On the acoustic analysis, means of 125,44 Hz (± 20,78 Hz) to F0; 0,85% (± 0,64%) for jitter; 3,23% (± 1,75%) for shimmer and 0,13 (± 0,02) for NHR using MDVP program. The results of nonlinear dynamics through PVDV proved with the number of loops in degree 4 (85.71% with a mean of 3.84 ± 0.40), regularity in degree 3 and 4 (both with 40.26% and mean of 3.12 ± 0.95) and degree 3 in spacing (58.44% and mean 2.95 ± 0.76). It was concluded that PVDV of the vowel /a/ of adult males Brazilians with adapted voices on the normal variability presented visual pattern characterized mostly by the presence of 4 or more loops, regular tracings or with discrete irregularities and spacing between lines of medium to small.
210

Desenvolvimento de arquitetura para sistemas de reconhecimento automático de voz baseados em modelos ocultos de Markov

Gomez Cipriano, Jose Luis January 2001 (has links)
Este trabalho foi realizado dentro da área de reconhecimento automático de voz (RAV). Atualmente, a maioria dos sistemas de RAV é baseada nos modelos ocultos de Markov (HMMs) [GOM 99] [GOM 99b], quer utilizando-os exclusivamente, quer utilizando-os em conjunto com outras técnicas e constituindo sistemas híbridos. A abordagem estatística dos HMMs tem mostrado ser uma das mais poderosas ferramentas disponíveis para a modelagem acústica e temporal do sinal de voz. A melhora da taxa de reconhecimento exige algoritmos mais complexos [RAV 96]. O aumento do tamanho do vocabulário ou do número de locutores exige um processamento computacional adicional. Certas aplicações, como a verificação de locutor ou o reconhecimento de diálogo podem exigir processamento em tempo real [DOD 85] [MAM 96]. Outras aplicações tais como brinquedos ou máquinas portáveis ainda podem agregar o requisito de portabilidade, e de baixo consumo, além de um sistema fisicamente compacto. Tais necessidades exigem uma solução em hardware. O presente trabalho propõe a implementação de um sistema de RAV utilizando hardware baseado em FPGAs (Field Programmable Gate Arrays) e otimizando os algoritmos que se utilizam no RAV. Foi feito um estudo dos sistemas de RAV e das técnicas que a maioria dos sistemas utiliza em cada etapa que os conforma. Deu-se especial ênfase aos Modelos Ocultos de Markov, seus algoritmos de cálculo de probabilidades, de treinamento e de decodificação de estados, e sua aplicação nos sistemas de RAV. Foi realizado um estudo comparativo dos sistemas em hardware, produzidos por outros centros de pesquisa, identificando algumas das suas características mais relevantes. Foi implementado um modelo de software, descrito neste trabalho, utilizado para validar os algoritmos de RAV e auxiliar na especificação em hardware. Um conjunto de funções digitais implementadas em FPGA, necessárias para o desenvolvimento de sistemas de RAV é descrito. Foram realizadas algumas modificações nos algoritmos de RAV para facilitar a implementação digital dos mesmos. A conexão, entre as funções digitais projetadas, para a implementação de um sistema de reconhecimento de palavras isoladas é aqui apresentado. A implementação em FPGA da etapa de pré-processamento, que inclui a pré-ênfase, janelamento e extração de características, e a implementação da etapa de reconhecimento são apresentadas finalmente neste trabalho.

Page generated in 0.0817 seconds