Global ETD Search

221	Desenvolvimento de arquitetura para sistemas de reconhecimento automático de voz baseados em modelos ocultos de Markov Gomez Cipriano, Jose Luis January 2001 (has links) Este trabalho foi realizado dentro da área de reconhecimento automático de voz (RAV). Atualmente, a maioria dos sistemas de RAV é baseada nos modelos ocultos de Markov (HMMs) [GOM 99] [GOM 99b], quer utilizando-os exclusivamente, quer utilizando-os em conjunto com outras técnicas e constituindo sistemas híbridos. A abordagem estatística dos HMMs tem mostrado ser uma das mais poderosas ferramentas disponíveis para a modelagem acústica e temporal do sinal de voz. A melhora da taxa de reconhecimento exige algoritmos mais complexos [RAV 96]. O aumento do tamanho do vocabulário ou do número de locutores exige um processamento computacional adicional. Certas aplicações, como a verificação de locutor ou o reconhecimento de diálogo podem exigir processamento em tempo real [DOD 85] [MAM 96]. Outras aplicações tais como brinquedos ou máquinas portáveis ainda podem agregar o requisito de portabilidade, e de baixo consumo, além de um sistema fisicamente compacto. Tais necessidades exigem uma solução em hardware. O presente trabalho propõe a implementação de um sistema de RAV utilizando hardware baseado em FPGAs (Field Programmable Gate Arrays) e otimizando os algoritmos que se utilizam no RAV. Foi feito um estudo dos sistemas de RAV e das técnicas que a maioria dos sistemas utiliza em cada etapa que os conforma. Deu-se especial ênfase aos Modelos Ocultos de Markov, seus algoritmos de cálculo de probabilidades, de treinamento e de decodificação de estados, e sua aplicação nos sistemas de RAV. Foi realizado um estudo comparativo dos sistemas em hardware, produzidos por outros centros de pesquisa, identificando algumas das suas características mais relevantes. Foi implementado um modelo de software, descrito neste trabalho, utilizado para validar os algoritmos de RAV e auxiliar na especificação em hardware. Um conjunto de funções digitais implementadas em FPGA, necessárias para o desenvolvimento de sistemas de RAV é descrito. Foram realizadas algumas modificações nos algoritmos de RAV para facilitar a implementação digital dos mesmos. A conexão, entre as funções digitais projetadas, para a implementação de um sistema de reconhecimento de palavras isoladas é aqui apresentado. A implementação em FPGA da etapa de pré-processamento, que inclui a pré-ênfase, janelamento e extração de características, e a implementação da etapa de reconhecimento são apresentadas finalmente neste trabalho. Reconhecimento : Padroes Reconhecimento : Voz Fpga Projeto : Circuitos integrados Processamento : Sinais Voz computacional
222	Compressão de bancos de fala para sistemas de síntese concatenativa de alta qualidade Hentz, Augusto Henrique 24 October 2012 (has links) Dissertação (mestrado) - Universidade Federal de Santa Catarina, Centro Tecnológico, Programa de Pós-Graduação em Engenharia Elétrica, Florianópolis, 2009. / Made available in DSpace on 2012-10-24T09:05:52Z (GMT). No. of bitstreams: 1 275012.pdf: 1391752 bytes, checksum: f17a2be92485300a2e0eeaa58f4703bf (MD5) / Sistemas de conversão texto-fala baseados na técnica de síntese concatenativa com seleção de unidades são capazes de produzir fala sintética de muito boa qualidade, com inteligibilidade e naturalidade próximas às da fala humana. Para conseguir tal feito, é necessário o uso de bancos de fala contendo exemplos de diversos contextos fonéticos e prosódicos. Freqüentemente, os bancos utilizados em sintetizadores de muito boa quali- dade têm duração de dezenas de horas, tornando sua ocupação de memória muito elevada. Além dos bancos de gravações, sistemas de síntese concatenativa utilizam um conjunto de informações para o cálculo de custos no processo de seleção de unidades, contribuindo para a ocupação de memória. O presente trabalho apresenta técnicas para reduzir a ocupa- ção de memória de sistemas de síntese concatenativa de fala, considerando o sintetizador desenvolvido no LINSE (Laboratório de Circuitos e Processamento de Sinais do Departa- mento de Engenharia Elétrica da UFSC). O banco de gravações do sistema considerado é compactado utilizando o codec iLBC, que proporciona a capacidade de acesso aleatório aos dados codificados, fundamental para a aplicações em síntese de fala concatenativa. O banco de parâmetros, por sua vez, é compactado usando quantização vetorial dos co- eficientes espectrais no processo de seleção de unidades. As técnicas propostas permitem reduzir a ocupação de memória do sistema considerado em até 79 %, sem grandes perdas na qualidade da fala sintética. Engenharia eletrica Fala - Inteligibilidade Reconhecimento automatico da voz Sintese da voz Sistemas de processamento da fala
223	Voz em estado de escuta: por uma pedagogia em vocalidades poéticas no ambiente da cena / Voz en estado de audición: por una pedagogía en vocalidades poéticas en el ambiente de la escena PEREIRA, Juliana Rangel de Freitas January 2014 (has links) PEREIRA, Juliana Rangel de Freitas. Voz em estado de escuta: por uma pedagogia em vocalidades poéticas no ambiente da cena. 2014. 201f. – Tese (Doutorado) – Universidade Federal do Ceará, Programa de Pós-graduação em Educação Brasileira, Fortaleza (CE), 2014. / Submitted by Márcia Araújo (marcia_m_bezerra@yahoo.com.br) on 2015-12-23T13:48:02Z No. of bitstreams: 1 2014_tese_jrfpereira.pdf: 19573921 bytes, checksum: e16c23fd0607bebee3ae3afdde2cd021 (MD5) / Approved for entry into archive by Márcia Araújo(marcia_m_bezerra@yahoo.com.br) on 2015-12-23T13:55:25Z (GMT) No. of bitstreams: 1 2014_tese_jrfpereira.pdf: 19573921 bytes, checksum: e16c23fd0607bebee3ae3afdde2cd021 (MD5) / Made available in DSpace on 2015-12-23T13:55:25Z (GMT). No. of bitstreams: 1 2014_tese_jrfpereira.pdf: 19573921 bytes, checksum: e16c23fd0607bebee3ae3afdde2cd021 (MD5) Previous issue date: 2014 / O presente estudo, de característica teórico-prático, é uma cartografia da voz em processo de criação e aprendizagem nas Artes Cênicas. O conceito de movência do medievalista e estudioso sobre voz: Paul Zumthor, a noção artística de Work in process (Cohen) e de corpo- vibrátil (Rolnik) foram noções que impulsionaram o pensamento desenvolvido nesta tese, na qual a aprendizagem de vocalidades poéticas ocorre no corpo-vocal em estado de experiência, constante movimento, em conexões de escuta com o ambiente da cena, assim como na vida. Tendo em vista o caráter prático deste estudo, uma pesquisa de campo foi realizada por meio da criação do laboratório “Vocalidades Poéticas” contando com a participação de estudantes dos cursos de Teatro-Licenciatura e Cinema e Audiovisual do Instituto de Cultura e Arte da Universidade Federal do Ceará. Este laboratório partiu das seguintes indagações: Como podemos estabelecer uma escuta aberta à voz do outro, favorecendo um conhecimento vocal a partir dessa escuta? De que modo podemos fazer-conhecer um processo de criação de vocalidade poética que permita um corpo-vocal em estado de movência e com presença viva, vibrátil, na cena? Nesta pesquisa, foi constante o exercício de entender no corpo da escrita os processos de criação-aprendizagem da voz como pertencentes a múltiplos conhecimentos, apontando para um ambiente de trans(formação) próprio à processualidade da criação e do ato de conhecer fazendo, no qual outras vozes, outros corpos, outros sujeitos puseram-se em existência e diálogo. Para tanto, nos rastros que ficam nesta tese, encontramos autores oriundos de diferentes áreas do conhecimento que teceram relações nesta pesquisa a medida que o próprio caminhar da pesquisa encontrava ecos nos mesmos, nisto consistindo seu teor cartográfico. São eles: Do teatro (Artaud, Grotowski, Lehmamm, Cohen), da música (Murray Schafer, Borges Caznok, John Cage), da psicanálise (Suely Rolnik), estudos do corpo e da dança (José Gil e Christine Greiner), da ciência (Maturana e Varela), da educação (Bondía), entre outros. Voz, processo, sinestesia e ambiente da cena se conjugam neste estudo para disparar processos pedagógicos-artísticos que permitam pensar a vocalidade poética no âmbito das artes da cena, a partir de uma noção de voz não apenas como condutora de um sentido único verbal, mas como força tátil-sinestésica, corpórea, vibrátil, erótica no encontro entre corpos-vocais, na escuta do outro, num constante jogo relacional de encontros sonoros. / El presente estudio, de característica teórico-práctica, es una cartografía de la voz en el proceso de creación y de aprendizaje en las Artes Escénicas. El concepto de ‘mudanza’ del medievalista y estudioso de la voz: Paul Zumthor, la noción artística de Work in Process de Renato Cohen y de cuerpo-vibrátil de Suely Rolnik, son nociones que impulsan el pensamiento desarrollado en esta tesis, en esta el aprendizaje de vocalidades poéticas se da en el cuerpo-vocal en estado de experiencia, en constante movimiento, en conexiones de escucha con el ambiente de la escena, así como en la vida. Considerando el carácter práctico de este estudio, una investigación a campo fue realizada por medio de la creación del laboratorio “Vocalidades poéticas” que contó con la participación de estudiantes de los cursos de Teatro-Pedagogía y Cine y Audiovisual del Instituto de Cultura y Arte de la Universidad Federal del Ceará. Este laboratorio se inició a partir de algunas interrogantes: ¿Cómo podemos establecer una escucha abierta a la voz del otro, favoreciendo un conocimiento vocal a partir de esa escucha? ¿De qué manera podemos hacer-pensar un proceso de creación de vocalidad poética que permita un cuerpo-vocal en estado de ‘mudanza’ y con presencia viva, vibrátil, en escena? En esta investigación fue una constante el ejercicio de entender en el cuerpo de la escrita los procesos de creación-aprendizaje de la voz como pertenecientes a múltiples áreas de conocimientos, apuntando para un ambiente de trans(fomación) propio de la procesualidad de la creación y del acto de conocer-haciendo, en el cual otras voces, otros cuerpos, otros sujetos se ponen en existencia y diálogo. De esta forma, en los rastros que aparecen en esta tesis, encontramos ecos, resonancias en las ideas de autores oriundos de diferentes áreas del conocimiento, cuyas conexiones se fueron dando durante el propio caminar de esta pesquisa, en esto consistiendo su modo cartográfico. Son ellos: Del teatro (Artaud, Grotowski, Lehmann, Cohen), de la música (Murray Schafer, Borges Caznok, John Cage), del Psicoanálisis (Suely Rolnik), Estudios del Cuerpo y de la danza (José Gil y Christine Greiner), de la ciencia (Maturana y Varela), de la educación (Bondía), entre otros. Voz, proceso, sinestesia y ambiente de la escena se conjugan en este estudio para disparar procesos pedagógico-artísticos que permitan pensar en la vocalidad poética dentro de las artes de la escena, a partir de una noción de la voz no apenas como conductora de un sentido único verbal, mas como fuerza táctil-sinestésica, corpórea, vibrátil, erótica en el encuentro entre cuerpos-vocales, en la escucha del otro, en un constante juego relacional de encuentros sonoros. Fonoaudiologia – preparação vocal Voz - experiência Cena – processo de criação Pedagogia Pedagogías de la Voz Proceso de creación
224	Diagrama de desvio fonatório na clínica vocal / Hoarseness diagram in the voice clinic Madazio, Glaucya [UNIFESP] 18 February 2009 (has links) (PDF) Made available in DSpace on 2015-07-22T20:49:52Z (GMT). No. of bitstreams: 0 Previous issue date: 2009-02-18 / Objetivo:Identificar quais as características discriminatórias do diagrama de desvio fonatório em vozes predominantemente adaptadas, rugosas,soprosas e tensas,em indivíduos adultos.Método:Foram analisadas 196 amostras vocais da vogal /ε/ sustentada de indivíduos adultos, divididas em dois grupos, 163 com alteração vocal e 33 sem alteração vocal.As amostras foram submetidas a dois tipos de avaliação,a perceptivo-auditiva e a acústica.A avaliação perceptivo-auditiva concentrou-se na identificação do tipo de predominância da qualidade vocal–adaptada,rugosa,soprosa ou tensa,e no grau de alteração da qualidade alterada,por meio da escala analógico-visual e sua correspondência numérica.A análise acústica do sinal vocal foi realizada no programa VoxMetria(CTS Informática)e abrangeu a configuração da distribuição das amostras vocais no diagrama de desvio fonatório quanto à área de normalidade,densidade, forma e localização nos quadrantes,e a extração de medidas acústicas como frequência fundamental,jitter,shimmer,correlação e GNE.Resultados: Houve diferença significante na localização das amostras vocais em relação à área de normalidade do diagrama, sendo que 100 por cento(33)das vozes adaptadas encontraram-se dentro da área e 69,3 por cento(113)das alteradas fora dela(p<0,001).Vozes adaptadas apresentaram densidade concentrada(78,8 por cento, 26)com diferença significante das vozes alteradas (p<0,001),que apresentaram densidade ampliada(56,4 por cento, 92).Em relação ao tipo de voz,todas as vozes adaptadas localizaram-se no quadrante inferior esquerdo, 45 por cento(27)das rugosas no quadrante inferior direito, 52,6 por cento(30)das soprosas no superior direito e 54,3 por cento(25)das tensas no inferior esquerdo.Quanto ao grau de alteração vocal, das 16 vozes alteradas avaliadas com grau 1, 93,8 por cento(15)localizaram-se no quadrante inferior esquerdo.As vozes classificadas com grau 3 de alteração dividiram-se entre os quadrantes inferior e superior direitos.Dos desvios vocais intensos,80 por cento(8)localizaram-se no quadrante superior direito.O quadrante inferior esquerdo concentrou vozes avaliadas na escala analógico-visual até 35,5mm(grau 1)e algumas de 35,5 a 50,5mm(grau 2).As vozes com grau 3 de alteração distribuíram-se nos quadrantes inferior direito,superior esquerdo e superior direito,sendo que neste localizaram-se as vozes com pior grau de alteração.Os valores de jitter e shimmer diferenciaram as vozes tensas das rugosas(p<0,021 e p=0,0032; respectivamente)e das soprosas (p=0,021 e p=0,005,respectivamente).O GNE também diferenciou as vozes tensas das rugosas(p=0,003)e das soprosas(p<0,002),além de diferenciar vozes rugosas e soprosas(p<0,001).A correlação entre F0 e os demais parâmetros acústicos não foi significante e a qualidade da correlação foi péssima:jitter(p=0,257; -8,9 por cento),shimmer (p=0,158; -11,2 por cento),correlação(p=0,285; 8,4 por cento) e GNE(p=0,790; -2,1 por cento).Conclusões:O diagrama de desvio fonatório diferenciou vozes adaptadas e vozes alteradas.Vozes adaptadas localizaram-se dentro da área de normalidade e,a maioria das vozes alteradas, fora.Não houve relação entre tipo de voz, densidade e forma no diagrama.A distribuição das vozes nos quadrantes relacionou-se com o tipo e o grau da alteração da voz.O GNE foi o único parâmetro acústico capaz de diferenciar os três tipos de vozes alteradas. / Purpose: To identify which characteristics discriminates the hoarseness diagram of adult voices that are predominantly adapted, rough, breathy and strained. Method: 196 adult voice samples of the sustained vowel “ae” were analyzed. They were distributed into two groups, 163 with vocal deviation and 33 with healthy voices. Voice samples were submitted to two types of analyses: acoustic and auditory perceptual. The perceptual analyses focused on the identification of the vocal quality predominance – adapted, rough, breathy and strained and also in the degree of deviation, by using a visual analogue scale and its numeric correspondence. The acoustic analyses was performed by means of the VoxMetria software (CTS Informatica) and consisted of assessing the configuration of vocal sample distribution in the hoarseness diagram according to normality area, density, shape and location in the quadrants, and the extraction of fundamental frequency, jitter, shimmer, correlation and GNE. Results: There was a significant difference in the position of the voice samples in relation to the normality area of the diagram, meaning that 100% (33) of the adapted voices were located inside this area and 69.3% (113) of the deviated voices were outside it (p<0.001). Adapted voices presented concentrated density (78.8%, 26), which were statistically different from the deviated voices (56.4%, 92) that presented spread density (56.4%, 92). As far as voice type is concerned, all adapted voices were located at the inferior left quadrant, 45% (27) of the rough voices were at the inferior right, 52.6% (30) of the breathy voices were at the superior right and 54.3% (25) of the strained were at the inferior left. Concerning the degree of severity of vocal deviation, 93.8% of the 16 deviated voices evaluated as having a 1 degree of deviation were located at the inferior and superior right quadrants. In the other hand, 80 % (8) of the voice with a severe degree of deviation were located in the superior right quadrant. The inferior left quadrant concentrated the voices evaluated by the visual analogue scale up to 35.5mm (degree 1) and some from 35.5 to 50.5mm (degree 2). Voices with 3 degree of deviation were located in the inferior right Abstract and both superior left and right quadrants. The voices with the worse degree of deviation were located at the superior right quadrant. Jitter and shimmer differed the strained voices from the rough voices (p<0.021 e p=0.0032 respectively) and from the breathy voices (p=0.021 e p=0.005, respectively). The GNE did also differ the strained voices from the rough voices (p=0.003) and from the breathy voices (p<0.002).It also differentiated the rough from the breathy voices (p<0.001). The correlation between F0 and the other acoustic parameters was not significant and the quality of correlation was very poor: jitter (p=0.257; -8.9%), shimmer (p=0.158; -11.2%), correlation (p=0.285; 8.4%) and GNE (p=0.790; -2.1%). Conclusions: The hoarseness diagram differentiated the adapted from the deviated voices. Adapted voices were located in the normality area, and the majority of the deviated voices were outside it. There was not a relationship between type of voice, density and shape of configuration of vocal sample distribution in the diagram. The distribution of voices in the quadrants related to the type and degree of severity of voice deviation. GNE was the only acoustic parameter able to differ from the three types of deviated voices. / TEDE / BV UNIFESP: Teses e dissertações Acústica da fala Percepção auditiva Qualidade da voz Distúrbio da voz Voice disorders Auditory perception Voice quality Speech acoustic
225	A utilização do Microsoft Speech SDK para o reconhecimento de voz Bernardi, Yuri Ademir January 2003 (has links) Dissertação (mestrado) - Universidade Federal de Santa Catarina, Centro Tecnologico. Programa de Pós-Graduação em Engenharia de Produção / Made available in DSpace on 2012-10-20T11:20:04Z (GMT). No. of bitstreams: 1 227346.pdf: 1266542 bytes, checksum: 024bef5b204e7abba3e5328642db3926 (MD5) / A necessidade do ser humano por novos meios de comunicação, tanto entre seus semelhantes, quanto na relação do homem com a máquina, nos traz novos desafios. Este trabalho avalia o "kit" da Microsoft de reconhecimento de fala. Esta ferramenta propõe facilidades para projetos que necessitam utilizar o reconhecimento de voz. Neste estudo são abordados vários conceitos, podendo assim o leitor ter uma boa conceituação sobre os tópicos descritos. Os principais assuntos relacionados na revisão bibliográfica são o reconhecimento de padrões, inteligência artificial e a voz. Finalmente apresenta-se o Microsoft Speech SDK e suas características. Após são apresentadas as avaliações e conclusões obtidas sobre o uso da ferramenta utilizada. The human being need for new communication means so much among its fellow creatures as in the relationship man machine this brings us new challenges. This work evaluates the kit of Microsoft of speech recognition. This tool proposes means for projects that need to use the voice recognition. In this study several concepts are approached, being able to not like this the reader to have a good concept on the described topics. The main subjects related in the bibliographical revision are the recognition of patterns, artificial intelligence and the voice. Finally it introduces it Microsoft Speech SDK and its characteristics. After healthy presented the evaluations and conclusions obtained on the use of the used tool. Engenharia de produção Voz Reconhecimento automatico da voz Inteligencia artificial Reconhecimento de padrOes Redes neurais (Computação)
226	Técnicas de processamento de sinais para alteração de parâmetros prosódicos aplicadas a um sistema de conversão texto-fala para a lingua portuguesa falada no Brasil Pacheco, Fernando Santana January 2001 (has links) Dissertação (mestrado) - Universidade Federal de Santa Catarina, Centro Tecnológico. Programa de Pós-Graduação em Engenharia Elétrica. / Made available in DSpace on 2012-10-18T14:32:01Z (GMT). No. of bitstreams: 0 / Sistemas de conversão texto-fala têm como objetivo a transformação de um texto com vocabulário irrestrito em uma mensagem falada. Esse processo consiste de duas etapas básicas. Na primeira, técnicas de processamento lingüístico realizam a extração de uma representação simbólica dos parâmetros acústicos a partir do texto de entrada. A representação simbólica é transformada em sinal de fala através de técnicas de processamento de sinais. Um dos métodos de síntese de fala é o de concatenação de segmentos de fala previamente gravados. No entanto, para conferir maior naturalidade à fala sintetizada, faz-se necessário alterar de forma dinâmica os parâmetros prosódicos (pitch, duração e energia) dos segmentos durante a operação de síntese. O presente trabalho apresenta o desenvolvimento de uma técnica baseada em análise/ressíntese LPC com excitação residual para alteração de parâmetros prosódicos. O objetivo é aplicá-la a um sistema de conversão texto-fala baseado em síntese concatenativa para a língua portuguesa falada no Brasil. Nesta técnica, simples operações de cópia e corte são realizadas no sinal de resíduo, permitindo a alteração do pitch. A alteração da duração é efetuada eliminando ou copiando quadros inteiros de análise. Essa técnica apresenta uma carga computacional reduzida, possibilitando a implementação em tempo real. Análises objetivas e testes perceptuais preliminares mostraram um bom desempenho da técnica. Engenharia eletrica Processamento de sinais Reconhecimento automatico da voz Reconhecimento de padrOes Fala - Inteligibilidade Sistemas de processamento da fala Sintese da voz
227	TEMPOS MÁXIMOS DE FONAÇÃO DE VOGAIS E CAPACIDADE VITAL EM MULHERES ADULTAS COM NÓDULOS VOCAIS / MAXIMUM PHONATION TIMES OF VOWELS AND VITAL CAPACITY IN ADULT WOMEN WITH VOCAL NODULES Kurtz, Laura Oliveira 05 March 2010 (has links) Obtaining measurements of Maximum Phonation Time (MPT) and Vital Capacity (VC) are fundamental in a speech-therapy evaluation since they provide information about neuromuscular and aerodynamic control of a subject s vocal production. Such variables may be altered in subjects who have vocal nodules, a pathology which alters the glottic closure and the pneumo-phono-articulatory coordination. Aim: verify the MPT of vowels, the VC and the possible relationship between them in adult women with vocal nodules. Materials and Methods: database records from a speech therapy school-clinic were used, making up a total of 38 subjects. The inclusion criteria were female adults and otorhinolaryngology diagnosis of vocal nodules. The exclusion criteria were: to have another laryngeal pathology other than the vocal nodules; hearing loss; oral breathing; history of neurological, psychiatric, endocrine or gastric disorders; flu or allergy history; drinking and/or smoking habits; previous speech therapy and/or otorhinolaryngology treatments. Anamnesis data, the otorhinolaryngology diagnosis, and the MPT measurements of vowels /a, i, u/ were collected from the database, as well as the value of the highest vital capacity from all subjects in the sample. MPT evaluation is given by the duration measurement of three emissions of each vowel. The patient is asked to stand and produce such sounds in habitual tone and intensity until the end of exhalation. The highest value of each vowel is then considered. Regarding VC values, the patient is asked to perform six exhalations in the spirometer, after maximal inhalation. Three exhalations are performed with nasal occlusion and three without occlusion, including a rest between them. Finally, the highest out of the six values collected is considered. The results were statiscally analysed at a 5% significance level. The analysis was carried out through descriptive statistics, Mann-Whitney U Test, Variables Normality Tests (Lilliefors), Spearman Correlation, Kruskal-Wallis Test. Results: representative age range; representative and within normality VC; less homogeneous MPT and mean, below normality and with a strong positive and meaningful correlation; moderate, positive and meaningful correlation between VC and MPT and the mean. Conclusion: in the presence of vocal nodules in an adult group of women, the Maximum Phonation Times were reduced, the vowel /a/ presented a lower value when compared to the other vowels, and the VC remained within normality, having a moderately positive correlation between both of them. / A obtenção de medidas de Tempos Máximos de Fonação (TMF) e da Capacidade Vital (CV) são fundamentais na avaliação fonoaudiológica, pois revelam informações sobre o controle neuromuscular e aerodinâmico da produção vocal de um indivíduo. Tais variáveis podem estar alteradas em indivíduos com nódulos vocais, patologia que altera o fechamento glótico e a coordenação pneumofonoarticulatória. Objetivo: verificar os TMF de vogais, a CV e a relação entre ambos em mulheres adultas com presença de nódulos vocais. Materiais e Métodos: utilizaram-se os registros do Banco de dados de uma clínica-escola de Fonoaudiologia, totalizando um grupo de estudo constituído de 38 sujeitos. Os critérios de inclusão foram: adultos do sexo feminino e diagnóstico otorrinolaringológico de nódulos vocais. Os critérios de exclusão foram: apresentar outra patologia laríngea além dos nódulos vocais; comprometimento auditivo; respiração oral; histórico de doenças neurológicas, psiquiátricas, endocrinológicas ou gástricas; gripe ou quadros de alergias; hábitos de etilismo e/ou tabagismo; tratamento fonoaudiológico e/ou otorrinolaringológico prévios. Foram coletados do Banco de Dados os dados de anamnese, o diagnóstico otorrinolaringológico, e as medidas de TMF das vogais /a, i, u/, bem como o valor da maior CV de todos os sujeitos da amostra. A avaliação dos TMF se dá pela medida da duração de três emissões de cada uma das vogais, sendo que o paciente é orientado a ficar em pé e realizar tais emissões em tom e intensidade habituais, até o final da expiração, considerando-se o maior valor de cada vogal. Em relação aos valores de CV, o paciente é solicitado a realizar um total de seis expirações no espirômetro, após inspiração máxima, sendo três delas com presença de oclusão nasal e três sem oclusão, com descanso entre elas. Por fim, é considerado o maior dos seis valores coletados. Os resultados foram analisados estatisticamente ao nível de significância de 5%, sendo a análise realizada por meio da estatística descritiva, Teste U de Mann-Whitney, Teste de Normalidade das Variáveis (Lilliefords), Correlação de Spearman, Teste de Kruskal-Wallis. Resultados: faixa de idade homogênea; CV representativa e dentro da normalidade; TMF e média menos representativos, abaixo da normalidade e com forte correlação positiva e significativa entre si; correlação moderada, positiva e significativa entre CV e TMF e sua média. Conclusão: na presença de nódulos vocais em um grupo de mulheres adultas, os TMF encontraram-se reduzidos, a vogal /a/ apresentou menor valor quando comparada às demais vogais, e a CV permaneceu dentro da normalidade, havendo correlação moderadamente positiva entre ambos. Voz Fonação Capacidade vital Distúrbios da voz Voice Phonation Vital capacity Voice disorders CNPQ::CIENCIAS DA SAUDE::FONOAUDIOLOGIA
228	Aula, repouso, aquecimento e desaquecimento vocal em professores de uma escola pública de ensino médio de Salvador - BA Masson, Maria Lúcia Vaz [UNESP] 06 March 2009 (has links) (PDF) Made available in DSpace on 2014-06-11T19:31:44Z (GMT). No. of bitstreams: 0 Previous issue date: 2009-03-06Bitstream added on 2014-06-13T19:02:15Z : No. of bitstreams: 1 masson_mlv_dr_mar.pdf: 892378 bytes, checksum: ab195f0a93b5bb84375fb6b2ea0e5a25 (MD5) / Justificativa: professores compõem uma categoria profissional que tem a voz como um dos cruciais instrumentos de trabalho. Fatores de risco os expõem a alterações vocais que podem prejudicar o exercício profissional. Dentre os aspectos considerados no cuidado com a voz, o aquecimento e o desaquecimento vocal possibilitam a preparação da voz para o uso em sala de aula. Objetivo: analisar os efeitos da aula, do repouso e de um procedimento de aquecimento e desaquecimento vocal na qualidade da voz e no grau de desconforto auto-referido. Métodos: Dezoito professores de uma escola pública estadual do município de Salvador-BA, selecionada por conveniência, compuseram a amostra deste estudo. Dividiram-se as amostras entre grupos experimental (n=8) e controle (n=10) e analisaram-se os efeitos da aula e repouso (grupo controle), aquecimento e desaquecimento vocal (grupo experimental), considerando-se a avaliação de juízes por meio da escala GRBASI e ressonância, análise acústica e grau de desconforto auto-referido. O material analisado foi submetido a tratamento estatístico, sendo considerado nível de significância de 5%. Resultados: A aula provocou elevação estatisticamente significante da freqüência fundamental e aumento do grau de desconforto auto-referido. Não houve diferença significante nas variáveis analisadas para o repouso vocal. O aquecimento vocal proporcionou redução do grau geral de alteração vocal e diminuição do desconforto, especialmente nos aspectos relacionados ao corpo. O desaquecimento vocal proporcionou diminuição da freqüência fundamental e redução do grau de desconforto, especialmente relacionado à voz. A comparação entre os grupos experimental e controle não demonstrou diferença estatisticamente significante em nenhuma variável analisada. Tanto o desaquecimento quanto o repouso vocal proporcionaram o retorno da voz ao ajuste coloquial... / Justification: Voice is a main work tool for teachers and they are exposed to risk factors able to cause voice disorders. Vocal warm-up and cool-down procedures are used as preparation for the use of voice in classrooms. Goal: to analyze the effects of vocal warm-up and cool-down procedure, rest and lecture on voice quality, as well as on the degree of self-reported discomfort. Methods: the subjects of this research were 18 teachers of a state school in Salvador/BA, which were selected by convenience. They were divided in two groups, one experimental (n=8) and the control (n=10). Then they were subject to an analysis of the effects of lecture and rest (control group), vocal warmup and cool-down procedures (experimental group). The criteria for comparison between the voices were evaluation by judges, considering the GRBASI scale and resonance, analysis of acoustic parameters and the degree of self-related discomfort. The significance level for the statistical treatment was 5%. Results: lecture resulted in statistically relevant increase of the fundamental frequency and rising of self-related discomfort. Rest did not result on statistically significant difference on the variables. Vocal warm-up resulted on decreasing in degree of vocal alteration and discomfort, especially on body related aspects. Vocal cool-down resulted on decreasing the fundamental frequency and the degree of discomfort, especially on voice related aspects. Comparison between experimental and control groups did not show any statistical difference on the analyzed variables. Cool-down and rest showed equally positive on adjusting back to the colloquial voice. Conclusion: lecture has raised the vocal attrition, indicating the vocal loading to which teachers are exposed. The proposed procedure showed to be positive and able to be applied preventively. New studies, with a larger number of subjects, should take place, ...(Complete abstract click electronic address below) Professores de ensino médio Comunicação oral Voz - Treinamento Voz - Qualidade Voice Voice training Voice quality
229	Avaliação clínica, videolaringoscópica e vocal perceptivo-auditiva e acústica de professores disfônicos Pereira, Eny Regina Bóia Neves [UNESP] 26 March 2014 (has links) (PDF) Made available in DSpace on 2015-01-26T13:21:29Z (GMT). No. of bitstreams: 0 Previous issue date: 2014-03-26Bitstream added on 2015-01-26T13:30:20Z : No. of bitstreams: 1 000798820.pdf: 910105 bytes, checksum: b34182747086ffa31d0aa97b4f2b1966 (MD5) / Coordenação de Aperfeiçoamento de Pessoal de Nível Superior (CAPES) / Professores são considerados grupo de risco para disfonias as quais se relacionam às condições de trabalho. Objetivos: analisar os aspectos clínicos, vocais e videolaringoscópicos em professores disfônicos. Métodos: 90 professores disfônicos preencheram questionário sobre voz, comorbidades e condições de trabalho, foram submetidos às análises vocais perceptivo-auditivas (Tempo máximo de Fonação, e escala GRBAS), acústica (MDVP program) e videolaringoscopias. Um grupo controle foi composto por 90 pacientes disfônicos, sendo similares em gênero e idade, com atividades profissionais diferentes da docência e o canto. Resultados: em ambos os grupos participaram 85 mulheres e 5 homens (idade média entre 31 a 50 anos). Nos controles a maioria trabalhava em atividades domésticas e a maioria dos professores lecionava nos ensinos fundamental (42,8%) e médio (37,7%). Os resultados dos parâmetros registrados nos professores e nos controles, respectivamente foram: Abuso vocal (76,7%; 37,8%), jornadas de trabalho entre 21 a 40 horas (72,2%; 80%), tempo na profissão abaixo de 10 anos (36%; 23%), absenteísmo (23%; 0%), sintomas nasossinusais (66%; 20%), gastroesofágicos (44%; 22%), rouquidão (82%; 78%), pigarro (70%; 62%), esforço ao falar (72%; 52%). As análises vocais indicaram, em ambos os grupos, valores diminuídos do Tempo Máximo de Fonação, comprometimento do parâmetro G da escala GRBASI (82%), diminuição de f0 e elevação dos demais parâmetros acústicos. Nódulos e laringite ácida prevaleceram nos professores e laringite ácida, pólipos e sulco nos controles. Conclusões: sintomas vocais, comorbidades e absenteísmo predominaram nos professores. As análises vocais perceptivo-auditivas e acústicas estiveram comprometidas de forma semelhante em ambos os grupos. Nódulos e laringite ácida prevaleceram nos professores e pólipos, laringite ácida e o sulco vocal nos controles / Professors are considered a risk group for dysphonic which are related to work conditions. Goals: Analyze the clinical, vocals and videolaryngoscopic aspects in dysphonic professors. Methodology: 90 dysphonic professors that filled out a form about voice, comorbities and work conditions, were submitted to vocal auditory perception analyses (Maximum phonation time and GRBASI scale), acoustic (MDVP program) and videolaryngoscopies. A control group formed by 90 dysphonic patients, all of them being similar in gender and age, with different professional activities from what they graduated from and the singing. Results: In both groups there were 85 women and 5 men (average age between 31 and 50 years old). In the control data most worked in domestic activities and most of the teacher taught in elementary school (42,8) and high school (37,7%). The results of the registered parameters for the professors and in the control groups were: Vocal abuse (76,7%; 37,8%), workload between 21 to 40 hours a week (72,2%; 80%), time in the job below 10 years (36%; 23%), absenteeism (23%; 0%), sinonasal symptoms 66%; 20%), gastroesophageal (44%; 22%), hoarseness(82%; 78%), hawk(70%; 62%), effort to speak 72%; 52%). The vocal analyses indicate, in both groups, decreased values of the Maximum Timing of Formation, commitments of the G parameter from the GRBASI scale (82%), decrease of f0 and elevation of the others acoustic parameters. Nodules and acid laryngitis prevailed in the professors and acid laryngitis, polyps and groove in control group. Conclusions: vocal symptoms, comorbidades and absenteeism prevailed in the teachers. The vocal perceptual and acoustic analyses were compromised in a similar manner. Nodules and acid laryngitis prevailed in the professors groups, polyps, acid laryngitis and vocal sulcus in the control Professores Distúrbios da voz - Diagnóstico Percepção auditiva Fonética acústica Voz Laringoscopia Auditory perception
230	Desenvolvimento de arquitetura para sistemas de reconhecimento automático de voz baseados em modelos ocultos de Markov Gomez Cipriano, Jose Luis January 2001 (has links) Este trabalho foi realizado dentro da área de reconhecimento automático de voz (RAV). Atualmente, a maioria dos sistemas de RAV é baseada nos modelos ocultos de Markov (HMMs) [GOM 99] [GOM 99b], quer utilizando-os exclusivamente, quer utilizando-os em conjunto com outras técnicas e constituindo sistemas híbridos. A abordagem estatística dos HMMs tem mostrado ser uma das mais poderosas ferramentas disponíveis para a modelagem acústica e temporal do sinal de voz. A melhora da taxa de reconhecimento exige algoritmos mais complexos [RAV 96]. O aumento do tamanho do vocabulário ou do número de locutores exige um processamento computacional adicional. Certas aplicações, como a verificação de locutor ou o reconhecimento de diálogo podem exigir processamento em tempo real [DOD 85] [MAM 96]. Outras aplicações tais como brinquedos ou máquinas portáveis ainda podem agregar o requisito de portabilidade, e de baixo consumo, além de um sistema fisicamente compacto. Tais necessidades exigem uma solução em hardware. O presente trabalho propõe a implementação de um sistema de RAV utilizando hardware baseado em FPGAs (Field Programmable Gate Arrays) e otimizando os algoritmos que se utilizam no RAV. Foi feito um estudo dos sistemas de RAV e das técnicas que a maioria dos sistemas utiliza em cada etapa que os conforma. Deu-se especial ênfase aos Modelos Ocultos de Markov, seus algoritmos de cálculo de probabilidades, de treinamento e de decodificação de estados, e sua aplicação nos sistemas de RAV. Foi realizado um estudo comparativo dos sistemas em hardware, produzidos por outros centros de pesquisa, identificando algumas das suas características mais relevantes. Foi implementado um modelo de software, descrito neste trabalho, utilizado para validar os algoritmos de RAV e auxiliar na especificação em hardware. Um conjunto de funções digitais implementadas em FPGA, necessárias para o desenvolvimento de sistemas de RAV é descrito. Foram realizadas algumas modificações nos algoritmos de RAV para facilitar a implementação digital dos mesmos. A conexão, entre as funções digitais projetadas, para a implementação de um sistema de reconhecimento de palavras isoladas é aqui apresentado. A implementação em FPGA da etapa de pré-processamento, que inclui a pré-ênfase, janelamento e extração de características, e a implementação da etapa de reconhecimento são apresentadas finalmente neste trabalho. Reconhecimento : Padroes Reconhecimento : Voz Fpga Projeto : Circuitos integrados Processamento : Sinais Voz computacional

Search results