Global ETD Search

1	Processamento do sinal de voz para o diagn?stico diferencial de altera??es lar?ngeas Zwetsch, Iuberi Carson 31 October 2006 (has links) Made available in DSpace on 2015-04-14T13:56:20Z (GMT). No. of bitstreams: 1 388874.pdf: 361292 bytes, checksum: 3b1a052f934e1c542258b1e39862e2eb (MD5) Previous issue date: 2006-10-31 / Este trabalho trata do desenvolvimento de t?cnica de processamento de sinais que usa como princ?pio a An?lise Cepstral do sinal da voz para o desenvolvimento de um sistema de reconhecimento de altera??es das pregas vocais, visando obter alternativas para as t?cnicas habitualmente usadas. O objetivo ? obter um sistema de an?lise de voz eficiente, que proporcione ferramenta auxiliar no processo diagn?stico e terap?utico, intercambiando ?reas da sa?de como medicina e fonoaudiologia com a engenharia, para aprimorar a aplicabilidade na obten??o e manipula??o dos dados deste tema em comum a estas profiss?es. Ap?s uma revis?o dos t?picos considerados importantes, para o entendimento de an?lise do sinal da voz, ? realizada uma implementa??o em duas etapas: uma de an?lise dos sinais com a t?cnica Cepstral e ap?s, outra etapa onde as caracter?sticas Cepstrais encontradas em cada caso s?o identificadas para que se obtenha padr?es de reconhecimento das altera??es lar?ngeas. Na primeira fase os sinais ac?sticos das altera??es vocais s?o separados em grupos, onde previamente se obteve o diagn?stico exame endosc?pico de 61 pessoas, todos adultos, sendo diagnosticados como 17 apresentando cisto de prega vocal, 9 com sulco de prega vocal, 8 com p?lipo de prega vocal, 5 com edema de Reinke, 9 com n?dulos e 13 normais. As altera??es lar?ngeas em estudo representam a maior parte dos diagn?sticos dos pacientes que consultam com queixas de rouquid?o nos consult?rios dos otorrinolaringologistas.[23] O m?todo de processamento do sinal utilizado foi o de an?lise Cepstral como par?metro de compara??o entre os achados de cada altera??o lar?ngea e o isolamento das caracter?sticas significativas do sinal para a aplica??o nos m?todos de identifica??o. Na etapa de identifica??o foram realizadas a separa??o das caracter?sticas e a classifica??o das altera??es lar?ngeas de uma maneira que foi poss?vel ser obtido um protocolo de diagn?stico. Com a t?cnica aplicada neste trabalho e a similaridade dos padr?es obtidos dos sinais das vozes, foi poss?vel obter um reconhecimento autom?tico das altera??es lar?ngeas com taxa de identifica??o elevada (89 %). O projeto de identifica??o das altera??es das pregas vocais ?, portanto, capaz de discriminar, de forma eficiente, as altera??es lar?ngeas a partir das suas caracter?sticas ac?sticas apresentadas, independentemente do sexo do paciente e de pequenas varia??es na altera??o lar?ngea e na obten??o do sinal satisfazendo o que ? proposto neste trabalho ENGENHARIA EL?TRICA RECONHECIMENTO DE VOZ (INFORM?TICA) PROCESSAMENTO DE SINAIS CNPQ::ENGENHARIAS
2	Um estudo emp?rico sobre m?quinas de tradu??o em tempo real para equipes distribu?das de desenvolvimento de software / An empirical study of real-time spech translation tools for multilingual distributed software development teams Pinto, Jo?o Henrique Stocker 29 February 2016 (has links) Submitted by Setor de Tratamento da Informa??o - BC/PUCRS (tede2@pucrs.br) on 2016-11-10T16:24:19Z No. of bitstreams: 1 DIS_JOAO_HENRIQUE_STOCKER_PINTO_COMPLETO.pdf: 1899268 bytes, checksum: 45904a9a9a328472ee0fb55849090e8d (MD5) / Made available in DSpace on 2016-11-10T16:24:19Z (GMT). No. of bitstreams: 1 DIS_JOAO_HENRIQUE_STOCKER_PINTO_COMPLETO.pdf: 1899268 bytes, checksum: 45904a9a9a328472ee0fb55849090e8d (MD5) Previous issue date: 2016-02-29 / Distributed Software Development is increasingly present into the culture of information technology companies. The number of companies that spread its teams trying to reduce costs, improve products quality and improve productivity increases every year. This scenario, however, demands a huge cooperation between people that, in many cases, do not master the same language. A Speech Translation System is an alternative to this scenario, simultaneously translating from a language to another. This master thesis presents an empirical study, which consists of the historical review of the rise of recognition tools, translation and speech synthesis to its current state, as well as addressing technical characteristics of the same. The empirical research base has two experiments conducted in partnership with the University Aldo Moro of Bari, in Italy, using part of the tools available in the market and in development of two prototypes that make the integration of speech recognition, machine translation and speech synthesis to facilitate communication between distributed teams of software projects. The research contributes in order to show that the currently available technologies for communication between distributed teams that don't dominate the same language are close to be really effective and if they can be used in daily activities in software development teams. In addition to compatibility between tools, this research tries to point which the way forward to integrate voice Recognizers, Machine Translation and Speech Synthesis. / O desenvolvimento distribu?do de software est? cada vez mais presente na cultura das empresas de T.I. O n?mero de empresas que distribui os integrantes das suas equipes buscando reduzir custos de m?o de obra, aumentar a qualidade dos produtos e tamb?m aumentar a produtividade cresce anualmente. Este cen?rio, por?m, demanda uma grande coopera??o entre pessoas que, em muitos casos, n?o dominam o mesmo idioma. M?quinas de tradu??o em tempo real s?o uma alternativa a este cen?rio, realizando a tradu??o simult?nea de um idioma para outro. Nesta disserta??o de mestrado investiga-se, atrav?s de estudos emp?ricos, a tradu??o em tempo real em equipes de desenvolvimento distribu?do de software utilizando-se a voz. Para isso, apresenta-se uma revis?o hist?rica do surgimento das ferramentas de reconhecimento, tradu??o e s?ntese de voz at? o seu estado atual, al?m de abordar caracter?sticas t?cnicas das mesmas. A base emp?rica da pesquisa conta ainda com dois experimentos realizados em parceria com a Universidade Aldo Moro, de Bari, na It?lia, utilizando as tecnologias dispon?veis no mercado, al?m do desenvolvimento de dois prot?tipos que fazem a integra??o entre reconhecedores de voz, m?quinas de tradu??o e sintetizadores de voz. A pesquisa contribui no sentido de mostrar quais tecnologias atualmente dispon?veis para a comunica??o entre equipes distribu?das que n?o dominam o mesmo idioma est?o pr?ximas de serem efetivas e se elas podem ser usadas nas atividades di?rias em equipes de desenvolvimento de software. Al?m disso a pesquisa aponta compatibilidades entre ferramentas e um poss?vel caminho a seguir para integrar reconhecedores de voz, m?quinas de tradu??o e sintetizadores de voz. PROCESSAMENTO DISTRIBU?DO RECONHECIMENTO DE VOZ (INFORM?TICA) ENGENHARIA DE SOFTWARE INFORM?TICA
3	M?quinas de tradu??o aplicada ? comunica??o em tempo real para desenvolvimento distribu?do de software Duarte, Tiago da Silveira 18 March 2014 (has links) Made available in DSpace on 2015-04-14T14:50:17Z (GMT). No. of bitstreams: 1 463519.pdf: 1845086 bytes, checksum: dea8d1ebf4d1c816a35b958ede396328 (MD5) Previous issue date: 2014-03-18 / The globalization allows companies to seek partnership for global project development in other countries. The domain of spoken English is considered one of the main reasons for the success of countries such as Ireland and India in global software development. However, A.T Kearney consultancy estimates that Brazil has only 5,4% of population fluent in English, and this is an important challenge that makes difficult the growth of geographically distributed software development in the country. In order to reduce the barriers posed by language differences, studies have been conducted to assess how machine translation can be used in the context of global software development in order to minimize or overcome such barriers. The goal of this research was in this context and aimed to study how speech translation can be used in global software development projects. In this research we first executed studies related to speech recognition and machine translation areas and identified available technologies for translation and speech recognition. After having identified these technologies, a simulation study was planned and executed in order to evaluate one of the identified technologies. The purpose of this study was to understand the feasibility of the available technology for speech recognition and translation for Brazilian Portuguese. The findings of the simulation indicate that Google technologies for speech recognition and translation for Brazilian Portuguese have adequate accuracy and could be used to create a complete machine translation in this language. / O aumento da globaliza??o possibilita que mais empresas busquem parcerias para execu??o de projetos em outros pa?ses. O dom?nio do idioma ingl?s, por exemplo, ? considerado um dos principais fatores para o sucesso de alguns pa?ses como Irlanda e ?ndia em desenvolvimento global de software. Entretanto, a consultoria A.T Kearney estima que o Brasil tem apenas 5,4% da popula??o fluente em ingl?s, e isto acaba se tornando um desafio para o desenvolvimento de software com equipes distribu?das geograficamente com integrantes que n?o dominam o mesmo idioma. Com o objetivo de reduzir as barreiras impostas pela diferen?a de idioma, estudos t?m sido conduzidos para avaliar de que forma m?quinas de tradu??o podem ser utilizadas em um contexto de Desenvolvimento Distribu?do de Software, a fim de minimizar ou transpor tais barreiras. O tema desta pesquisa est? inserido neste contexto e teve como objetivo estudar como m?quinas de tradu??o podem ser utilizadas em projetos de desenvolvimento distribu?do de software. Inicialmente foram realizados estudos na ?rea de reconhecimento de voz e m?quina de tradu??o, visando identificar tecnologias de tradu??o e reconhecimento de voz dispon?veis. As tecnologias foram estudadas e foi ent?o proposto um estudo de simula??o com uma destas tecnologias, para avaliar se ela poderia ser utilizada para compor um tradutor de voz para o idioma portugu?s brasileiro. Por fim, os resultados da simula??o levantaram ind?cios de que as tecnologias do Google para reconhecimento de voz no idioma portugu?s e para tradu??o do portugu?s para o ingl?s possuem n?veis adequados de precis?o e poderiam ser utilizadas no desenvolvimento de uma m?quina de tradu??o de voz para o idioma portugu?s. INFORM?TICA RECONHECIMENTO DE VOZ (INFORM?TICA) TRADU??O AUTOM?TICA ENGENHARIA DE SOFTWARE
4	Aplica??o do m?todo de fus?o para verifica??o de locutor independente de texto Silva, Mayara Ferreira da 10 July 2015 (has links) Submitted by Setor de Tratamento da Informa??o - BC/PUCRS (tede2@pucrs.br) on 2016-01-04T17:56:48Z No. of bitstreams: 1 DIS_MAYARA_FERREIRA_DA_SILVA_COMPLETO.pdf: 2803272 bytes, checksum: 9305b74451ec83ddca38d1c444ffb3dd (MD5) / Made available in DSpace on 2016-01-04T17:56:48Z (GMT). No. of bitstreams: 1 DIS_MAYARA_FERREIRA_DA_SILVA_COMPLETO.pdf: 2803272 bytes, checksum: 9305b74451ec83ddca38d1c444ffb3dd (MD5) Previous issue date: 2015-07-10 / Coordena??o de Aperfei?oamento de Pessoal de N?vel Superior - CAPES / This work presents an overview of text independent speaker verification, describing the basic operation of the system and the reviewing some important developments in speaker modeling and feature extraction from speech. Following, a point of improvement identified within the feature extraction stage leads to the main objective of this work: to determine one or more sets of coefficients relevant to speaker discrimination while minimizing the equal error rate (EER). The proposal is to replace the delta(?) and double-delta(??) coefficients by a linear predictor code (LPC) for the mel frequency cepstral coefficients (MFCC). In addition, score level fusion is employed to combine the ouputs of MFCC-only and MFCC-LPC systems, as well as MFCC-only and MFCC-?-?? systems. In all cases, performance is evaluated with respect to variations of the signal to noise-ratio (SNR) in the tested audio. In addition, the work introduces a new Brazilian Portuguese speech repository containing free-speech from 155 males. Results and discussions are presented with a reflection on the expected outcomes, as well as general comments and observations. Finally, concludings remarks are made about the work, featuring future prospects regarding text independent speaker verification research. This work attained a 4% reduction in the EER compared to the reference system (MFCC-only), with best results occuring in the case fusion of MFCC-only and MFCC-?-?? scores. / Este trabalho apresenta uma vis?o geral acerca de verifica??o de locutor independente de texto, demonstrando o funcionamento b?sico do sistema e as principais refer?ncias de m?todos j? utilizados ao longo de anos para extra??o de caracter?sticas da fala e modelamento do locutor. Detectado um ponto a ser trabalhado dentro da etapa de extra??o de caracter?sticas, objetiva-se determinar coeficientes ou um conjunto destes relevantes para discrimina??o do locutor, com o intuito de minimizar a EER (Equal Error Rate). A proposta consiste em substituir os coeficientes delta(?) e double-delta(?2) por coeficientes de um preditor LPC (Linear Predictor Coding) o qual realiza a predi??o dos coeficientes MFCC (Mel Frequency Cepstral Coeficients). Al?m disso, aplica-se uma fus?o a n?vel de score em fun??o de sistemas baseados em MFCC e LPC. Outra an?lise discutida no trabalho ? a fus?o de um sistema MFCC com ? e ??. Um t?pico tamb?m avaliado ? com rela??o a varia??es de SNRs (Signal to Noise Ratios) nos ?udios testados. Al?m disso, ? elaborado um banco de falas em portugu?s brasileiro. Por fim, s?o expostos os resultados obtidos e ? feita a an?lise dos mesmos, a fim de refletir sobre o que era esperado e levantar alguns coment?rios. Enfim, s?o feitas as considera??es a respeito do trabalho, e elencadas as perspectivas futuras em torno das pesquisas de verifica??o de locutor independente de texto. Com este trabalho atingiu-se uma redu??o de 4% na taxa de erro igual (EER) em compara??o ao sistema de refer?ncia, sendo que os melhores resultados foram apresentados pelo sistema que realiza um fus?o do sistema MFCC com o ? e ??. ENGENHARIA EL?TRICA REDES NEURAIS (COMPUTA??O) RELA??O HOMEM-M?QUINA RECONHECIMENTO DE VOZ (INFORM?TICA) SINTETIZADORES DE VOZ (INFORM?TICA) PROCESSAMENTO DE VOZ - T?CNICAS DIGITAIS ENGENHARIAS

1

Page generated in 0.023 seconds