1 |
Processamento do sinal de voz para o diagnóstico diferencial de alterações laríngeasZwetsch, Iuberi Carson January 2006 (has links)
Made available in DSpace on 2013-08-07T18:53:25Z (GMT). No. of bitstreams: 1
000388874-Texto+Parcial-0.pdf: 361292 bytes, checksum: 3b1a052f934e1c542258b1e39862e2eb (MD5)
Previous issue date: 2006 / This work deals with the development processing technique of signals that uses as principle the Cepstral Analysis of the voice signal for the development of a recognition system to vocal folds diseases, to be getting at to alternative for the habitually used techniques. The objective is getting a efficient and reliable voice analysis system, that it provides tool auxiliary in the diagnostic and therapeutical process, interchanging areas of the health as medicine and fonoaudiology with engineering, to improve the applicability in the attainment and manipulation of the common data of this subject to these professions. After a revision of the considered important topics, for the agreement of the signal voice analysis, an implementation in two stages is carried through: signals analysis with the Cepstral technique, and after, another stage where Cepstrais characteristics joined of each disease are identified so that if it gets of diseases recognition standards. At the first phase, the vocal folds diseases acoustic signals are separate in groups, where previously the diagnosis through endoscopic examination of 61 individuals was gotten, all adults, being diagnosised as 17 presenting vocal fold cyst, 9 with vocal fold ridge, 8 with vocal fold polyp, 5 with Reinke edema, 9 with nodules and 13 normal ones. These diseases represent most of the patient diagnostics who consult with complaints of hoarseness in the doctor's offices of the otorrinolaringologists. The method of signal processing used was the Cepstral analysis as comparison parameter between the alterations of each disease and the isolation of the signal significant characteristics for the application in the identification methods. In the stage of identification it was carried through the characteristics separation and the diseases classification in a way that was possible to be gotten a diagnosis protocol. With the technique applied in this work and the similarity of the voices signals gotten standards, it was possible to get an automatic recognition of the disease with high identification tax (89%). The project of vocal folds disease identification is, therefore, capable to discriminate, of efficient form, the disease from its characteristics presented acoustics, independently of the patient sex and small variations in the disease and the signal acquisition satisfying what it is considered in this work. / Este trabalho trata do desenvolvimento de técnica de processamento de sinais que usa como princípio a Análise Cepstral do sinal da voz para o desenvolvimento de um sistema de reconhecimento de alterações das pregas vocais, visando obter alternativas para as técnicas habitualmente usadas. O objetivo é obter um sistema de análise de voz eficiente, que proporcione ferramenta auxiliar no processo diagnóstico e terapêutico, intercambiando áreas da saúde como medicina e fonoaudiologia com a engenharia, para aprimorar a aplicabilidade na obtenção e manipulação dos dados deste tema em comum a estas profissões. Após uma revisão dos tópicos considerados importantes, para o entendimento de análise do sinal da voz, é realizada uma implementação em duas etapas: uma de análise dos sinais com a técnica Cepstral e após, outra etapa onde as características Cepstrais encontradas em cada caso são identificadas para que se obtenha padrões de reconhecimento das alterações laríngeas. Na primeira fase os sinais acústicos das alterações vocais são separados em grupos, onde previamente se obteve o diagnóstico exame endoscópico de 61 pessoas, todos adultos, sendo diagnosticados como 17 apresentando cisto de prega vocal, 9 com sulco de prega vocal, 8 com pólipo de prega vocal, 5 com edema de Reinke, 9 com nódulos e 13 normais. As alterações laríngeas em estudo representam a maior parte dos diagnósticos dos pacientes que consultam com queixas de rouquidão nos consultórios dos otorrinolaringologistas. [23] O método de processamento do sinal utilizado foi o de análise Cepstral como parâmetro de comparação entre os achados de cada alteração laríngea e o isolamento das características significativas do sinal para a aplicação nos métodos de identificação. Na etapa de identificação foram realizadas a separação das características e a classificação das alterações laríngeas de uma maneira que foi possível ser obtido um protocolo de diagnóstico. Com a técnica aplicada neste trabalho e a similaridade dos padrões obtidos dos sinais das vozes, foi possível obter um reconhecimento automático das alterações laríngeas com taxa de identificação elevada (89 %). O projeto de identificação das alterações das pregas vocais é, portanto, capaz de discriminar, de forma eficiente, as alterações laríngeas a partir das suas características acústicas apresentadas, independentemente do sexo do paciente e de pequenas variações na alteração laríngea e na obtenção do sinal satisfazendo o que é proposto neste trabalho.
|
2 |
Máquinas de tradução aplicada à comunicação em tempo real para desenvolvimento distribuído de softwareDuarte, Tiago da Silveira January 2014 (has links)
Made available in DSpace on 2014-12-06T01:01:18Z (GMT). No. of bitstreams: 1
000463519-Texto+Completo-0.pdf: 1845086 bytes, checksum: dea8d1ebf4d1c816a35b958ede396328 (MD5)
Previous issue date: 2014 / The globalization allows companies to seek partnership for global project development in other countries. The domain of spoken English is considered one of the main reasons for the success of countries such as Ireland and India in global software development. However, A. T Kearney consultancy estimates that Brazil has only 5,4% of population fluent in English, and this is an important challenge that makes difficult the growth of geographically distributed software development in the country. In order to reduce the barriers posed by language differences, studies have been conducted to assess how machine translation can be used in the context of global software development in order to minimize or overcome such barriers. The goal of this research was in this context and aimed to study how speech translation can be used in global software development projects. In this research we first executed studies related to speech recognition and machine translation areas and identified available technologies for translation and speech recognition. After having identified these technologies, a simulation study was planned and executed in order to evaluate one of the identified technologies. The purpose of this study was to understand the feasibility of the available technology for speech recognition and translation for Brazilian Portuguese. The findings of the simulation indicate that Google technologies for speech recognition and translation for Brazilian Portuguese have adequate accuracy and could be used to create a complete machine translation in this language. / O aumento da globalização possibilita que mais empresas busquem parcerias para execução de projetos em outros países. O domínio do idioma inglês, por exemplo, é considerado um dos principais fatores para o sucesso de alguns países como Irlanda e Índia em desenvolvimento global de software. Entretanto, a consultoria A. T Kearney estima que o Brasil tem apenas 5,4% da população fluente em inglês, e isto acaba se tornando um desafio para o desenvolvimento de software com equipes distribuídas geograficamente com integrantes que não dominam o mesmo idioma. Com o objetivo de reduzir as barreiras impostas pela diferença de idioma, estudos têm sido conduzidos para avaliar de que forma máquinas de tradução podem ser utilizadas em um contexto de Desenvolvimento Distribuído de Software, a fim de minimizar ou transpor tais barreiras. O tema desta pesquisa está inserido neste contexto e teve como objetivo estudar como máquinas de tradução podem ser utilizadas em projetos de desenvolvimento distribuído de software. Inicialmente foram realizados estudos na área de reconhecimento de voz e máquina de tradução, visando identificar tecnologias de tradução e reconhecimento de voz disponíveis. As tecnologias foram estudadas e foi então proposto um estudo de simulação com uma destas tecnologias, para avaliar se ela poderia ser utilizada para compor um tradutor de voz para o idioma português brasileiro. Por fim, os resultados da simulação levantaram indícios de que as tecnologias do Google para reconhecimento de voz no idioma português e para tradução do português para o inglês possuem níveis adequados de precisão e poderiam ser utilizadas no desenvolvimento de uma máquina de tradução de voz para o idioma português.
|
3 |
Aplicação do método de fusão para verificação de locutor independente de textoSilva, Mayara Ferreira da January 2015 (has links)
Made available in DSpace on 2016-01-05T01:03:29Z (GMT). No. of bitstreams: 1
000476876-Texto+Completo-0.pdf: 2803272 bytes, checksum: 9305b74451ec83ddca38d1c444ffb3dd (MD5)
Previous issue date: 2015 / This work presents an overview of text independent speaker verification, describing the basic operation of the system and the reviewing some important developments in speaker modeling and feature extraction from speech. Following, a point of improvement identified within the feature extraction stage leads to the main objective of this work: to determine one or more sets of coefficients relevant to speaker discrimination while minimizing the equal error rate (EER). The proposal is to replace the delta(Δ) and double-delta(Δ²) coefficients by a linear predictor code (LPC) for the mel frequency cepstral coefficients (MFCC). In addition, score level fusion is employed to combine the ouputs of MFCC-only and MFCC-LPC systems, as well as MFCC-only and MFCC-Δ-Δ² systems. In all cases, performance is evaluated with respect to variations of the signal to noise-ratio (SNR) in the tested audio. In addition, the work introduces a new Brazilian Portuguese speech repository containing free-speech from 155 males. Results and discussions are presented with a reflection on the expected outcomes, as well as general comments and observations. Finally, concludings remarks are made about the work, featuring future prospects regarding text independent speaker verification research. This work attained a 4% reduction in the EER compared to the reference system (MFCC-only), with best results occuring in the case fusion of MFCC-only and MFCC-Δ-Δ² scores. / Este trabalho apresenta uma visão geral acerca de verificação de locutor independente de texto, demonstrando o funcionamento básico do sistema e as principais referências de métodos já utilizados ao longo de anos para extração de características da fala e modelamento do locutor. Detectado um ponto a ser trabalhado dentro da etapa de extração de características, objetiva-se determinar coeficientes ou um conjunto destes relevantes para discriminação do locutor, com o intuito de minimizar a EER (Equal Error Rate). A proposta consiste em substituir os coeficientes delta(Δ) e double-delta(Δ2) por coeficientes de um preditor LPC (Linear Predictor Coding) o qual realiza a predição dos coeficientes MFCC (Mel Frequency Cepstral Coeficients). Além disso, aplica-se uma fusão a nível de score em função de sistemas baseados em MFCC e LPC. Outra análise discutida no trabalho é a fusão de um sistema MFCC com Δ e Δ².Um tópico também avaliado é com relação a variações de SNRs (Signal to Noise Ratios) nos áudios testados. Além disso, é elaborado um banco de falas em português brasileiro. Por fim, são expostos os resultados obtidos e é feita a análise dos mesmos, a fim de refletir sobre o que era esperado e levantar alguns comentários. Enfim, são feitas as considerações a respeito do trabalho, e elencadas as perspectivas futuras em torno das pesquisas de verificação de locutor independente de texto. Com este trabalho atingiu-se uma redução de 4% na taxa de erro igual (EER) em comparação ao sistema de referência, sendo que os melhores resultados foram apresentados pelo sistema que realiza um fusão do sistema MFCC com o Δ e Δ².
|
Page generated in 0.0197 seconds