Orientador: Jose Geraldo Chiquito / Dissertação (mestrado) - Universidade Estadual de Campinas, Faculdade de Engenharia Eletrica e de Computação / Made available in DSpace on 2018-07-23T20:16:10Z (GMT). No. of bitstreams: 1
Gomes_LeandrodeCamposTeixeira_M.pdf: 7657405 bytes, checksum: e4cae4f7fef2aeaa666c6f598c0c24bb (MD5)
Previous issue date: 1998 / Resumo: Neste trabalho encontra-se descrito o sistema de conversão texto-fala para o português do Brasil desenvolvido no Laboratório de Processamento de Sinais da Faculdade de Engenharia Elétrica e de Computação da Unicamp. O sistema recebe como entrada um texto genérico em português e produz em sua saída o sinal de fala correspondente. O processo de conversão texto-fala divide-se em três etapas básicas, cada uma englobando vários módulos: Processamento de texto: pré-processamento, classificação gramatical, divisão silábica e transcrição ortográfico-fonética. Processamento prosódico: determinação de fronteiras prosódicas, geração de contornos de entonação e geração de durações de segmentos. Processamento de sinal: síntese do sinal de fala utilizando o sintetizador de formantes de Klatt. Os módulos de processamento prosódico empregam dados de duração e entonação extraídos de elocuções naturais, ajustando-os às particularidades do texto de entrada com base em informações provenientes do classificador gramatical. A abordagem de síntese por regras é utilizada para a geração dos parâmetros de controle do sintetizador. Uma linguagem e um compilador específicos foram criados para a descrição das regras de síntese. Embora não tenham sido realizadas avaliações formais da qualidade do sistema, testes informais indicaram um bom desempenho geral em termos de inteligibilidade e naturalidade / Abstract: This work contains a description of the text-to-speech conversion system for the Portuguese of Brazil developed at the Signal Processing Laboratory of the Electrical and Computer Engineering School of Unicamp. The system receives as input a generic text in Portuguese and produces as output the corresponding speech signal. The text-to-speech conversion process is divided into three basic steps, each one including several modules: Text processing: preprocessing, grammatical classification, syllabic division and orthographic-phonetic transcription. Prosodic processing: determination of prosodic boundaries, generation of intonation patterns and generation of segmental durations. Signal processing: synthesis of the speech signal using the Klatt formant synthesizer. The prosodic processing modules use duration and intonation data extracted from natural utterances, adjusting them to the particularities of the input text on the basis of information provided by the grammatical classifier. The synthesis-by-rule approach is used for generating the synthesizer control parameters. A specific language and a compiler have been created for the description of the synthesis rules. A1thoughformal evaluations of the system quality have not been made, informal tests have indicated a good general performance in terms of intelligibility and naturalness / Mestrado / Mestre em Engenharia Elétrica
Identifer | oai:union.ndltd.org:IBICT/oai:repositorio.unicamp.br:REPOSIP/259365 |
Date | 15 July 1998 |
Creators | Gomes, Leandro de Campos Teixeira |
Contributors | UNIVERSIDADE ESTADUAL DE CAMPINAS, Chiquito, Jose Geraldo, 1951-, Romano, João Marcos Travassos, Vieira, Maurilio Nunes |
Publisher | [s.n.], Universidade Estadual de Campinas. Faculdade de Engenharia Elétrica e de Computação, Programa de Pós-Graduação em Engenharia Elétrica |
Source Sets | IBICT Brazilian ETDs |
Language | Portuguese |
Detected Language | Portuguese |
Type | info:eu-repo/semantics/publishedVersion, info:eu-repo/semantics/masterThesis |
Format | 107f. : il., application/pdf |
Source | reponame:Repositório Institucional da Unicamp, instname:Universidade Estadual de Campinas, instacron:UNICAMP |
Rights | info:eu-repo/semantics/openAccess |
Page generated in 0.0024 seconds