Orientador: Fabio Violaro, Plinio A. Barbosa / Dissertação (mestrado) - Universidade Estadual de Campinas, Faculdade de Engenharia Eletrica e de Computação / Made available in DSpace on 2018-07-24T21:28:17Z (GMT). No. of bitstreams: 1
Pessoa_LuisAugustodeSa_M.pdf: 9139469 bytes, checksum: 762d0ca82f9215f12bdc99ecc1d6c7a0 (MD5)
Previous issue date: 1999 / Resumo: o reconhecimento de fala contínua baseado somente em informações acústicas não proporciona bons resultados [Lippmann97]. Modelos da Língua podem ser usados para caracterizar, capturar e explorar as regularidades da língua natural, melhorando o desempenho do sistema de reconhecimento. Esta Tese apresenta o estudo e a implementação de Modelos da Língua para o português do Brasil. São propostos dois modelos bigram de classes de palavras (modelos lineares) e um modelo baseado em gramática independente de contexto (modelo hierárquico). Um dos modelos bigram emprega classificação manual de palavras (classes gramaticais) e o outro emprega classificação automática através do algoritmo Simulated Annealing. O modelo baseado em gramática foi desenvolvido com base em uma teoria de Gramática Gerativa [Chomsky65] e utiliza a Sintaxe Xbarra [Jackendoff77]. Os Modelos da Língua foram avaliados através de um sistema de reconhecimento de fala contínua dependente do locutor desenvolvido por Morais [Morais97]. Este trabalho também apresenta um algoritmo de decodificação, baseado no algoritmo LeveI Building [Rabiner*85], que leva em conta as restrições do Modelo da Língua durante o procedimento de busca / Abstract: : Continuous speech recognition based only on acoustic information does not provide good results [Lippmann97]. Language Models can be used to characterize, capture and exploit the language regularities, improving the recognition system performance. This Thesis presents the study and implementation of Language Models for Brazilian Portuguese. Two word class bigram language models (linear models) and one model based on context-free grammar (hierarchical model) are proposed. One bigram model uses manual classification of words (grammatical classes) and the other one uses automatic classification performed by the Simulated Annealing algorithm. The grammar-based model is implemented employing a theory of Generative Grammar [Chomsky65] and uses the X-bar Syntax [Jackendoft77]. The Language Models are evaluated using a speaker dependent continuous speech recognition system developed by Morais [Morais97]. This work also presents a decoding algorithm, based on Level Building algorithm [Rabiner*85], which considers the Language Model constraints during the search procedure / Mestrado / Mestre em Engenharia Elétrica
Identifer | oai:union.ndltd.org:IBICT/oai:repositorio.unicamp.br:REPOSIP/259048 |
Date | 24 February 1999 |
Creators | Pessoa, Luis Augusto de Sa |
Contributors | UNIVERSIDADE ESTADUAL DE CAMPINAS, Barbosa, Plinio Almeida, 1966-, Violaro, Fabio, 1950-, Barbosa, Plinio A. |
Publisher | [s.n.], Universidade Estadual de Campinas. Faculdade de Engenharia Elétrica e de Computação, Programa de Pós-Graduação em Engenharia Elétrica |
Source Sets | IBICT Brazilian ETDs |
Language | Portuguese |
Detected Language | Portuguese |
Type | info:eu-repo/semantics/publishedVersion, info:eu-repo/semantics/masterThesis |
Format | 178f. : il., application/pdf |
Source | reponame:Repositório Institucional da Unicamp, instname:Universidade Estadual de Campinas, instacron:UNICAMP |
Rights | info:eu-repo/semantics/openAccess |
Page generated in 0.0025 seconds