Return to search

Modelos da lingua para o portugues do Brasil aplicados ao reconhecimento de fala continua : modelos lineares e modelos hierarquicos (Parsing)

Orientador: Fabio Violaro, Plinio A. Barbosa / Dissertação (mestrado) - Universidade Estadual de Campinas, Faculdade de Engenharia Eletrica e de Computação / Made available in DSpace on 2018-07-24T21:28:17Z (GMT). No. of bitstreams: 1
Pessoa_LuisAugustodeSa_M.pdf: 9139469 bytes, checksum: 762d0ca82f9215f12bdc99ecc1d6c7a0 (MD5)
Previous issue date: 1999 / Resumo: o reconhecimento de fala contínua baseado somente em informações acústicas não proporciona bons resultados [Lippmann97]. Modelos da Língua podem ser usados para caracterizar, capturar e explorar as regularidades da língua natural, melhorando o desempenho do sistema de reconhecimento. Esta Tese apresenta o estudo e a implementação de Modelos da Língua para o português do Brasil. São propostos dois modelos bigram de classes de palavras (modelos lineares) e um modelo baseado em gramática independente de contexto (modelo hierárquico). Um dos modelos bigram emprega classificação manual de palavras (classes gramaticais) e o outro emprega classificação automática através do algoritmo Simulated Annealing. O modelo baseado em gramática foi desenvolvido com base em uma teoria de Gramática Gerativa [Chomsky65] e utiliza a Sintaxe Xbarra [Jackendoff77]. Os Modelos da Língua foram avaliados através de um sistema de reconhecimento de fala contínua dependente do locutor desenvolvido por Morais [Morais97]. Este trabalho também apresenta um algoritmo de decodificação, baseado no algoritmo LeveI Building [Rabiner*85], que leva em conta as restrições do Modelo da Língua durante o procedimento de busca / Abstract: : Continuous speech recognition based only on acoustic information does not provide good results [Lippmann97]. Language Models can be used to characterize, capture and exploit the language regularities, improving the recognition system performance. This Thesis presents the study and implementation of Language Models for Brazilian Portuguese. Two word class bigram language models (linear models) and one model based on context-free grammar (hierarchical model) are proposed. One bigram model uses manual classification of words (grammatical classes) and the other one uses automatic classification performed by the Simulated Annealing algorithm. The grammar-based model is implemented employing a theory of Generative Grammar [Chomsky65] and uses the X-bar Syntax [Jackendoft77]. The Language Models are evaluated using a speaker dependent continuous speech recognition system developed by Morais [Morais97]. This work also presents a decoding algorithm, based on Level Building algorithm [Rabiner*85], which considers the Language Model constraints during the search procedure / Mestrado / Mestre em Engenharia Elétrica

Identiferoai:union.ndltd.org:IBICT/oai:repositorio.unicamp.br:REPOSIP/259048
Date24 February 1999
CreatorsPessoa, Luis Augusto de Sa
ContributorsUNIVERSIDADE ESTADUAL DE CAMPINAS, Barbosa, Plinio Almeida, 1966-, Violaro, Fabio, 1950-, Barbosa, Plinio A.
Publisher[s.n.], Universidade Estadual de Campinas. Faculdade de Engenharia Elétrica e de Computação, Programa de Pós-Graduação em Engenharia Elétrica
Source SetsIBICT Brazilian ETDs
LanguagePortuguese
Detected LanguagePortuguese
Typeinfo:eu-repo/semantics/publishedVersion, info:eu-repo/semantics/masterThesis
Format178f. : il., application/pdf
Sourcereponame:Repositório Institucional da Unicamp, instname:Universidade Estadual de Campinas, instacron:UNICAMP
Rightsinfo:eu-repo/semantics/openAccess

Page generated in 0.0018 seconds