Global ETD Search

Return to search

Modelos da lingua para o portugues do Brasil aplicados ao reconhecimento de fala continua : modelos lineares e modelos hierarquicos (Parsing)

Orientador: Fabio Violaro, Plinio A. Barbosa / Dissertação (mestrado) - Universidade Estadual de Campinas, Faculdade de Engenharia Eletrica e de Computação / Made available in DSpace on 2018-07-24T21:28:17Z (GMT). No. of bitstreams: 1
Pessoa_LuisAugustodeSa_M.pdf: 9139469 bytes, checksum: 762d0ca82f9215f12bdc99ecc1d6c7a0 (MD5)
Previous issue date: 1999 / Resumo: o reconhecimento de fala contínua baseado somente em informações acústicas não proporciona bons resultados [Lippmann97]. Modelos da Língua podem ser usados para caracterizar, capturar e explorar as regularidades da língua natural, melhorando o desempenho do sistema de reconhecimento. Esta Tese apresenta o estudo e a implementação de Modelos da Língua para o português do Brasil. São propostos dois modelos bigram de classes de palavras (modelos lineares) e um modelo baseado em gramática independente de contexto (modelo hierárquico). Um dos modelos bigram emprega classificação manual de palavras (classes gramaticais) e o outro emprega classificação automática através do algoritmo Simulated Annealing. O modelo baseado em gramática foi desenvolvido com base em uma teoria de Gramática Gerativa [Chomsky65] e utiliza a Sintaxe Xbarra [Jackendoff77]. Os Modelos da Língua foram avaliados através de um sistema de reconhecimento de fala contínua dependente do locutor desenvolvido por Morais [Morais97]. Este trabalho também apresenta um algoritmo de decodificação, baseado no algoritmo LeveI Building [Rabiner*85], que leva em conta as restrições do Modelo da Língua durante o procedimento de busca / Abstract: : Continuous speech recognition based only on acoustic information does not provide good results [Lippmann97]. Language Models can be used to characterize, capture and exploit the language regularities, improving the recognition system performance. This Thesis presents the study and implementation of Language Models for Brazilian Portuguese. Two word class bigram language models (linear models) and one model based on context-free grammar (hierarchical model) are proposed. One bigram model uses manual classification of words (grammatical classes) and the other one uses automatic classification performed by the Simulated Annealing algorithm. The grammar-based model is implemented employing a theory of Generative Grammar [Chomsky65] and uses the X-bar Syntax [Jackendoft77]. The Language Models are evaluated using a speaker dependent continuous speech recognition system developed by Morais [Morais97]. This work also presents a decoding algorithm, based on Level Building algorithm [Rabiner*85], which considers the Language Model constraints during the search procedure / Mestrado / Mestre em Engenharia Elétrica

Reconhecimento automático da voz

Modelos linguisticos

Gramática gerativa

Reconhecimento automatico da fala

Identifer	oai:union.ndltd.org:IBICT/oai:repositorio.unicamp.br:REPOSIP/259048
Date	24 February 1999
Creators	Pessoa, Luis Augusto de Sa
Contributors	UNIVERSIDADE ESTADUAL DE CAMPINAS, Barbosa, Plinio Almeida, 1966-, Violaro, Fabio, 1950-, Barbosa, Plinio A.
Publisher	[s.n.], Universidade Estadual de Campinas. Faculdade de Engenharia Elétrica e de Computação, Programa de Pós-Graduação em Engenharia Elétrica
Source Sets	IBICT Brazilian ETDs
Language	Portuguese
Detected Language	Portuguese
Type	info:eu-repo/semantics/publishedVersion, info:eu-repo/semantics/masterThesis
Format	178f. : il., application/pdf
Source	reponame:Repositório Institucional da Unicamp, instname:Universidade Estadual de Campinas, instacron:UNICAMP
Rights	info:eu-repo/semantics/openAccess

Page generated in 0.0025 seconds

Modelos da lingua para o portugues do Brasil aplicados ao reconhecimento de fala continua : modelos lineares e modelos hierarquicos (Parsing)

Description

Links & Downloads

Tags

Additional Fields