O desenvolvimento de recursos computacionais para PLN é, na maioria das vezes, uma tarefa árdua e demorada, principalmente na fase inicial, de aquisição de conhecimento. Esta tarefa pode ser simplificada com a centralização dos dados em um repositório que armazene todas as informações lexicais disponíveis de uma determinada língua. Este trabalho documenta o desenvolvimento da DlADORIM, uma base relacional de dados lexicais para a língua portuguesa, com cerca de 1.5 milhão de entradas. Os desafios linguísticos e computacionais encontrados durante todo o processo são discutidos. Várias interfaces de acesso e edição foram implementadas e avaliadas. / The development of computational resources of NLP is usually an expensive task in terms of time complexity, mainly in knowledge acquisition phase. This task can be simplified by keeping the data in a central repository, which stores all the available lexical information of a particular language. This work describes the development process of DIADORIM, a relational lexical database for Brazilian Portuguese with around 1.5 million entries. Linguistics and computational development problems are deeply discussed. Interfaces for accessing and editing data were implemented and evaluated.
Identifer | oai:union.ndltd.org:IBICT/oai:teses.usp.br:tde-17062015-113227 |
Date | 27 March 2002 |
Creators | Juliana Galvani Greghi |
Contributors | Maria das Graças Volpe Nunes, Marcelo Finger, Bento Carlos Dias da Silva |
Publisher | Universidade de São Paulo, Ciências da Computação e Matemática Computacional, USP, BR |
Source Sets | IBICT Brazilian ETDs |
Language | Portuguese |
Detected Language | Portuguese |
Type | info:eu-repo/semantics/publishedVersion, info:eu-repo/semantics/masterThesis |
Source | reponame:Biblioteca Digital de Teses e Dissertações da USP, instname:Universidade de São Paulo, instacron:USP |
Rights | info:eu-repo/semantics/openAccess |
Page generated in 0.0017 seconds