Return to search

Projeto e desenvolvimento de uma base de dados lexicais do português / Design and development of a lexical data base of Portuguese

O desenvolvimento de recursos computacionais para PLN é, na maioria das vezes, uma tarefa árdua e demorada, principalmente na fase inicial, de aquisição de conhecimento. Esta tarefa pode ser simplificada com a centralização dos dados em um repositório que armazene todas as informações lexicais disponíveis de uma determinada língua. Este trabalho documenta o desenvolvimento da DlADORIM, uma base relacional de dados lexicais para a língua portuguesa, com cerca de 1.5 milhão de entradas. Os desafios linguísticos e computacionais encontrados durante todo o processo são discutidos. Várias interfaces de acesso e edição foram implementadas e avaliadas. / The development of computational resources of NLP is usually an expensive task in terms of time complexity, mainly in knowledge acquisition phase. This task can be simplified by keeping the data in a central repository, which stores all the available lexical information of a particular language. This work describes the development process of DIADORIM, a relational lexical database for Brazilian Portuguese with around 1.5 million entries. Linguistics and computational development problems are deeply discussed. Interfaces for accessing and editing data were implemented and evaluated.

Identiferoai:union.ndltd.org:IBICT/oai:teses.usp.br:tde-17062015-113227
Date27 March 2002
CreatorsJuliana Galvani Greghi
ContributorsMaria das Graças Volpe Nunes, Marcelo Finger, Bento Carlos Dias da Silva
PublisherUniversidade de São Paulo, Ciências da Computação e Matemática Computacional, USP, BR
Source SetsIBICT Brazilian ETDs
LanguagePortuguese
Detected LanguagePortuguese
Typeinfo:eu-repo/semantics/publishedVersion, info:eu-repo/semantics/masterThesis
Sourcereponame:Biblioteca Digital de Teses e Dissertações da USP, instname:Universidade de São Paulo, instacron:USP
Rightsinfo:eu-repo/semantics/openAccess

Page generated in 0.0017 seconds