O reconhecimento de entidades nomeadas por meio de conditional Random Fields para a l?ngua portuguesa

Made available in DSpace on 2015-04-14T14:50:10Z (GMT). No. of bitstreams: 1
457280.pdf: 1466158 bytes, checksum: 50a287eaebe41a6c016dd9b8f5bac19d (MD5)
Previous issue date: 2013-03-08 / Many tasks in Natural Language Processing involves the provision of a large number of variables, which depend on each other. Structured prediction methods are essentially a combination of classification and modeling based on graphs. They combine the power of classification methods with the ability of this type of modeling to play compactly, multivariate data. The classification methods perform prediction using a large set of features as input. Conditional Random Fields (CRF) is a probabilistic method for predicting structured and has been widely applied in various areas such as natural language processing, including the Named Entity Recognition (NER), computer vision, and bioinformatics. Therefore, this dissertation proposes the application of CRF to NER for the Portuguese Language and to evaluate their performance based on the HAREM corpus. Finally, comparative tests of similar approaches were performed, illustrating the efficiency and competitiveness of the proposed system. / Muitas tarefas de Processamento da Linguagem Natural envolvem a previs?o de um grande n?mero de vari?veis, as quais dependem umas das outras. M?todos de predi??o estruturada s?o, essencialmente, uma combina??o de classifica??o e de modelagem baseada em grafo. Eles unem a compet?ncia dos m?todos de classifica??o com a capacidade desse tipo de modelagem de reproduzir, compactamente, dados multivariados. Os m?todos de classifica??o realizam a predi??o usando um grande conjunto de features como entrada. Conditional Random Fields (CRF) ? um m?todo probabil?stico de predi??o estruturada e tem sido amplamente aplicado em diversas ?reas, tais como processamento da linguagem natural, incluindo o Reconhecimento de Entidades Nomeadas (REN), vis?o computacional e bioinform?tica. Sendo assim, neste trabalho ? proposta a aplica??o do CRF para o REN em textos da L?ngua Portuguesa e, sequencialmente, avaliar o seu desempenho com base no corpus do HAREM. Finalmente, testes comparativos da abordagem determinada versus a similar da literatura foram realizados, ilustrando a competitividade e efic?cia do sistema proposto.

Identiferoai:union.ndltd.org:IBICT/oai:tede2.pucrs.br:tede/5246
Date08 March 2013
CreatorsAmaral, Daniela Oliveira Ferreira do
ContributorsVieira, Renata
PublisherPontif?cia Universidade Cat?lica do Rio Grande do Sul, Programa de P?s-Gradua??o em Ci?ncia da Computa??o, PUCRS, BR, Faculdade de Inform?ca
Source SetsIBICT Brazilian ETDs
LanguagePortuguese
Detected LanguageEnglish
Typeinfo:eu-repo/semantics/publishedVersion, info:eu-repo/semantics/masterThesis
Formatapplication/pdf
Sourcereponame:Biblioteca Digital de Teses e Dissertações da PUC_RS, instname:Pontifícia Universidade Católica do Rio Grande do Sul, instacron:PUC_RS
Rightsinfo:eu-repo/semantics/openAccess
Relation1974996533081274470, 500, 600, 1946639708616176246

Page generated in 0.0079 seconds