Global ETD Search

O reconhecimento de entidades nomeadas por meio de conditional Random Fields para a l?ngua portuguesa

Made available in DSpace on 2015-04-14T14:50:10Z (GMT). No. of bitstreams: 1
457280.pdf: 1466158 bytes, checksum: 50a287eaebe41a6c016dd9b8f5bac19d (MD5)
Previous issue date: 2013-03-08 / Many tasks in Natural Language Processing involves the provision of a large number of variables, which depend on each other. Structured prediction methods are essentially a combination of classification and modeling based on graphs. They combine the power of classification methods with the ability of this type of modeling to play compactly, multivariate data. The classification methods perform prediction using a large set of features as input. Conditional Random Fields (CRF) is a probabilistic method for predicting structured and has been widely applied in various areas such as natural language processing, including the Named Entity Recognition (NER), computer vision, and bioinformatics. Therefore, this dissertation proposes the application of CRF to NER for the Portuguese Language and to evaluate their performance based on the HAREM corpus. Finally, comparative tests of similar approaches were performed, illustrating the efficiency and competitiveness of the proposed system. / Muitas tarefas de Processamento da Linguagem Natural envolvem a previs?o de um grande n?mero de vari?veis, as quais dependem umas das outras. M?todos de predi??o estruturada s?o, essencialmente, uma combina??o de classifica??o e de modelagem baseada em grafo. Eles unem a compet?ncia dos m?todos de classifica??o com a capacidade desse tipo de modelagem de reproduzir, compactamente, dados multivariados. Os m?todos de classifica??o realizam a predi??o usando um grande conjunto de features como entrada. Conditional Random Fields (CRF) ? um m?todo probabil?stico de predi??o estruturada e tem sido amplamente aplicado em diversas ?reas, tais como processamento da linguagem natural, incluindo o Reconhecimento de Entidades Nomeadas (REN), vis?o computacional e bioinform?tica. Sendo assim, neste trabalho ? proposta a aplica??o do CRF para o REN em textos da L?ngua Portuguesa e, sequencialmente, avaliar o seu desempenho com base no corpus do HAREM. Finalmente, testes comparativos da abordagem determinada versus a similar da literatura foram realizados, ilustrando a competitividade e efic?cia do sistema proposto.

INFORM?TICA

PROCESSAMENTO DA LINGUAGEM NATURAL

ONTOLOGIA

AN?LISE SEM?NTICA (PROGRAMA??O)

Identifer	oai:union.ndltd.org:IBICT/oai:tede2.pucrs.br:tede/5246
Date	08 March 2013
Creators	Amaral, Daniela Oliveira Ferreira do
Contributors	Vieira, Renata
Publisher	Pontif?cia Universidade Cat?lica do Rio Grande do Sul, Programa de P?s-Gradua??o em Ci?ncia da Computa??o, PUCRS, BR, Faculdade de Inform?ca
Source Sets	IBICT Brazilian ETDs
Language	Portuguese
Detected Language	English
Type	info:eu-repo/semantics/publishedVersion, info:eu-repo/semantics/masterThesis
Format	application/pdf
Source	reponame:Biblioteca Digital de Teses e Dissertações da PUC_RS, instname:Pontifícia Universidade Católica do Rio Grande do Sul, instacron:PUC_RS
Rights	info:eu-repo/semantics/openAccess
Relation	1974996533081274470, 500, 600, 1946639708616176246

Page generated in 0.0079 seconds

O reconhecimento de entidades nomeadas por meio de conditional Random Fields para a l?ngua portuguesa

Description

Links & Downloads

Tags

Additional Fields