Global ETD Search

Return to search

Extra??o de rela??es hipon?micas em corpora de l?ngua portuguesa

Submitted by Setor de Tratamento da Informa??o - BC/PUCRS (tede2@pucrs.br) on 2015-06-08T11:20:00Z
No. of bitstreams: 1
470106 - Texto Completo.pdf: 1241867 bytes, checksum: fb5ae9bcc63565dabf9bfb2f5c3ed3ad (MD5) / Made available in DSpace on 2015-06-08T11:20:00Z (GMT). No. of bitstreams: 1
470106 - Texto Completo.pdf: 1241867 bytes, checksum: fb5ae9bcc63565dabf9bfb2f5c3ed3ad (MD5)
Previous issue date: 2015-03-26 / Natural Language Processing (NLP) is a Computer Science area featured by its relevance
to the development of applications that process large amounts of text or speech.
In this paper we focus on texts in Portuguese, extracting from them hyponymic relations
between entities, using a rules-based approach adapted from Hearst to English, and
Freitas and Quental and Taba and Caseli to Portuguese. The prototype was executed over
a corpus of Portuguese texts and the output was analyzed according to the reference
author and rule sets. The evaluation process followed the one proposed by Freitas and
Quental with human judgment, and the results are compared to those reported in the main
references. The dissertation also studies in detail the most common errors identified. / O Processamento da Linguagem Natural (PLN) ? uma ?rea da Ci?ncia da Computa??o
destacada por sua relev?ncia para o desenvolvimento de aplica??es em processamento
de grandes quantidades de documentos textuais ou orais.
Neste trabalho focamos nos textos em l?ngua portuguesa, deles extraindo rela??es
hipon?micas entre entidades, usando uma abordagem baseada em regras adaptadas dos
trabalhos de Hearst para o ingl?s, Freitas e Quental e Taba e Caseli para o portugu?s,
aqui complementadas.
Para validar a proposta foi desenvolvido um prot?tipo que extrai rela??es hipon?micas de
corpora em l?ngua portuguesa. O prot?tipo foi executado sobre corpus de textos e os
resultados obtidos foram analisados tanto por fonte de refer?ncia como por grupos de
regras. O processo avaliativo seguiu o proposto por Freitas e Quental com avalia??o
humana, e as medidas obtidas s?o comparadas com as relatadas nas principais fontes de
refer?ncia. A disserta??o ainda estuda em detalhe os erros mais frequentes identificados.

http://tede2.pucrs.br/tede2/handle/tede/6108

INFORM?TICA

PROCESSAMENTO DA LINGUAGEM NATURAL

AN?LISE SEM?NTICA (PROGRAMA??O)

Identifer	oai:union.ndltd.org:IBICT/oai:tede2.pucrs.br:tede/6108
Date	26 March 2015
Creators	Machado, Pablo Neves
Contributors	Lima, Vera L?cia Strube de
Publisher	Pontif?cia Universidade Cat?lica do Rio Grande do Sul, Programa de P?s-Gradua??o em Ci?ncia da Computa??o, PUCRS, Brasil, Faculdade de Inform?tica
Source Sets	IBICT Brazilian ETDs
Language	Portuguese
Detected Language	Portuguese
Type	info:eu-repo/semantics/publishedVersion, info:eu-repo/semantics/masterThesis
Format	application/pdf
Source	reponame:Biblioteca Digital de Teses e Dissertações da PUC_RS, instname:Pontifícia Universidade Católica do Rio Grande do Sul, instacron:PUC_RS
Rights	info:eu-repo/semantics/openAccess
Relation	1974996533081274470, 600, 600, 600, -3008542510401149144, 3671711205811204509

Page generated in 0.0023 seconds

Extra??o de rela??es hipon?micas em corpora de l?ngua portuguesa

Description

Links & Downloads

Tags

Additional Fields