Return to search

Extra??o de rela??es hipon?micas em corpora de l?ngua portuguesa

Submitted by Setor de Tratamento da Informa??o - BC/PUCRS (tede2@pucrs.br) on 2015-06-08T11:20:00Z
No. of bitstreams: 1
470106 - Texto Completo.pdf: 1241867 bytes, checksum: fb5ae9bcc63565dabf9bfb2f5c3ed3ad (MD5) / Made available in DSpace on 2015-06-08T11:20:00Z (GMT). No. of bitstreams: 1
470106 - Texto Completo.pdf: 1241867 bytes, checksum: fb5ae9bcc63565dabf9bfb2f5c3ed3ad (MD5)
Previous issue date: 2015-03-26 / Natural Language Processing (NLP) is a Computer Science area featured by its relevance
to the development of applications that process large amounts of text or speech.
In this paper we focus on texts in Portuguese, extracting from them hyponymic relations
between entities, using a rules-based approach adapted from Hearst to English, and
Freitas and Quental and Taba and Caseli to Portuguese. The prototype was executed over
a corpus of Portuguese texts and the output was analyzed according to the reference
author and rule sets. The evaluation process followed the one proposed by Freitas and
Quental with human judgment, and the results are compared to those reported in the main
references. The dissertation also studies in detail the most common errors identified. / O Processamento da Linguagem Natural (PLN) ? uma ?rea da Ci?ncia da Computa??o
destacada por sua relev?ncia para o desenvolvimento de aplica??es em processamento
de grandes quantidades de documentos textuais ou orais.
Neste trabalho focamos nos textos em l?ngua portuguesa, deles extraindo rela??es
hipon?micas entre entidades, usando uma abordagem baseada em regras adaptadas dos
trabalhos de Hearst para o ingl?s, Freitas e Quental e Taba e Caseli para o portugu?s,
aqui complementadas.
Para validar a proposta foi desenvolvido um prot?tipo que extrai rela??es hipon?micas de
corpora em l?ngua portuguesa. O prot?tipo foi executado sobre corpus de textos e os
resultados obtidos foram analisados tanto por fonte de refer?ncia como por grupos de
regras. O processo avaliativo seguiu o proposto por Freitas e Quental com avalia??o
humana, e as medidas obtidas s?o comparadas com as relatadas nas principais fontes de
refer?ncia. A disserta??o ainda estuda em detalhe os erros mais frequentes identificados.

Identiferoai:union.ndltd.org:IBICT/oai:tede2.pucrs.br:tede/6108
Date26 March 2015
CreatorsMachado, Pablo Neves
ContributorsLima, Vera L?cia Strube de
PublisherPontif?cia Universidade Cat?lica do Rio Grande do Sul, Programa de P?s-Gradua??o em Ci?ncia da Computa??o, PUCRS, Brasil, Faculdade de Inform?tica
Source SetsIBICT Brazilian ETDs
LanguagePortuguese
Detected LanguagePortuguese
Typeinfo:eu-repo/semantics/publishedVersion, info:eu-repo/semantics/masterThesis
Formatapplication/pdf
Sourcereponame:Biblioteca Digital de Teses e Dissertações da PUC_RS, instname:Pontifícia Universidade Católica do Rio Grande do Sul, instacron:PUC_RS
Rightsinfo:eu-repo/semantics/openAccess
Relation1974996533081274470, 600, 600, 600, -3008542510401149144, 3671711205811204509

Page generated in 0.0023 seconds