Return to search

A resolução de anáforas pronominais da língua portuguesa com base no algoritmo de Mitkov.

Made available in DSpace on 2016-06-02T19:05:25Z (GMT). No. of bitstreams: 1
ChavesDissMestrado2007.pdf: 1531762 bytes, checksum: 7abc0f23650c4081b1838680a8af1dd3 (MD5)
Previous issue date: 2007-08-22 / One of the problems of natural language processing systems is to assure
referential cohesion in a text. This property allows connecting the text constituents and
making it readable. We address the anaphoric phenomenon as one of the main factors of
referential cohesion. Anaphors depict a reference relationship between two or more text
components, and the interpretation of the anaphor is dependent upon the interpretation
of its antecedent. This work is limited to pronominal anaphors, thus, to automatic
pronoun resolution. Several algorithms have been proposed to this end. They usually
involve (1) identifying the anaphoric component; (2) determining the set of its possible
antecedents; and (3) identifying and selecting the most likely antecedent of the anaphor.
The lack of anaphora resolution in, e.g., information extraction and automatic
translation or summarization may yield non-cohesive texts. Herein we present an
adaptation of the Mitkov´s algorithm for pronoun resolution. 3rd person pronouns for
Brazilian Portuguese are especially addressed, whose antecedents are noun phrases.
This approach has been intrinsically evaluated on annotated corpora. It has also been
compared with Lappin and Leass algorithm for pronoun resolution, adapted to
Portuguese. Annotations embed morphological, syntactic and co-referential information.
The evaluation measure adopted was the success rate. This is defined as the ratio
between the number of anaphors correctly resolved by the system and the total number
of anaphors in the text. The results of both evaluations are discussed here. / Um dos problemas encontrados em sistemas de processamento de línguas
naturais é conseguir manter a coesão referencial de um texto, propriedade que permite
estabelecer as ligações entre os seus constituintes, tornando-o inteligível. Dentre os
fatores de coesão referencial destacamos a anáfora, que ocorre quando duas ou mais
expressões de um texto estabelecem uma relação de referência entre si, isto é, a
interpretação da anáfora depende de um antecedente ao qual ela se refere no texto.
Diversos algoritmos na literatura foram propostos para a resolução automática de
anáforas pronominais, que consiste em: 1) identificar a anáfora, 2) determinar o
conjunto de possíveis antecedentes e 3) identificar e selecionar o antecedente da
anáfora. A ausência da resolução anafórica em aplicações como extração de informação,
tradução automática e sumarização textual, dentre outras, pode levar à descontinuidade
referencial de seus resultados, tornando-os não-coesos. Nesse contexto, apresentamos
uma adaptação do algoritmo de Mitkov, originalmente aplicado no inglês, para resolver
anáforas da língua portuguesa, especialmente as determinadas por pronomes pessoais de
terceira pessoa cujo antecedente seja um sintagma nominal. Essa abordagem foi
avaliada com base em corpora anotados com informações morfossintáticas e coreferenciais,
utilizando-se como medida de avaliação de desempenho a taxa de sucesso,
que determina o número de anáforas resolvidas corretamente pelo sistema automático
em relação ao número de anáforas presentes no corpus avaliado. Além disso, fez-se uma
comparação de desempenho entre essa abordagem e o algoritmo de Lappin & Leass
adaptado para o português. Os resultados dessa avaliação são discutidos ao final do
trabalho.

Identiferoai:union.ndltd.org:IBICT/oai:repositorio.ufscar.br:ufscar/351
Date22 August 2007
CreatorsChaves, Amanda Rocha
ContributorsRino, Lúcia Helena Machado
PublisherUniversidade Federal de São Carlos, Programa de Pós-graduação em Ciência da Computação, UFSCar, BR
Source SetsIBICT Brazilian ETDs
LanguagePortuguese
Detected LanguagePortuguese
Typeinfo:eu-repo/semantics/publishedVersion, info:eu-repo/semantics/masterThesis
Formatapplication/pdf
Sourcereponame:Repositório Institucional da UFSCAR, instname:Universidade Federal de São Carlos, instacron:UFSCAR
Rightsinfo:eu-repo/semantics/openAccess

Page generated in 0.0016 seconds