Return to search

Estudo e validação de teorias do domínio lingüístico com vistas à melhoria do tratamento de cadeias de co-referência em Sumarização Automática.

Made available in DSpace on 2016-06-02T20:24:59Z (GMT). No. of bitstreams: 1
DissTIC.pdf: 1727948 bytes, checksum: fd1e13beaba58ee4b0a4f9d4b5d19687 (MD5)
Previous issue date: 2007-08-21 / Universidade Federal de Sao Carlos / The work presented in the dissertation focuses on the study and validation of linguistic
theories so as to improve reference cohesion in Automatic Summarization systems, which
with the advent of the Internet have received increasing attention due to the urge to manage
the huge amounts of on-line textual information that become available each day.
In this dissertation we evaluate Seno (2005) s Veins Theory-based proposal and prototype,
and present a reimplementation with distinct features based on the analysis of a corpus
annotated with rhetoric (RST) and referential information. In addition, we report on the
first validation effort for Portuguese for Veins Theory s Conjecture 1 (C1), which
constrains anaphora resolution given the rhetoric structure of texts and whose applicability
to Automatic Summarization interests us. As a methodological novelty, we put forth the
Non-Trivial Precision, a more realistic estimator of C1 s predictive power. / O trabalho apresentado nesta dissertação tem como foco o estudo e validação de teorias
lingüísticas com vistas à melhoria dos sistemas de Sumarização Automática, ramo da
Lingüística Computacional que, com o advento da internet, tem recebido grande atenção
nos últimos tempos, pois a quantidade de informação on-line é enorme e os leitores têm
cada vez menos tempo para apreender o máximo desta informação.
Nesta dissertação, avaliamos o protótipo de AS baseado na Teoria das Veias proposto por
Seno (2005) e apresentamos uma reimplementação com características distintas, baseada
em análise de córpus um córpus anotado com informação retórica (RST) e referencial.
Como inovação metodológica, formulamos a Precisão Não-Trivial, um estimador mais
realista para o poder preditivo da C1.

Identiferoai:union.ndltd.org:IBICT/oai:repositorio.ufscar.br:ufscar/5650
Date21 August 2007
CreatorsCarbonel, Thiago Ianez
ContributorsRino, Lúcia Helena Machado
PublisherUniversidade Federal de São Carlos, Programa de Pós-graduação em Linguística, UFSCar, BR
Source SetsIBICT Brazilian ETDs
LanguagePortuguese
Detected LanguagePortuguese
Typeinfo:eu-repo/semantics/publishedVersion, info:eu-repo/semantics/masterThesis
Formatapplication/pdf
Sourcereponame:Repositório Institucional da UFSCAR, instname:Universidade Federal de São Carlos, instacron:UFSCAR
Rightsinfo:eu-repo/semantics/openAccess

Page generated in 0.0023 seconds