Made available in DSpace on 2016-06-02T20:24:59Z (GMT). No. of bitstreams: 1
DissTIC.pdf: 1727948 bytes, checksum: fd1e13beaba58ee4b0a4f9d4b5d19687 (MD5)
Previous issue date: 2007-08-21 / Universidade Federal de Sao Carlos / The work presented in the dissertation focuses on the study and validation of linguistic
theories so as to improve reference cohesion in Automatic Summarization systems, which
with the advent of the Internet have received increasing attention due to the urge to manage
the huge amounts of on-line textual information that become available each day.
In this dissertation we evaluate Seno (2005) s Veins Theory-based proposal and prototype,
and present a reimplementation with distinct features based on the analysis of a corpus
annotated with rhetoric (RST) and referential information. In addition, we report on the
first validation effort for Portuguese for Veins Theory s Conjecture 1 (C1), which
constrains anaphora resolution given the rhetoric structure of texts and whose applicability
to Automatic Summarization interests us. As a methodological novelty, we put forth the
Non-Trivial Precision, a more realistic estimator of C1 s predictive power. / O trabalho apresentado nesta dissertação tem como foco o estudo e validação de teorias
lingüísticas com vistas à melhoria dos sistemas de Sumarização Automática, ramo da
Lingüística Computacional que, com o advento da internet, tem recebido grande atenção
nos últimos tempos, pois a quantidade de informação on-line é enorme e os leitores têm
cada vez menos tempo para apreender o máximo desta informação.
Nesta dissertação, avaliamos o protótipo de AS baseado na Teoria das Veias proposto por
Seno (2005) e apresentamos uma reimplementação com características distintas, baseada
em análise de córpus um córpus anotado com informação retórica (RST) e referencial.
Como inovação metodológica, formulamos a Precisão Não-Trivial, um estimador mais
realista para o poder preditivo da C1.
Identifer | oai:union.ndltd.org:IBICT/oai:repositorio.ufscar.br:ufscar/5650 |
Date | 21 August 2007 |
Creators | Carbonel, Thiago Ianez |
Contributors | Rino, Lúcia Helena Machado |
Publisher | Universidade Federal de São Carlos, Programa de Pós-graduação em Linguística, UFSCar, BR |
Source Sets | IBICT Brazilian ETDs |
Language | Portuguese |
Detected Language | Portuguese |
Type | info:eu-repo/semantics/publishedVersion, info:eu-repo/semantics/masterThesis |
Format | application/pdf |
Source | reponame:Repositório Institucional da UFSCAR, instname:Universidade Federal de São Carlos, instacron:UFSCAR |
Rights | info:eu-repo/semantics/openAccess |
Page generated in 0.0023 seconds