Spelling suggestions: "subject:"indexação dda informação"" "subject:"indexação daa informação""
1 |
RISO - TT - Extração de expressões temporais em textos. / RISO - TT - Extraction of temporal expressions in texts.SANTOS, Adriano Araújo. 26 July 2018 (has links)
Submitted by Johnny Rodrigues (johnnyrodrigues@ufcg.edu.br) on 2018-07-26T15:09:11Z
No. of bitstreams: 1
ADRIANO ARAÚJO SANTOS - DISSERTAÇÃO PPGCC 2013..pdf: 7720673 bytes, checksum: fdba828ba2c20b709ed7c3efbc93f751 (MD5) / Made available in DSpace on 2018-07-26T15:09:11Z (GMT). No. of bitstreams: 1
ADRIANO ARAÚJO SANTOS - DISSERTAÇÃO PPGCC 2013..pdf: 7720673 bytes, checksum: fdba828ba2c20b709ed7c3efbc93f751 (MD5)
Previous issue date: 2013-04-22 / A necessidade de gerenciar a grande quantidade de documentos digitais existentes
na atualidade, associada à incapacidade humana de analisar todas essas
informações em tempo hábil, fez com que as pesquisas e o desenvolvimento de
sistemas na área de automatização de processos para a gestão de informação
crescessem, no entanto, essa atividade não é trivial. A maioria dos documentos
disponíveis não tem estrutura bem definida (padronizada), o que torna difícil a
criação de mecanismos computacionais que automatizem a análise das informações
e gera a necessidade de se promoverem atividades intermediárias de conversão de
informações em linguagem natural em informações estruturadas. Para isso, são
necessárias atividades de reconhecimento de padrões nominais, temporais e
espaciais. No tocante a essa pesquisa, o objetivo principal foi criar um mecanismo
de reconhecimento de padrões temporais. Heuristicamente, foi criado um dicionário de regras baseadas em associações de padrões temporais e desenvolvido um módulo de marcação e recuperação de padrões temporais em uma arquitetura extensível e flexível, chamado RISO-TT, que implementa esse mecanismo de reconhecimento de padrões temporais. Esse módulo faz parte do projeto de pesquisa RISO (Recuperação da Informação Semântica de Objetos Textuais). Foram realizados dois experimentos para avaliar a eficiência do RISO-TT. O primeiro, com o intuito de verificar a extensibilidade e a
flexibilidade do módulo RISO-TT, e o segundo, para analisar a eficiência da
abordagem proposta com base em uma comparação com duas ferramentas
consolidadas no meio académico (HeidelTime e SuTime). O RISO-TT obteve
resultados superiores aos concorrentes no processo de marcação de expressões
temporais, comprovados por meio de testes estatísticos. / The necessity of managing the large amount of digital existing documents nowadays,
associated to the human inability to analyze ali this information in a fast manner, led
to a growth of research in the area of system development for automation of the
information management process. Nevertheless, this is not a trivial task. Most of the
available documents do not have a standardized structure, hindering the
development of computational schemes that can automate the analysis of
information, thus requiring jobs of information conversion from natural language to
structured information. For such, syntactic, temporal and spatial pattern recognition
tasks are needed. Concerning the present study, the main objective is to create an
advanced temporal pattern recognition mechanism. We created, heurístically, a rules
dictionary of temporal patterns, developing a module in an extendable and flexible
architecture for retrieval and marking. This module, called RISO-TT, implements this
pattern recognition mechanism and is part of the RISO project (Retrieval of Semantic
Information from Textual Objects). Two experiments were carried out in order to
evaluate the efficiency of this approach. The first one was intended to verify the
extendability and flexibility of the RISO-TT architecture and the second one to
analyze the efficiency of the proposed approach, based on a comparison between
the developed module and two Consolidated tools in the academic community
(Heideltime and SuTime). RISO-TT outperformed the rivais in the temporal
expression marking process, which was proved through statistical tests.
|
Page generated in 0.0838 seconds