Global ETD Search

Return to search

Modelo para sumarização computacional de textos científicos. / Scientific text computational summarization model.

Neste trabalho, propõe-se um modelo para a sumarização computacional extrativa de textos de artigos técnico-cientificos em inglês. A metodologia utilizada baseia-se em um módulo de avaliação de similaridade semântica textual entre sentenças, desenvolvido especialmente para integrar o modelo de sumarização. A aplicação deste módulo de similaridade à extração de sentenças é feita por intermédio do conceito de uma janela deslizante de comprimento variável, que facilita a detecção de equivalência semântica entre frases do artigo e aquelas de um léxico de frases típicas, atribuíveis a uma estrutura básica dos artigos. Os sumários obtidos em aplicações do modelo apresentam qualidade razoável e utilizável, para os efeitos de antecipar a informação contida nos artigos. / In this work a model is proposed for the computational extractive summarization of scientific papers in English. Its methodology is based on a semantic textual similarity module, for the evaluation of equivalence between sentences, specially developed to integrate the summarization model. A variable width window facilitates the application of this module to detect semantic similarity between phrases in the article and those in a basic structure, assignable to the articles. Practical summaries obtained with the model show usable quality to anticipate the information found in the papers.

http://www.teses.usp.br/teses/disponiveis/3/3139/tde-10082017-145217/

Artigo científico

Computational summarization

Natural language processing

Processamento de linguagem natural

Scientific paper

Semantic textual similarity

Identifer	oai:union.ndltd.org:usp.br/oai:teses.usp.br:tde-10082017-145217
Date	07 March 2017
Creators	Tarafa Guzmán, Alejandro
Contributors	Ferreira, Ademar
Publisher	Biblioteca Digitais de Teses e Dissertações da USP
Source Sets	Universidade de São Paulo
Language	Portuguese
Detected Language	Portuguese
Type	Dissertação de Mestrado
Format	application/pdf
Rights	Liberar o conteúdo para acesso público.

Page generated in 0.0019 seconds

Modelo para sumarização computacional de textos científicos. / Scientific text computational summarization model.

Description

Links & Downloads

Tags

Additional Fields