Return to search

Classificação de textos usando ontologias

Orientadora: Profa. Dra. Debora Maria Rossi de Medeiros / Dissertação (mestrado) - Universidade Federal do ABC, Programa de Pós-Graduação em Ciência da Computação, 2016. / Em diversos domínios de conhecimento, uma das principais forma de divulgação de informação é por meio de documentos de texto. Exemplos são websites, artigos científicos,
blogs, postagens em redes sociais e reviews de produtos/serviços. Dessa forma, extrair
automaticamente informações desse tipo de fonte de dados se torna uma importante tarefa.
Uma das formas mais clássicas de extração de informação de documentos textuais é
chamada de classificação. Esta tarefa consiste de atribuir automaticamente a categoria a
qual um texto pertence, com base em um conjunto de textos previamente categorizado.
Extrair informação de documentos textuais é, em geral, uma tarefa desafiadora por lidar
com uma forma não estruturada de dados, uma vez que uma mesma informação pode ser
expressa de diversas manerias. Neste contexto, uma ontologia pode representar uma ferramenta poderosa para auxiliar a tarefa de extração de informação de textos. Ontologias
são, em linhas gerais, dicionários de conceitos conectados por meio de relações semânticas.
Este trabalho investiga o uso de ontologias na tarefa de classificação de textos. Foi
proposta uma abordagem onde são criados novos atributos para descrever os textos de
uma base com base nos conceitos de uma ontologia. Foram realizados experimentos com
bases de textos benchmark amplamente utilizadas pela comunidade científica. Em geral,
a abordagem proposta proporcionou vantagem em relação à abordagem convencional em
cenários específicos. Esses cenários indicam uma região de potencias da nova abordagem
que será melhor explorada em trabalhos futuros. / In several knowledge areas, one of the main forms of spreading information is through
textual documents. Some examples are websites, scientific papers, blogs, social media
posts and product/service reviews. Thus, automatically extracting information from this
type of data becomes an important task. One of the most classic information extraction
task is text classification. This task consists of automatically assigning the category to
which a text belongs, based on a previously categorized text set. Extracting information
from textual data is, in general, a challenging task because it deals with unstructured
data, once the same piece of information can be expressed by different ways. In this
context, an ontology may be a powerful tool to aid information extraction from texts. In
a nutshell, ontologies are dictionaries of concepts linked according to semantic relations.
This project studies the usage of ontologies in the task of text classification. We proposed
an approach where new features for describing the texts based on an ontology concepts.
Experiments with benchmark text bases, widely employed by scientific community. In
general, the proposed approach overcomes the conventional approach in specific scenarios.
These scenarios point to potential areas where the new approach will be better explored
in future work.

Identiferoai:union.ndltd.org:IBICT/oai:BDTD:106574
Date January 2016
CreatorsGuevara, Juan Florencio Valdivia
ContributorsMedeiros, Debora Maria Rossi de, França, Fabricio Olivetti de, Souza, Bruno Feres de
Source SetsIBICT Brazilian ETDs
LanguagePortuguese
Detected LanguagePortuguese
Typeinfo:eu-repo/semantics/publishedVersion, info:eu-repo/semantics/masterThesis
Formatapplication/pdf, 96 f. : il.
Sourcereponame:Repositório Institucional da UFABC, instname:Universidade Federal do ABC, instacron:UFABC
Rightsinfo:eu-repo/semantics/openAccess
Relationhttp://biblioteca.ufabc.edu.br/index.php?codigo_sophia=106574&midiaext=74722, http://biblioteca.ufabc.edu.br/index.php?codigo_sophia=106574&midiaext=74721, Cover: http://biblioteca.ufabc.edu.brphp/capa.php?obra=106574

Page generated in 0.0039 seconds