Global ETD Search

Return to search

KDC

DissertaÃ§Ã£o (mestrado) - Universidade Federal de Santa Catarina, Centro TecnolÃ³gico, Programa de PÃ³s-GraduaÃ§Ã£o em CiÃªncia da ComputaÃ§Ã£o, FlorianÃ³polis, 2015. / Made available in DSpace on 2016-05-24T17:49:37Z (GMT). No. of bitstreams: 1
338993.pdf: 1478677 bytes, checksum: dc5a2121bf6037984f65437d39bb1b87 (MD5)
Previous issue date: 2015 / ClassificaÃ§Ã£o de documentos fornece um meio para organizar as informaÃ§Ãµes, permitindo uma melhor compreensÃ£o e interpretaÃ§Ã£o dos dados. A tarefa de classificar Ã© caracterizada pela associaÃ§Ã£o de rÃ³tulos de classes a documentos com o objetivo de criar agrupamentos semÃ¢nticos. O aumento exponencial no nÃºmero de documentos e dados digitais demanda formas mais precisas, abrangentes e eficientes para busca e organizaÃ§Ã£o de informaÃ§Ãµes. Nesse contexto, o aprimoramento de tÃ©cnicas de classificaÃ§Ã£o de documentos com o uso de informaÃ§Ã£o semÃ¢ntica Ã© considerado essencial. Sendo assim, este trabalho propÃµe uma abordagem baseada em conhecimento para a classificaÃ§Ã£o de documentos. A tÃ©cnica utiliza termos extraÃdos de documentos associando-os a conceitos de uma base de conhecimento de domÃnio aberto. Em seguida, os conceitos sÃ£o generalizados a um nÃvel maior de abstraÃ§Ã£o. Por fim, Ã© calculado um valor de disparidade entre os conceitos generalizados e o documento, sendo o conceito de menor disparidade considerado como rÃ³tulo de classe aplicÃ¡vel ao documento. A aplicaÃ§Ã£o da tÃ©cnica proposta oferece vantagens sobre os mÃ©todos convencionais como a ausÃªncia da necessidade de treinamento, a oportunidade de atribuir uma ou mÃºltiplas classes a um documento e a capacidade de aplicaÃ§Ã£o em diferentes temas de classificaÃ§Ã£o sem a necessidade de alterar o classificador.<br> / Abstract : Document classification provides a way to organize information, providing a better way to understand available data. The classification task is characterized by the association of class labels to documents, aiming to create semantic clusters. The exponential increase in the number of documents and digital data demands for more precise, comprehensive and efficient ways to search and organize information. In this context, the improvement of document classification techniques using semantic information is considered essential. Thus, this paper proposes a knowledge-based approach for the classification of documents. The technique uses terms extracted from documents in association with concepts of an open domain knowledge base. Then, the concepts are generalized to a higher level of abstraction. Finally a disparity value between generalized concepts and the document is calculated, and the best ranked concept is then considered as a class label applicable to the document. The application of the proposed technique offers advantages over conventional methods including no need for training, the choice to assign one or multiple classes to a document and the capacity to classify over different subjects without the need to change the classifier.

ComputaÃ§Ã£o

Documentos

ClassificaÃ§Ã£o

RecuperaÃ§Ã£o da informaÃ§Ã£o

Banco de dados textuais

Identifer	oai:union.ndltd.org:IBICT/oai:repositorio.ufsc.br:123456789/162787
Date	January 2015
Creators	Silva, Gleidson AntÃ´nio Cardoso da
Contributors	Universidade Federal de Santa Catarina, Dorneles, Carina Friedrich
Source Sets	IBICT Brazilian ETDs
Language	Portuguese
Detected Language	Portuguese
Type	info:eu-repo/semantics/publishedVersion, info:eu-repo/semantics/masterThesis
Format	58 p.\| il., grafs., tabs.
Source	reponame:Repositório Institucional da UFSC, instname:Universidade Federal de Santa Catarina, instacron:UFSC
Rights	info:eu-repo/semantics/openAccess

Page generated in 0.0015 seconds

KDC

Description

Links & Downloads

Tags

Additional Fields