Return to search

Classificação de informação usando ontologias / Information classification using ontologies

Although the positive aspects that Internet possesses and the potential it permits, there is a problematic that consists on finding needed pieces of information among the deluge of available documents on the web. Tools that are able to semantically treat the information contained in the documents which follows a structure only focused on data presentation are still lacking. The MASTER-Web system solves the problem of integrated extraction of content-pages that belong to classes which form a cluster. In this context, we propose the extension of this tool to the scientific articles classification
based on ontologies. To achieve this goal, an ontology for the Artificial Intelligence domain was constructed and rule-based classification strategies were adopeted. The approach presented here employs this ontology and textual classification techniques to extract useful pieces of information from the articles in order to infer to which themes
it is about. This combination led to significative results: e.g. in the texts, the system is able to identify the specific subdivisions of AI and entails conclusions, distinguishing
correctlly the themes of the articles from the ones that are briefiy mentioned in the texts. The application of simple techniques and a detailed ontology lead to promising
classification results, independently of the document structure, proposing an eficient and plausible solution. / Coordenação de Aperfeiçoamento de Pessoal de Nível Superior / Apesar dos aspectos positivos que a Internet possui e do potencial que permite, existe a problemática, que consiste em encontrar a informação necessária em meio a uma enorme quantidade de documentos disponíveis na rede. Faltam, ainda, ferramentas capazes de tratar semanticamente a informação contida em documentos que seguem uma estrutura preocupada apenas com a exibição dos seus dados. O sistema MASTERWeb, resolve o problema da extração integrada de páginas-conteúdo pertencentes às classes que integram um grupo (cluster ). Neste contexto propomos a extensão dessa ferramenta para a classificação de artigos científicos baseada em ontologias. Para isso foi construída uma ontologia do domínio de Inteligência Artificial e adotadas estratégias de classificação utilizando sistemas de regras. A abordagem apresentada aqui, emprega esta ontologia e técnicas de classificação textual para extrair dos artigos informações úteis, e daí inferir sobre os temas tratados nestes artigos. Essa combinação conduziu a resultados bastante significativos: por exemplo, o sistema é capaz de identificar no texto as subáreas de IA que ele aborda e deriva conclusões, distinguindo os assuntos tratados pelo artigo daqueles que são brevemente citados no texto. A aplicação de técnicas simples e uma ontologia bem formada levam a resultados de classificação promissores, independentemente da estrutura do documento, propondo uma solução eficiente e plausível.

Identiferoai:union.ndltd.org:IBICT/oai:www.repositorio.ufal.br:riufal/852
Date28 September 2006
CreatorsSilva, Eunice Palmeira da
ContributorsFreitas, Frederico Luiz Gonçalves de, FREITAS, F., Costa, Evandro de Barros, COSTA, E. B., Bittencourt, Guilherme, BITTENCOURT, G.
PublisherUniversidade Federal de Alagoas, BR, Modelagem Computacional de Conhecimento, Programa de Pós-Graduação em Modelagem Computacional de Conhecimento, UFAL
Source SetsIBICT Brazilian ETDs
LanguagePortuguese
Detected LanguagePortuguese
Typeinfo:eu-repo/semantics/publishedVersion, info:eu-repo/semantics/masterThesis
Formatapplication/pdf
Sourcereponame:Repositório Institucional da UFAL, instname:Universidade Federal de Alagoas, instacron:UFAL
Rightsinfo:eu-repo/semantics/openAccess
Relationbitstream:http://www.repositorio.ufal.br:8080/bitstream/riufal/852/1/Dissertacao_EunicePalmeira_2006.pdf, bitstream:http://www.repositorio.ufal.br:8080/bitstream/riufal/852/2/Dissertacao_EunicePalmeira_2006.pdf.txt

Page generated in 0.0027 seconds