Although the positive aspects that Internet possesses and the potential it permits, there is a problematic that consists on finding needed pieces of information among the deluge of available documents on the web. Tools that are able to semantically treat the information contained in the documents which follows a structure only focused on data presentation are still lacking. The MASTER-Web system solves the problem of integrated extraction of content-pages that belong to classes which form a cluster. In this context, we propose the extension of this tool to the scientific articles classification
based on ontologies. To achieve this goal, an ontology for the Artificial Intelligence domain was constructed and rule-based classification strategies were adopeted. The approach presented here employs this ontology and textual classification techniques to extract useful pieces of information from the articles in order to infer to which themes
it is about. This combination led to significative results: e.g. in the texts, the system is able to identify the specific subdivisions of AI and entails conclusions, distinguishing
correctlly the themes of the articles from the ones that are briefiy mentioned in the texts. The application of simple techniques and a detailed ontology lead to promising
classification results, independently of the document structure, proposing an eficient and plausible solution. / Coordenação de Aperfeiçoamento de Pessoal de Nível Superior / Apesar dos aspectos positivos que a Internet possui e do potencial que permite, existe a problemática, que consiste em encontrar a informação necessária em meio a uma enorme quantidade de documentos disponíveis na rede. Faltam, ainda, ferramentas capazes de tratar semanticamente a informação contida em documentos que seguem uma estrutura preocupada apenas com a exibição dos seus dados. O sistema MASTERWeb, resolve o problema da extração integrada de páginas-conteúdo pertencentes às classes que integram um grupo (cluster ). Neste contexto propomos a extensão dessa ferramenta para a classificação de artigos científicos baseada em ontologias. Para isso foi construída uma ontologia do domínio de Inteligência Artificial e adotadas estratégias de classificação utilizando sistemas de regras. A abordagem apresentada aqui, emprega esta ontologia e técnicas de classificação textual para extrair dos artigos informações úteis, e daí inferir sobre os temas tratados nestes artigos. Essa combinação conduziu a resultados bastante significativos: por exemplo, o sistema é capaz de identificar no texto as subáreas de IA que ele aborda e deriva conclusões, distinguindo os assuntos tratados pelo artigo daqueles que são brevemente citados no texto. A aplicação de técnicas simples e uma ontologia bem formada levam a resultados de classificação promissores, independentemente da estrutura do documento, propondo uma solução eficiente e plausível.
Identifer | oai:union.ndltd.org:IBICT/oai:www.repositorio.ufal.br:riufal/852 |
Date | 28 September 2006 |
Creators | Silva, Eunice Palmeira da |
Contributors | Freitas, Frederico Luiz Gonçalves de, FREITAS, F., Costa, Evandro de Barros, COSTA, E. B., Bittencourt, Guilherme, BITTENCOURT, G. |
Publisher | Universidade Federal de Alagoas, BR, Modelagem Computacional de Conhecimento, Programa de Pós-Graduação em Modelagem Computacional de Conhecimento, UFAL |
Source Sets | IBICT Brazilian ETDs |
Language | Portuguese |
Detected Language | Portuguese |
Type | info:eu-repo/semantics/publishedVersion, info:eu-repo/semantics/masterThesis |
Format | application/pdf |
Source | reponame:Repositório Institucional da UFAL, instname:Universidade Federal de Alagoas, instacron:UFAL |
Rights | info:eu-repo/semantics/openAccess |
Relation | bitstream:http://www.repositorio.ufal.br:8080/bitstream/riufal/852/1/Dissertacao_EunicePalmeira_2006.pdf, bitstream:http://www.repositorio.ufal.br:8080/bitstream/riufal/852/2/Dissertacao_EunicePalmeira_2006.pdf.txt |
Page generated in 0.0022 seconds