Return to search

Extra??o e alinhamento de hierarquias em p?ginas WEB

Made available in DSpace on 2015-04-14T14:49:51Z (GMT). No. of bitstreams: 1
439643.pdf: 1981246 bytes, checksum: 04537cde325826102af000a0bad6e653 (MD5)
Previous issue date: 2012-03-23 / The heterogeneity of the ways information is presented on the web is a characteristic which complicates the analysis between different sources. Even in hierarchical structures, which have a minimum relation of order, there is no standard for how to display the elements and how to reference them. Therefore, this work s main focus is to present a visual and extensible tool that centralizes and supports operations on such structures in web pages. To that end, the PLATAL (Platform of Hierarchy Extraction and Alignment) tool was developed, to facilitate the various operations of hierarchy alignment. The tool has four main modules: one for extracting hierarchies of web pages, making them available for manipulation in standard formats of the semantic web; one for automated alignment of these hierarchies, based on various heuristics and ontology alignment techniques; one for manual alignment of hierarchies, allowing the creation of reference alignments; and finally, one for evaluation of alignments, through the analysis of precision and recall. To evaluate the heuristics of alignment, experiments were performed in the field of e-commerce. The results were compared with that produced by other tools described in the literature. Therefore, this work contributes as a way to enable the creation of aligned hierarchies from heterogeneous structures found on the web. / A heterogeneidade das formas como as informa??es s?o apresentadas na web ? uma caracter?stica que dificulta a an?lise de dados entre diferentes fontes. Mesmo em estruturas hier?rquicas, que possuem uma rela??o m?nima de ordem, n?o h? um padr?o para como exibir os elementos e como referenciar os mesmos. Por isso, o foco principal deste trabalho ? apresentar uma ferramenta visual e extens?vel que centraliza e auxilia opera??es sobre tais estruturas em p?ginas da internet. Para tanto, foi elaborada a ferramenta PLATAL (Plataforma de Extra??o e Alinhamento de Hierarquias), voltada para facilitar as diversas opera??es de alinhamento de hierarquias. A ferramenta possui quatro m?dulos principais: um para extra??o de hierarquias de p?ginas da internet, tornando-as dispon?veis para manipula??o em formatos padr?es da web sem?ntica; um para alinhamento automatizado dessas hierarquias, baseado em diversas heur?sticas e t?cnicas de alinhamento de ontologias; um para alinhamento manual de hierarquias, possibilitando a cria??o de alinhamentos de refer?ncia; e por fim, um para avalia??o de alinhamentos, atrav?s da an?lise de precis?o e abrang?ncia. Para avaliar as heur?sticas de alinhamento, foram realizados experimentos no dom?nio de com?rcio eletr?nico. Os resultados foram comparados com o produzido por outras ferramentas descritas na literatura. Portanto, este trabalho contribui como uma forma de viabilizar a cria??o de hierarquias alinhadas a partir das estruturas heterog?neas encontradas na web.

Identiferoai:union.ndltd.org:IBICT/oai:tede2.pucrs.br:tede/5183
Date23 March 2012
CreatorsSouza, Bernardo Severo de
ContributorsVieira, Renata
PublisherPontif?cia Universidade Cat?lica do Rio Grande do Sul, Programa de P?s-Gradua??o em Ci?ncia da Computa??o, PUCRS, BR, Faculdade de Inform?ca
Source SetsIBICT Brazilian ETDs
LanguagePortuguese
Detected LanguageEnglish
Typeinfo:eu-repo/semantics/publishedVersion, info:eu-repo/semantics/masterThesis
Formatapplication/pdf
Sourcereponame:Biblioteca Digital de Teses e Dissertações da PUC_RS, instname:Pontifícia Universidade Católica do Rio Grande do Sul, instacron:PUC_RS
Rightsinfo:eu-repo/semantics/openAccess
Relation1974996533081274470, 500, 600, 1946639708616176246

Page generated in 0.012 seconds