Return to search

Uso de relações semântico-estruturais no aprimoramento do cálculo da similaridade semântica: um estudo voltado a estruturas ontológicas em língua portuguesa

Made available in DSpace on 2013-08-07T18:42:46Z (GMT). No. of bitstreams: 1
000416526-Texto+Completo-0.pdf: 2208042 bytes, checksum: 26409ec36e39b51edbbc8ac6e980a237 (MD5)
Previous issue date: 2009 / This work presents a study on alternative techniques to improve SiSe measure (Semantic Similarity), which was proposed by Freitas [FRE07]. This measure refers to the mapping of terms between different ontological structures, using an adaptation of the Taxonomic Model of Maedche and Staab (2002) for the semantic similarity calculus. SiSe makes a similarity comparison between terms of different ontological structures through term hierarchy analysis, their superconcepts and subconcepts. In this context, the resulting coefficient is the semantic-structural similarity between terms from ontological structures. The original SiSe measure showed relatively satisfactory coefficients for the semantic-structural mapping. However, it did not achieve its goals in some testing cases. Some examples are the results considered as false positives and the similarity cases that were not detected by the measure (false negatives). Based on these problems, new structural similarity strategies are proposed to improve the SiSe measure. These strategies are mostly based on related works which deal with structural similarity through: i) the attribution of adequacy factors based in the term position in the ontological structural hierarchy; ii) the arrangement of sets formed by their super-concepts; iii) the arrangement of sets formed by their sub-concepts; and iv) the usage of the corrected Jaccard measure. These strategies are explained and evaluated according to Golden Mapping and state of the art metrics: precision, recall and F-measure. The obtained results reached 100% of accuracy in SiSe false positive cases. / O presente trabalho tem como objetivo estudar alternativas para aprimorar a medida SiSe (Similaridade Semântica), que foi proposta por Freitas [FRE07]. Esta medida visa o mapeamento de termos entre estruturas ontológicas distintas, utilizando uma adaptação do Modelo Taxonômico de Maedche e Staab [MAE02b] para o cálculo da similaridade semântica que faz uma comparação da similaridade entre termos de estruturas ontológicas distintas através da análise da hierarquia em que os mesmos se inserem, seus superconceitos e subconceitos. Desta forma, o coeficiente resultante é a similaridade semântico-estrutural entre os termos das estruturas ontológicas. A medida SiSe levou a coeficientes de similaridade considerados relativamente satisfatórios para o mapeamento semântico-estrutural, porém não atingiu seus objetivos em alguns casos para os quais foi testada. Incluem-se aqui os resultados considerados como falsos positivos e os casos de similaridade que a medida não detectou (falsos negativos). Partindo desses problemas, estratégias de similaridade estrutural são propostas para aprimorar, assim, a medida SiSe. As estratégias são baseadas, em sua maioria, em trabalhos da literatura que abordam a similaridade estrutural através de: i) atribuições de fatores de adequação fundamentados na posição dos termos na hierarquia da estrutura ontológica; ii) atribuições de conjuntos formados pelos superconceitos dos termos analisados; iii) atribuições de conjuntos formados pelos subconceitos destes termos e; iv) o uso da medida de Jaccard corrigida. As estratégias são descritas e avaliadas de acordo com um recurso denominado Golden Mapping e métricas mais comumente utilizadas na literatura: precisão, abrangência e medida-F. Os resultados obtidos chegaram a 100% de acurácia no que se refere aos falsos positivos da SiSe.

Identiferoai:union.ndltd.org:IBICT/urn:repox.ist.utl.pt:RI_PUC_RS:oai:meriva.pucrs.br:10923/1539
Date January 2009
CreatorsBrandolt, Josiane Fontoura dos Anjos
ContributorsLima, Vera Lúcia Strube de
PublisherPontifícia Universidade Católica do Rio Grande do Sul, Porto Alegre
Source SetsIBICT Brazilian ETDs
LanguagePortuguese
Detected LanguagePortuguese
Typeinfo:eu-repo/semantics/publishedVersion, info:eu-repo/semantics/masterThesis
Sourcereponame:Repositório Institucional da PUC_RS, instname:Pontifícia Universidade Católica do Rio Grande do Sul, instacron:PUC_RS
Rightsinfo:eu-repo/semantics/openAccess

Page generated in 0.0045 seconds