Submitted by Maria Aparecida (cidazen@gmail.com) on 2017-08-29T14:17:25Z
No. of bitstreams: 1
Fabio Augusto.pdf: 2319314 bytes, checksum: 7dc99465ac724efe228c61bb9dfafa80 (MD5) / Made available in DSpace on 2017-08-29T14:17:25Z (GMT). No. of bitstreams: 1
Fabio Augusto.pdf: 2319314 bytes, checksum: 7dc99465ac724efe228c61bb9dfafa80 (MD5)
Previous issue date: 2009-05-18 / Several techniques for extracting meaning from text in order to construct more
accurate internal representations of both queries and information items in retrieval
systems have been already proposed. However, there is a lack of semantic retrieval
models to provide appropriate abstractions of these techniques. This work proposes
a knowledge--based information retrieval model that explores the semantic content of
information items . The internal representation of information items is based on user
interest groups, called “semantic cases”. The model also defines a criteria for retrieve
information items and a function for ordering the results that uses similarity measures
based on semantic distance between semantic cases items. The model was
instantiated by a sample system built upon the tributary legal domain using the
specialization of the ONTOJURIS, a generic legal ontology, called ONTOTRIB. Legal
normative instruments can be instantiated in a knowledge base by ONTOTRIB
classes. The results obtained for this specific domain showed an improvement in the
precision rates compared to a keyword-based system. / Várias técnicas para extrair significado de textos com o objetivo de construir
representações internas mais precisas, tanto para itens de informação quanto para
consultas em sistemas de recuperação já foram propostas. Contudo, faltam modelos
de recuperação baseados em semântica que especifiquem abstrações apropriadas
para essas técnicas. Este trabalho apresenta um modelo de recuperação baseado
no conhecimento que explora o conteúdo semântico dos itens de informação. A
representação interna dos itens de informação é baseada em grupos de interesse do
usuário chamados de “casos semânticos”. O modelo também define um critério para
a recuperação dos itens de informação e uma função para ordenar os resultados
obtidos que utiliza medidas de similaridade baseadas na distância semântica entre
os elementos das representações internas. O modelo foi instanciado em um sistema
construído para o domínio jurídico tributário usando a ontologia ONTOTRIB, uma
extensão da ontologia genérica ONTOJURIS, que permite a instanciação de
instrumentos jurídico-tributários. Os resultados obtidos nos testes realizados neste
domínio específico apontaram uma melhoria da precisão em relação a um sistema
baseado em palavras-chave.
Identifer | oai:union.ndltd.org:IBICT/oai:tede2:tede/1876 |
Date | 18 May 2009 |
Creators | SILVA, Fábio Augusto de Santana |
Contributors | GIRARDI, Rosario, GIRARDI GUTIÉRREZ, Maria del Rosário, LOH, Stanley, SAAVEDRA MENDEZ, Osvaldo Ronald |
Publisher | Universidade Federal do Maranhão, PROGRAMA DE PÓS-GRADUAÇÃO EM ENGENHARIA DE ELETRICIDADE/CCET, UFMA, Brasil, DEPARTAMENTO DE ENGENHARIA DA ELETRICIDADE/CCET |
Source Sets | IBICT Brazilian ETDs |
Language | Portuguese |
Detected Language | Portuguese |
Type | info:eu-repo/semantics/publishedVersion, info:eu-repo/semantics/masterThesis |
Format | application/pdf |
Source | reponame:Biblioteca Digital de Teses e Dissertações da UFMA, instname:Universidade Federal do Maranhão, instacron:UFMA |
Rights | info:eu-repo/semantics/openAccess |
Page generated in 0.0026 seconds