Dissertação (mestrado) - Universidade Federal de Santa Catarina, Centro de Ciências da Educação. Programa de Pós-graduação em Ciência da Informação / Made available in DSpace on 2012-10-23T13:55:37Z (GMT). No. of bitstreams: 1
240352.pdf: 590202 bytes, checksum: 7af00bdcd931753aad952bf6beb0bb97 (MD5) / O desenvolvimento científico e tecnológico vem trazendo em seu escopo novas estruturas de conteúdos. Relações de toda ordem montam teias que ligam dados, informações, pessoas e locais em um mesmo ambiente não mais físico. A velocidade determinante deste novo século tem gerado inquietações acerca da nova situação que envolve todas as áreas do conhecimento. Grandes volumes de conteúdos precisam ser recuperados com rapidez e precisão atendendo às expectativas dos usuários. Sistemas de Recuperação de Informação são desenvolvidos na tentativa de solucionar esta questão. A pesquisa se insere no universo das linguagens aplicadas nesses sistemas e sua motivação é fruto da leitura e reflexão de estudos anteriores sobre o tema, envolvendo aspectos da sua estrutura, conceitos, relacionamentos e variações. Abordando a linguagem natural e suas novas formas de representação, são estudadas as ontologias de um Sistema de Recuperação de Informações que utiliza a tecnologia KMAI . Esta tecnologia adota técnicas de inteligência artificial e ontologias como forma de recuperação da informação em documentos não-estruturados disponíveis em mídias escritas: jornais, revistas e sites eletrônicos com código aberto. O sistema-alvo de estudo, desenvolvido para o Observatório Regional Base de Indicadores de Sustentabilidade Metropolitano de Curitiba- ORBIS_MC, busca estruturar informações que vão subsidiar políticas públicas de desenvolvimento para a região metropolitana por meio de monitoramento, recuperação e composição da base do conhecimento sobre Saúde Ambiental, Saúde Humana e Violência Urbana na Região Metropolitana de Curitiba. O sistema conta com um dicionário de termos construído por especialistas nas áreas definidas como objeto de representação. A presente pesquisa propõe uma metodologia de validação das ontologias que integram este dicionário, considerando os critérios lingüísticos que reflitam o uso da língua no contexto comunicativo, visto que se trata de uma linguagem utilizada para recuperar conteúdos cuja função é comunicar. Apoiando-se no estudo de publicações já reconhecidas nas áreas de Ciência da Informação e Lingüística, foram sistematizadas recomendações sobre o estabelecimento das relações semânticas entre os termos, a fim de definir critérios de validação de ontologias sob o ponto de vista lingüístico. Esses critérios foram aplicados em um "corpus" de 28 termos e 163 relações semânticas. O resultado da análise apresenta 82,21% de relações semânticas consideradas consistentes e 17,79% inadequadas. Para este último conjunto, foram tecidas recomendações. A aplicação de uma metodologia de fundamentação lingüística sob a perspectiva do uso foi a obtenção de uma ontologia atualizada, tanto no seu aspecto lexical como semântico, aumentando a eficiência de recuperação da informação.
Identifer | oai:union.ndltd.org:IBICT/oai:repositorio.ufsc.br:123456789/90679 |
Date | January 2007 |
Creators | Bedin, Sonali Paula |
Contributors | Universidade Federal de Santa Catarina, Café, Lígia Maria Arruda |
Publisher | Florianópolis, SC |
Source Sets | IBICT Brazilian ETDs |
Language | Portuguese |
Detected Language | Portuguese |
Type | info:eu-repo/semantics/publishedVersion, info:eu-repo/semantics/masterThesis |
Format | 108 f.| tabs. |
Source | reponame:Repositório Institucional da UFSC, instname:Universidade Federal de Santa Catarina, instacron:UFSC |
Rights | info:eu-repo/semantics/openAccess |
Page generated in 0.0021 seconds