Tese (doutorado) - Universidade Federal de Santa Catarina, Centro Tecnológico, Programa de Pós-Graduação em Engenharia e Gestão do Conhecimento, Florianópolis, 2011 / Made available in DSpace on 2012-10-26T03:17:30Z (GMT). No. of bitstreams: 1
290706.pdf: 6175753 bytes, checksum: 41c6c7a0cb0d438e93a5150fd9d3578f (MD5) / O grande número de informações disponíveis, que estão em diferentes fontes de dados, exige cada vez mais processamento dos motores de busca. Recuperar informações que estão nessas bases de dados com a melhor precisão possível é um dos desafios a serem alcançados dentro do contexto desta tese. Os registros clínicos médicos contêm uma imensa gama de informações, normalmente escritas em forma de texto livre e sem um padrão linguístico. Os médicos não escrevem os diagnósticos e os laudos do paciente com o uso de elementos de estilo, o que dificulta o processamento e a recuperação da informação por parte dos sistemas computacionais. Consequentemente, obter o conhecimento a partir desses dados não é uma tarefa fácil para um motor de busca. Este trabalho apresenta o desenvolvimento de um modelo, que permite recuperar o conhecimento de informações textuais em documentos médicos. Técnicas de expansão de pesquisas, que utilizam detecção de ativos de conhecimento da ontologia DeCS e de dicionários linguísticos, são utilizadas. O objetivo é ampliar o universo de pesquisa do usuário e criar uma base de conhecimento para permitir o seu reúso. A proposta de tese aqui apresentada difere dos anteriores porque a intenção é retornar às pesquisas dos usuários uma série de documentos médicos muito mais eficazes do que nas tradicionais ferramentas de busca. Com o intuito de melhorar os resultados de uma pesquisa, anotações semânticas e detecção de expressões negativas serão utilizadas para processar os textos médicos. O estudo de caso apresentado no final mostra que, dos dez primeiros resultados do modelo ora proposto, alcançou-se uma média de 90% de precisão, enquanto que o modelo booleano limitou-se a 60%, e com o diferencial de que no modelo tradicional, o usuário teve que refazer suas consultas várias vezes até chegar a um resultado satisfatório, ao passo que no modelo semântico obteve êxito já na primeira consulta. Justamente porque o usuário não encontrou uma resposta nas primeiras pesquisas no modelo booleano, os tempos de resposta médios foram de 49 minutos, contra 0,6 segundos do novo modelo. Conclui-se, dessa forma, que o usuário não precisará despender muito tempo para encontrar a informação ou não precisará procurar em diferentes bases de dados a fim de encontrar a informação necessária.
Identifer | oai:union.ndltd.org:IBICT/oai:repositorio.ufsc.br:123456789/95550 |
Date | 26 October 2012 |
Creators | Andrade, Rafael |
Contributors | Universidade Federal de Santa Catarina, Wangenheim, Aldo von, Dantas, Mário |
Source Sets | IBICT Brazilian ETDs |
Language | Portuguese |
Detected Language | Portuguese |
Type | info:eu-repo/semantics/publishedVersion, info:eu-repo/semantics/doctoralThesis |
Format | 180 p.| il., grafs., tabs. |
Source | reponame:Repositório Institucional da UFSC, instname:Universidade Federal de Santa Catarina, instacron:UFSC |
Rights | info:eu-repo/semantics/openAccess |
Page generated in 0.0022 seconds