Return to search

Recuperação da informação de textos livres não estruturados em prontuários eletrônicos de otorrinolaringologia

Orientador: Prof. Dr. Rogério Hamerschmidt / Tese (doutorado) - Universidade Federal do Paraná, Setor de Ciências da Saúde, Programa de Pós-Graduação em Clínica Cirúrgica. Defesa: Curitiba, 08/12/2017 / Inclui referências : f.63-71 / Resumo: Introdução: O uso de prontuários eletrônicos na prática médica é uma realidade e os textos livres não estruturadas, contêm uma grande quantidade de dados que podem ser utilizados para a formação de conhecimento. Utilizar técnicas de recuperação da informação, contribui para a descoberta dos termos mais utilizados e para compará-los a protocolos existentes. O preenchimento automatizado de coleta pode auxiliar o aumento das amostras em pesquisas. Objetivos: Extrair palavras, de textos livres não estruturados, em prontuário eletrônico e comparar sua frequência com um protocolo já existente de termos, das doenças de maior prevalência, em uma base de dados. Criar uma interface de ligação para o preenchimento automático dos sintomas e doenças, entre o Sistema CLINIC? e o Sistema SINPE©. Material e Métodos: O estudo foi realizado com base em um big data, de 375.095 prontuários eletrônicos. Destes, foram selecionados os que possuíam CID e campo histórico preenchido, com no mínimo cinco caracteres e excluídos os pós-operatórios e reconsultas inferiores a 30 dias. Do resultado, foram analisados os CID's mais prevalentes e analisados os textos livres não estruturados, com a ferramenta word cloud e, após, comparados com termos do sistema de protocolos. Foi elaborada uma interface, entre o sistema de prontuários e o Sistema SINPE©, visando uma coleta de dados automatizada. Resultados: Foram analisados 125.973 prontuários, contendo textos livres não estruturados. A amostra apresentou 57,24% de pacientes do sexo feminino e 42,76% do sexo masculino, com idade média de 38,53 anos. Os 19 CID's de maior prevalência representaram 70,11% dos casos. Foram desenvolvidas word cloud's para os textos livres, nas doenças de maior prevalência. Compararam-se as palavras inseridas no prontuário eletrônico, com os termos do protocolo de otorrinolaringologia, do Sistema SINPE© sendo identificadas as palavras mais frequentes, nas doenças de maior prevalência e construídos intervalos de confiança (IC=95%). A interface desenvolvida, mostrou ser capaz de identificar, nos textos livres, os termos do protocolo e automatizar a coleta de dados. Conclusões: Foram extraídas, de textos livres não estruturados, as palavras de maior frequência, e comparadas com um protocolo de termos já existente, nas doenças de maior prevalência. Foi desenvolvida uma interface entre os sistemas CLINIC? e SINPE©, capaz de preencher de forma automática os itens do protocolo mestre, tanto em sintomas como em diagnósticos. Palavras-chave: Registros Eletrônicos de Saúde; Protocolos; Otorrinolaringologia. / Abstract: Introduction: The use of electronic medical records in medical practice is a reality and free unstructured text contains a large amount of information, which may be used to establish knowledge. Using information retrieval techniques contributes for the discovery of the most used terms and the comparison of such terms to existing protocols. Automated data collection may help in increasing samples in research. Objectives: Extract words from free unstructured text out of electronic medical records and compare their frequency to an existing protocol of terms for the most prevalent diseases from a database. Create a connecting interface for the automatic filling in of symptoms and diseases between the CLINIC? and the SINPE© systems. Material and Methods: The study was performed based on a big data made up of 375,095 electronic medical records. Out of these, those which contained the ICD and medical history fields filled in and which had at least five characters were selected, and post-ops and return visits within less than thirty days were excluded. From the results, the most prevalent ICDs and free unstructured text were analyzed with the word cloud tool, and later compared to the terms in the protocol system. An interface was created between the SINPE© system and the medical records system, aiming at automated data collection. Results: 125,973 medical records were analyzed which had free unstructured text. The sample was made up of 57.24% of female patients and 42.76% male patients, with an average age of 38.53 years old. The 19 most prevalent ICDs represented 70.11% of cases. Word clouds were developed for the free text in the most prevalent diseases. The words inserted in the electronic medical records were compared to the terms in the otolaryngology protocol in the SINPE© system. The most frequent words were identified in the most prevalent diseases and confidence intervals were built (CI 95%). The interface developed was able to identify the terms of the protocol in free text and automate the data collection. Conclusions: The most frequent words were extracted from free unstructured text and compared to an existing protocol of terms for the most prevalent diseases. An interface between the CLINIC? and the SINPE© systems was developed which is able to automatically fill in the items of the master protocol, relative to both symptoms and diagnosis. Keywords: Electronic Heatlh Records; Protocols; Otorhinolaryngology.

Identiferoai:union.ndltd.org:IBICT/oai:dspace.c3sl.ufpr.br:1884/52809
Date January 2017
CreatorsBeltrão, Claudio Jose
ContributorsUniversidade Federal do Paraná. Setor de Ciências da Saúde. Programa de Pós-Graduação em Clínica Cirúrgica, Hamerschmidt, Rogério
Source SetsIBICT Brazilian ETDs
LanguagePortuguese
Detected LanguageEnglish
Typeinfo:eu-repo/semantics/publishedVersion, info:eu-repo/semantics/doctoralThesis
Format99 f. : il. algumas color., grafs., tabs., application/pdf
Sourcereponame:Repositório Institucional da UFPR, instname:Universidade Federal do Paraná, instacron:UFPR
Rightsinfo:eu-repo/semantics/openAccess
RelationDisponível em formato digital

Page generated in 0.0028 seconds