Return to search

Descrição da proveniência de dados para extração de conhecimento em sistemas de informação de hemoterapia / Provenance Description to Extract Knowledge from Hemotherapy Information Systems

O Hemocentro São Paulo é responsável por manter um banco de dados com informações sobre cada doação ou tentativa de doação de sangue. No entanto, os dados desse banco de dados não possuem a qualidade requerida pelas ferramentas/técnicas de análise. Por essa razão, fica difícil utilizar tais dados para estabelecer relações sistemáticas entre as variáveis armazenadas. A principal contribuição desta tese é a descrição da proveniência para atributos selecionados usando critérios de classificação definidos por especialistas. Este trabalho mostra que é possível fazer investigações detalhadas usando a descrição dos dados sem a necessidade de alterar a estrutura do banco de dados. Durante o período de 1996 a 2006, 1.469.505 doadores foram responsáveis por mais de 2.8 milhões de doações. Após a descrição da proveniência, foram obtidos 252.301 doadores do sexo masculino e 133.056 doadores do sexo feminino e que atenderam aos critérios de inclusão usados nesta tese. Dos 385.357 doadores incluídos na análise, 21.954 (5,7%) tiveram suas doações adiadas devido a seus baixos níveis de hematócrito, 3.850 (1,5%) eram do sexo masculino e 18.104 (13,6%) do sexo feminino. Os resultados obtidos demonstram que, embora os intervalos de espera entre as doações de sangue sejam grandes entre os doadores do sexo feminino e masculino, as mulheres são recusadas mais cedo, por risco de desenvolver anemia, do que os homens. Aproximadamente 12,84% das mulheres e 1,21% dos homens desenvolveriam hematócrito baixo antes da sétima doação. Os dados sugerem que indivíduos com baixo nível de hematócrito devem esperar mais tempo antes de executarem a próxima doação. Portanto, é importante compreender se existe uma ligação entre a doação de sangue e a diminuição no nível de hematócrito, a fim de evitar resultados indesejáveis para os doadores de sangue. O modelo de proveniência apresentado nesta tese não foi definido de acordo com os modelos de proveniência genéricos já implementados. Esta tese apresenta um modelo de proveniência que foi capaz de acrescentar informações semânticas para adquirir conhecimento de um experimento in silico. Um dos principais objetivos foi desenvolver uma abordagem baseada em declarações, tentando responder a importantes questionamentos biológicos. O modelo descrito combina ricas informações em cada processo usando declarações, e se baseia no conhecimento de especialistas. Esta tese também utilizou estatística descritiva e Análise de Sobrevivência. Finalmente, com a validação do modelo em um domínio conhecido, é pretendido expandir esse método para outros sistemas de informação voltados para hemoterapia. / The São Paulo Blood Center is responsible to maintain a database with information on each donation. However, this database does not have the quality required by techniques of analysis. For this reason, it is difficult to use it directly to establish systematic relationships between the variables. The main contribution of this paper is a provenance description of attributes selected using classification criteria defined by specialists. We show that it is possible to make detailed investigations using the data description without the need to change the structure of the database. During 1996 2006, 1,469,505 donors were responsible for more than 2.8 million of donation. After the provenance description, we obtained 252,301 male and 133,056 female that met our inclusion criteria. Of the 385,357 donors included in the analysis, 21,954(5.7%) were deferred due to low hematocrit, 3,850(1.5%) were males and 18,104(13.6%) were females. Our results show that, although the intervals between donations for female and male donors are wider, women presented anemia earlier than men. Approximately 12,84% of the females and 1,21% of the males would develop low hematocrit before the 7th donation. Our data suggest that individuals with low hematocrit level should wait longer before the next donation. Therefore, it is important to understand if there is a connection between blood donation and decrease in hematocrit level in order to prevent undesirable outcomes to blood donors. The provenance model presented here was not defined according to the generic provenance models already implemented. This thesis presents a provenance model that is able to add semantic information to acquire knowledge of an in silico experiment. One of the main purposes is to develop an approach based on declarations in order to answer biological questions. The provenance model described in this paper combines rich information for each process using the declarations, each having expert knowledge as a basis. To evaluate this provenance model we use descriptive statistics and Survival Analysis. Finally, with the validation of the model in a known domain, we intent to apply and validate this provenance model to other hemotherapy information systems.

Identiferoai:union.ndltd.org:usp.br/oai:teses.usp.br:tde-04092012-134137
Date23 May 2012
CreatorsAlmeida, Fernanda Nascimento
ContributorsFerreira, João Eduardo, Sabino, Ester Cerdeira
PublisherBiblioteca Digitais de Teses e Dissertações da USP
Source SetsUniversidade de São Paulo
LanguagePortuguese
Detected LanguagePortuguese
TypeTese de Doutorado
Formatapplication/pdf
RightsLiberar o conteúdo para acesso público.

Page generated in 0.0571 seconds