Spelling suggestions: "subject:"integração dde dados biológicos"" "subject:"integração dee dados biológicos""
1 |
Análise metadimensional em inferência de redes gênicas e priorizaçãoMarchi, Carlos Eduardo January 2017 (has links)
Orientador: Prof. Dr. David Corrêa Martins Júnior / Dissertação (mestrado) - Universidade Federal do ABC, Programa de Pós-Graduação em Ciência da Computação, 2017.
|
2 |
Desenvolvimento de uma plataforma de bioinformática integrada aplicada a identificação molecular de microrganismos patogênicosSarmento, Felipe José de Queiroz 27 February 2013 (has links)
Submitted by Leonardo Cavalcante (leo.ocavalcante@gmail.com) on 2018-07-17T18:21:26Z
No. of bitstreams: 1
Arquivototal.pdf: 16322215 bytes, checksum: c172a5636f12cf8195f2382f1c23de59 (MD5) / Made available in DSpace on 2018-07-17T18:21:26Z (GMT). No. of bitstreams: 1
Arquivototal.pdf: 16322215 bytes, checksum: c172a5636f12cf8195f2382f1c23de59 (MD5)
Previous issue date: 2013-02-27 / Conselho Nacional de Pesquisa e Desenvolvimento Científico e Tecnológico - CNPq / Various researches in molecular epidemiology, molecular diagnosis and evolutionary genetics related
to pathogens are compared to managing large amounts of data derived from institutions
such as, hospitals or laboratories. Although there already are some proposals to connect molecular
information to the diagnosis of pathogens, none of them uses high performance bioinformatics
tools which are embedded in a system and linked to a patient’s electronic record. The MolEpi
tool has been developed as a system of data and information management addressed to public
health, incorporating clinical and epidemiological information about patients, as well as molecular
data of 16S rRNA sequences of pathogenic bacteria. In order to confirm which species of these
bacteria were identified, biological samples (urine, secretions and purulent wounds, tracheal aspirate
and blood) and subsequently incubation and growth of colonies in culture, and PCR was
used followed by sequencing and analysis of the conserved coding region for 16S ribosomal RNA
(rDNA). Such strategy enabled fast bacterial identification, regardless of prior knowledge of the
species of microorganism under study. Moreover MolEpi is a system interconnected to repositories
of specific sequences as Genbank (NCBI), RDP-II (Ribosomal Database Project - MSU) and
GreenGene (LBL). In this way, once the sequences of clinical isolates are confirmed and validated,
they can be used as reference in the identification of other unknown microorganisms. Thus, a
local database was established, representing the profile of pathogens found in the hospital unity
of study and which should be object of public health surveillance. In order to develop MolEpi,
we used the Java programming language and the PostgreSQL8.3 object-relational database. It
was also developed BACSearch, which has the following programs to handle the analysis of 16S
rDNA sequences, we used the framework BioJava; to multiple alignment, ClustalW2, MAFFT and
MUSCLE, and for editing of multiple alignment and phylogenetic analysis, the JalView2.4.0 was
used. The system was validated with 200 clinical specimens isolated and identified from sites of
nosocomial infection. The DNA sequences produced from these samples were subjected to BLAST
by using the developed tool, which identified Pseudomonas aeruginosa, Acinetobacter baumannii,
Klebsiella pneumoniae and Morganella morganii as the main pathogens involved. Data on resistance
patterns of the species were obtained in microbiology laboratory, and incorporated into the
database. The application of MolEpi tool to the Health System can provide prompt and accurate
diagnosis, connected to relevant network information which can be intended for health professionals. / A maioria das pesquisas em epidemiologia molecular, diagnóstico molecular e genética evolutiva
são confrontadas com o gerenciamento de grandes volumes de dados. Além disso, os dados utilizados
em estudos de doenças patogênicas são complexos e geralmente derivam de instituições
tais como hospitais ou laboratórios. Embora já existam propostas que conecte informações moleculares
ao diagnóstico de patogenias, nenhuma delas utilizam ferramentas de bioinformática de
alto desempenho incorporadas a um sistema e vinculada a um prontuário eletrônico do paciente.
MolEpi foi desenvolvido como um sistema de gerenciamento de dados e informações dimensionado
a saúde pública, incorporando informações clínicas e epidemiológicas sobre pacientes e dados
moleculares de sequências do gene rRNA 16S de bactérias patogênicas. Para identificação destas
bactérias foram utilizadas amostras biológicas (urina, secreções e purulentas de feridas, aspirado
traqueal e sangue) e PCR seguida de sequenciamento e análise da região conservada codificadora
de RNA ribossômico (rDNA) 16S. Este estratégia permite uma identificação bacteriana rápida,
independente de conhecimento prévio da espécie de microrganismo em estudo. O MolEpi é um sistema
facilmente atualizável com as sequências específicas de bancos como Genbank(NCBI), RDP-II
(Ribosomal Database Project - MSU) e GreenGene (LBL). A partir da confirmação e validação
das sequências dos isolados clínicos, estas podem ser utilizadas como referência na identificação
de outros microrganismos desconhecidos. Neste sentido, foi estabelecido um banco de dados local,
representativo do perfil de patógenos encontrados na unidade hospitalar de estudo e objeto
de vigilância epidemiológica. Para o desenvolvimento do MolEpi, utilizamos a linguagem Java e
banco de dados PostgreSQL8.3. Foi desenvolvido também o BACSearch, que possui os seguintes
programas: para o processamento de sequências de rDNA 16S utilizamos os frameworks BioJava;
para alinhamento múltiplo foi implementado o ClustalW2, MAFFT e o MUSCLE e para edição do
alinhamento múltiplo e análise filogenética foi utilizado JalView R⃝2.4.0b2. O sistema foi validado
com 200 espécimes clínicos identificadas e isoladas de sítios de infecção hospitalar. As sequências
de DNA produzidas a partir destas amostras foram submetidas ao BLAST, utilizando a ferramenta
desenvolvida, identificando Pseudomonas aeruginosa, Acinetobacter baumannii, Klebsiela
pneumonie e Staphylococcus aureus como os principais patógenos correspondentes. Os dados sobre
o padrão de resistência das espécies foram obtidos em laboratório de microbiologia e incorporados
ao banco de dados. A aplicação do MolEpi ao Sistema Único de Saúde poderá fornecer diagnósticos
mais rápidos, precisos, e interligados a uma rede de informações relevantes para o profissional de
saúde.
|
3 |
MIDB : um modelo de integração de dados biológicosPerlin, Caroline Beatriz 29 February 2012 (has links)
Made available in DSpace on 2016-06-02T19:05:56Z (GMT). No. of bitstreams: 1
4370.pdf: 1089392 bytes, checksum: 82daa0e51d37184f8864bd92d9342dde (MD5)
Previous issue date: 2012-02-29 / In bioinformatics, there is a huge volume of data related to biomolecules and to nucleotide and amino acid sequences that reside (in almost their totality) in several Biological Data Bases (BDBs). For a specific sequence, there are some informational classifications: genomic data, evolution-data, structural data, and others. Some BDBs store just one or some of these classifications. Those BDBs are hosted in different sites and servers, with several data base management systems with different data models. Besides, instances and schema might have semantic heterogeneity. In such scenario, the objective of this project is to propose a biological data integration model, that adopts new schema integration and instance integration techniques. The proposed integration model has a special mechanism of schema integration and another mechanism that performs the instance integration (with support of a dictionary) allowing conflict resolution in the attribute values; and a Clustering Algorithm is used in order to cluster similar entities. Besides, a domain specialist participates managing those clusters. The proposed model was validated through a study case focusing on schema and instance integration about nucleotide sequence data from organisms of Actinomyces gender, captured from four different data sources. The result is that about 97.91% of the attributes were correctly categorized in the schema integration, and the instance integration was able to identify that about 50% of the clusters created need support from a specialist, avoiding errors on the instance resolution. Besides, some contributions are presented, as the Attributes Categorization, the Clustering Algorithm, the distance functions proposed and the proposed model itself. / Na bioinformática, existe um imenso volume de dados sendo produzidos, os quais estão relacionados a sequências de nucleotídeos e aminoácidos que se encontram, em quase a sua totalidade, armazenados em Bancos de Dados Biológicos (BDBs). Para uma determinada sequência existem algumas classificações de informação: dados genômicos, dados evolutivos, dados estruturais, dentre outros. Existem BDBs que armazenam somente uma ou algumas dessas classificações. Tais BDBs estão hospedados em diferentes sites e servidores, com sistemas gerenciadores de banco de dados distintos e com uso de diferentes modelos de dados, além de terem instâncias e esquemas com heterogeneidade semântica. Dentro desse contexto, o objetivo deste projeto de mestrado é propor um Modelo de Integração de Dados Biológicos, com novas técnicas de integração de esquemas e integração de instâncias. O modelo de integração proposto possui um mecanismo especial de integração de esquemas, e outro mecanismo que realiza a integração de instâncias de dados (com um dicionário acoplado) permitindo resolução de conflitos nos valores dos atributos; e um Algoritmo de Clusterização é utilizado, com o objetivo de realizar o agrupamento de entidades similares. Além disso, o especialista de domínio participa do gerenciamento desses agrupamentos. Esse modelo foi validado por meio de um estudo de caso com ênfase na integração de esquemas e integração de instâncias com dados de sequências de nucleotídeos de genes de organismos do gênero Actinomyces, provenientes de quatro diferentes fontes de dados. Como resultado, obteve-se que aproximadamente 97,91% dos atributos foram categorizados corretamente na integração de esquemas e a integração de instâncias conseguiu identificar que aproximadamente 50% dos clusters gerados precisam de tratamento do especialista, evitando erros de resolução de entidades. Além disso, algumas contribuições são apresentadas, como por exemplo a Categorização de Atributos, o Algoritmo de Clusterização, as funções de distância propostas e o modelo MIDB em si.
|
Page generated in 0.0999 seconds