61 |
Análise computacional de metagenomas: evidências de um resistoma marinhoAndrade, Bruno Gabriel Nascimento January 2012 (has links)
Submitted by Priscila Nascimento (pnascimento@icict.fiocruz.br) on 2013-03-22T18:57:42Z
No. of bitstreams: 1
Bruno_Gabriel_N_Andrade.pdf: 1653673 bytes, checksum: 187a641b69c50d36212eb943747940e5 (MD5) / Made available in DSpace on 2013-03-22T18:57:42Z (GMT). No. of bitstreams: 1
Bruno_Gabriel_N_Andrade.pdf: 1653673 bytes, checksum: 187a641b69c50d36212eb943747940e5 (MD5)
Previous issue date: 2012 / Fundação Oswaldo Cruz. Instituto Oswaldo Cruz. Rio de Janeiro, RJ, Brasil. / As Metallo-β-Lactamases (Mβls) são uma família de enzimas cuja importância clínica reside
na sua capacidade de hidrolisar praticamente todos os antibióticos da classe dos β-Lactâmicos,
incluindo as carbapenemas, que são os compostos mais poderosos utilizados atualmente, a única
exceção são os monobactâmicos. Estas enzimas são classificadas em três subclasses, B1, B2 e B3,
com base nas suas identidades em nível de sequência e perfil de atividade. As enzimas das
subclasses B1 e B3, caracterizam-se por ter amplo espectro de ação enquanto que, as da subclasse
B2, são carbapenemases estritas. O conjunto de genes associados à resistência das bactérias aos
antimicrobianos, presentes em um determinado ambiente, é conhecido como “Resistoma”.
Evidências caracterizam a microbiota de ambientes naturais como fonte e/ou reservatório destes
genes e o resistoma ambiental como reservatório original das Mβls. Nosso estudo tem como
objetivo buscar em projetos de metagenomas marinhos públicos evidências da existência de um
resistoma neste bioma. Buscamos, in silico, por Mβls putativas similares àquelas encontradas em
bactérias presentes em ambientes clínicos. Os projetos de metagenomas marinhos públicos foram
obtidos no banco de armazenamento do Cyberinfrastructure for Advanced Microbial Research
(CAMERA), buscas por Metallo-β-Lactamases foram feitas com o software HMMer V3,
empregando um limiar de similaridade baseado em um e-value de 10-20, utilizando os alelos de
Metallo-β-Lactamases conhecidos para a construção de perfis HMM, empregados como sondas.
Para determinar a relação com as Metallo-β-Lactamases clínicas, uma segunda busca foi feita com
os resultados do HMMer contra o banco de dados de proteínas não redundantes (NR) utilizando o
programa Blastp do pacote Blast+. Motivos conservados característicos das Mβls foram
identificados visualmente para a eliminação de falsos positivos, análises filogenéticas foram feitas
utilizando o programa MEGA v5. Identificamos, em sítios de vários oceanos e mares, sequências
apresentando Mβls putativas, apresentando similaridade de sequência estatisticamente relevante
com Mβls clínicas, como: VIM, CFIA, BLAB, SPM, CPHA, GOB, L1, FEZ1 e CAU-1. Algumas
destas Mβls putativas apresentaram identidade de sequência com suas similares clínicas, as Mβls
VIM e SPM. Nossa análise mostrou que a Mβl GOB apresenta uma grande abundância e dispersão.
Assim, apresentamos as primeiras evidências da existência de um resistoma marinho, caracterizado
pela presença de sequências das três subclasses de Mβls e com ampla distribuição pelo meio
marinho. / The Metallo-β-lactamases (Mβls) are a family of enzymes with high impact in the clinic due
to their ability to hydrolyze virtually all antibiotics belonging to the β-lactams group, excluding the
monobactams. These enzymes are classified into three subclasses, B1, B2 and B3, based on their
sequence similarity and the activity profile. The enzymes from subclass B1 and B3 present a broad
spectrum of activity and the subclass B2 are strict carbapenemases. The set of genes associated with
bacteria antimicrobial resistance present in an environment is known as “Resistome”. Studies have
presented evidences characterizing the microbiota of natural environments as the source and/or
reservoir of resistance genes and the environmental resistome as the original reservoir of Mβls. Our
study aims to search publicly available marine metagenome projects for evidences of a marine
resistome. We performed an in silico analysis to reveal putative Mβls that are similar to those found
in the clinical setting. The marine metagenomic were downloaded from the Cyberinfrastructure for
Advanced Microbial Research (CAMERA), and screened for Metallo-β-lactamases with the
HMMer V3 software, with similarity threshold of an e-value of 10-20, using the known Metallo-β-
lactamases alleles to build HMM profiles, and used them as queries. In order to determine the
relationship between these two groups, the results were queried against the NCBI non-redundant
protein database using the Blastp software with the same e-value cutoff. The Mβl motifs were
visually identified to eliminate false positives, and phylogenetic analysis were made using the
MEGA v5 software. Putative sequences showing identity with clinical Mβls, such as: VIM, CFIA,
BLAB, SPM, CPHA, GOB, L1, FEZ1 and CAU-1 were found in samples from distinct oceans. Our
analysis showed that the Mβl GOB is variable and dispersed in various sites of the oceans. Thus, we
could map and bring evidences of the marine resistome based on the presence of the three
subclasses of Mβls distributed in the ocean.
|
62 |
Bioinformática aplicada em RNomics: estratégias computacionais para caracterização de RNAs não-codificadores / Bioinformatics in RNomics: Computational characterization of non-coding RNAsPaschoal, Alexandre Rossi 13 April 2012 (has links)
A visao sobre o dogma central da biologia molecular passou por aperfeicoamentos na virada deste seculo. Muito se deve ao interesse por pesquisas feitas para compreensao do que ate entao eram regioes do genoma conhecidas como DNA Lixo. Neste contexto, projetos de transcriptoma, avancos em tecnologias de sequenciamento, bem como analises em bioinformatica, contribuiram para elucidar o que estava sendo transcrito. Tais regioes foram denominadas como RNAs nao-codificadores ou non-coding RNA (ncRNA) que eram transcritas, mas nao traduzidas em proteinas. Apesar da quantidade de metodos para o estudo in silico dos ncRNAs, existem lacunas a serem preenchidas nas pesquisas desta molecula, tais como: metodos de anotacao em geral, caracterizacao de novas classes e mecanismos alternativos de busca por similaridade de sequencia primaria. Alem disso, nao se havia uma ferramenta que reunisse num unico local as informacoes dos bancos de dados publicos de ncRNA disponiveis. Neste trabalho, buscou-se preencher tais lacunas, contribuindo para o desenvolvimento de metodos computacionais nas pesquisas em ncRNAs. Foram utilizados os genomas de Hymenoptera e Diptera como sistema biologico para aplicar e testar os metodos desenvolvidos. / The classical vision of the central dogma of molecular biology was not changes dramatic until the end of the 20th century. At this time the scientific communities were interesting to understand what have in the regions of the genome known as \"Junk DNA\". Transcriptome projects together with sequencing Technologies anda bioinformatics analysis help to elucidate that this transcripts were regions that do not coding proteins and maybe has function. These transcripts are called non-coding RNA (ncRNA). Although there are a lot of computational approaches to the in silico research of ncRNA, there is a gap of research about this molecule such: approaches to the general annotation of ncRNA; identification of new classes of ncRNA; and alternatives search mechanisms of ncRNA. Besides that, there are not any central repository of public non-coding RNA databases that could help search for the information about it. In this report, we fill this gap. We tried to contributing to the development of computational methods in research on ncRNAs. We also used the Hymenoptera and Diptera genomes as a biological system to apply and test our developed approaches.
|
63 |
Desenvolvimento de um algoritmo para identificação e caracterização de cavidades em regiões específicas de estruturas tridimensionais de proteínas / Development of an algorithm to identify and characterize cavities in specific regions of three-dimensional structures of proteins.Oliveira, Saulo Henrique Pires de 25 May 2011 (has links)
A identificação e caracterização geométrica e físico-química de espaços vazios na estrutura tridimensional de proteínas é capaz de agregar informações importantes para guiar o desenho racional de drogas e a caracterização funcional de sítios de ligação e sítios catalíticos. Dessa forma, algumas ferramentas computacionais foram desenvolvidas nas últimas duas décadas, visando efetuar essas caracterizações. Contudo, as ferramentas existentes lidam com uma série de limitações, dais quais merecem destaque a falta de precisão, falta de capacidade de integração em protocolos de larga escala, falta de capacidade de customização e a falta de uma caracterização eletrostática . Tendo em mente estas limitações, desenvolvemos uma nova ferramenta, denominada KV-Finder, com o objetivo de estender as funcionalidades dos programas existentes, fornecendo assim uma caracterização sistemática mais eficiente e mais informativa dos espaços vazios da estrutura tridimensional de proteínas. Através de uma modelagem matricial baseada em um direcionamento realizado pelo usuário, nossa ferramenta identifica e caracteriza espaços vazios em topologias proteicas. O utilitário é capaz de quantificar o volume, a forma, a extensão de sua superfície, os resíduos proteicos que interagem com os espaços vazios e um mapa de cargas parciais da superfície encontrada. Nossa rotina foi integrada com ferramentas gráficas de modelagem molecular, fornecendo uma interação fácil e eficiente com o usuário. A validação de nosso algoritmo foi realizada em um conjunto de proteínas cujos diversos tipos de espaços vazios englobam os mais variados sítios de ligação e sítios catalíticos. O cálculo do volume de cavidades enzimáticas foi efetuado em larga escala, acompanhando a evolução do tamanho de bolsões na superfamília ALDH. Com relação aos outros softwares existentes, nossa ferramenta apresenta uma série de vantagens das quais merecem destaque menor tempo de execução, maior precisão, maior acessibilidade e facilidade de integração com outros programas, além das características únicas de permitir que a busca ocorra em regiões específicas dentro da proteína e de realizar um mapeamento parcial de cargas da superfície encontrada. / The identification and characterization of geometrical and physical-chemical properties in protein vacant spaces aggregates important information for steering rational drug designing and functional characterization of binding and catalytic sites. Therefore, several softwares have been develop during the past two decades in order to perform such characterization. Nevertheless, the existing tools still present a series of limitations such as lack of precision, lack of integrability in large scale protocols, lack of customization capacity and the lack of a proper electrostatic depiction. We developed a new software, dubbed KV-Finder, in order to complement and extend the functionality of existing softwares, providing a systematic and more descriptive portrayal of protein vacant spaces. By employing a user-driven matrix modeling, our tool identifies and characterizes empty spaces in all sorts of protein topologies. The software quantifies the volume, the area and the shape of the surface, the residues that interact with the vacant spaces and a partial charge map of the computed surface. Our routine was integrated with a graphical molecular modeling software, providing the user with a simple and easy-to-use interface. KV-Finder has been validated with a distinct set of proteins and binding sites. The volume computation was carried in large scale, accompanying the evolution of the pocket volume in the ALDH superfamily. Compared with existing software, KV-Finder presents greater precision, greater accessibility and ease of integration in large scale protocols and visualization softwares. Also, the software possesses unique and innovative features such as the ability to segment and subsegment the empty spaces, a electrostatic depiction and a ligand interaction highlight feature.
|
64 |
Bioinformatics applied to natural products discovery processes: systematization, biosynthetic evidences, and isolation of promising speciesZANIN, João Luiz Baldim 06 May 2016 (has links)
Estratégias guiadas por genoma foram utilizadas a fim de examinar o potencial biossintético de microorganismos da classe Betaproteobacteria no âmbito de Produtos Naturais. Uma estratégia capaz de ser expandida para todos os tipos de microorganismos foi criada para estimar as reações enzimáticas das Peptideo Sintetases Não Ribossomais a fim de sistematizar a e analisar suas similaridades biossintéticas. Todas as bases de dados e software user-friendly foram adotadas a fim de tornar esta estratégia simples e mais abrangente. Elas foram NCBI, KEGG, NORINE, antiSMASH, Cystoscape, Gitools, MEGA e Clustal. Os resultados tornaram possível a criação de uma stratégia, chamada XPAIRT (eXPAndable Identification of amino acids in nonRibosomal peptides Tendencies) correlacionando pares de peptídeos e seus genomas similares via Jaccard Index e filogenia. Neste contexto, espécies Betaproteobacteria mostraram sintetizar produtos naturais seguindo certa similaridade biossintética na montagem de monômeros para a construção do esqueleto peptídico. Subunidades estruturais tais como asp.ser e orn.ser foram amplamente encontradas. Essas similaridades foram correlacionados gerando índice de similaridade entre espécies e sua distribuição entre genomas semelhantes, que foram nomeados como contribuíntes. Quanto maior a identidade genômica de um cluster de gene biossintético para um produto natural de forma geral, maior a chance de um contribuínte expressar pares similares relativos ao cluster em questão. A partir de análises de contagem de clusteres de genes biossintéticos, pôde-se eleger microorganismos promissores para isolamento de amostras ambientais. Essas análises mostraram que espécies do gênero Burkholderia são as mais promissoras quando comparadas a todos os genomas disponíveis da subclasse Betaproteobacteria. Análises genômicas da espécie padrão do gênero, Burkholderia thailandensis mostraram que cromossomos 1 e 2, em comparação a uma cepa produtora de antibióticos padrão, S. coelicolor, não apresentarem mesmas informações para biossíntese de compostos, mas apresentam similaridades de classes, sendo elas, Terpenos, T1PKS, Bacteriocinas e Peptídeos Não Ribossomais. Todos os resultados não tiveram correlações com os clusteres de S. coelicolor evidenciando que B. thailandensis apresenta-se promissora para a descoberta de novos compostos. Como espécies do gênero Burkholderia foram o principal alvo neste trabalho, um método guiado por genoma foi desenvolvido para isolar tanto quanto possível cepas de amostras ambientais. O método levou em consideração as necessidades básicas de um microorganismo para sobreviver: a) o tipo de microbioma que os microorganismos de interesse se encontram, analizados através de resultados de metagenômica, b) resistência à antibióticos e metais, c) capacidade de metabolizar compostos com papel biológico, d) crescimento celular e nutrientes, e e) variações de pH e crescimento celular. Todas as análises foram cruzadas e os melhores candidatos à composição de meios de culturas celular específicos para o isolamento de microorganismos do gênero Burkholderia foram selecionados. A estratégia foi bem-sucedida para diversos tipos de amostras. Estes experimentos excepcionais demonstraram a eficácia na resolução de problemas químico-biológicos auxiliando a análise posterior de novos produtos naturais. / Genome-guided strategies were applied to examine Betaproteobacteria species potential for the biosynthesis of nonribosomal peptides. A generalizable strategy was created to track similarities in enzymatic reactions of nonribosomal peptides synthetases in order to organize their capability of assembling monomers building the peptides backbones. Databases and user-friendly software were adopted making this strategy a comprehensive one. Databases and software adopted, as well as, NCBI, KEGG, NORINE, antiSMASH, Cystoscape, Gitools, MEGA e Clustal were used for this purpose. Betaproteobacteria species showed to possess biosynthetic similarities in assembling monomers for the peptide backbone of a nonribosomal peptide. These evidences were correlated giving similarities indexes between species and their distribution between similar genomes. Predictions were fragmented in several ways, for example, monomers, pairs and triads. Correlation analyses displayed that pairs it is the best way of tracking similarities. This result turned possible to create a strategy, named XPAIRT (eXPAndable Identification of amino acids in nonRibosomal peptides Tendencies) correlating pairs of peptides and their similar genomes via Jaccard Index and phylogeny. Thought these investigations it was noticed that Betaproteobacteria species generally assemble asp.orn and orn.ser, mainly Burkholderia species, among other pairs of peptides. Further analysis showed that species from the genera Burkholderia are the most promising ones due to their Biosynthetic Gene Cluster counting for all available Betaproteobacteria genomes. These species were further analyzed and a standard strain, Burkholderia thailandensis, was used to the identification of intraspecific variation for their biosynthetic potential. A specific study on Biosynthetic Gene Cluster variation was proceeded for discovering disparities between chromosomes 1 and 2, and a standard antibiotic producer strain, S. coelicolor. Results showed that B. thailandensis have different possibilities for biosynthesizing natural products. Even thought, common classes of compounds such as, Terpenes, Bacteriocins, T1PKS and Nonribosomal Peptides were identified for all strains. As Burkholderia species were the main target in this work, a genome-guided method was developed for isolating as much strains as possible from environmental samples. This very method took into account the basic needs for a microorganism to survive: a) the type of microbiome that microorganisms of interest coexist, analyzed through metagenomics, b) resistance to antibiotics and metals, c) ability to metabolize compounds with biological role, d) cell growth related to different nutrients, and e) cell growth under pH variations. The strategy was successful for diverse types of samples. These exceptional experiments are part of a novel way of working with Natural Products, using genomic, bioinformatics and visual statistical analysis in order to access common characteristics and uniqueness of species guiding the search of medically relevant natural products. / Coordenação de Aperfeiçoamento de Pessoal de Nível Superior - CAPES
|
65 |
Predição in silico de RNAs não codificantes na bactéria mycoplasma hyopneumoniae/ / In silico prediction of non-coding RNAS for the bacterium mycoplasma hyopneumoniaeGodinho, Caio Padoan de Sá 18 March 2014 (has links)
Made available in DSpace on 2015-03-04T18:57:58Z (GMT). No. of bitstreams: 1
dissertacao_caio_godinho_2014.pdf: 2200918 bytes, checksum: aa8817dd5a147c8a2d55413e1a796132 (MD5)
Previous issue date: 2014-03-18 / Mycoplasma hyopneumoniae 7448 e uma bactéria patogênica e parasita obrigatória do trato respiratório de suínos. A compreensão de seus mecanismos de regulação gênica é ainda incompleta e incapaz de explicar a dinâmica observada na expressão de seus genes. Diversos elementos podem exercer funções regulatórias da expressão gênica em bactérias, dentre eles os ncRNAs. Este trabalho reporta a identificação e classificaçãao de 48 regiões no genoma de M. hyopneumoniae 7448
suscetíveis a abrigarem novos genes de ncRNA. Para isso foram utilizadas técnicas de modelagem estocástica e diversas outras ferramentas computacionais. Duas importantes ferramentas foram desenvolvidas no decorrer desta dissertação, sendo uma para a inferência de conservação evolutiva em regiões intergênicas e a outra { denominada FraPS { uma melhoria na delimitação genômica dos candidatos a ncRNA. Os resultados corroboram com a hipótese da existência de ncRNAs como elementos reguladores da expressão gênica na bactéria estudada, exercendo
papeis fundamentais na sobrevivência e patogenicidade da mesma. Genes de adesinas, lipoproteínas, e do complexo de transporte ABC foram encontrados entre os possíveis genes-alvo a regulação via ncRNA, resultado que auxilia o planejamento de experimentos moleculares para o estudo da regulação por ncRNAs em micoplasmas.
|
66 |
P-MIA : padr?o m?ltiplas inst?ncias autoadapt?veis : um padr?o de dados para wokflows cient?ficosH?bler, Patr?cia Nogueira 10 December 2010 (has links)
Made available in DSpace on 2015-04-14T14:49:29Z (GMT). No. of bitstreams: 1
428502.pdf: 4574146 bytes, checksum: 0b828e3a78fb87024bcab2a9d14b3a60 (MD5)
Previous issue date: 2010-12-10 / A busca de solu??es informatizadas, com o objetivo de se obter agilidade e confiabilidade nas informa??es, faz com que profissionais de diferentes ?reas utilizem tecnologias com prop?sitos semelhantes. A utiliza??o de sistemas de gerenciamento de workflow ? um exemplo desse tipo de solu??o, a qual empresas e cientistas utilizam para documentar as etapas executadas e otimizar o tempo de execu??o. Esta Tese apresenta um padr?o capaz de manipular grandes volumes de dados e otimizar seu processamento, identificando grupos de dados promissores, como um componente de workflows cient?ficos. A ?rea de aplica??o ? a Bioinform?tica, uma ?rea multidisciplinar, que se utiliza de v?rias ferramentas computacionais para a realiza??o de seus experimentos, os quais podem demorar anos para serem finalizados. A solu??o proposta beneficia, dentro da Bioinform?tica, o desenho racional de f?rmacos. Assim, a contextualiza??o da ?rea de estudo ? realizada, e ? proposta uma solu??o para o problema por meio da defini??o de um padr?o de dados que permite a autoadapta??o de inst?ncias de workflow em execu??o. O P-MIA: Padr?o M?ltiplas Inst?ncias Autoadapt?veis, assim denominado por manipular um grande conjunto de dados e por, em tempo de execu??o, definir as a??es a serem executadas sobre os dados, ? formalizado com base nas defini??es de redes de Petri e sua representa??o gr?fica feita por meio de redes de Petri coloridas. Sobre o padr?o, s?o realizados testes experimentais, os quais comprovam que, com a utiliza??o do P-MIA, ? poss?vel reduzir a quantidade de experimentos, mantendo um crit?rio de qualidade aceit?vel.
|
67 |
Desenvolvimento de um filtro de descritores moleculares geom?tricos para gerar um ranqueamento em banco de dados de ligantesQuevedo, Christian Vahl 23 March 2011 (has links)
Made available in DSpace on 2015-04-14T14:49:40Z (GMT). No. of bitstreams: 1
435073.pdf: 3764608 bytes, checksum: 23d34083821e24bc00c6f737db4be5b8 (MD5)
Previous issue date: 2011-03-23 / Bancos de dados de ligantes de acesso p?blico oferecem atualmente mais de 20 milh?es ligantes para os usu?rios. Em contrapartida, a realiza??o de testes in silico com esse elevado volume de dados ? computacionalmente muito custoso, que vem demandar o desenvolvimento de novas solu??es para a redu??o do n?mero de ligantes a ser testado em seus receptores alvo. No entanto, ainda n?o h? m?todo para efetivamente reduzir esse n?mero elevado em um valor gerenci?vel, constituindo-se assim, um grande desafio do Planejamento Racional de F?rmacos. Este trabalho tem o objetivo de desenvolver uma fun??o heur?stica para realizar uma triagem virtual com ligantes dispon?veis, cuja inten??o ? selecionar os candidatos mais promissores. A fun??o desenvolvida ? baseada na geometria da cavidade do substrato do receptor, filtrando apenas os ligantes compat?veis com esta cavidade considerando as varia??es 3D do modelo totalmente flex?vel do receptor. Para testar a efic?cia da fun??o proposta foram feitas duas avalia??es utilizando como estudo de caso a enzima do Mycobacterium tuberculosis, a InhA. Os resultados obtidos deste filtro melhoraram o processo de triagem virtual, descartando a realiza??o dos testes de docagem molecular dos ligantes que n?o se encaixam na cavidade do substrato do receptor.
|
68 |
FReMI: a middleware to handle molecular docking simulations of fully-flexible receptor models in HPC environmentsDe Paris, Renata 12 April 2012 (has links)
Made available in DSpace on 2015-04-14T14:49:44Z (GMT). No. of bitstreams: 1
438211.pdf: 1765612 bytes, checksum: c7adb8a9601c78a38e044070d6b5568e (MD5)
Previous issue date: 2012-04-12 / Simula??es de docagem molecular de modelos de receptores totalmente flex?veis (Fully-Flexible Receptor - FFR) est?o se tornando cada vez mais frequentes. Entretanto, tais simula??es exigem alto n?vel de processamento e sua execu??o sequencial pode se tornar uma tarefa impratic?vel. Este trabalho apresenta um middleware, chamado Middleware de Receptores Flex?vel (Flexible Receptor Middleware FReMI), que auxilia a reduzir o tempo total de execu??o nas simula??es de docagem molecular de receptores totalmente flex?veis. FReMI manipula uma quantidade intensiva de dados e tarefas para executar a triagem virtual de modelos de receptores totalmente flex?veis, e prov? interoperabilidade entre o web workflow de docagem de receptores flex?veis (Web Fully-flexible Docking Workflow - W-FReDoW) e dois diferentes ambientes de alto desempenho (High Performance Computing HPC). FReMI utiliza protocolos de internet para comunicar com o W-FReDoW , o qual auxilia na redu??o da dimens?o do modelo FFR por meio de um padr?o de dados. Al?m disso, FReMI envia tarefas de simula??es de docagem para serem executadas em um cluster dedicado e tamb?m em um alternativo modelo de cluster virtual constru?do por meio de nuvens de computadores el?sticos da Amazon (Amazon s Elastic Compute Cloud EC2). Os resultados apresentam uma arquitetura conceitual do FReMI e dois conjuntos de experimentos a partir da execu??o do FReMI. O primeiro conjunto relatou os experimentos realizados com FReMI, usando uma amostra de snapshots a partir de um modelo FFR e os dois ambientes HPC. O segundo conjunto descreveu os experimentos, com um conjunto de dados completo, executando FReMI e W-FReDoW apenas em um ambiente de cluster MPI constru?do com as inst?ncias da Amazon EC2. Os resultados do ?ltimo conjunto de experimentos apresentaram uma redu??o na dimensionalidade do modelo FFR, transformando ele um modelo de receptor flex?vel totalmente reduzido (Reduced Fully-Flexible Receptor Model RFFR), por meio do descarte de conforma??es n?o promissoras identificadas pelo W-FReDoW. Al?m disso, a redu??o do tempo total de execu??o do FReMI com o W-FReDoW foi entre 10 a 30% a partir da execu??o separada do FReMI, e de aproximadamente 94% do FReMI a partir da sua respectiva execu??o sequencial. / Molecular docking simulations of Fully-Flexible Protein Receptor (FFR) models are coming of age. However, they are computer intensive and their sequential execution can became an unfeasible task. This study presents a middleware, called Flexible Receptor Middleware (FReMI), to assist in faster docking simulations of flexible receptors. FReMI handles intensive tasks and data of totally fully-flexible receptor models in virtual screening and, provides the interoperability between a Web Fully-flexible Docking Workflow (W-FReDoW) and two different High Performance Computing (HPC) environments. FReMI uses internet protocols to communicate with W-FReDoW which helps to reduce the FFR model dimension with a data pattern. Also it sends tasks of docking simulations to execute in a HPC of dedicated cluster and; an alternative model of virtual cluster built on Amazon s Elastic Compute Cloud (EC2). The results are the FReMI conceptual architecture and two sets of experiments from execution of the FReMI. The first set reports the experiments performed with FReMI using a sample of snapshots from a FFR model on both HPC environments. The second one describes the experiments, on the complete data set, performed with FReMI and W-FReDoW shared execution in a MPI cluster environment on Amazon EC2 instances only. The last set of experiments results shows a reduction of the FFR model dimensionality, transforming it into a Reduced Fully-Flexible Receptor (RFFR) model, by discarding the non-promising conformations generated by W-FReDoW. It also reduces the total execution time to between 10-30% of that of FReMI s only execution, which, in turn, decreased near 94% with respect to the serial execution.
|
69 |
Um estudo sobre a predi??o da estrutura 3D aproximada de prote?nas utilizando o m?todo CReF com refinamentoDall"agno, Karina Cristina da Motta 22 March 2012 (has links)
Made available in DSpace on 2015-04-14T14:49:45Z (GMT). No. of bitstreams: 1
438289.pdf: 4232980 bytes, checksum: 881bd64c55df7a95a458dac98379df88 (MD5)
Previous issue date: 2012-03-22 / One of the most important problems in Structural Bioinformatics is to understand how the information coded in linear sequence amino acids, or primary structure, is translated into the three-dimensional structure of a protein. Many algorithms proposed solutions to this complex problem of NP-complete class. One of them is the CReF method (Central Residue Fragment-based) which makes prediction of approximate 3-D structure of proteins and polypeptides. The method uses data mining techniques to group data structures, showing good secondary structure prediction, good performance at low machine cost, but has problems in the prediction of turns and loops regions and usability. Valuing the different characteristics of CReF and seeking to evolve it, this work proposes improvements to CReF. After the initial stage of understanding the tool and making changes to turn it executable on the current state of data banks and support tools, two categories of improvements to make were identified. The technical improvements aimed to automate CReF, adapting it to the environment and emphasizing usability. In the method‟s improvements variations on the amount of groups were tested for data mining with the Expectation Maximization algorithm in Weka. Tests indicated that the best results for the initial conformation were for four and six groups, hence we decided to allow the user to select the amount of groups. A new mapping of the data in the Ramachandran plot indicated some problems that had to be fixed. In the analysis of data mining results, we decided that groups in regions not allowed would be discarded. The new version of CReF generated by the implementation of these improvements standardized the method of secondary structure prediction to use Porter. As a consequence, the rules of selection of data mining groups to represent each amino acids have been changed and extended. The new version has the same initial performance of CReF in prediction and execution, however, the problem of correct predictions of turns and loops remained. This problem was addressed through a refinement protocol, based on simulations by the molecular dynamics method, which presented a significant result for the target protein 1ZDD. / Um dos principais desafios da Bioinform?tica Estrutural ? entender como a informa??o decodificada em uma sequ?ncia linear de amino?cidos, ou estrutura prim?ria de uma prote?na, possibilita a forma??o de sua estrutura tridimensional. Muitos algoritmos buscam propor solu??es para o problema complexo da classe NP-completo. Dentre eles, est? o m?todo CReF (Central Residue Fragment-based method) que realiza a predi??o da estrutura 3D aproximada de prote?nas ou polipept?dios. O m?todo usa t?cnicas de minera??o de dados para agrupar dados de estruturas, apresentando boa predi??o de estruturas secund?rias, bom desempenho em m?quina de baixo custo, mas enfrenta problemas na predi??o das regi?es de voltas e al?as e na usabilidade. Valorizando as caracter?sticas diferenciadas do m?todo e buscando sua evolu??o, este trabalho prop?s-se a realizar melhorias no CReF. Ap?s uma etapa inicial de entendimento e adapta??es para tornar a ferramenta execut?vel na situa??o atual dos bancos de dados e ferramentas de apoio, foram identificadas duas categorias de melhorias. As melhorias t?cnicas tiveram por objetivo automatizar a ferramenta, adapt?-la ao ambiente e ao usu?rio enfatizando usabilidade. Para melhorias no m?todo realizaram-se testes com varia??o na quantidade de grupos identificados na etapa de minera??o de dados com o algoritmo Expectation Maximization (EM) no Weka. Os testes indicaram que as melhores conforma??es iniciais eram obtidas com quatro e seis grupos, assim, optou-se por permitir ao usu?rio a escolha dos grupos a considerar. Um novo mapeamento do mapa de Ramachandran indicou ajustes que foram corrigidos e decidiu-se descartar grupos identificados nas regi?es n?o permitidas na an?lise do resultado da minera??o de dados. A nova vers?o do CReF, gerada pela implementa??o dessas melhorias, tamb?m padronizou o m?todo de predi??o de estrutura secund?ria, passando a utilizar o m?todo Porter. Como consequ?ncia, as regras para escolha do grupo resultante da minera??o a representar cada amino?cido foram adaptadas e ampliadas para atender novas situa??es. A nova vers?o manteve o desempenho de predi??o e execu??o iniciais do CReF, entretanto, manteve o problema das voltas e al?as. Este problema de otimiza??o das regi?es de voltas e al?as foi endere?ado por meio do desenho e aplica??o de um protocolo de refinamento, baseado em simula??es pelo m?todo da din?mica molecular, o qual apresentou um resultado expressivo para a prote?na alvo de c?digo PDB 1ZDD.
|
70 |
Smart execution of molecular docking simulations of a fully-flexible receptor modelFrantz, F?bio Andr? 12 April 2012 (has links)
Made available in DSpace on 2015-04-14T14:49:48Z (GMT). No. of bitstreams: 1
439095.pdf: 3289381 bytes, checksum: eb6fc534e5a9d631dbafb97aa0a9c407 (MD5)
Previous issue date: 2012-04-12 / Molecular docking simulations of Fully-Flexible Receptor (FFR) models are coming of age. However, they demand parallelization of computing activities for their executions and generate huge amounts of data that needs to be analyzed. Many Task Computing (MTC) is an attractive paradigm routinely applied to execute intensive tasks. In this work we propose an environment to execute molecular docking simulations of FFR models to small molecules integrated with an MTC middleware. This environment is based on a new pattern called Self-adapting Multiple Instances (P-SaMI) that provide rules to reduce the number of experiments, providing a Reduced Fully-Flexible Receptor (RFFR) model. The main contribution of this research is to prove that P-SaMI rules can be used on Molecular Docking Simulations through a web environment integrated with an MTC middleware. / Simula??es de docagem molecular com modelos de Receptores Totalmente Flex?veis (FFR) est?o adquirindo maturidade. No entanto, isto demanda atividades computacionais de paraleliza??o para gera??o e execu??o de grande volume de dados que precisam ser analizados. Computa??o multi-tarefa ? um paradigma atrativo e que vem sendo aplicado frequentemente para executar tarefas intensivas. Neste trabalho propomos um ambiente para executar simula??es de docagem molecular no modelo FFR com pequenas mol?culas integradas a um componente MTC. Este ambiente ? baseado no padr?o M?ltiplas Inst?ncias Autoadapt?veis (P-SaMI) que possui regras para redu??o do n?mero de experimentos, provendo um modelo de Receptores Totalmente Flex?veis Reduzido (RFFR). A principal contribui??o desta pesquisa est? na comprova??o de que as regras do P-SaMI podem ser usadas em Simula??es de Docagem Molecular atrav?s de um ambiente web integrado com um componente MTC.
|
Page generated in 0.127 seconds