Spelling suggestions: "subject:"bioinformática"" "subject:"bioinformáticas""
1 |
Identificação e análise de promotores Sigma 70 no genoma de Herbaspirillum seropedicae SmR1 utilizando métodos de inteligência artificialFreire, Rodnei Damaceno January 2014 (has links)
Orientadora : Profa. Dra. Liu Un Rigo / Orientador : Prof. Dr. Roberto Tadeu Raittz / Dissertação (mestrado) - Universidade Federal do Paraná, Setor de Tecnologia, Programa de Pós-Graduação em Bioinformática. Defesa: Curitiba, 29/09/2014 / Inclui referências / Área de concentração: Saúde humana e animal / Resumo:Sigma 70 ou sigma N constituem fatores complementares da RNA-polimerase, cuja principal função é promover a transcrição de genes procarióticos. No caso de Escherichia coli, o consenso da região -35 (TTGACA) e -10 (TATAAT) do fator sigma 70, está localizado a partir do intervalo da décima à trigésima quinta base a montante do sítio de início de transcrição e as bases mais conservadas estão localizadas nas posições -10 (A2 = 95% - T6 = 96%) e -35 (T1 = 82% - T2 = 84%). Propusemos neste trabalho identificar sequências promotoras de transcrição dependentes do fator sigma 70, utilizando um algoritmo que pré-seleciona candidatos aos promotores sigma 70 com base no padrão de conservação. Os candidatos são então classificados através de treinamento de rede artificial, com conjunto de sequências de promotores sigma 70 validados e um conjunto de sequências improváveis, geradas aleatoriamente. O método foi testado in silico no genoma da betaproteobactéria Herbaspirillum seropedicae SmR1, resultando em 4.998 sequências candidatas a promotores fator sigma 70. Deste grupo foram selecionados 288 candidatos a partir das regiões intergênicas de genes com alto nível de expressão. Isto tornou possível validar os resultados obtidos para identificação de sequências promotoras sigma 70 e propor uma sequência consenso para o promotor de transcrição sigma 70 em Herbaspirillum seropedicae SmR1. A metodologia utilizada para identificar os sítios de ligação sigma 70 mostrou-se eficaz na identificação de candidatos aos promotores sigma 70 em H. seropedicae SmR1 e possivelmente em outras proteobactérias. Palavras-chave: Herbaspirillum, Promotores, Fatores de Transcrição, sigma 70. / Abstract: Sigma 70 or sigma N constitute complementary sigma factors of RNA-polymerase, whose main function is to promote the transcription of prokaryotic genes. In the case of Escherichia coli, the consensus of the -35 region (TTGACA) and -10 (TATAAT) sigma 70 factor sequence, located from the range of the tenth to the thirty-fifth base upstream of the transcription start site and the bases more conserved are located at positions -10 (A2 = 95% - T6 = 96%) and -35 (T1 = 82% - T2 = 84%). We proposed in this work to identify promoter sequences of the sigma 70 dependent transcription factor, using an algorithm that pre-selects candidates for sigma 70 promoters based on conservation pattern. The candidates sequences are ranked using artificial neural network training set of validated sigma 70 promoter sequences and a set of randomly generated sequences. The method was tested in silico using the Betaproteobacteria Herbaspirillum seropedicae SMR1 genome, resulting in 4.998 candidate sequences for promoters to sigma 70 factor with standard conservation. Among these candidates 288 were manually selected from the intergenic regions of genes with high expression level. This made it possible to validate the results obtained for indentification of sigma 70 sequences and propose a consensus sequence for transcriptional promoter sigma 70 in Herbaspirillum seropedicae SMR1. The methodology used to predict sigma 70 binding sites showed effectiveness to identify candidates for sigma 70 promoters in H. seropedicae SMR1 and possibly in other proteobacteria.
Keywords: Herbaspirillum, Promoters, Transcription Factors, sigma 70.
|
2 |
Sequenciamento e análise do genoma de derxia lacustris HL 12Trefflich, Sheyla January 2016 (has links)
Orientador : Prof. Dr. Emanuel Maltempi de Souza / Coorientador : Dr. Arnaldo Glogauer / Dissertação (mestrado) - Universidade Federal do Paraná, Setor de Educação Profissional e Tecnológica, Programa de Pós-Graduação em Bioinformática. Defesa: Curitiba, 29/10/2010 / Inclui referências : f. 40-43;49-51 / Resumo: As rizobactérias são bactérias de vida livre que habitam as raízes das plantas, desenvolvem uma relação de simbiose e geram benefícios aos organismos vegetais. A existência desses organismos é de grande importância na agricultura, já que a carência na absorção de nitrogênio impacta diretamente na taxa de crescimento das plantas, diminui a produtividade agrícola e originam problemas de ordem ambiental com a utilização de fertilizantes que são poluentes ao meio. A fixação biológica de nitrogênio é realizada por uma ampla gama de bactérias. Derxia lacustris HL12 é uma bactéria fixadora de nitrogênio, pertencente à classe das Betaproteobacterias, ordem Burkholderiales, família Alcaligenaceae, gênero Derxia. Esse organismo foi isolado de amostras de água provenientes de um lago na região de Taiwan. D. lacustris HL12 é a segunda bactéria inserida no gênero Derxia, de acordo com a comparação entre as sequências do gene do RNA ribossomal 16S desta e de Derxia gummosa DSM 723, que é considerado o organismo de referência. Esse organismo está depositado no NCBI e possui uma montagem com 19 contigs e um contig separado da sequencia do 16S rRNA . D. lacustris HL12 teve seu genoma sequenciado por duas vezes na plataforma Illumina Miseq. O processo de sequenciamento resultou num total de 3.532.510 reads. Seus reads possuem um tamanho médio de 300pb. Os dados brutos foram montados com os seguintes softwares: CLC, Velvet, Celera, Spades, Masurca. A melhor montagem obtida foi a realizada no software Celera, possuindo 129 contigs e percentual de GC igual a 69,20% . O software Matlab foi utilizado em ensaios de ordenação e cálculos do genoma. O software Fgap foi utilizado com os dados provenientes de todas as montagens realizadas para o fechamento dos gaps existentes no genoma. O software Bowtie foi responsável por mapear o genoma com os dados brutos. O software Mummer foi utilizado na construção do dotplot entre D. lacustris HL12 e D. gummosa DSM 723. O software Fastqc foi utilizado para analisar a qualidade dos dados brutos. O genoma de D. lacustris HL12 possui um draft com 28 contigs. Foi localizado um operon ribossomal completo.O genoma passou por uma análise de anotação para identificação de genes em algumas vias metabólicas do organismo. Foram encontrados os genes do cluster Nif, reforçando o indício do organismo fixar nitrogênio com os anotadores Sila e Rast. Palavras-chave: Fixação de nitrogênio, Sequência genômica, Derxia lacustris HL12. / Abstract: Rhizobacteria are bacteria which inhabit plant roots developing a symbiosis relationship that benefits those organisms. The existence of this kind of bacteria is of great importance to agriculture, once the need for nitrogen absorption impacts directly on plant growth rate, decreases agricultural productivity and generates environmental problems caused by the use of fertilizers. The biological nitrogen fixation is made by a large number of species. Derxia lacustris HL12 is a nitrogen fixing bacterium belonging to the class Betaproteobacterias, order Burkholderiales, family Alcaligenaceae, genus Derxia. This organism was isolated from fresh water collected from a lake in Taiwan. D. lacustris HL12 is the second bacteria inserted in the genus Derxia, in accordance with the comparison between its gene sequence of RNA ribosomal 16S and that of Derxia gummosa DSM 723, considered the reference organism. This organism is stored at the NCBI and has an assembly with 19 contigs. and one additional contig separated form 16S rRNA's sequence. D. lacustris HL12 had its genome sequenced twice using the Illumina Miseq platform. The sequencing process resulted in a total of 3,532,510 reads. The average size of its reads is of 300 pb. Raw data were assembled using the following softwares: CLC, Velvet, Celera, Spades, Masurca. The best assembly was obtained by using the Celera software and has 129 contigs and a CG percentage of 69.20%. Matlab was used in collation test runs and genome calculations. The software Fgap used the data collected from all the assemblies obtained for closing the existing gaps in the genome. The software Bowtie scanned the genome using raw data. The software Mummer was used in the construction of the dotplot between D. lacustris HL12 and D. gummosa DSM 723. The software Fastqc was employed to analyze the quality of the raw data. D. lacustris HL12's genome has a draft with 28 contigs. A complete ribosomal operon was located. The genome was submitted through an annotation analysis for the identification of the genes in some of the organism's metabolic pathways. Nif cluster genes were found using Sila and Rast annotation tools, which evinces D. lacustris HL12 as a nitrogen fixing bacteria. Key-words: Nitrogen fixation, Geonomic sequencing, Derxia lacustris HL12.
|
3 |
Meta-análise do Projeto Toxicogenômico Japonês diferenças entre modelos in vivo e in vitro /Biagi Júnior, Carlos Alberto Oliveira de. January 2017 (has links)
Orientador: José Luiz Rybarczyk Filho / Resumo: A toxicogenômica é um campo emergente que possibilita o estudo dos efeitos de uma determinada droga a nível molecular em sistemas modelos. Uma das principais questões é se podemos substituir os estudos in vivo pelos estudos in vitro. As ciências ômicas possibilitam a resposta para esse tipo de questionamento pois fornecem técnicas como, por exemplo, o microarray, que permite o conhecimento dos transcritos (RNAs) de um dado organismo. O Projeto Toxicogenômico Japonês fornece dados para Homo sapiens, com somente experimentos in vitro, e para Rattus norvegicus, com experimentos in vitro e in vivo, tratados com 131 drogas (aprovadas pelo FDA) em diferentes concentrações de dose e tempos de amostragem, totalizando, aproximadamente, 20000 chips de microarray. A partir desses dados foi possível responder a questão inicial e observar as diferenças existentes entre cada modelo. Por meio da linguagem de programação R normalizamos os dados, obtemos os genes diferencialmente expressos e o respectivo enriquecimento funcional, dessa forma observamos as diferenças entre cada modelo. Em seguida realizamos uma análise comparativa dos modelos in vivo e in vitro adaptando a metodologia do mapa modular proposta por Segal e colaboradores. Essa metodologia tem como objetivo principal obter módulos, que são sets de genes (dados do Gene Ontology, KEGG e Reactome) que agem em conjunto para realizar uma função específica. Além de extrair módulos caracterizaremos os valores de expressão em relação as c... (Resumo completo, clicar acesso eletrônico abaixo) / Mestre
|
4 |
Influência das abordagens metodológicas na reconstrução filogenética de Ceriantharia (Cnidaria, Anthozoa) /Costa, Lucas Bassi. January 2018 (has links)
Orientador: Sérgio Nascimento Stampar / Banca: Carlos Camargo Alberts / Banca: Julia Silva Beneti / Resumo: O filo Cnidaria pode ser considerado um dos mais distintos do reino animal. Dentre suas subclasses, encontra-se Ceriantharia, constituída pelas anêmonas de tubo. Esses animais são até o momento um desafio para a sistemática, uma vez que após diversas propostas, nenhuma se fez unânime até o momento. Grande parte da divergência encontrada em classificar o grupo, deve-se aos métodos/materiais utilizados para análise. Sendo assim, o presente trabalho buscou, através de dados moleculares, estudar as relações de Ceriantharia dentre os Anthozoa e os demais Cnidaria e comparar os resultados obtidos pelos diferentes métodos de reconstruções filogenéticas. Para tal, foram utilizados marcadores ribossomais completos (28S e 18S). Por meio de softwares específicos, as sequências genéticas foram analisadas e as reconstruções foram realizadas seguindo dois dos métodos mais utilizados atualmente (máxima verossimilhança e inferência bayesiana). Tendo em mãos inúmeras ferramentas, o presente trabalho é uma oportunidade de gerar conhecimento e buscar conceitos mais precisos dentro da sistemática do grupo / Abstract: The Cnidaria phylum can be considered one of the most distinguished of the animal kingdom. Among them, there is the subclass Ceriantharia, constituted by the tube anemones. These animals are so far a challenge to systematics, since after several proposals, none has been considered as unanimous yet. Much of the divergence found in classifying the group is due to the methods / materials used for analysis. Thus, the present work sough trough molecular data, to study the relationships of Ceriantharia among the Anthozoa and the other Cnidaria and to compare the results obtained by the different methods of phylogenetic reconstruction. For this, complete ribosomal markers (28S and 18S), were used. By means of specific softwares, the genetic sequences were analyzed and the reconstruction were performed following two of the most commonly used methods (maximum likelihood and Bayesian inference). Having in hand numerous tools, the present work was a very important opportunity to generate knowledge and to search for more precise concepts within the systematics of the group / Mestre
|
5 |
Protein locator : um método para consolidação de resultados na identificação de proteínasRodrigues, Higor de Souza 30 July 2008 (has links)
Dissertação (mestrado)—Universidade de Brasília, Faculdade de Tecnologia, Departamento de Engenharia Elétrica, 2008. / Submitted by Jaqueline Oliveira (jaqueoliveiram@gmail.com) on 2008-12-02T16:33:09Z
No. of bitstreams: 1
DISSERTACAO_2008_HigordeSRodrigues.pdf: 5051689 bytes, checksum: 15aa9b75d481623dcb07bc2f132b089a (MD5) / Approved for entry into archive by Georgia Fernandes(georgia@bce.unb.br) on 2009-02-12T16:44:00Z (GMT) No. of bitstreams: 1
DISSERTACAO_2008_HigordeSRodrigues.pdf: 5051689 bytes, checksum: 15aa9b75d481623dcb07bc2f132b089a (MD5) / Made available in DSpace on 2009-02-12T16:44:00Z (GMT). No. of bitstreams: 1
DISSERTACAO_2008_HigordeSRodrigues.pdf: 5051689 bytes, checksum: 15aa9b75d481623dcb07bc2f132b089a (MD5) / Um dos papéis mais importantes da Bioinformática proteômica pode ser descrito
como o tratamento do conjunto de dados gerado a partir do sequenciamento de
proteínas, construindo de forma eficaz e organizada, informações inteligíveis para os
pesquisadores dessa área. Existem diversos bancos de dados de seqüências, como o
EMBL, o SwissProt e o UniProt, bem como diferentes programas para realizar buscas
por similaridades nestes bancos de dados, como o Mascot, o Fasta, o Blast e
AACompIdent. O objetivo deste estudo foi construir um sistema inédito que apresente
de maneira probabilística a similaridade entre proteínas que constituem os bancos de
dados pré-existentes e os dados experimentais fornecidos pelos pesquisadores. A partir da inserção dos dados, o sistema, chamado Protein Locator, busca as seqüências similares nos programas já existentes, e utiliza o algoritmo QFAST de combinação de pvalores
e também o algoritmo PLscore, uma nova versão do QFAST proposto por este
estudo, para a combinação de todos os resultados obtidos. Os algoritmos realizam a
combinação das probabilidades dos resultados fornecidos pelos programas de
identificação e o Protein Locator apresenta ao usuário os valores originais de cada
programa e o valor consolidado pela combinação dos resultados, sendo formado pelo identificador da proteína e a probabilidade de erro do match. Para a validação do método de combinação de resultados e do algoritmo PLscore, foram realizadas pesquisas de identificação de 18 conjuntos de dados de experimentos teóricos com proteínas que simularam seu seqüenciamento, análise de composição de
aminoácidos e obtenção da lista de massa de peptídeos. Em 9 desses experimentos,
foram incluídos desvios laboratoriais e nos outros 9 foram utilizadas as informações
completas. Em 14 dos 18 resultados, a combinação dos dados possibilitou o aumento na acurácia do resultado; em 4 casos, não houve mudanças nas conclusões das pesquisas e em nenhum caso houve piora dos resultados. O tempo entre o armazenamento de informações das pesquisas e a espera pelos resultados combinados foi de aproximadamente 30 minutos, bastante inferior ao tempo medido para se realizar um experimento semelhante de forma manual, cerca de 3 horas.
____________________________________________________________________________________ ABSTRACT / The analysis of protein sequencing data is one of the most important roles of proteomic bioinformatics. In addition, bioinformatics organizes data in an optimized way to be used by researches in this area. There are some protein databases, such as EMBL, SwissProt and Uniprot with software to search for sequencing similarities such
as Mascot, Fasta, Blast and AACompIdent. The aim of this study was to create a new
system to calculate statistical similarity degree between proteins described in databases and experimental data. The system, called Protein Locator, compares experimental data with sequences through the preexisting software and uses both the QFAST p-value combination algorithm and the PLscore algorithm (a new version of QFAST proposed by this study) to combine results. The algorithms combine probability between the results from the sequences search software and Protein Locator shows the original pvalues from each software, the p-value obtained from results combination, and also the protein identifier and the probability of match. To evaluate the results combination method and the PLscore algorithm, we have
used 18 data collections from theoretical experiments in which protein sequencing,
analysis of amino acids composition and peptides mass were simulated. In 9 of these
experiments, we have included the laboratory error and in the other 9 we have used the complete data. In 14 out the 18 results, data combination method increased accuracy; in the other 4, results were equivalent to those found without combination. Combination of results and protein identification required 30 minutes from laboratory data insertion while manual search would usually require approximating 3 hours.
|
6 |
Prospecção em folhas de pimentão `Sunshine ́ de peptídeos antimicrobianos com ação contra fitopatógenos e estruturação do banco de dados sobre defensinas DefDB / Prospection in leaves of bell pepper (‘Sunshine’) of antimicrobial peptides with action against fitopathogens and structuring of the defensins data bank DefDBMagalhães, Rubens Daniel Miserani 27 January 2010 (has links)
Submitted by Marco Antônio de Ramos Chagas (mchagas@ufv.br) on 2016-05-17T15:55:22Z
No. of bitstreams: 1
texto completo.pdf: 3652908 bytes, checksum: 5659a8779947e080c2cd957f4f69a051 (MD5) / Made available in DSpace on 2016-05-17T15:55:22Z (GMT). No. of bitstreams: 1
texto completo.pdf: 3652908 bytes, checksum: 5659a8779947e080c2cd957f4f69a051 (MD5)
Previous issue date: 2010-01-27 / Conselho Nacional de Desenvolvimento Científico e Tecnológico / Peptídeos antimicrobianos (AMPs) são expressos por muitos organismos e apresentam uma função multifacetada. Estudos os têm revelado como potenciais agentes antibacterianos, defensivos agrícolas, medicamentos cicatrizantes, imuno-moduladores, agentes quimiotáticos, entre outros. Defensinas, a maior família dos peptídeos antimicrobianos, são moléculas com prevalência catiônica, ricas em cisteínas, apresentando em geral três ou quatro pontes dissulfídicas. São constituídas de 45 a 54 resíduos de aminoácidos, encontradas em organismos vertebrados e invertebrados, apresentam atividade contra bactérias Gram-positivas e Gram-negativas, fungos e vírus encapsulados. Essas moléculas apresentam baixa toxicidade a animais e plantas, justificando assim seu uso como drogas ou defensivos agrícolas. As defensinas atuam por meio de atrações eletrostáticas com a face externa das membranas celulares alvo, gerando poros e ocasionando morte celular. Elas também atuam, segundo estudos recentes, como sinalizadores primários e secundários em vias apoptóticas e como agentes potencializadores das defesas imunológicas, sendo o mecanismo de atuação molecular ainda desconhecido. A busca por AMPs de plantas tem sido realizada no Laboratório de Proteômica e Bioquímica de Proteínas (DBB/UFV) visando à caracterização estrutural desses peptídeos. O isolamento de peptídeos antimicrobianos de extratos solúvel (ES) e de parede celular (EP) de folhas de pimentão da variedade Sunshine foi realizado por etapas pré-cromatográficas (centrifugações, fracionamento salino e por ultrafiltrações) e por cromatografia líquida multidimensional offline. As frações de interesse obtidas de ES e de EP foram testadas em relação à sua atividade antimicrobiana contra o fungo Alternaria solani e contra as bactérias Clavibacter michiganensis subsp. michiganensis, Gram positiva, e Ralstonia solanacearum, Gram negativa, pela técnica de microplacas, evidenciando a inibição do crescimento desses microrganismos. Os resultados sugerem a ocorrência de aglomerações dos AMPs nos extratos, dadas as características de hidrofobicidade e cargas desses peptídeos, e que as etapas de separação por massas moleculares devem ser realizadas visando reduzir esses efeitos. O procedimento experimental proposto ao final do trabalho, que envolve o fracionamento por sal e por ultrafiltração, seguindo-se cromatografia de fase reversa em C4, permitiu a separação das amostras em frações com atividades antimicrobianas diferentes e potencialmente de interesse para a exploração comercial na defesa de plantas. A construção de um banco de dados que agrupe informações sobre defensinas, possibilitando evidenciar relações entre as moléculas já conhecidas e sequências não identificadas, apresenta-se de grande importância para a complementação dos estudos crescentes sobre esses peptídeos. As bases de dados do DefDB já estão disponíveis e podem ser utilizadas para identificação de sequências obtidas por métodos de sequenciamento, seja pelo alinhamento com a sequência obtida, ou pela identificação comparativa utilizando ferramentas computacionais específicas, como programas e pipelines utilizados para análises de dados de espectrometria de massa. Assim, as informações obtidas desse banco de dados, com a ajuda de ferramentas de análises já disponíveis na rede mundial de computadores, podem colaborar para a identificação de novas sequências, para a elucidação do mecanismo de atuação molecular, além de contribuir para direcionar estudos iniciais sobre esses peptídeos. Portanto, a obtenção de frações com alta atividade antimicrobiana, juntamente com o desenvolvimento de bases de dados específicas, que facilitem a identificação dos possíveis peptídeos antimicrobianos presentes nessas frações, pode ser o caminho para o estudo e o isolamento de novos compostos naturais, capazes de substituir defensivos agrícolas danosos ao ambiente, e/ou serem utilizados como base de medicamentos para combater infecções e doenças imunológicas. / Antimicrobial peptides (AMPs) are expressed by many organisms and have a multifaceted role. Studies have revealed the AMPs as potential antibacterial agents, pesticides, drugs, healing, immune modulators, chemotactic agents, among others. Defensins, the largest family of antimicrobial peptides, are cationic molecules, rich in cysteines, with four disulfide bridges. They consist of 45 to 54 amino acid residues, found in vertebrate and invertebrate organisms, presenting activity against Gram-positive and Gram- negative bacteria, fungi and encapsulated virus. These molecules have low animals and plants toxicity, thereby justifying their use as drugs or pesticides. The defensins act by means of electrostatic attractions with the external surface of the target cell membranes, creating pores and causing the cell death. They also operate, according to recent studies, such as primary and secondary signs in the apoptosis via and as enhancers of immune defenses, being the molecular mechanism of action still unknown. The search for AMPs in plants has been performed at the Laboratório de Proteômica e Bioquímica de Proteínas (DBB / UFV) aiming to characterize the structure of these peptides. The process of separation of peptides was performed by pre-chromatographic step (centrifuging, saline precipitation and ultrafiltration) and offline multidimensional liquid chromatography. The fractions of interest obtained from ES and EP were tested about their antimicrobial activity against the fungus Alternaria solani and against the bacteria Clavibacter michiganensis subsp. michiganensis, Gram positive, and Ralstonia solanacearum, Gram negative, the microplate technique, showing the inhibition of growth of these microorganisms. The results indicated the occurrence of possible agglomeration of AMPs in the extracts, given the characteristics of hydrophobicity and charges of these peptides, and that the separation steps by molecular weight should be carried out to reduce these effects. The experimental procedure proposed by the latter, which involves the fractionation by salt and by ultrafiltration followed by reverse- phase chromatography on C4, allowed the separation of samples into fractions with different antimicrobial activities and potentially of interest to the commercial exploration to the plants defense. The construction of a data bank to collate information about defensins, allowing the construction of relations between the molecules that have been discovered and unidentified sequences, presented as a very important achievement for the complementation of studies about these peptides. The DefDB databases are available and can be used to identify the sequences obtained by sequencing methods, either by aligning the sequence obtained, or by the comparative identification using specific computational tools, such as programs and pipelines used for data analysis of MS. Thus, the information of this data bank, helped by analysis tools already available on the World Wide Web, may contribute to the identification of new sequences, to elucidate the molecular mechanism of action, and contributes to guide initial studies about these peptides. Therefore, the obtation of fractions with high antimicrobial activity, together with the development of specific databases, to facilitate the identification of potential antimicrobial peptides in these fractions, may be the way to the study and isolation of new natural compounds that can replace harmful pesticides to the environment, and/or be used as the basis for drugs to fight against infections and immune disorders. / Dissertação antiga, falta ficha catalog.
|
7 |
Gerenciamento de dados de proveniência de workflow de bioinformática com banco de dados baseados em grafoAlmeida, Rodrigo Pinheiro de 26 June 2015 (has links)
Dissertação (mestrado)—Universidade de Brasília, Instituto de Ciências Exatas, Departamento de Ciência da Computação, Programa de Pós-Graducação em Informática, 2015. / Submitted by Fernanda Percia França (fernandafranca@bce.unb.br) on 2016-06-07T16:28:08Z
No. of bitstreams: 1
2015_RodrigoPinheirodeAlmeida.pdf: 2786870 bytes, checksum: 683fe7a67964204f75f57755f9546e73 (MD5) / Approved for entry into archive by Raquel Viana(raquelviana@bce.unb.br) on 2016-12-21T17:01:19Z (GMT) No. of bitstreams: 1
2015_RodrigoPinheirodeAlmeida.pdf: 2786870 bytes, checksum: 683fe7a67964204f75f57755f9546e73 (MD5) / Made available in DSpace on 2016-12-21T17:01:19Z (GMT). No. of bitstreams: 1
2015_RodrigoPinheirodeAlmeida.pdf: 2786870 bytes, checksum: 683fe7a67964204f75f57755f9546e73 (MD5) / Muitos experimentos científicos na bioinformática são executados como workflows computacionais. Algumas vezes para a validação e reconhecimento de um experimento é necessário reexecutá-lo sob as mesmas circustâncias nas quais foi originado. Proveniência de dados diz respeito à origem ou procedência dos dados. Para facilitar o entendimento e análise dos resultados, é interessante ter os dados de proveniência, que detalham e documentam a história e os caminhos dos dados de entrada, do início do experimento até o final. Portanto, neste contexto, a proveniência de dados pode ser aplicada para realizar a rastreabilidade de um experimento. Considerando que uma execução de um workflow pode ser representado por um grafo, como definido no modelo PROV-DM, este documento apresenta uma arquitetura capaz de realizar a proveniência de dados de expe- rimentos científicos na bioinformática de forma automática e armazenamento em bancos de grafo. / Many scientific experiments in bioinformatics are executed as computational work- flows. Sometimes for the validation and recognition of an experiment is need rerun under same circumstances in which it was originated. Date provenance concers the origin data. To facilate the understanding and analysis of the results is interesting to have the source data, detailing and documeting the history and the paths of the input data, the beginning of the experiment until the end. Therefore, in this context, the data provenance can be applied to realize an experiment traceability. Whereas an execution of a workflow can be represented by a graph, as defined in PROV-DM model, this document presents an architecture able to perform the data provenance of iscientif experiments in bioinformatics automatically and storage graph database.
|
8 |
Análise comparativa de métodos de determina¸cão de vias biológicas alteradas em dados toxicogenômicos de estudos in vitro e in vivoSanches Seco, Giordano Bruno January 2018 (has links)
Orientador: José Luiz Rybarczyk Filho / Resumo: A toxicogenômica é uma área de estudo que se utiliza de dados provindos de tecnologias das ciências ômicas e de metodologias de análise de dados da bioinformática para caracte- rizar perfis biológicos de compostos a fim realizar um estudo sobre seu comportamento no sistema biológico. Um dos problemas na análise de dados de expressão gênica é que existem diversas metodologias disponı́veis, cada uma aborda os dados brutos de maneira diferente e consequentemente fornecem resultados diferentes. Porém estes resultados não estão necessa- riamente errados, por essa razão abordar dados toxicogenômicos de diversas maneiras pode ajudar pesquisadores a tecer hipóteses sobre os mecanismos das drogas. Isso pode implicar em redução de custos na fase pré-clı́nica do desenvolvimento de medicamentos e numa melhor qualidade de tratamento para os pacientes. A abordagem mais comum na análise de dados de expressão gênica é o enriquecimento funcional dos genes que se mostrem diferencialmente expressos. Entretanto é possı́vel que informações relevantes possam ser obtidas utilizando métodos com outras considerações. Para avaliar esta hipótese o presente trabalho tem por objetivo analisar dados de expressão gênica disponı́veis em bases de dados on-line referentes a 3 drogas antineoplásicas testadas em fı́gado de Rattus norvergicus (estudos in vivo e in vi- tro) e Homo sapiens (estudo in vivo apenas) para avaliação de ontologias alteradas em cada droga. Duas metodologias de bioinformática foram utiliz... (Resumo completo, clicar acesso eletrônico abaixo) / Abstract: Toxicogenomics is an area that uses data generated by omics technologies and bioinformatics to characterize biological profiles of chemical compounds in order to analyze the biological system’s behavior in response to said compounds. A commom problem in the analysis of gene expression data is the large amount of methodologies available, each one approaches the raw data differently and consequently provide different results. But these results are not necessarily wrong, for that reason approaching toxicogenomic data in several ways may help researchers to hypothesize about a drug’s mechanisms. This may imply cost reduction in the pre-clinical phase of drug development and in a better quality of treatment for patients. The most common approach in the analysis of gene expression data is the functional enrichment of differentially expressed genes (EFDEGs). However, it is possible that relevant information can be obtained using methods with other considerations. To evaluate this hypothesis this work aims to analyze gene expression data available in the OPEN TG-GATEs online database about 3 antineoplastic drugs tested in the liver of Rattus norvergicus (in vivo and in vitro) and Homo sapiens (in vivo only) for the evaluation of altered ontologies in each drug. Two bioinformatics methodologies were used to analyze these data. The traditional analysis of differentially expressed genes (EFDEGs) and the analysis of groups of functionally associated genes determined by shannon entropy (A... (Complete abstract click electronic access below) / Mestre
|
9 |
Análise in silico de um novo “cluster” de PKS II MetagenômicoGomes, Elisângela Soares [UNESP] 23 February 2011 (has links) (PDF)
Made available in DSpace on 2014-06-11T19:27:22Z (GMT). No. of bitstreams: 0
Previous issue date: 2011-02-23Bitstream added on 2014-06-13T19:35:21Z : No. of bitstreams: 1
gomes_es_me_jabo.pdf: 1563110 bytes, checksum: d05b3a2a3af4b9eac347a74aebd3029e (MD5) / Conselho Nacional de Desenvolvimento Científico e Tecnológico (CNPq) / As PKSs tipo II são complexos enzimáticos envolvidos na produção de policetídeos. Estes são metabólitos secundários que possuem papel-chave no desencadeamento das respostas bioquímicas que levam à diversificação fisiológica frente a fatores adversos, fazem parte da composição de pigmentos de esporos microbianos, além de comporem a estrutura química de importantes antibióticos explorados pela indústria farmacêutica. Foi feita a prospecção de novos “clusters” gênicos para PKSs tipo II em uma biblioteca metagenômica de 9.320 clones, através de amplificação por PCR com “primers” degenerados para uma região gênica conservada. Dentre três clones encontrados, um foi sequenciado pela estratégia de shotgun, resultando em um consensus de 22.988 pares de bases. Foi feita a predição funcional de ORFs por homologia obtida com a ferramenta Blast (NCBI) e também a identificação de domínios enzimáticos pelo PRODOM e PFAM. Dentre os resultados da predição por homologia de domínios enzimáticos foi possível identificar ORFs homologas à: reguladores gênicos (LacI e LuxR); carboidrases (Lacases, β-glucosidases, Quitinases/Celulases); transferases (O-metil-transferases, Acíl-transferases); pks mínima; ciclases, aromatases, hidroxilases, mono-oxigenases e transportadores ABC. Alguns “clusters” enzimáticos podem ainda atuar em degradação de celulose e lignina. As enzimas candidatas ao core biossíntético do “cluster” (pks mínima) foram submetidas à modelagem de estrutura tridimensional in silico. Os modelos 3D foram avaliados quanto a acurácia, utilizando as ferramentas: Verify3D, Qmean, Procheck, Rampage e Swiss-Model. Uma vez validados, as KSA e CLF foram submetidas a simulações de “docking” enzimático / The type II PKSs are enzyme complexes involved in the production of polyketides. These are secondary metabolites that have key role in triggering the biochemical responses that lead to physiological diversification against adverse factors are part of the pigment composition of microbial spores, and compose the chemical structure of most antibiotics exploited by the pharmaceutical industry. Some clusters could act in enzymatic degradation of cellulose and lignin. It was made a prospection for new clusters gene for type II PKSs in a metagenomic library of 9320 clones by PCR amplification with degenerate primers for a conserved gene region. Among three clones found, one was sequenced by subcloning and shotgun strategy, resulting in a consensus of 22,988 base pairs. It was made the prediction of functional homology ORFs by Blast (NCBI) and also identifying areas for enzymatic Prodom and PFAM. Among them were found homologous to: ABC transporters; minimal PKS, cyclasea; Aromatasea; Hydroxylases; Mono-oxygenases; O-methyl-transferases; Multicopper oxidase/laccase, β-glucosidase, chitinase/ Cellulases; Peptidases; Acyl-transferases, in addition of gene regulators similar to LacI and LuxR. The biosynthetic enzymes candidates for the core of the cluster (minimal pks) underwent three-dimensional structure modeling in silico. The 3D models were evaluated for accurate, using the tools of 'Assessing Verify3D, Qmean, Procheck, Rampage and Swiss-Model. Once validated, the KSA and CLF were subjected to simulated docking enzyme between them
|
10 |
Desenvolvimento de workflows científicos para a geração e análise de diferentes redes de interatomasNotari, Daniel Luís 12 December 2012 (has links)
Workflows científicos são projetados para realizar experimentos in silico com o
intuito de processar e analisar uma grande quantidade de dados usando simulação
computacional. Os experimentos são organizados como uma sequência de etapas que
caracterizam um fluxo de execução, onde em cada etapa utilizam-se diferentes
softwares. Estes softwares não possuem um modelo de representação de dados comum.
Por isto, quando um workflow científico é construído com o objetivo de integrar e
processar dados, cada etapa precisa analisar a estrutura dos dados, processá-los e
preparar os mesmos de acordo com a estrutura necessária para a execução da próxima
etapa do workflow. Desta maneira, os workflows científicos usam diferentes algoritmos
provenientes das áreas da matemática e da ciência da computação, os quais são capazes
de processar, armazenar e transformar os dados utilizados em informação útil para
diferentes análises de pesquisadores de biologia. Adicionalmente, a biologia de sistemas
é uma subárea da bioinformática que ajuda a compreender as interações observadas
entre populações de moléculas, células e organismos resultantes do aumento da
complexidade biológica. Assim, nesta tese de doutorado, buscou-se desenvolver
workflows científicos utilizando-se ferramentas de bioinformática e biologia de sistemas
para comparar processos biológicos através da geração de redes de interação proteínaproteína.
Para tanto, o programa Dis2PPI foi gerado por meio de um workflow científico
que possibilitou integrar os bancos de dados de doenças monogênicas OMIM (Online
Mendelian Inheritance in Man) com o programa de metabuscas STRING (Search Tool
for the Retrieval of Interacting Genes/Proteins). O objetivo desta integração foi gerar
uma rede de interação proteína-proteína associada com doenças de natureza
monogênica. Como prova de conceito, o programa Dis2PPI foi utilizado para a
obtenção de redes de interação para as síndromes xeroderma pigmentosa e de Cockayne, duas doenças monogênicas raras e cujos fenótipos estão associados com
acúmulos de danos de DNA, câncer, progeria e neurodegeneração. Uma vez geradas,
estas redes foram avaliadas com o uso ferramentas de biologia de sistemas para análise
de ontologia gênica e de centralidade no programa Cytoscape. Da mesma forma, o
programa Net2Homology foi gerado através de um desenho de um workflow científico
que possibilitasse integrar o resultado de um alinhamento de sequências de proteínas,
usando o programa NCBI PSI-BLAST, com o programa de metabuscas STRING. Neste
sentido, o programa Net2Homology possibilitou recuperar duas redes de interação
proteína-proteína associada a dois organismos diferentes. Este mesmo programa foi
utilizado para a obtenção de redes de interação para a doença xeroderma pigmentosa e
para a enzima ciclo-oxigenase-1 cruzando as informações dos organismos Homo
sapiens e Mus musculus. As redes de interação obtidas foram comparadas visando obter
os processos biológicos evolutivamente conservados. / Submitted by Marcelo Teixeira (mvteixeira@ucs.br) on 2014-06-17T12:38:59Z
No. of bitstreams: 1
Tese Daniel Luis Notari.pdf: 7846140 bytes, checksum: ebfd645042f867b8840d5ab9083411bc (MD5) / Made available in DSpace on 2014-06-17T12:38:59Z (GMT). No. of bitstreams: 1
Tese Daniel Luis Notari.pdf: 7846140 bytes, checksum: ebfd645042f867b8840d5ab9083411bc (MD5) / Scientific workflows can be used to design in silico experiments to process and
analyse a great amount of data using computational simulation. In this sense, all in
silico experiments are organized as a sequence of steps that characterize an execution
flow, where each steps employ different softwares. It is important to note that these
softwares do not employ a common structure or model to represent data. Thus, taking
into account the diversity of softwares and data representation, a scientific workflow
should be built to integrate and process data, where each step must be able to analyse
the data structure, to process these data and finally generate a new data structure that
provide the requirements needed to execute the next step of the workflow. It is
important to note that scientific workflows use mathematics and computer sciences
methods capable to process, storage, and transform these data into useful information.
In addition, a subarea of Bioinformatics termed Systems biology helps to understand the
interactions observed between populations of molecules, cells and organisms as the
result of the increase of biological complexity. Thus, the purpose of this work was to
develop scientific workflows using bioinformatics and system biology softwares with
the purpose to compare different biological processes from the generation of proteinprotein
interaction (PPI) networks. In this sense, the Dis2PPI software was design as a
scientific workflow to integrate OMIM (Online Mendelian Inheritance in Man)
database with metasearch program STRING (Search Tool for the Retrieval of
Interacting Genes/Proteins) in order to retrieve protein-protein interaction networks
associated to monogenic diseases. The Dis2PPI was used to generate PPI networks for
xeroderma pigmentosum and cockayne syndromes, two rare monogenic diseases
associated with DNA damage, cancer, progeria, and neurodegeneration. The PPI
networks generated were analyzed with Cytoscape program and specific plugins that evaluate gene ontologies and centrality analysis. By its turn, Net2Homology program
was designed as a scientific workflow to integrate NCBI PSI-BLAST sequence
alignments with STRING metasearch program to recovery PPI networks associate with
two different species. In this sense, Net2Homology was used to obtain PPI network for
xeroderma pigmentosum disease and cyclooxigenase-1 enzyme by crossing Homo
sapiens and Mus musculus information. A comparison between these networks was
realized to verify the major evolutively conserved biological process.
|
Page generated in 0.0732 seconds