Global ETD Search

1	Coeficientes de determinação, predição intrinsicamente multivariada e genética / Coefficient of determination, intrinsically multivariate and genetic prediction Higa, Carlos Henrique Aguena 21 December 2006 (has links) Esta dissertação de mestrado tem como finalidade descrever o trabalho realizado em uma pesquisa que envolve a análise de expressões gênicas provenientes de microarrays com o objetivo de encontrar genes importantes em um organismo ou em uma determinada doença, como o câncer. Acreditamos que a descoberta desses genes, que chamamos aqui de genes de predição intrinsicamente multivariada (genes IMP), possa levar a descobertas de importantes processos biológicos ainda não conhecidos na literatura. A busca por genes IMP foi realizada em conjunto com estudos de modelos e conceitos matemáticos e estatísticos como redes Booleanas, cadeias de Markov, Coeficiente de Determinação (CoD), Classificação em análise de expressões gênicas e métodos de estimação de erro. No modelo de redes Booleanas, introduzido na Biologia por Kauffman, as expressões gênicas são quantizadas em apenas dois níveis: \"ligado\'\' ou \"desligado\'\'. O nível de expressão (estado) de cada gene, está relacionado com o estado de alguns outros genes através de uma função lógica. Adicionando uma perturbação aleatória a este modelo, temos um modelo mais geral conhecido como redes Booleanas com perturbação. O sistema dinâmico representado pela rede é uma cadeia de Markov ergódica e existe então uma distribuição de probabilidade estacionária. Temos a hipótese de que os experimentos de microarray seguem esta distribuição estacionária. O CoD é uma medida normalizada de quanto a expressão de um gene alvo pode ser melhor predita observando-se a expressão de um conjunto de genes preditores. Uma determinada configuração de CoDs caracteriza um gene alvo como sendo um gene IMP. Podemos trabalhar não somente com genes alvo, mas também com fenótipos alvo, onde o fenótipo de um sistema biológico poderia ser representado por uma variável aleatória binária. Por exemplo, podemos estar interessados em saber quais genes estão relacionados ao fenótipo de vida/morte de uma célula. Como a distribuição de probabilidade das amostras de microarray é desconhecida, o estudo dos CoDs é feito através de estimativas. Entre os métodos de estimação de erro estudados para este propósito podemos citar: Holdout, Resubstituição, Cross-validation, Bootstrap e .632 Bootstrap. Os métodos foram implementados para calcular os CoDs, permitindo então a busca por genes IMP. Os programas implementados na pesquisa foram usados em conjunto com uma pesquisa realizada pelo Prof. Dr. Hugo A. Armelin do Instituto de Química da USP. Este estudo em particular envolve a busca de genes importantes relacionados à morte de células tumorigênicas de camundongo disparada por FGF2 (Fibroblast Growth Factor 2). Nesta pesquisa observamos sub-redes de genes envolvidos no processo biológico em questão e também encontramos genes que podem estar relacionados ao fenômeno de morte das células de camundongo ou que estão, de fato, participando de alguma via disparada pelo FGF2. Esta abordagem de análise de expressões gênicas, juntamente com a pesquisa realizada pelo Prof. Armelin, resulta em uma metodologia para buscas de genes envolvidos em novos mecanismos de células tumorigênicas, ativados pelo FGF2. Na realidade esta metodologia pode ser aplicada em qualquer processo biológico de interesse científico, desde que seja possível modelar o problema proposto no contexto de redes Booleanas, coeficientes de determinação e genes IMP. / This Master\'s degree dissertation describes a research that involves an analysis of gene expression data from microarray experiments with the purpose to find important genes in certain organisms or diseases such as cancer. We believe that these type of genes, called intrinsically multivariately predictive genes (IMP genes), can lead to the discovery of important biological process that are unknown in the literature. The search for IMP genes was done with the study of mathematical and statistical models such as Boolean Networks, Markov Chains, Coefficient of Determination (CoD), Classification and Error Estimation Methods. In the Boolean network model, introduced in Biology by Kauffman, the gene expression is quantized in only two levels: ON and OFF. The expression level (state) of each gene is related with the state of some other genes through a logical function. Adding a random perturbation to this model, we have a more general Boolean-type model called Boolean network with perturbation. The dynamical system represented by this network is an ergodic Markov chain and thereby it possesses a steady-state distribution. We have the hypothesis that the microarray experiments follow this steady-state distribution. The CoD is a normalized measure of how much a gene expression of a target gene can be better predicted observing the expression of a set of predictor genes. A certain configuration of CoDs characterizes a target gene as an IMP gene. We can deal not only with target genes, but also with target phenotypes, where the phenotype of a biological system could be represented by a binary random variable. For example, we could be interested in knowing which genes are related to a life/death cell phenotype. Since the joint probability distribution of the gene expressions is unknown, the CoDs must be computed through estimated values. Among the error estimation methods studied we can cite: Holdout, Resubstitution, Cross-validation, Bootstrap and .632 Bootstrap. Those methods were implemented as a software in order to compute the CoDs and thereby allowing us to search for IMP genes. The software we implemented in this research was used within a research developed by Professor Dr. Hugo A. Armelin from the Instituto de Química - University of Sao Paulo. This particular research involves the search for important genes related to the death of tumorigenic mouse cells triggered by FGF2 (Fibroblast Growth Factor 2). From this research cooperation, we built some gene subnetworks involved in the target biological process and we found some genes that could be related to the death phenotype of mouse cells. This approach of gene expression analysis, together with the research developed by Professor Armelin, results in a methodology to search for important genes that could be involved in new mechanisms of tumorigenic cells triggered by FGF2. Actually, this methodology can be applied to any biological process of scientific interest, if one can model the proposed problem in the context of Boolean Networks, Coefficient of Determination and IMP genes. Coefficient of determination Coeficientes de determinação gene regulatory networks microarray microarray redes de regulação gênica
2	Coeficientes de determinação, predição intrinsicamente multivariada e genética / Coefficient of determination, intrinsically multivariate and genetic prediction Carlos Henrique Aguena Higa 21 December 2006 (has links) Esta dissertação de mestrado tem como finalidade descrever o trabalho realizado em uma pesquisa que envolve a análise de expressões gênicas provenientes de microarrays com o objetivo de encontrar genes importantes em um organismo ou em uma determinada doença, como o câncer. Acreditamos que a descoberta desses genes, que chamamos aqui de genes de predição intrinsicamente multivariada (genes IMP), possa levar a descobertas de importantes processos biológicos ainda não conhecidos na literatura. A busca por genes IMP foi realizada em conjunto com estudos de modelos e conceitos matemáticos e estatísticos como redes Booleanas, cadeias de Markov, Coeficiente de Determinação (CoD), Classificação em análise de expressões gênicas e métodos de estimação de erro. No modelo de redes Booleanas, introduzido na Biologia por Kauffman, as expressões gênicas são quantizadas em apenas dois níveis: \"ligado\'\' ou \"desligado\'\'. O nível de expressão (estado) de cada gene, está relacionado com o estado de alguns outros genes através de uma função lógica. Adicionando uma perturbação aleatória a este modelo, temos um modelo mais geral conhecido como redes Booleanas com perturbação. O sistema dinâmico representado pela rede é uma cadeia de Markov ergódica e existe então uma distribuição de probabilidade estacionária. Temos a hipótese de que os experimentos de microarray seguem esta distribuição estacionária. O CoD é uma medida normalizada de quanto a expressão de um gene alvo pode ser melhor predita observando-se a expressão de um conjunto de genes preditores. Uma determinada configuração de CoDs caracteriza um gene alvo como sendo um gene IMP. Podemos trabalhar não somente com genes alvo, mas também com fenótipos alvo, onde o fenótipo de um sistema biológico poderia ser representado por uma variável aleatória binária. Por exemplo, podemos estar interessados em saber quais genes estão relacionados ao fenótipo de vida/morte de uma célula. Como a distribuição de probabilidade das amostras de microarray é desconhecida, o estudo dos CoDs é feito através de estimativas. Entre os métodos de estimação de erro estudados para este propósito podemos citar: Holdout, Resubstituição, Cross-validation, Bootstrap e .632 Bootstrap. Os métodos foram implementados para calcular os CoDs, permitindo então a busca por genes IMP. Os programas implementados na pesquisa foram usados em conjunto com uma pesquisa realizada pelo Prof. Dr. Hugo A. Armelin do Instituto de Química da USP. Este estudo em particular envolve a busca de genes importantes relacionados à morte de células tumorigênicas de camundongo disparada por FGF2 (Fibroblast Growth Factor 2). Nesta pesquisa observamos sub-redes de genes envolvidos no processo biológico em questão e também encontramos genes que podem estar relacionados ao fenômeno de morte das células de camundongo ou que estão, de fato, participando de alguma via disparada pelo FGF2. Esta abordagem de análise de expressões gênicas, juntamente com a pesquisa realizada pelo Prof. Armelin, resulta em uma metodologia para buscas de genes envolvidos em novos mecanismos de células tumorigênicas, ativados pelo FGF2. Na realidade esta metodologia pode ser aplicada em qualquer processo biológico de interesse científico, desde que seja possível modelar o problema proposto no contexto de redes Booleanas, coeficientes de determinação e genes IMP. / This Master\'s degree dissertation describes a research that involves an analysis of gene expression data from microarray experiments with the purpose to find important genes in certain organisms or diseases such as cancer. We believe that these type of genes, called intrinsically multivariately predictive genes (IMP genes), can lead to the discovery of important biological process that are unknown in the literature. The search for IMP genes was done with the study of mathematical and statistical models such as Boolean Networks, Markov Chains, Coefficient of Determination (CoD), Classification and Error Estimation Methods. In the Boolean network model, introduced in Biology by Kauffman, the gene expression is quantized in only two levels: ON and OFF. The expression level (state) of each gene is related with the state of some other genes through a logical function. Adding a random perturbation to this model, we have a more general Boolean-type model called Boolean network with perturbation. The dynamical system represented by this network is an ergodic Markov chain and thereby it possesses a steady-state distribution. We have the hypothesis that the microarray experiments follow this steady-state distribution. The CoD is a normalized measure of how much a gene expression of a target gene can be better predicted observing the expression of a set of predictor genes. A certain configuration of CoDs characterizes a target gene as an IMP gene. We can deal not only with target genes, but also with target phenotypes, where the phenotype of a biological system could be represented by a binary random variable. For example, we could be interested in knowing which genes are related to a life/death cell phenotype. Since the joint probability distribution of the gene expressions is unknown, the CoDs must be computed through estimated values. Among the error estimation methods studied we can cite: Holdout, Resubstitution, Cross-validation, Bootstrap and .632 Bootstrap. Those methods were implemented as a software in order to compute the CoDs and thereby allowing us to search for IMP genes. The software we implemented in this research was used within a research developed by Professor Dr. Hugo A. Armelin from the Instituto de Química - University of Sao Paulo. This particular research involves the search for important genes related to the death of tumorigenic mouse cells triggered by FGF2 (Fibroblast Growth Factor 2). From this research cooperation, we built some gene subnetworks involved in the target biological process and we found some genes that could be related to the death phenotype of mouse cells. This approach of gene expression analysis, together with the research developed by Professor Armelin, results in a methodology to search for important genes that could be involved in new mechanisms of tumorigenic cells triggered by FGF2. Actually, this methodology can be applied to any biological process of scientific interest, if one can model the proposed problem in the context of Boolean Networks, Coefficient of Determination and IMP genes. Coeficientes de determinação microarray redes de regulação gênica Coefficient of determination gene regulatory networks microarray
3	Avaliação de métodos de inferência de redes de regulação gênica. / Evaluation of gene regulatory networks inference methods. Fachini, Alan Rafael 17 October 2016 (has links) A representação do Sistema de Regulação Gênica por meio de uma Rede de Regulação Gênica (GRN) pode facilitar a compreensão dos processos biológicos no nível molecular, auxiliando no entendimento do comportamento dos genes, a descoberta da causa de doenças e o desenvolvimento de novas drogas. Através das GRNs pode-se avaliar quais genes estão ativos e quais são suas influências no sistema. Nos últimos anos, vários métodos computacionais foram desenvolvidos para realizar a inferência de redes a partir de dados de expressão gênica. Esta pesquisa apresenta uma análise comparativa de métodos de inferência de GRNs, realizando uma revisão do modelo experimental descrito na literatura atual aplicados a conjuntos de dados contendo poucas amostras. Apresenta também o uso comitês de especialistas (ensemble) para agregar o resultado dos métodos a fim de melhorar a qualidade da inferência. Como resultado obteve-se que o uso de poucas amostras de dados (abaixo de 50) não fornecem resultados interessantes para a inferência de redes. Demonstrou-se também que o uso de comitês de especialistas melhoram os resultados de inferência. Os resultados desta pesquisa podem auxiliar em pesquisas futuras baseadas em GRNs. / The representation of the gene regulation system by means of a Gene Regulatory Network (GRN) can help the understanding of biological processes at the molecular level, elucidating the behavior of genes and leading to the discovery of disease causes and the development of new drugs. GRNs allow to evaluate which genes are active and how they influence the system. In recent years, many computational methods have been developed for networks inference from gene expression data. This study presents a comparative analysis of GRN inference methods, reviewing the experimental modeling present in the state-of-art scientific publications applied to datasets with small data samples. The use of ensembles was proposed to improve the quality of the network inference. As results, we show that the use of small data samples (less than 50 samples) do not show a good result in the network inference problem. We also show that the use of ensemble improve the network inference. Bioinformática Bioinformatics Comitês de Especialistas Ensemble Gene Regulatory Networks Machine learning Network Inference Redes de Regulação Gênica
4	Dinâmica da Fermentação Alcóolica: Aplicação de Redes Booleanas na Dinâmica de Expressão Gênica em Linhagens de Saccharomyces Cerevisiae durante o Processo Fermentativo / Dynamics of alcoholic fermentation: application of Boolean networks in the dynamics of gene expression in Saccharomyces cerevisiae strains during fermentation process Noronha, Melline Fontes 17 October 2012 (has links) Na busca por soluções que maximizem a produção de etanol, o melhoramento genético de diferentes linhagens de levedura tornou-se foco de investigação em diversos centros de pesquisa. Com o recente sequenciamento de uma linhagem selvagem utilizada nas usinas sucroalcooleiras brasileiras, a linhagem PE-2 da espécie Saccharomyces cerevisiae, surgiu o interesse em estudar sua dinâmica durante o processo de fermentação a fim de encontrar aspectos que possam explicar como estas se tornaram mais adaptadas às dornas de fermentação mantendo a alta produtividade de bioetanol. A partir da análise transcricional da linhagem PE-2, Buscamos por métodos de inferência de redes que possam representar a dinâmica dessa levedura. Propomos nesse trabalho a modelagem de dados experimentais temporais das linhagens PE-2 e S288c (utilizada como referência) baseado em um modelo de Redes Booleanas. Trata-se de um modelo onde convertemos dados contínuos em dados discretos (0 or 1) no qual, de acordo com restrições ditadas pelo modelo, são inferidas redes que representem interações gênicas ao longo do tempo baseados nas amostras temporais. Conseguimos modelar, com sucesso, algumas redes utilizando conjuntos com 11 e 12 genes relacionados a genes pertencentes à via da glicólise e fermentação da levedura. / Ethanol production improvements give rise to the breeding of yeast strains, that became the investigation focus in several research centers. Recently, a wild strain used in Brazilian sugarcane industry was sequenced, the PE-2 strain of Saccharomyces cerevisiae, and this event brought an interest in studying the dynamics of the fermentation of this strain in order to understand which aspects this strain become more adapted to the fermentation conditions, maintaining a high capacity to produce bioethanol. From the analysis of transcriptional strain PE-2, we seek for inference networks methods that can represent the dynamics of this yeast.In this work, we model an experimental temporal data of strain PE-2 and strain S288c (used as a reference) based on Boolean networks model. In this model, the data are converted from continuous into discrete data (0 or 1) and, based on constraints rules of Boolean Network model, networks are inferred to represent gene interactions over time based on temporal data. We successfully model networks using a set with 11 and 12 genes related to yeast glycolysis and fermentation pathways. bioetanol bioethanol levedura linhagem PE-2 modelo booleano. PE-2 strain redes de regulação gênica yeast
5	Avaliação de métodos de inferência de redes de regulação gênica. / Evaluation of gene regulatory networks inference methods. Alan Rafael Fachini 17 October 2016 (has links) A representação do Sistema de Regulação Gênica por meio de uma Rede de Regulação Gênica (GRN) pode facilitar a compreensão dos processos biológicos no nível molecular, auxiliando no entendimento do comportamento dos genes, a descoberta da causa de doenças e o desenvolvimento de novas drogas. Através das GRNs pode-se avaliar quais genes estão ativos e quais são suas influências no sistema. Nos últimos anos, vários métodos computacionais foram desenvolvidos para realizar a inferência de redes a partir de dados de expressão gênica. Esta pesquisa apresenta uma análise comparativa de métodos de inferência de GRNs, realizando uma revisão do modelo experimental descrito na literatura atual aplicados a conjuntos de dados contendo poucas amostras. Apresenta também o uso comitês de especialistas (ensemble) para agregar o resultado dos métodos a fim de melhorar a qualidade da inferência. Como resultado obteve-se que o uso de poucas amostras de dados (abaixo de 50) não fornecem resultados interessantes para a inferência de redes. Demonstrou-se também que o uso de comitês de especialistas melhoram os resultados de inferência. Os resultados desta pesquisa podem auxiliar em pesquisas futuras baseadas em GRNs. / The representation of the gene regulation system by means of a Gene Regulatory Network (GRN) can help the understanding of biological processes at the molecular level, elucidating the behavior of genes and leading to the discovery of disease causes and the development of new drugs. GRNs allow to evaluate which genes are active and how they influence the system. In recent years, many computational methods have been developed for networks inference from gene expression data. This study presents a comparative analysis of GRN inference methods, reviewing the experimental modeling present in the state-of-art scientific publications applied to datasets with small data samples. The use of ensembles was proposed to improve the quality of the network inference. As results, we show that the use of small data samples (less than 50 samples) do not show a good result in the network inference problem. We also show that the use of ensemble improve the network inference. Bioinformática Comitês de Especialistas Redes de Regulação Gênica Bioinformatics Ensemble Gene Regulatory Networks Machine learning Network Inference
6	Dinâmica da Fermentação Alcóolica: Aplicação de Redes Booleanas na Dinâmica de Expressão Gênica em Linhagens de Saccharomyces Cerevisiae durante o Processo Fermentativo / Dynamics of alcoholic fermentation: application of Boolean networks in the dynamics of gene expression in Saccharomyces cerevisiae strains during fermentation process Melline Fontes Noronha 17 October 2012 (has links) Na busca por soluções que maximizem a produção de etanol, o melhoramento genético de diferentes linhagens de levedura tornou-se foco de investigação em diversos centros de pesquisa. Com o recente sequenciamento de uma linhagem selvagem utilizada nas usinas sucroalcooleiras brasileiras, a linhagem PE-2 da espécie Saccharomyces cerevisiae, surgiu o interesse em estudar sua dinâmica durante o processo de fermentação a fim de encontrar aspectos que possam explicar como estas se tornaram mais adaptadas às dornas de fermentação mantendo a alta produtividade de bioetanol. A partir da análise transcricional da linhagem PE-2, Buscamos por métodos de inferência de redes que possam representar a dinâmica dessa levedura. Propomos nesse trabalho a modelagem de dados experimentais temporais das linhagens PE-2 e S288c (utilizada como referência) baseado em um modelo de Redes Booleanas. Trata-se de um modelo onde convertemos dados contínuos em dados discretos (0 or 1) no qual, de acordo com restrições ditadas pelo modelo, são inferidas redes que representem interações gênicas ao longo do tempo baseados nas amostras temporais. Conseguimos modelar, com sucesso, algumas redes utilizando conjuntos com 11 e 12 genes relacionados a genes pertencentes à via da glicólise e fermentação da levedura. / Ethanol production improvements give rise to the breeding of yeast strains, that became the investigation focus in several research centers. Recently, a wild strain used in Brazilian sugarcane industry was sequenced, the PE-2 strain of Saccharomyces cerevisiae, and this event brought an interest in studying the dynamics of the fermentation of this strain in order to understand which aspects this strain become more adapted to the fermentation conditions, maintaining a high capacity to produce bioethanol. From the analysis of transcriptional strain PE-2, we seek for inference networks methods that can represent the dynamics of this yeast.In this work, we model an experimental temporal data of strain PE-2 and strain S288c (used as a reference) based on Boolean networks model. In this model, the data are converted from continuous into discrete data (0 or 1) and, based on constraints rules of Boolean Network model, networks are inferred to represent gene interactions over time based on temporal data. We successfully model networks using a set with 11 and 12 genes related to yeast glycolysis and fermentation pathways. bioetanol levedura linhagem PE-2 modelo booleano. redes de regulação gênica bioethanol PE-2 strain yeast
7	Halobacterium salinarum NRC-1: rede de regulação gênica e sua análise probabilística / Halobacterium salinarum NRC-1: genetic regulatory network and it\'s probabilistic analysis. Crocetti, Guilherme Martins 08 May 2018 (has links) Este trabalho teve como objetivo principal modelar a Rede de Regulação Gênica do organismo modelo Halobacterium salinarum NRC-1, estabelecendo interações entre as entidades da rede por intermédio de experimentos inéditos de interação física: ChIP- , RIP- e dRNA-seq. Em contraponto com as abordagens clássicas de construção de redes, que estimam interações através de medições de expressão gênica, este trabalho as estabeleceu exclusivamente de interações físicas, permitindo que a estrutura final seja uma representação mais fiel ao fenômeno físico de regulação gênica, baseando-se nos fundamentos da Biologia Sistêmica. Em vista da abundância de dados públicos de expressão gênica para o organismo e do objetivo primário, um objetivo secundário foi traçado: identificar, computacionalmente, genes de fato controlados pelas interações fornecidas pela nova rede. Para isso, a estrutura estabelecida foi transformada numa Rede Bayesiana, e a identificação de genes foi efetuada através da análise de suas Tabelas de Probabilidade Condicionais. Finalmente, como os resultados obtidos para o objetivo secundário foram desfavoráveis a utilização de Redes Bayesianas, os resultados efetivos deste trabalho foram a criação de uma nova Rede de Regulação Gênica para a H. salinarum e uma análise em torno da efetividade de Redes Bayesianas neste contexto. / The main goal of this work was modeling the gene regulatory network of the model organism Halobacterium salinarum NRC-1, establishing new interactions between networks entities through unpublished physical interaction experiments: ChIP-, RIP- e dRNA-seq. Instead of using classical approaches to build network structures that estimates interactions using gene expression data, this work established them exclusively from physical interactions. Therefore, the final structure is a more reliable representation of the physical phenomenon of gene expression, built using the principles of systems biology. Considering the amount of public available gene expression data and the primary goal, another objective was proposed: a computational analysis to detect genes actually controlled by the interactions of the new network. To achieve this goal the established network was transformed in a Bayesian network, detecting genes through the analysis of their conditional probability tables. Lastly, as the results of the secondary goal went against the use of Bayesian networks, the effective results of this thesis were the creation of a new genetic regulatory network for H. salinarum and an analysis around Bayesian networks in this context. Bayesian networks Bioinformática Genetic regulatory networks Halobacterium salinarum Halobacterium salinarum NRC-1 Redes bayesianas Redes de regulação gênica Systems biology
8	Halobacterium salinarum NRC-1: rede de regulação gênica e sua análise probabilística / Halobacterium salinarum NRC-1: genetic regulatory network and it\'s probabilistic analysis. Guilherme Martins Crocetti 08 May 2018 (has links) Este trabalho teve como objetivo principal modelar a Rede de Regulação Gênica do organismo modelo Halobacterium salinarum NRC-1, estabelecendo interações entre as entidades da rede por intermédio de experimentos inéditos de interação física: ChIP- , RIP- e dRNA-seq. Em contraponto com as abordagens clássicas de construção de redes, que estimam interações através de medições de expressão gênica, este trabalho as estabeleceu exclusivamente de interações físicas, permitindo que a estrutura final seja uma representação mais fiel ao fenômeno físico de regulação gênica, baseando-se nos fundamentos da Biologia Sistêmica. Em vista da abundância de dados públicos de expressão gênica para o organismo e do objetivo primário, um objetivo secundário foi traçado: identificar, computacionalmente, genes de fato controlados pelas interações fornecidas pela nova rede. Para isso, a estrutura estabelecida foi transformada numa Rede Bayesiana, e a identificação de genes foi efetuada através da análise de suas Tabelas de Probabilidade Condicionais. Finalmente, como os resultados obtidos para o objetivo secundário foram desfavoráveis a utilização de Redes Bayesianas, os resultados efetivos deste trabalho foram a criação de uma nova Rede de Regulação Gênica para a H. salinarum e uma análise em torno da efetividade de Redes Bayesianas neste contexto. / The main goal of this work was modeling the gene regulatory network of the model organism Halobacterium salinarum NRC-1, establishing new interactions between networks entities through unpublished physical interaction experiments: ChIP-, RIP- e dRNA-seq. Instead of using classical approaches to build network structures that estimates interactions using gene expression data, this work established them exclusively from physical interactions. Therefore, the final structure is a more reliable representation of the physical phenomenon of gene expression, built using the principles of systems biology. Considering the amount of public available gene expression data and the primary goal, another objective was proposed: a computational analysis to detect genes actually controlled by the interactions of the new network. To achieve this goal the established network was transformed in a Bayesian network, detecting genes through the analysis of their conditional probability tables. Lastly, as the results of the secondary goal went against the use of Bayesian networks, the effective results of this thesis were the creation of a new genetic regulatory network for H. salinarum and an analysis around Bayesian networks in this context. Bioinformática Halobacterium salinarum Redes bayesianas Redes de regulação gênica Bayesian networks Genetic regulatory networks Halobacterium salinarum NRC-1 Systems biology
9	Modelagem do controle gênico do ciclo celular por redes genéticas probabilísticas. / Cell-Cycle Genetic Control Modeling by Probabilistic Genetic Networks Trepode, Nestor Walter 27 June 2007 (has links) O ciclo de divisão celular compreende uma seqüência de fenômenos controlados por una complexa rede de regulação gênica muito estável e robusta. Aplicamos as Redes Genéticas Probabilísticas (PGNs) para construir um modelo cuja dinâmica e robustez se assemelham às observadas no ciclo celular biológico. A estrutura de nosso modelo PGN foi inspirada em fatos biológicos bem estabelecidos tais como a existência de subsistemas integradores, realimentação negativa e positiva e caminhos de sinalização redundantes. Nosso modelo representa as interações entre genes como processos estocásticos e apresenta uma forte robustez na presença de ruido e variações moderadas dos parâmetros. Um modelo determinístico recentemente publicado do ciclo celular da levedura não resiste a condições de ruido que nosso modelo suporta bem. A adição de mecanismos de auto excitação, permite a nosso modelo apresentar uma atividade oscilatória similar à observada no ciclo celular embrionário. Nossa abordagem de modelar e simular o comportamento observado usando mecanismos de controle biológico conhecidos fornece hipóteses plausíveis de como a regulação subjacente pode ser realizada na célula. A pesquisa atualmente em curso procura identificar tais mecanismos de regulação no ciclo celular da levedura, usando dados de expressão gênica provenientes de medições seqüenciais de microarray. / The cell division cycle comprises a sequence of phenomena controlled by a stable and robust genetic network. We applied a Probabilistic Genetic Network (PGN) to construct an hypothetical model with dynamical behaviour and robustness typical of the biological cell-cycle. The structure of our PGN model was inspired in well established biological facts such as the existence of integrator subsystems, negative and positive feedback loops and redundant signaling pathways. Our model represents genes\' interactions as stochastic processes and presents strong robustness in the presence of moderate noise and parameters fluctuations. A recently published deterministic yeast cell-cycle model collapses upon noise conditions that our PGN model supports well. In addition, self stimulatory mechanisms can give our PGN model the possibility of having a pacemaker activity similar to the observed in the oscillatory embryonic cell cycle. Our approach of modeling and simulating the observed behavior by known biological control mechanisms provides plausible hypotheses of how the underlying regulation may be performed in the cell. The ongoing research is lead to identify such regulation mechanisms in the yeast cell-cycle from time-series microarray gene expression data. cell-cycle control controle do ciclo celular dinamical system gene regulation networks modelagem modeling probabilistic genetic networks redes de regulação gênica redes genéticas probabilísticas simulação simulation sistema dinâmico
10	Inferência de redes de regulação gênica utilizando o paradigma de crescimento de sementes / Inference of gene regulatory networks using the seed growing paradigm Higa, Carlos Henrique Aguena 17 February 2012 (has links) Um problema importante na área de Biologia Sistêmica é o de inferência de redes de regulação gênica. Os avanços científicos e tecnológicos nos permitem analisar a expressão gênica de milhares de genes simultaneamente. Por \"expressão gênica\'\', estamos nos referindo ao nível de mRNA dentro de uma célula. Devido a esta grande quantidade de dados, métodos matemáticos, estatísticos e computacionais têm sido desenvolvidos com o objetivo de elucidar os mecanismos de regulação gênica presentes nos organismos vivos. Para isso, modelos matemáticos de redes de regulação gênica têm sido propostos, assim como algoritmos para inferir estas redes. Neste trabalho, focamos nestes dois aspectos: modelagem e inferência. Com relação à modelagem, estudamos modelos existentes para o ciclo celular da levedura (Saccharomyces cerevisiae). Após este estudo, propomos um modelo baseado em redes Booleanas probabilísticas sensíveis ao contexto, e em seguida, um aprimoramento deste modelo, utilizando cadeias de Markov não homogêneas. Mostramos os resultados, comparando os nossos modelos com os modelos estudados. Com relação à inferência, propomos um novo algoritmo utilizando o paradigma de crescimento de semente de genes. Neste contexto, uma semente é um pequeno subconjunto de genes de interesse. Nosso algoritmo é baseado em dois passos: passo de crescimento de semente e passo de amostragem. No primeiro passo, o algoritmo adiciona outros genes à esta semente, seguindo algum critério. No segundo, o algoritmo realiza uma amostragem de redes, definindo como saída um conjunto de redes potencialmente interessantes. Aplicamos o algoritmo em dados artificiais e dados biológicos de células HeLa, mostrando resultados satisfatórios. / A key problem in Systems Biology is the inference of gene regulatory networks. The scientific and technological advancement allow us to analyze the gene expression of thousands of genes, simultaneously. By \"gene expression\'\' we refer to the mRNA concentration level inside a cell. Due to this large amount of data, mathematical, statistical and computational methods have been developed in order to elucidate the gene regulatory mechanisms that take part of every living organism. To this end, mathematical models of gene regulatory networks have been proposed, along with algorithms to infer these networks. In this work, we focus in two aspects: modeling and inference. Regarding the modeling, we studied existing models for the yeast (Saccharomyces cerevisiae) cell cycle. After that, we proposed a model based on context sensitive probabilistic Boolean networks, and then, an improvement of this model, using nonhomogeneous Markov chain. We show the results, comparing our models against the studied models. Regarding the inference, we proposed a new algorithm using the seed growing paradigm. In this context, a seed is a small subset of genes. Our algorithm is based in two main steps: seed growing step and sampling step. In the first step, the algorithm adds genes into the seed, according to some criterion. In the second step, the algorithm performs a sampling process on the space of networks, defining as its output a set of potentially interesting networks. We applied the algorithm on artificial and biological HeLa cells data, showing satisfactory results. Boolean networks cadeia de Markov constraint satisfaction problems feature selection gene regulatory networks inference inferência de redes Markov chain redes Booleanas redes de regulação gênica seleção de características

Search results