1 |
Interações gênicas usando redes booleanas limiarizadas modeladas como um problema de satisfação de restrições / Gene interactions using thresholded boolean networks modeled as a constraint satsfaction problemAndrade, Tales Pinheiro de 03 April 2012 (has links)
As reações químicas que resultam da expressão de genes são complexas e ainda não são total- mente compreendidas. Sabe-se que os genes enviam, recebem, e processam informações formando uma complexa rede de comunicação, mas a arquitetura e dinâmica destas redes não são totalmente conhecidas. Dessa forma, um problema importante é determinar como os genes se relacionam dentro da célula. Esse processo de determinar o relacionamento entre os genes é conhecido como inferência de redes gênicas. Uma das formas para representar o relacionamento entre os genes é usar modelos matemáticos e computacionais de Redes Gênicas. Em especial, um dos modelos de grande interesse é o de Redes Booleanas (BN - do inglês Boolean Networks), no qual os genes podem assumir dois estados, ativo ou inativo, se estão, respectivamente, expressos ou não. Estes estados podem variar ao longo do tempo, dependendo de como os genes se relacionam. Nosso interesse está em estudar um caso particular deste modelo, conhecido como Redes Booleanas Limiarizadas, onde apenas uma classe de funções booleanas é utilizada para construir as BNs. Para inferir as Redes Booleanas Limiarizadas, usamos um algoritmo constituído de dois passos. Primeiro, usamos o arcabouço do Problema de Satisfação de Restrições (CSP - do inglês Constraint Satisfaction Problem) para inferir conjuntos de soluções consistentes com uma dada série temporal de um conjunto de genes. Em seguida analisamos o comportamento dinâmico das soluções encon- tradas , filtrando conjuntos de soluções de maior interesse para testes práticos em laboratório. Usando o arcabouço do CSP, construímos um solver, usando a biblioteca Gecode,1 para inferência de redes consistentes, usando como entrada uma série temporal oriunda de dados de microarrays. Em seguida, através da simulação da dinâmica de uma amostra das redes encontradas no passo anterior, fomos capazes de determinar algumas restrições interessantes para filtrar o conjunto de redes. Aplicamos o nosso método para três conjuntos de dados: dois artificiais, e para validação, usamos uma série temporal de uma rede artificial conhecida na literatura. Com isso fomos capazes de inferir conjuntos de redes gênicas de possível interesse para testes em laboratório. / The chemical reactions that result in gene expression are complex and not yet fully understood. It is known that genes send, receive and process information to form a complex network of com- munication, but the architecture and dynamics of these networks are not fully known. Thus, one major problem is to determine how genes are linked within the cell. This process of determining the relationship between genes is known as inference of genetic networks. One way to represent the relationship between genes is to use mathematical and computer models of genetic networks. In particular, one of the models of great interest are Boolean Networks (BN), in which genes can take two states, active or inactive, if they are, respectively, expressed or not. These states may vary over time, depending on how genes are related. Our interest is in studying a case of this particular model, known as thresholded Boolean networks, where only one class of Boolean functions is used to build the GNs. To infer the thresholded Boolean networks, we use an algorithm that consists of two steps. First, we use the framework of Constraint Satisfaction Problem (CSP) to infer sets of solutions consistent with a time series of a given set of genes. Then analyze the dynamic behavior of the solutions, filtering sets of solutions with interest for practical tests in the laboratory. Using the framework of the CSP, we constructed a solver, using the library Gecode, 2 for in- ference of consistent networks, using as input a time series arising from microarrays data. Then, by simulating the dynamics of a sample of networks found in the previous step, we were able to determine some interesting constraints to filter the set of networks. We apply our method to three datasets: two artificial, and for validation, we use a time series of an artificial network known from literature. Thus we were able to infer genetic networks sets of possible interest for laboratory tests.
|
2 |
Interações gênicas usando redes booleanas limiarizadas modeladas como um problema de satisfação de restrições / Gene interactions using thresholded boolean networks modeled as a constraint satsfaction problemTales Pinheiro de Andrade 03 April 2012 (has links)
As reações químicas que resultam da expressão de genes são complexas e ainda não são total- mente compreendidas. Sabe-se que os genes enviam, recebem, e processam informações formando uma complexa rede de comunicação, mas a arquitetura e dinâmica destas redes não são totalmente conhecidas. Dessa forma, um problema importante é determinar como os genes se relacionam dentro da célula. Esse processo de determinar o relacionamento entre os genes é conhecido como inferência de redes gênicas. Uma das formas para representar o relacionamento entre os genes é usar modelos matemáticos e computacionais de Redes Gênicas. Em especial, um dos modelos de grande interesse é o de Redes Booleanas (BN - do inglês Boolean Networks), no qual os genes podem assumir dois estados, ativo ou inativo, se estão, respectivamente, expressos ou não. Estes estados podem variar ao longo do tempo, dependendo de como os genes se relacionam. Nosso interesse está em estudar um caso particular deste modelo, conhecido como Redes Booleanas Limiarizadas, onde apenas uma classe de funções booleanas é utilizada para construir as BNs. Para inferir as Redes Booleanas Limiarizadas, usamos um algoritmo constituído de dois passos. Primeiro, usamos o arcabouço do Problema de Satisfação de Restrições (CSP - do inglês Constraint Satisfaction Problem) para inferir conjuntos de soluções consistentes com uma dada série temporal de um conjunto de genes. Em seguida analisamos o comportamento dinâmico das soluções encon- tradas , filtrando conjuntos de soluções de maior interesse para testes práticos em laboratório. Usando o arcabouço do CSP, construímos um solver, usando a biblioteca Gecode,1 para inferência de redes consistentes, usando como entrada uma série temporal oriunda de dados de microarrays. Em seguida, através da simulação da dinâmica de uma amostra das redes encontradas no passo anterior, fomos capazes de determinar algumas restrições interessantes para filtrar o conjunto de redes. Aplicamos o nosso método para três conjuntos de dados: dois artificiais, e para validação, usamos uma série temporal de uma rede artificial conhecida na literatura. Com isso fomos capazes de inferir conjuntos de redes gênicas de possível interesse para testes em laboratório. / The chemical reactions that result in gene expression are complex and not yet fully understood. It is known that genes send, receive and process information to form a complex network of com- munication, but the architecture and dynamics of these networks are not fully known. Thus, one major problem is to determine how genes are linked within the cell. This process of determining the relationship between genes is known as inference of genetic networks. One way to represent the relationship between genes is to use mathematical and computer models of genetic networks. In particular, one of the models of great interest are Boolean Networks (BN), in which genes can take two states, active or inactive, if they are, respectively, expressed or not. These states may vary over time, depending on how genes are related. Our interest is in studying a case of this particular model, known as thresholded Boolean networks, where only one class of Boolean functions is used to build the GNs. To infer the thresholded Boolean networks, we use an algorithm that consists of two steps. First, we use the framework of Constraint Satisfaction Problem (CSP) to infer sets of solutions consistent with a time series of a given set of genes. Then analyze the dynamic behavior of the solutions, filtering sets of solutions with interest for practical tests in the laboratory. Using the framework of the CSP, we constructed a solver, using the library Gecode, 2 for in- ference of consistent networks, using as input a time series arising from microarrays data. Then, by simulating the dynamics of a sample of networks found in the previous step, we were able to determine some interesting constraints to filter the set of networks. We apply our method to three datasets: two artificial, and for validation, we use a time series of an artificial network known from literature. Thus we were able to infer genetic networks sets of possible interest for laboratory tests.
|
3 |
Canalização: fenótipos robustos como consequência de características da rede de regulação gênica / Canalization: phenotype robustness as consequence of characteristics of the gene regulatory networkPatricio, Vitor Hugo Louzada 20 April 2011 (has links)
Em sistemas biológicos, o estudo da estabilidade das redes de regulação gênica é visto como uma contribuição importante que a Matemática pode proporcionar a pesquisas sobre câncer e outras doenças genéticas. Neste trabalho, utilizamos o conceito de ``canalização\'\' como sinônimo de estabilidade em uma rede biológica. Como as características de uma rede de regulação canalizada ainda são superficialmente compreendidas, estudamos esse conceito sob o ponto de vista computacional: propomos um modelo matemático simplificado para descrever o fenômeno e realizamos algumas análises sobre o mesmo. Mais especificamente, a estabilidade da maior bacia de atração das redes Booleanas - um clássico paradigma para a modelagem de redes de regulação - é analisada. Os resultados indicam que a estabilidade da maior bacia de atração está relacionada com dados biológicos sobre o crescimento de colônias de leveduras e que considerações sobre a interação entre as funções Booleanas e a topologia da rede devem ser realizadas conjuntamente na análise de redes estáveis. / In biological systems, the study of gene regulatory networks stability is seen as an important contribution that Mathematics can make to cancer research and that of other genetic diseases. In this work, we consider the concept of ``canalization\'\' as a consequence of stability in gene regulatory networks. The characteristics of canalized regulatory networks are superficially understood. Hence, we study the canalization concept under a computational framework: a simplified model is proposed to describe the phenomenon using Boolean Networks - a classical paradigm to modeling regulatory networks. Specifically, the stability of the largest basin of attraction in gene regulatory networks is analyzed. Our results indicate that the stability of the largest basin of attraction is related to biological data on growth of yeast colonies, and that thoughts about the interaction between Boolean functions and network topologies must be given in the analysis of stable networks.
|
4 |
Pipeline para Análise In Sílico de Dados de Expressão de miRNAs e mRNAs em Células de Mamíferos. / Pipeline for in silico Analysis of miRNAs and mRNAs Expression Data in Mammals Cells.Pignata, Luiz Fernando Martins 13 April 2012 (has links)
Os microRNAs estão envolvidos no processo de regulação da expressão gênica da célula, onde a molécula de microRNA se liga com o RNA mensageiro interrompendo, assim, a expressão do respectivo gene pela interrupção da tradução. A bioinformática tem auxiliado na identificação de vários genes codificadores de microRNAs em plantas e animais, incluindo mamíferos, por meio de analises de dados de microarray; assim como na predição de estruturas. Os dados de expressão de microRNAs e RNAs mensageiros foram obtidos por meio de cooperação firmada entre o Laboratório de Bioinformática do Departamento de Genética da Faculdade de Medicina de Ribeirão Preto - USP, coordenado pela orientadora desse projeto, e o Laboratório de Imunogenética Molecular do mesmo departamento, coordenado pelo Professor Doutor Geraldo A. S. Passos. Durante o desenvolvimento e os testes realizados, foram utilizados dados (valores numéricos de dados de expressão coletados por microarrays) provenientes da comparação da expressão de microRNAs e RNAs do timo de camundongos non obese diabetic que reproduzem diabetes melitus do tipo 1, e dados provenientes da comparação da expressão de microRNAs e RNAs de outros experimentos. O presente projeto teve como objetivo o desenvolvimento de um pipeline para a análise in silico de dados de expressão gênica de microRNAs e mRNAs obtidos por microarray. Com base em dados de expressão de microRNAs e RNAs mensageiros, foi possível a análise de diversas ferramentas e o desenvolvimento e ajuste de scripts para que seja possível a análise sequencial de tais dados. Dessa forma, o pipeline desenvolvido inclui a quantificação dos dados de expressão gênica a partir das lâminas de microarray, a normalização dos dados, as análises estatísticas das sequências diferencialmente expressas utilizando o Multi Experiment Viewer, a construção de redes de interação microRNAs-RNAs mensageiros e a busca de alvos de microRNAs baseada nesta rede, ambos pelo GenMir++. O pipeline desenvolvido é executado com facilidade e possibilitou a correta análise dos dados, evitando desperdício de tempo em análises de bancada. A partir dos resultados obtidos, novos alvos de miRNA foram encontrados com o uso do pipeline e comprovados em bancada. Tais resultados apresentados no 55º Congresso Brasileiro de Genética com o resumo intitulado MicroRNA-mRNA Network Controlling the Promiscuous Gene Expression in the Thymus of NOD (Non Obese Diabetic) Mice: Implications in the Emergence of Type 1 Diabetes Mellitus. / The microRNAs are involved in the regulation of gene expression of the cell. The miRNA molecule binds to the messenger RNA and interrupts the gene expression by disrupting the translation. Through microarray data analysis, bioinformatics is a valuable aid for the identification of several genes that encode miRNAs in plants and animals, including mammals. It is also very useful for predicting structures. Data of miRNA and mRNA expression were obtained by the collaboration the Bioinformatics Laboratory and the Molecular Immunogenetics Laboratory of the Department of Genetics of the Faculty of Medicine of Ribeirão Preto - USP, coordinated by professors Silvana Giuliatti and Geraldo A. S. Passos, respectively. During the development and tests of the research, microarrays data (numerical values os the expression) were obtained from the comparison between the expression of miRNA and mRNA of the thymus of non obese diabetic mice with diabetes mellitus type 1, as well as from comparisons of their expression in other experiments. The present study is aimed at the development of a pipeline for in silico analysis of the data of miRNAs and mRNA gene expression obtained by microarray. Based on miRNAs and mRNA expression, it was possible to analyze several tools, develop and adjust scripts that allowed the sequential analysis of such data. The pipeline includes the quantification of gene expression data from microarray, the normalization of the data, the statistical analysis of differentially expressed sequences using Multi Experiment Viewer, the construction of networks of interaction of miRNA-mRNAs, and the search for targets of miRNAs based on such network using GenMir++. The pipeline was performed easily and allowed the correct analysis of the data, avoiding waste of time in bench analysis. From the results, new targets of miRNA were found using the pipeline and were verified further in bench analysis. The results were presented in the 55 th Brazilian Genetics Congress in the paper entitled \"MicroRNA-mRNA Network Controlling the Promiscuous Gene Expression in the Thymus of NOD (Non Obese Diabetic) Mice: Implications in the Emergence of Type 1 Diabetes Mellitus\".
|
5 |
Seleção de características em inferência de redes de interação gênica a partir de conjuntos reduzidos de amostrasCubas, Carlos Fernando Montoya January 2014 (has links)
Orientador: Prof. Dr. David Correa Martins Junior / Dissertação (mestrado) - Universidade Federal do ABC, Programa de Pós-Graduação em Ciência da Computação, 2014.
|
6 |
Canalização: fenótipos robustos como consequência de características da rede de regulação gênica / Canalization: phenotype robustness as consequence of characteristics of the gene regulatory networkVitor Hugo Louzada Patricio 20 April 2011 (has links)
Em sistemas biológicos, o estudo da estabilidade das redes de regulação gênica é visto como uma contribuição importante que a Matemática pode proporcionar a pesquisas sobre câncer e outras doenças genéticas. Neste trabalho, utilizamos o conceito de ``canalização\'\' como sinônimo de estabilidade em uma rede biológica. Como as características de uma rede de regulação canalizada ainda são superficialmente compreendidas, estudamos esse conceito sob o ponto de vista computacional: propomos um modelo matemático simplificado para descrever o fenômeno e realizamos algumas análises sobre o mesmo. Mais especificamente, a estabilidade da maior bacia de atração das redes Booleanas - um clássico paradigma para a modelagem de redes de regulação - é analisada. Os resultados indicam que a estabilidade da maior bacia de atração está relacionada com dados biológicos sobre o crescimento de colônias de leveduras e que considerações sobre a interação entre as funções Booleanas e a topologia da rede devem ser realizadas conjuntamente na análise de redes estáveis. / In biological systems, the study of gene regulatory networks stability is seen as an important contribution that Mathematics can make to cancer research and that of other genetic diseases. In this work, we consider the concept of ``canalization\'\' as a consequence of stability in gene regulatory networks. The characteristics of canalized regulatory networks are superficially understood. Hence, we study the canalization concept under a computational framework: a simplified model is proposed to describe the phenomenon using Boolean Networks - a classical paradigm to modeling regulatory networks. Specifically, the stability of the largest basin of attraction in gene regulatory networks is analyzed. Our results indicate that the stability of the largest basin of attraction is related to biological data on growth of yeast colonies, and that thoughts about the interaction between Boolean functions and network topologies must be given in the analysis of stable networks.
|
7 |
Pipeline para Análise In Sílico de Dados de Expressão de miRNAs e mRNAs em Células de Mamíferos. / Pipeline for in silico Analysis of miRNAs and mRNAs Expression Data in Mammals Cells.Luiz Fernando Martins Pignata 13 April 2012 (has links)
Os microRNAs estão envolvidos no processo de regulação da expressão gênica da célula, onde a molécula de microRNA se liga com o RNA mensageiro interrompendo, assim, a expressão do respectivo gene pela interrupção da tradução. A bioinformática tem auxiliado na identificação de vários genes codificadores de microRNAs em plantas e animais, incluindo mamíferos, por meio de analises de dados de microarray; assim como na predição de estruturas. Os dados de expressão de microRNAs e RNAs mensageiros foram obtidos por meio de cooperação firmada entre o Laboratório de Bioinformática do Departamento de Genética da Faculdade de Medicina de Ribeirão Preto - USP, coordenado pela orientadora desse projeto, e o Laboratório de Imunogenética Molecular do mesmo departamento, coordenado pelo Professor Doutor Geraldo A. S. Passos. Durante o desenvolvimento e os testes realizados, foram utilizados dados (valores numéricos de dados de expressão coletados por microarrays) provenientes da comparação da expressão de microRNAs e RNAs do timo de camundongos non obese diabetic que reproduzem diabetes melitus do tipo 1, e dados provenientes da comparação da expressão de microRNAs e RNAs de outros experimentos. O presente projeto teve como objetivo o desenvolvimento de um pipeline para a análise in silico de dados de expressão gênica de microRNAs e mRNAs obtidos por microarray. Com base em dados de expressão de microRNAs e RNAs mensageiros, foi possível a análise de diversas ferramentas e o desenvolvimento e ajuste de scripts para que seja possível a análise sequencial de tais dados. Dessa forma, o pipeline desenvolvido inclui a quantificação dos dados de expressão gênica a partir das lâminas de microarray, a normalização dos dados, as análises estatísticas das sequências diferencialmente expressas utilizando o Multi Experiment Viewer, a construção de redes de interação microRNAs-RNAs mensageiros e a busca de alvos de microRNAs baseada nesta rede, ambos pelo GenMir++. O pipeline desenvolvido é executado com facilidade e possibilitou a correta análise dos dados, evitando desperdício de tempo em análises de bancada. A partir dos resultados obtidos, novos alvos de miRNA foram encontrados com o uso do pipeline e comprovados em bancada. Tais resultados apresentados no 55º Congresso Brasileiro de Genética com o resumo intitulado MicroRNA-mRNA Network Controlling the Promiscuous Gene Expression in the Thymus of NOD (Non Obese Diabetic) Mice: Implications in the Emergence of Type 1 Diabetes Mellitus. / The microRNAs are involved in the regulation of gene expression of the cell. The miRNA molecule binds to the messenger RNA and interrupts the gene expression by disrupting the translation. Through microarray data analysis, bioinformatics is a valuable aid for the identification of several genes that encode miRNAs in plants and animals, including mammals. It is also very useful for predicting structures. Data of miRNA and mRNA expression were obtained by the collaboration the Bioinformatics Laboratory and the Molecular Immunogenetics Laboratory of the Department of Genetics of the Faculty of Medicine of Ribeirão Preto - USP, coordinated by professors Silvana Giuliatti and Geraldo A. S. Passos, respectively. During the development and tests of the research, microarrays data (numerical values os the expression) were obtained from the comparison between the expression of miRNA and mRNA of the thymus of non obese diabetic mice with diabetes mellitus type 1, as well as from comparisons of their expression in other experiments. The present study is aimed at the development of a pipeline for in silico analysis of the data of miRNAs and mRNA gene expression obtained by microarray. Based on miRNAs and mRNA expression, it was possible to analyze several tools, develop and adjust scripts that allowed the sequential analysis of such data. The pipeline includes the quantification of gene expression data from microarray, the normalization of the data, the statistical analysis of differentially expressed sequences using Multi Experiment Viewer, the construction of networks of interaction of miRNA-mRNAs, and the search for targets of miRNAs based on such network using GenMir++. The pipeline was performed easily and allowed the correct analysis of the data, avoiding waste of time in bench analysis. From the results, new targets of miRNA were found using the pipeline and were verified further in bench analysis. The results were presented in the 55 th Brazilian Genetics Congress in the paper entitled \"MicroRNA-mRNA Network Controlling the Promiscuous Gene Expression in the Thymus of NOD (Non Obese Diabetic) Mice: Implications in the Emergence of Type 1 Diabetes Mellitus\".
|
8 |
Desenvolvimento de uma ferramenta computacional para análise de co-expressão gênica e sua aplicação na biologia de sistemas / Development of a computational tool for gene co-expression analyses and its application in systems biologyRusso, Pedro de Sa Tavares 09 May 2019 (has links)
A Biologia de Sistemas proporciona um olhar holístico sobre os processos biológicos, integrando os diversos componentes intracelulares através de redes altamente complexas. Em particular, redes de co-expressão tem permitido nos últimos anos uma compreensão cada vez maior dos sistemas biológicos e dos mecanismos moleculares que os regem. Por outro lado, as ferramentas matemáticas e estatísticas já desenvolvidas para a análise destas redes e sistemas são, em geral, densas e pouco familiares para profissionais das áreas biológicas e da saúde. Portanto, a fim de possibilitar uma análise ao mesmo tempo relevante e facilitada, nosso grupo criou a ferramenta CEMiTool, que tem por objetivo identificar módulos de coexpressão de genes de modo automático, de maneira fácil e intuitiva para usuários com pouca ou nenhuma experiência com linguagens de programação. A fim de demonstrar a facilidade de uso da ferramenta, aplicamos o CEMiTool a mais de 1000 estudos de transcriptômica, cujos resultados foram utilizados para a confecção de um banco de dados, permitindo a integração de informações entre estudos. Além disso, para facilitar ainda mais o acesso a este tipo de análises, foi criada uma versão online da ferramenta, denominada webCEMiTool, que permite realizar as análises no navegador. Finalmente, criou-se também a ferramenta annotator, permitindo a definição automática de grupos de amostras de estudos de transcriptômica a partir do agrupamento de cadeias de caracteres presentes em dados de anotação. Todo o código está livremente disponível à comunidade. / System biology methods provide a holistic view of biological processes, integrating the several intracellular molecular components via the use of highly complex networks. In particular, co-expression networks have allowed for an increasing understanding of biological systems and the complex molecular mechanisms driving them. On the other hand, previously described tools for the analysis of biological networks are in general relatively difficult to use for life and health scientists given their high mathematical and computational demand. Therefore, in order to provide at the same time a relevant and easy-to-use analysis, we have developed the CEMiTool package, which aims to identify gene coexpression modules in an automatic, easy and intuitive way for users with little to no prior computational expertise. We applied CEMiTool to over 1000 transcriptomics studies and used the results to create a new gene coexpression database, which allows users to integrate information across analyses. Moreover, to further facilitate analyses we developed an online version of the tool named webCEMiTool, which permits users to run coexpression analysis easily via browser. Finally, we also developed annotator, a package for automatically determining experimental groups based on sample annotation string similarity. All code is freely available to the community.
|
9 |
Um algoritmo eficiente para o crescimento de redes sobre o grafo probabilístico completo do sistema de regulação gênica considerado / An efficient algorithm for growing networks on the regulatory gene system complete random graphLima, Leandro de Araujo 10 August 2009 (has links)
Sabe-se biologicamente que o nível de expressão dos genes está entre os fatores podem indicar o quanto estes estão em atividade em determinado momento. Avanços na tecnologia de microarray têm possibilitado medir os níveis de expressão de milhares de genes ao mesmo tempo. Esses dados podem ser medidos de maneira a formarem uma série temporal, que pode ser tratada estatisticamente para serem obtidas informações sobre as relações entre os genes. Já foram propostos vários modelos para tratar redes gênicas matematicamente. Esses modelos têm evoluído de forma a agregarem cada vez mais características das redes reais. Neste trabalho, será feita uma revisão de modelos discretos para redes de regulação gênica, primeiramente com as redes Booleanas, modelo determinístico, e depois as redes Booleanas probabilísticas e as redes genéticas probabilísticas, modelos que tratam o problema estocasticamente. Usando o último modelo citado, serão mostrados dois métodos para estimar o nível de predição entre os genes, coeficiente de determinação e informação mútua. Além de se estimar essas relações, foram desenvolvidas algumas técnicas para construir redes a partir de genes específicos, que são chamados sementes. Também serão apresentados dois desses métodos de crescimento de redes e, baseado neles, um terceiro método que foi desenvolvido neste trabalho. Foi criado um algoritmo que realiza o crescimento da rede mudando as sementes a cada iteração, agrupando estes genes em grupos com diferentes níveis de confiança, chamados camadas. O algoritmo também usa outros critérios para agregar novos genes à rede. Após a explanação desses métodos, será mostrado um software que, a partir de dados temporais de expressão gênica, estima as dependências entre os genes e executa o crescimento da rede em torno de genes que se deseje estudar. Também serão mostradas as melhorias feitas no programa. Ao final, serão apresentados alguns testes feitos com dados do Plasmodium falciparum, parasita causador da malária. / It\'s known that gene expression levels are among the factors that can show how genes are active in certain moment. Advances in microarray technology have given the possibility to measure expression levels of thousands of genes in a certain instant of time. These data constitute time series that we can treat statistically in order to get information genes relationships. Many models were proposed to treat gene networks mathematically. These models have evolved to aggregate more and more real networks features. In this work, it is made a brief review of discrete models of regulatory genetic networks, initially Boolean networks, a deterministic model, and then probabilistic Boolean networks and probabilistic genetic networks, models that treat the problem stochastically. Using the last model cited, two methods to estimate the prediction level among genes are shown, coefficient of determination and mutual information. Besides estimating these relations, some techniques have been developed to construct networks from specific genes, that are called seeds. It will be also shown two methods of network growth and, based on these, a third method that was developed during this work. An algorithm was created, such that it grows the network changing the seeds in each iteration, grouping these genes in groups with different level of confidence, called layers. The algorithm also uses other criteria to add new genes to the network. After studying these methods, it will be shown a software that, using time series gene expression data, estimates dependences among genes and runs the network growing process around chosen genes. It is also presented the improvements made in the program. Finally, some tests using data of Plasmodium falciparum, malaria parasite, are shown.
|
10 |
Um algoritmo eficiente para o crescimento de redes sobre o grafo probabilístico completo do sistema de regulação gênica considerado / An efficient algorithm for growing networks on the regulatory gene system complete random graphLeandro de Araujo Lima 10 August 2009 (has links)
Sabe-se biologicamente que o nível de expressão dos genes está entre os fatores podem indicar o quanto estes estão em atividade em determinado momento. Avanços na tecnologia de microarray têm possibilitado medir os níveis de expressão de milhares de genes ao mesmo tempo. Esses dados podem ser medidos de maneira a formarem uma série temporal, que pode ser tratada estatisticamente para serem obtidas informações sobre as relações entre os genes. Já foram propostos vários modelos para tratar redes gênicas matematicamente. Esses modelos têm evoluído de forma a agregarem cada vez mais características das redes reais. Neste trabalho, será feita uma revisão de modelos discretos para redes de regulação gênica, primeiramente com as redes Booleanas, modelo determinístico, e depois as redes Booleanas probabilísticas e as redes genéticas probabilísticas, modelos que tratam o problema estocasticamente. Usando o último modelo citado, serão mostrados dois métodos para estimar o nível de predição entre os genes, coeficiente de determinação e informação mútua. Além de se estimar essas relações, foram desenvolvidas algumas técnicas para construir redes a partir de genes específicos, que são chamados sementes. Também serão apresentados dois desses métodos de crescimento de redes e, baseado neles, um terceiro método que foi desenvolvido neste trabalho. Foi criado um algoritmo que realiza o crescimento da rede mudando as sementes a cada iteração, agrupando estes genes em grupos com diferentes níveis de confiança, chamados camadas. O algoritmo também usa outros critérios para agregar novos genes à rede. Após a explanação desses métodos, será mostrado um software que, a partir de dados temporais de expressão gênica, estima as dependências entre os genes e executa o crescimento da rede em torno de genes que se deseje estudar. Também serão mostradas as melhorias feitas no programa. Ao final, serão apresentados alguns testes feitos com dados do Plasmodium falciparum, parasita causador da malária. / It\'s known that gene expression levels are among the factors that can show how genes are active in certain moment. Advances in microarray technology have given the possibility to measure expression levels of thousands of genes in a certain instant of time. These data constitute time series that we can treat statistically in order to get information genes relationships. Many models were proposed to treat gene networks mathematically. These models have evolved to aggregate more and more real networks features. In this work, it is made a brief review of discrete models of regulatory genetic networks, initially Boolean networks, a deterministic model, and then probabilistic Boolean networks and probabilistic genetic networks, models that treat the problem stochastically. Using the last model cited, two methods to estimate the prediction level among genes are shown, coefficient of determination and mutual information. Besides estimating these relations, some techniques have been developed to construct networks from specific genes, that are called seeds. It will be also shown two methods of network growth and, based on these, a third method that was developed during this work. An algorithm was created, such that it grows the network changing the seeds in each iteration, grouping these genes in groups with different level of confidence, called layers. The algorithm also uses other criteria to add new genes to the network. After studying these methods, it will be shown a software that, using time series gene expression data, estimates dependences among genes and runs the network growing process around chosen genes. It is also presented the improvements made in the program. Finally, some tests using data of Plasmodium falciparum, malaria parasite, are shown.
|
Page generated in 0.0285 seconds