Spelling suggestions: "subject:"probabilistic genetic networks"" "subject:"probabilistica genetic networks""
1 |
Um algoritmo eficiente para o crescimento de redes sobre o grafo probabilístico completo do sistema de regulação gênica considerado / An efficient algorithm for growing networks on the regulatory gene system complete random graphLima, Leandro de Araujo 10 August 2009 (has links)
Sabe-se biologicamente que o nível de expressão dos genes está entre os fatores podem indicar o quanto estes estão em atividade em determinado momento. Avanços na tecnologia de microarray têm possibilitado medir os níveis de expressão de milhares de genes ao mesmo tempo. Esses dados podem ser medidos de maneira a formarem uma série temporal, que pode ser tratada estatisticamente para serem obtidas informações sobre as relações entre os genes. Já foram propostos vários modelos para tratar redes gênicas matematicamente. Esses modelos têm evoluído de forma a agregarem cada vez mais características das redes reais. Neste trabalho, será feita uma revisão de modelos discretos para redes de regulação gênica, primeiramente com as redes Booleanas, modelo determinístico, e depois as redes Booleanas probabilísticas e as redes genéticas probabilísticas, modelos que tratam o problema estocasticamente. Usando o último modelo citado, serão mostrados dois métodos para estimar o nível de predição entre os genes, coeficiente de determinação e informação mútua. Além de se estimar essas relações, foram desenvolvidas algumas técnicas para construir redes a partir de genes específicos, que são chamados sementes. Também serão apresentados dois desses métodos de crescimento de redes e, baseado neles, um terceiro método que foi desenvolvido neste trabalho. Foi criado um algoritmo que realiza o crescimento da rede mudando as sementes a cada iteração, agrupando estes genes em grupos com diferentes níveis de confiança, chamados camadas. O algoritmo também usa outros critérios para agregar novos genes à rede. Após a explanação desses métodos, será mostrado um software que, a partir de dados temporais de expressão gênica, estima as dependências entre os genes e executa o crescimento da rede em torno de genes que se deseje estudar. Também serão mostradas as melhorias feitas no programa. Ao final, serão apresentados alguns testes feitos com dados do Plasmodium falciparum, parasita causador da malária. / It\'s known that gene expression levels are among the factors that can show how genes are active in certain moment. Advances in microarray technology have given the possibility to measure expression levels of thousands of genes in a certain instant of time. These data constitute time series that we can treat statistically in order to get information genes relationships. Many models were proposed to treat gene networks mathematically. These models have evolved to aggregate more and more real networks features. In this work, it is made a brief review of discrete models of regulatory genetic networks, initially Boolean networks, a deterministic model, and then probabilistic Boolean networks and probabilistic genetic networks, models that treat the problem stochastically. Using the last model cited, two methods to estimate the prediction level among genes are shown, coefficient of determination and mutual information. Besides estimating these relations, some techniques have been developed to construct networks from specific genes, that are called seeds. It will be also shown two methods of network growth and, based on these, a third method that was developed during this work. An algorithm was created, such that it grows the network changing the seeds in each iteration, grouping these genes in groups with different level of confidence, called layers. The algorithm also uses other criteria to add new genes to the network. After studying these methods, it will be shown a software that, using time series gene expression data, estimates dependences among genes and runs the network growing process around chosen genes. It is also presented the improvements made in the program. Finally, some tests using data of Plasmodium falciparum, malaria parasite, are shown.
|
2 |
Um algoritmo eficiente para o crescimento de redes sobre o grafo probabilístico completo do sistema de regulação gênica considerado / An efficient algorithm for growing networks on the regulatory gene system complete random graphLeandro de Araujo Lima 10 August 2009 (has links)
Sabe-se biologicamente que o nível de expressão dos genes está entre os fatores podem indicar o quanto estes estão em atividade em determinado momento. Avanços na tecnologia de microarray têm possibilitado medir os níveis de expressão de milhares de genes ao mesmo tempo. Esses dados podem ser medidos de maneira a formarem uma série temporal, que pode ser tratada estatisticamente para serem obtidas informações sobre as relações entre os genes. Já foram propostos vários modelos para tratar redes gênicas matematicamente. Esses modelos têm evoluído de forma a agregarem cada vez mais características das redes reais. Neste trabalho, será feita uma revisão de modelos discretos para redes de regulação gênica, primeiramente com as redes Booleanas, modelo determinístico, e depois as redes Booleanas probabilísticas e as redes genéticas probabilísticas, modelos que tratam o problema estocasticamente. Usando o último modelo citado, serão mostrados dois métodos para estimar o nível de predição entre os genes, coeficiente de determinação e informação mútua. Além de se estimar essas relações, foram desenvolvidas algumas técnicas para construir redes a partir de genes específicos, que são chamados sementes. Também serão apresentados dois desses métodos de crescimento de redes e, baseado neles, um terceiro método que foi desenvolvido neste trabalho. Foi criado um algoritmo que realiza o crescimento da rede mudando as sementes a cada iteração, agrupando estes genes em grupos com diferentes níveis de confiança, chamados camadas. O algoritmo também usa outros critérios para agregar novos genes à rede. Após a explanação desses métodos, será mostrado um software que, a partir de dados temporais de expressão gênica, estima as dependências entre os genes e executa o crescimento da rede em torno de genes que se deseje estudar. Também serão mostradas as melhorias feitas no programa. Ao final, serão apresentados alguns testes feitos com dados do Plasmodium falciparum, parasita causador da malária. / It\'s known that gene expression levels are among the factors that can show how genes are active in certain moment. Advances in microarray technology have given the possibility to measure expression levels of thousands of genes in a certain instant of time. These data constitute time series that we can treat statistically in order to get information genes relationships. Many models were proposed to treat gene networks mathematically. These models have evolved to aggregate more and more real networks features. In this work, it is made a brief review of discrete models of regulatory genetic networks, initially Boolean networks, a deterministic model, and then probabilistic Boolean networks and probabilistic genetic networks, models that treat the problem stochastically. Using the last model cited, two methods to estimate the prediction level among genes are shown, coefficient of determination and mutual information. Besides estimating these relations, some techniques have been developed to construct networks from specific genes, that are called seeds. It will be also shown two methods of network growth and, based on these, a third method that was developed during this work. An algorithm was created, such that it grows the network changing the seeds in each iteration, grouping these genes in groups with different level of confidence, called layers. The algorithm also uses other criteria to add new genes to the network. After studying these methods, it will be shown a software that, using time series gene expression data, estimates dependences among genes and runs the network growing process around chosen genes. It is also presented the improvements made in the program. Finally, some tests using data of Plasmodium falciparum, malaria parasite, are shown.
|
3 |
Modelagem do controle gênico do ciclo celular por redes genéticas probabilísticas. / Cell-Cycle Genetic Control Modeling by Probabilistic Genetic NetworksTrepode, Nestor Walter 27 June 2007 (has links)
O ciclo de divisão celular compreende uma seqüência de fenômenos controlados por una complexa rede de regulação gênica muito estável e robusta. Aplicamos as Redes Genéticas Probabilísticas (PGNs) para construir um modelo cuja dinâmica e robustez se assemelham às observadas no ciclo celular biológico. A estrutura de nosso modelo PGN foi inspirada em fatos biológicos bem estabelecidos tais como a existência de subsistemas integradores, realimentação negativa e positiva e caminhos de sinalização redundantes. Nosso modelo representa as interações entre genes como processos estocásticos e apresenta uma forte robustez na presença de ruido e variações moderadas dos parâmetros. Um modelo determinístico recentemente publicado do ciclo celular da levedura não resiste a condições de ruido que nosso modelo suporta bem. A adição de mecanismos de auto excitação, permite a nosso modelo apresentar uma atividade oscilatória similar à observada no ciclo celular embrionário. Nossa abordagem de modelar e simular o comportamento observado usando mecanismos de controle biológico conhecidos fornece hipóteses plausíveis de como a regulação subjacente pode ser realizada na célula. A pesquisa atualmente em curso procura identificar tais mecanismos de regulação no ciclo celular da levedura, usando dados de expressão gênica provenientes de medições seqüenciais de microarray. / The cell division cycle comprises a sequence of phenomena controlled by a stable and robust genetic network. We applied a Probabilistic Genetic Network (PGN) to construct an hypothetical model with dynamical behaviour and robustness typical of the biological cell-cycle. The structure of our PGN model was inspired in well established biological facts such as the existence of integrator subsystems, negative and positive feedback loops and redundant signaling pathways. Our model represents genes\' interactions as stochastic processes and presents strong robustness in the presence of moderate noise and parameters fluctuations. A recently published deterministic yeast cell-cycle model collapses upon noise conditions that our PGN model supports well. In addition, self stimulatory mechanisms can give our PGN model the possibility of having a pacemaker activity similar to the observed in the oscillatory embryonic cell cycle. Our approach of modeling and simulating the observed behavior by known biological control mechanisms provides plausible hypotheses of how the underlying regulation may be performed in the cell. The ongoing research is lead to identify such regulation mechanisms in the yeast cell-cycle from time-series microarray gene expression data.
|
4 |
"Redução de dimensionalidade utilizando entropia condicional média aplicada a problemas de bioinformática e de processamento de imagens" / Dimensionality reduction using mean conditional entropy applied for bioinformatics and image processing problemsMartins Junior, David Correa 22 September 2004 (has links)
Redução de dimensionalidade é um problema muito importante da área de reconhecimento de padrões com aplicação em diversos campos do conhecimento. Dentre as técnicas de redução de dimensionalidade, a de seleção de características foi o principal foco desta pesquisa. De uma forma geral, a maioria dos métodos de redução de dimensionalidade presentes na literatura costumam privilegiar casos nos quais os dados sejam linearmente separáveis e só existam duas classes distintas. No intuito de tratar casos mais genéricos, este trabalho propõe uma função critério, baseada em sólidos princípios de teoria estatística como entropia e informação mútua, a ser embutida nos algoritmos de seleção de características existentes. A proposta dessa abordagem é tornar possível classificar os dados, linearmente separáveis ou não, em duas ou mais classes levando em conta um pequeno subespaço de características. Alguns resultados com dados sintéticos e dados reais foram obtidos confirmando a utilidade dessa técnica. Este trabalho tratou dois problemas de bioinformática. O primeiro trata de distinguir dois fenômenos biológicos através de seleção de um subconjunto apropriado de genes. Foi estudada uma técnica de seleção de genes fortes utilizando máquinas de suporte vetorial (MSV) que já vinha sendo aplicada para este fim em dados de SAGE do genoma humano. Grande parte dos genes fortes encontrados por esta técnica para distinguir tumores de cérebro (glioblastoma e astrocytoma), foram validados pela metodologia apresentada neste trabalho. O segundo problema que foi tratado neste trabalho é o de identificação de redes de regulação gênica, utilizando a metodologia proposta, em dados produzidos pelo trabalho de DeRisi et al sobre microarray do genoma do Plasmodium falciparum, agente causador da malária, durante as 48 horas de seu ciclo de vida. O presente texto apresenta evidências de que a utilização da entropia condicional média para estimar redes genéticas probabilísticas (PGN) pode ser uma abordagem bastante promissora nesse tipo de aplicação. No contexto de processamento de imagens, tal técnica pôde ser aplicada com sucesso em obter W-operadores minimais para realização de filtragem de imagens e reconhecimento de texturas. / Dimensionality reduction is a very important pattern recognition problem with many applications. Among the dimensionality reduction techniques, feature selection was the main focus of this research. In general, most dimensionality reduction methods that may be found in the literature privilegiate cases in which the data is linearly separable and with only two distinct classes. Aiming at covering more generic cases, this work proposes a criterion function, based on the statistical theory principles of entropy and mutual information, to be embedded in the existing feature selection algorithms. This approach allows to classify the data, linearly separable or not, in two or more classes, taking into account a small feature subspace. Results with synthetic and real data were obtained corroborating the utility of this technique. This work addressed two bioinformatics problems. The first is about distinguishing two biological fenomena through the selection of an appropriate subset of genes. We studied a strong genes selection technique using support vector machines (SVM) which has been applied to SAGE data of human genome. Most of the strong genes found by this technique to distinguish brain tumors (glioblastoma and astrocytoma) were validated by the proposed methodology presented in this work. The second problem covered in this work is the identification of genetic network regulation, using our proposed methodology, from data produced by work of DeRisi et al about microarray of the Plasmodium falciparum genome, malaria agent, during 48 hours of its life cycle. This text presents evidences that using mean conditional entropy to estimate a probabilistic genetic network (PGN) may be very promising. In the image processing context, it is shown that this technique can be applied to obtain minimal W-operators that perform image filtering and texture recognition.
|
5 |
"Redução de dimensionalidade utilizando entropia condicional média aplicada a problemas de bioinformática e de processamento de imagens" / Dimensionality reduction using mean conditional entropy applied for bioinformatics and image processing problemsDavid Correa Martins Junior 22 September 2004 (has links)
Redução de dimensionalidade é um problema muito importante da área de reconhecimento de padrões com aplicação em diversos campos do conhecimento. Dentre as técnicas de redução de dimensionalidade, a de seleção de características foi o principal foco desta pesquisa. De uma forma geral, a maioria dos métodos de redução de dimensionalidade presentes na literatura costumam privilegiar casos nos quais os dados sejam linearmente separáveis e só existam duas classes distintas. No intuito de tratar casos mais genéricos, este trabalho propõe uma função critério, baseada em sólidos princípios de teoria estatística como entropia e informação mútua, a ser embutida nos algoritmos de seleção de características existentes. A proposta dessa abordagem é tornar possível classificar os dados, linearmente separáveis ou não, em duas ou mais classes levando em conta um pequeno subespaço de características. Alguns resultados com dados sintéticos e dados reais foram obtidos confirmando a utilidade dessa técnica. Este trabalho tratou dois problemas de bioinformática. O primeiro trata de distinguir dois fenômenos biológicos através de seleção de um subconjunto apropriado de genes. Foi estudada uma técnica de seleção de genes fortes utilizando máquinas de suporte vetorial (MSV) que já vinha sendo aplicada para este fim em dados de SAGE do genoma humano. Grande parte dos genes fortes encontrados por esta técnica para distinguir tumores de cérebro (glioblastoma e astrocytoma), foram validados pela metodologia apresentada neste trabalho. O segundo problema que foi tratado neste trabalho é o de identificação de redes de regulação gênica, utilizando a metodologia proposta, em dados produzidos pelo trabalho de DeRisi et al sobre microarray do genoma do Plasmodium falciparum, agente causador da malária, durante as 48 horas de seu ciclo de vida. O presente texto apresenta evidências de que a utilização da entropia condicional média para estimar redes genéticas probabilísticas (PGN) pode ser uma abordagem bastante promissora nesse tipo de aplicação. No contexto de processamento de imagens, tal técnica pôde ser aplicada com sucesso em obter W-operadores minimais para realização de filtragem de imagens e reconhecimento de texturas. / Dimensionality reduction is a very important pattern recognition problem with many applications. Among the dimensionality reduction techniques, feature selection was the main focus of this research. In general, most dimensionality reduction methods that may be found in the literature privilegiate cases in which the data is linearly separable and with only two distinct classes. Aiming at covering more generic cases, this work proposes a criterion function, based on the statistical theory principles of entropy and mutual information, to be embedded in the existing feature selection algorithms. This approach allows to classify the data, linearly separable or not, in two or more classes, taking into account a small feature subspace. Results with synthetic and real data were obtained corroborating the utility of this technique. This work addressed two bioinformatics problems. The first is about distinguishing two biological fenomena through the selection of an appropriate subset of genes. We studied a strong genes selection technique using support vector machines (SVM) which has been applied to SAGE data of human genome. Most of the strong genes found by this technique to distinguish brain tumors (glioblastoma and astrocytoma) were validated by the proposed methodology presented in this work. The second problem covered in this work is the identification of genetic network regulation, using our proposed methodology, from data produced by work of DeRisi et al about microarray of the Plasmodium falciparum genome, malaria agent, during 48 hours of its life cycle. This text presents evidences that using mean conditional entropy to estimate a probabilistic genetic network (PGN) may be very promising. In the image processing context, it is shown that this technique can be applied to obtain minimal W-operators that perform image filtering and texture recognition.
|
6 |
Modelagem do controle gênico do ciclo celular por redes genéticas probabilísticas. / Cell-Cycle Genetic Control Modeling by Probabilistic Genetic NetworksNestor Walter Trepode 27 June 2007 (has links)
O ciclo de divisão celular compreende uma seqüência de fenômenos controlados por una complexa rede de regulação gênica muito estável e robusta. Aplicamos as Redes Genéticas Probabilísticas (PGNs) para construir um modelo cuja dinâmica e robustez se assemelham às observadas no ciclo celular biológico. A estrutura de nosso modelo PGN foi inspirada em fatos biológicos bem estabelecidos tais como a existência de subsistemas integradores, realimentação negativa e positiva e caminhos de sinalização redundantes. Nosso modelo representa as interações entre genes como processos estocásticos e apresenta uma forte robustez na presença de ruido e variações moderadas dos parâmetros. Um modelo determinístico recentemente publicado do ciclo celular da levedura não resiste a condições de ruido que nosso modelo suporta bem. A adição de mecanismos de auto excitação, permite a nosso modelo apresentar uma atividade oscilatória similar à observada no ciclo celular embrionário. Nossa abordagem de modelar e simular o comportamento observado usando mecanismos de controle biológico conhecidos fornece hipóteses plausíveis de como a regulação subjacente pode ser realizada na célula. A pesquisa atualmente em curso procura identificar tais mecanismos de regulação no ciclo celular da levedura, usando dados de expressão gênica provenientes de medições seqüenciais de microarray. / The cell division cycle comprises a sequence of phenomena controlled by a stable and robust genetic network. We applied a Probabilistic Genetic Network (PGN) to construct an hypothetical model with dynamical behaviour and robustness typical of the biological cell-cycle. The structure of our PGN model was inspired in well established biological facts such as the existence of integrator subsystems, negative and positive feedback loops and redundant signaling pathways. Our model represents genes\' interactions as stochastic processes and presents strong robustness in the presence of moderate noise and parameters fluctuations. A recently published deterministic yeast cell-cycle model collapses upon noise conditions that our PGN model supports well. In addition, self stimulatory mechanisms can give our PGN model the possibility of having a pacemaker activity similar to the observed in the oscillatory embryonic cell cycle. Our approach of modeling and simulating the observed behavior by known biological control mechanisms provides plausible hypotheses of how the underlying regulation may be performed in the cell. The ongoing research is lead to identify such regulation mechanisms in the yeast cell-cycle from time-series microarray gene expression data.
|
Page generated in 0.1115 seconds