Spelling suggestions: "subject:"coeficiente dde determinação"" "subject:"coeficiente dee determinação""
1 |
Um algoritmo eficiente para o crescimento de redes sobre o grafo probabilístico completo do sistema de regulação gênica considerado / An efficient algorithm for growing networks on the regulatory gene system complete random graphLima, Leandro de Araujo 10 August 2009 (has links)
Sabe-se biologicamente que o nível de expressão dos genes está entre os fatores podem indicar o quanto estes estão em atividade em determinado momento. Avanços na tecnologia de microarray têm possibilitado medir os níveis de expressão de milhares de genes ao mesmo tempo. Esses dados podem ser medidos de maneira a formarem uma série temporal, que pode ser tratada estatisticamente para serem obtidas informações sobre as relações entre os genes. Já foram propostos vários modelos para tratar redes gênicas matematicamente. Esses modelos têm evoluído de forma a agregarem cada vez mais características das redes reais. Neste trabalho, será feita uma revisão de modelos discretos para redes de regulação gênica, primeiramente com as redes Booleanas, modelo determinístico, e depois as redes Booleanas probabilísticas e as redes genéticas probabilísticas, modelos que tratam o problema estocasticamente. Usando o último modelo citado, serão mostrados dois métodos para estimar o nível de predição entre os genes, coeficiente de determinação e informação mútua. Além de se estimar essas relações, foram desenvolvidas algumas técnicas para construir redes a partir de genes específicos, que são chamados sementes. Também serão apresentados dois desses métodos de crescimento de redes e, baseado neles, um terceiro método que foi desenvolvido neste trabalho. Foi criado um algoritmo que realiza o crescimento da rede mudando as sementes a cada iteração, agrupando estes genes em grupos com diferentes níveis de confiança, chamados camadas. O algoritmo também usa outros critérios para agregar novos genes à rede. Após a explanação desses métodos, será mostrado um software que, a partir de dados temporais de expressão gênica, estima as dependências entre os genes e executa o crescimento da rede em torno de genes que se deseje estudar. Também serão mostradas as melhorias feitas no programa. Ao final, serão apresentados alguns testes feitos com dados do Plasmodium falciparum, parasita causador da malária. / It\'s known that gene expression levels are among the factors that can show how genes are active in certain moment. Advances in microarray technology have given the possibility to measure expression levels of thousands of genes in a certain instant of time. These data constitute time series that we can treat statistically in order to get information genes relationships. Many models were proposed to treat gene networks mathematically. These models have evolved to aggregate more and more real networks features. In this work, it is made a brief review of discrete models of regulatory genetic networks, initially Boolean networks, a deterministic model, and then probabilistic Boolean networks and probabilistic genetic networks, models that treat the problem stochastically. Using the last model cited, two methods to estimate the prediction level among genes are shown, coefficient of determination and mutual information. Besides estimating these relations, some techniques have been developed to construct networks from specific genes, that are called seeds. It will be also shown two methods of network growth and, based on these, a third method that was developed during this work. An algorithm was created, such that it grows the network changing the seeds in each iteration, grouping these genes in groups with different level of confidence, called layers. The algorithm also uses other criteria to add new genes to the network. After studying these methods, it will be shown a software that, using time series gene expression data, estimates dependences among genes and runs the network growing process around chosen genes. It is also presented the improvements made in the program. Finally, some tests using data of Plasmodium falciparum, malaria parasite, are shown.
|
2 |
Interação genótipos x ambientes, adaptabilidade, estabilidade e repetibilidade em clones de guaraná (Paullinia cupana var. sorbilis (Mart.) Ducke) / Genotype x environment interaction, adaptability, stability, and repeatability in clones of guarana (Paullinia cupana var. sorbilis (Mart) (Ducke)Nascimento Filho, Firmino José do 10 October 2003 (has links)
Submitted by Marco Antônio de Ramos Chagas (mchagas@ufv.br) on 2017-06-02T18:11:20Z
No. of bitstreams: 1
texto completo.pdf: 691583 bytes, checksum: 4ef3641fa5567e83a1b4ec4ac4985770 (MD5) / Made available in DSpace on 2017-06-02T18:11:20Z (GMT). No. of bitstreams: 1
texto completo.pdf: 691583 bytes, checksum: 4ef3641fa5567e83a1b4ec4ac4985770 (MD5)
Previous issue date: 2003-10-10 / A guaranaicultura vem se tornando importante atividade agrícola no Estado do Amazonas, onde existe grande variação ambiental, principalmente em se tratando de seus solos e da atual expansão de seu plantio, que vem atingindo novos locais e regiões. Desta forma, a cultura é submetida a diversos fatores de ordem física, como no caso do tipo de solo, do clima e da aplicação de tecnologias modernas, a exemplo do uso de corretivos e fertilizantes, o que cria novas condições ambientais aos materiais genéticos que vêm sendo selecionados. O conhecimento da existência da interação genótipos x anos ou genótipos x locais e outros tipos de interações, de sua magnitude e também de sua significância, apesar de contribuir para melhorar a eficiência dos programas de melhoramento, não fornece informações detalhadas sobre o comportamento individual de cada genótipo, em relação aos fatores ambientais. Com essa finalidade, os dados deste estudo foram gerados em experimentos instalados em delineamento de blocos casualizados completos, com duas repetições, e em parcelas constituídas por três plantas, espaçadas 5 m x 5 m. Para atender aos objetivos propostos, foi fundamental a avaliação em várias condições de cultivo, para possibilitar o estudo das interações e, a partir destas, estimar os parâmetros adaptabilidade e estabilidade fenotípica dos clones de guaraná e também, com base nos coeficientes de repetibilidade, o número mínimo de medições necessárias para se obter o real valor genotípico dos materiais. Os resultados das análises biométricas têm como propósitos contribuir, orientar e adotar melhores estratégias de seleção para o Programa de Melhoramento Clonal do Guaraná da Embrapa Amazônia Ocidental (Centro de Pesquisa Agroflorestal da Amazônia Ocidental – CPAA), em Manaus, AM, além de identificar genótipos superiores, objetivando proporcionar aos produtores clones de bom desempenho produtivo e adequado às condições disponíveis de cultivo. Os resultados alcançados neste trabalho indicaram a existência de expressiva variabilidade entre os clones e interação significativa de genótipos x ambientes, com predominância da fração comfplexa e de condições favoráveis à seleção, em razão dos altos coeficientes de determinação genético (H 2 ) e da existência de relação CVg/CVe maior ou próxima de 1,0. Maior discriminação entre os clones avaliados foi verificada nos ambientes de alta potencialidade, ou seja, o local Maués, em solo de mata primária e capoeira, sendo neste último caso adubado. Com base no comportamento dos clones, foram detectados materiais com adaptabilidades ampla e específica às condições favoráveis e desfavoráveis, destacando-se o clone CMU871, com alta produção, boa estabilidade e alta adaptabilidade, ou seja, responsivo à melhoria das condições de cultivo; e o clone CMU619, que apresentou alta produção, porém com especificidade às condições favoráveis. Determinou-se que quatro anos de avaliação da produção são necessários para acessar o real valor dos clones, porém, para isso, deve-se excluir da análise a primeira produção mensurável. / Guarana culture is increasingly becoming an important agricultural activity in the state of Amazon, which presents great environmental variation, especially in soil and expanded planted area, reaching new places and regions. Thus, the culture is submitted to several physical factors such as type of soil, climate and modern technologies, e.g., correctives and fertilizers, creating new environmental conditions for the genetic materials being currently selected. Despite contributing to improving breeding program efficiency, knowledge about genotype x year or genotype x place interactions and other types of interactions, their magnitude as well as their significance does not supply detailed information on the individual behavior of each genotype in relation to the environmental factors. Thus, experiments were arranged in a randomized complete block design with two repetitions with plots being three 5 m x 5 m spaced plants. In order to meet the proposed objectives, evaluation under various cultivation conditions was fundamental to allow the study of interactions and based on these, to estimate the parameters adaptability and phenotypic stability of the guarana clones and also, based on the repeatability coefficients, the minimal number of necessary measurements to obtain the real genotypic value of the materials. The biometric analysis results aim at contributing to, guiding, and adopting improved selection strategies for the Guarana Clonal Breeding Program – Embrapa Amazonia Ocidental (Centro de Pesquisa da Amazonia Oriental – CPAA) in Manaus, AM, besides identifying superior genotypes to provide producers clones with good productive performance and adequate to the available cultivation conditions. The results obtained in this work indicate an expressive variability among clones and significant genotype x environment interaction, with a predominance of the complex fraction and favorable selection conditions, due to the high genetic determination coefficients (H 2 ) and CVg/CVe relation greater or close to 1.0 Greater discrimination among the clones evaluated was verified in highly potential environments, i.e., Maues, located in primary forest soil and second growth soil, being fertilized in the latter. Based on the behavior of the clones, amply and specifically adapted materials for favorable and unfavorable conditions were detected, especially clone CMU871,which displayed high production, good stability and high adaptability, i.e., was responsive to the improved cultivation conditions; and clone CMU619, which presented high production but with specificity under favorable conditions. It was determined that four years of production evaluation are necessary to assess the real value of the clones. However, the first measurable production must be excluded from the analysis. / Tese importada do Alexandria
|
3 |
Um algoritmo eficiente para o crescimento de redes sobre o grafo probabilístico completo do sistema de regulação gênica considerado / An efficient algorithm for growing networks on the regulatory gene system complete random graphLeandro de Araujo Lima 10 August 2009 (has links)
Sabe-se biologicamente que o nível de expressão dos genes está entre os fatores podem indicar o quanto estes estão em atividade em determinado momento. Avanços na tecnologia de microarray têm possibilitado medir os níveis de expressão de milhares de genes ao mesmo tempo. Esses dados podem ser medidos de maneira a formarem uma série temporal, que pode ser tratada estatisticamente para serem obtidas informações sobre as relações entre os genes. Já foram propostos vários modelos para tratar redes gênicas matematicamente. Esses modelos têm evoluído de forma a agregarem cada vez mais características das redes reais. Neste trabalho, será feita uma revisão de modelos discretos para redes de regulação gênica, primeiramente com as redes Booleanas, modelo determinístico, e depois as redes Booleanas probabilísticas e as redes genéticas probabilísticas, modelos que tratam o problema estocasticamente. Usando o último modelo citado, serão mostrados dois métodos para estimar o nível de predição entre os genes, coeficiente de determinação e informação mútua. Além de se estimar essas relações, foram desenvolvidas algumas técnicas para construir redes a partir de genes específicos, que são chamados sementes. Também serão apresentados dois desses métodos de crescimento de redes e, baseado neles, um terceiro método que foi desenvolvido neste trabalho. Foi criado um algoritmo que realiza o crescimento da rede mudando as sementes a cada iteração, agrupando estes genes em grupos com diferentes níveis de confiança, chamados camadas. O algoritmo também usa outros critérios para agregar novos genes à rede. Após a explanação desses métodos, será mostrado um software que, a partir de dados temporais de expressão gênica, estima as dependências entre os genes e executa o crescimento da rede em torno de genes que se deseje estudar. Também serão mostradas as melhorias feitas no programa. Ao final, serão apresentados alguns testes feitos com dados do Plasmodium falciparum, parasita causador da malária. / It\'s known that gene expression levels are among the factors that can show how genes are active in certain moment. Advances in microarray technology have given the possibility to measure expression levels of thousands of genes in a certain instant of time. These data constitute time series that we can treat statistically in order to get information genes relationships. Many models were proposed to treat gene networks mathematically. These models have evolved to aggregate more and more real networks features. In this work, it is made a brief review of discrete models of regulatory genetic networks, initially Boolean networks, a deterministic model, and then probabilistic Boolean networks and probabilistic genetic networks, models that treat the problem stochastically. Using the last model cited, two methods to estimate the prediction level among genes are shown, coefficient of determination and mutual information. Besides estimating these relations, some techniques have been developed to construct networks from specific genes, that are called seeds. It will be also shown two methods of network growth and, based on these, a third method that was developed during this work. An algorithm was created, such that it grows the network changing the seeds in each iteration, grouping these genes in groups with different level of confidence, called layers. The algorithm also uses other criteria to add new genes to the network. After studying these methods, it will be shown a software that, using time series gene expression data, estimates dependences among genes and runs the network growing process around chosen genes. It is also presented the improvements made in the program. Finally, some tests using data of Plasmodium falciparum, malaria parasite, are shown.
|
4 |
Parâmetros genéticos e fenotípicos em arroz irrigado estimados por método de análise espacial / Genetic and phenotypic parameters in rice crop estimated by method of spatial analysisGuimarães, Paulo Henrique Ramos 28 February 2014 (has links)
Submitted by Luciana Ferreira (lucgeral@gmail.com) on 2015-01-27T13:40:32Z
No. of bitstreams: 2
license_rdf: 23148 bytes, checksum: 9da0b6dfac957114c6a7714714b86306 (MD5)
Dissertação - Paulo Henrique Ramos Guimarães - 2014.pdf: 1517515 bytes, checksum: 862883b307a6231b2a7f63d38c9f03ea (MD5) / Approved for entry into archive by Luciana Ferreira (lucgeral@gmail.com) on 2015-01-28T11:19:18Z (GMT) No. of bitstreams: 2
license_rdf: 23148 bytes, checksum: 9da0b6dfac957114c6a7714714b86306 (MD5)
Dissertação - Paulo Henrique Ramos Guimarães - 2014.pdf: 1517515 bytes, checksum: 862883b307a6231b2a7f63d38c9f03ea (MD5) / Made available in DSpace on 2015-01-28T11:19:18Z (GMT). No. of bitstreams: 2
license_rdf: 23148 bytes, checksum: 9da0b6dfac957114c6a7714714b86306 (MD5)
Dissertação - Paulo Henrique Ramos Guimarães - 2014.pdf: 1517515 bytes, checksum: 862883b307a6231b2a7f63d38c9f03ea (MD5)
Previous issue date: 2014-02-28 / Coordenação de Aperfeiçoamento de Pessoal de Nível Superior - CAPES / Some spatial analysis methods have been applied in order to mitigate environmental variation. The objective of this study was to evaluate the efficiency of spatial statistical, through the method of Papadakis, relative to the analysis to augmented blocks Federer in the correction of environmental variation. Were evaluated 198 progenies S0:2 of rice and four witnesses for augmented blocks of Federer. Data set were taken in the grain yield (GY, kg ha- 1) and plant height (PH, cm). The data set were subjected to variance analyses and were estimated the genetic and phenotypic parameters. The different approaches (BAF and Papadakis) were compared as to their estimates of genetic and phenotypic parameters. The ranking of adjusted means in the two models analyzed was performed, and calculated the Spearman correlation. There have been improvements in the statistics that depict the experimental accuracy when the spatial analysis was, that affect the estimates of genetic and phenotypic parameters. The use of the Papadakis method yielded fewer iterations compared to BAF for the same value of . Was able to gain direct selection for the AP and PG characters when the Papadakis method was used. With the use of spatial analysis selection was less influenced by the effect of environmental variation. Finally it was found that the spatial analysis methods were effective in the removal of environmental effects highlighting the Papadakis method, indicating that it can provide improvement / Alguns métodos de análise espacial têm sido aplicados objetivando reduzir a variação ambiental. O objetivo deste trabalho foi avaliar a eficiência da análise espacial, por meio do método de Papadakis, em relação ao delineamento de blocos aumentados de Federer na correção da variação ambiental. Foram avaliadas 198 progênies S0:2 de arroz irrigado e quatro testemunhas no delineamento de blocos aumentados de Federer. Os caracteres avaliados foram: produção de grãos (PG, kg ha-1) e de altura de plantas (AP, cm). Foi efetuada análise de variância para os caracteres estudados e estimados os componentes de variância e os parâmetros genéticos e fenotípicos. As diferentes abordagens (BAF e Papadakis) foram comparadas quanto às suas estimativas de parâmetros genéticos e fenotípicos e correlação de Spearman. Houve melhorias nas estatísticas que retratam a precisão experimental quando a análise espacial foi utilizada, isto influenciou as estimativas de parâmetros genéticos e fenótipos. O uso do método de Papadakis apresentou a necessidade de uso de menor número de repetições em relação ao BAF para o mesmo valor de . Houve ganho de seleção direto para os caracteres AP e PG quando o método de Papadakis foi utilizado. Com o uso da análise espacial a seleção foi menos influenciada pelo efeito da variação ambiental. Por fim verificou-se que o método de Papadakis foi eficiente na remoção dos efeitos ambientais, indicando que o mesmo pode proporcionar melhoria na precisão experimental, o que torna o processo seletivo mais eficiente.
|
5 |
Seleção de características e predição intrinsecamente multivariada em identificação de redes de regulação gênica / Feature selection and intrinsically multivariate prediction in gene regulatory networks identificationMartins Junior, David Corrêa 01 December 2008 (has links)
Seleção de características é um tópico muito importante em aplicações de reconhecimento de padrões, especialmente em bioinformática, cujos problemas são geralmente tratados sobre um conjunto de dados envolvendo muitas variáveis e poucas observações. Este trabalho analisa aspectos de seleção de características no problema de identificação de redes de regulação gênica a partir de sinais de expressão gênica. Particularmente, propusemos um modelo de redes gênicas probabilísticas (PGN) que devolve uma rede construída a partir da aplicação recorrente de algoritmos de seleção de características orientados por uma função critério baseada em entropia condicional. Tal critério embute a estimação do erro por penalização de amostras raramente observadas. Resultados desse modelo aplicado a dados sintéticos e a conjuntos de dados de microarray de Plasmodium falciparum, um agente causador da malária, demonstram a validade dessa técnica, tendo sido capaz não apenas de reproduzir conhecimentos já produzidos anteriormente, como também de produzir novos resultados. Outro aspecto investigado nesta tese é o fenômeno da predição intrinsecamente multivariada (IMP), ou seja, o fato de um conjunto de características ser um ótimo caracterizador dos objetos em questão, mas qualquer de seus subconjuntos propriamente contidos não conseguirem representá-los de forma satisfatória. Neste trabalho, as condições para o surgimento desse fenômeno foram obtidas de forma analítica para conjuntos de 2 e 3 características em relação a uma variável alvo. No contexto de redes de regulação gênica, foram obtidas evidências de que genes alvo de conjuntos IMP possuem um enorme potencial para exercerem funções vitais em sistemas biológicos. O fenômeno conhecido como canalização é particularmente importante nesse contexto. Em dados de microarray de melanoma, constatamos que o gene DUSP1, conhecido por exercer função canalizadora, foi aquele que obteve o maior número de conjuntos de genes IMP, sendo que todos eles possuem lógicas de predição canalizadoras. Além disso, simulações computacionais para construção de redes com 3 ou mais genes mostram que o tamanho do território de um gene alvo pode ter um impacto positivo em seu teor de IMP com relação a seus preditores. Esta pode ser uma evidência que confirma a hipótese de que genes alvo de conjuntos IMP possuem a tendência de controlar diversas vias metabólicas cruciais para a manutenção das funções vitais de um organismo. / Feature selection is a crucial topic in pattern recognition applications, especially in bioinformatics, where problems usually involve data with a large number of variables and small number of observations. The present work addresses feature selection aspects in the problem of gene regulatory network identification from expression profiles. Particularly, we proposed a probabilistic genetic network model (PGN) that recovers a network constructed from the recurrent application of feature selection algorithms guided by a conditional entropy based criterion function. Such criterion embeds error estimation by penalization of rarely observed patterns. Results from this model applied to synthetic and real data sets obtained from Plasmodium falciparum microarrays, a malaria agent, demonstrate the validity of this technique. This method was able to not only reproduce previously produced knowledge, but also to produce other potentially relevant results. The intrinsically multivariate prediction (IMP) phenomenon has been also investigated. This phenomenon is related to the fact of a feature set being a nice predictor of the objects in study, but all of its properly contained subsets cannot predict such objects satisfactorily. In this work, the conditions for the rising of this phenomenon were analitically obtained for sets of 2 and 3 features regarding a target variable. In the gene regulatory networks context, evidences have been achieved in which target genes of IMP sets possess a great potential to execute vital functions in biological systems. The phenomenon known as canalization is particularly important in this context. In melanoma microarray data, we verified that DUSP1 gene, known by having canalization function, was the one which composed the largest number of IMP gene sets. It was also verified that all these sets have canalizing predictive logics. Moreover, computational simulations for generation of networks with 3 or more genes show that the territory size of a target gene can contribute positively to its IMP score with regard to its predictors. This could be an evidence that confirms the hypothesis stating that target genes of IMP sets are inclined to control several metabolic pathways essential to the maintenance of the vital functions of an organism.
|
6 |
Seleção de características e predição intrinsecamente multivariada em identificação de redes de regulação gênica / Feature selection and intrinsically multivariate prediction in gene regulatory networks identificationDavid Corrêa Martins Junior 01 December 2008 (has links)
Seleção de características é um tópico muito importante em aplicações de reconhecimento de padrões, especialmente em bioinformática, cujos problemas são geralmente tratados sobre um conjunto de dados envolvendo muitas variáveis e poucas observações. Este trabalho analisa aspectos de seleção de características no problema de identificação de redes de regulação gênica a partir de sinais de expressão gênica. Particularmente, propusemos um modelo de redes gênicas probabilísticas (PGN) que devolve uma rede construída a partir da aplicação recorrente de algoritmos de seleção de características orientados por uma função critério baseada em entropia condicional. Tal critério embute a estimação do erro por penalização de amostras raramente observadas. Resultados desse modelo aplicado a dados sintéticos e a conjuntos de dados de microarray de Plasmodium falciparum, um agente causador da malária, demonstram a validade dessa técnica, tendo sido capaz não apenas de reproduzir conhecimentos já produzidos anteriormente, como também de produzir novos resultados. Outro aspecto investigado nesta tese é o fenômeno da predição intrinsecamente multivariada (IMP), ou seja, o fato de um conjunto de características ser um ótimo caracterizador dos objetos em questão, mas qualquer de seus subconjuntos propriamente contidos não conseguirem representá-los de forma satisfatória. Neste trabalho, as condições para o surgimento desse fenômeno foram obtidas de forma analítica para conjuntos de 2 e 3 características em relação a uma variável alvo. No contexto de redes de regulação gênica, foram obtidas evidências de que genes alvo de conjuntos IMP possuem um enorme potencial para exercerem funções vitais em sistemas biológicos. O fenômeno conhecido como canalização é particularmente importante nesse contexto. Em dados de microarray de melanoma, constatamos que o gene DUSP1, conhecido por exercer função canalizadora, foi aquele que obteve o maior número de conjuntos de genes IMP, sendo que todos eles possuem lógicas de predição canalizadoras. Além disso, simulações computacionais para construção de redes com 3 ou mais genes mostram que o tamanho do território de um gene alvo pode ter um impacto positivo em seu teor de IMP com relação a seus preditores. Esta pode ser uma evidência que confirma a hipótese de que genes alvo de conjuntos IMP possuem a tendência de controlar diversas vias metabólicas cruciais para a manutenção das funções vitais de um organismo. / Feature selection is a crucial topic in pattern recognition applications, especially in bioinformatics, where problems usually involve data with a large number of variables and small number of observations. The present work addresses feature selection aspects in the problem of gene regulatory network identification from expression profiles. Particularly, we proposed a probabilistic genetic network model (PGN) that recovers a network constructed from the recurrent application of feature selection algorithms guided by a conditional entropy based criterion function. Such criterion embeds error estimation by penalization of rarely observed patterns. Results from this model applied to synthetic and real data sets obtained from Plasmodium falciparum microarrays, a malaria agent, demonstrate the validity of this technique. This method was able to not only reproduce previously produced knowledge, but also to produce other potentially relevant results. The intrinsically multivariate prediction (IMP) phenomenon has been also investigated. This phenomenon is related to the fact of a feature set being a nice predictor of the objects in study, but all of its properly contained subsets cannot predict such objects satisfactorily. In this work, the conditions for the rising of this phenomenon were analitically obtained for sets of 2 and 3 features regarding a target variable. In the gene regulatory networks context, evidences have been achieved in which target genes of IMP sets possess a great potential to execute vital functions in biological systems. The phenomenon known as canalization is particularly important in this context. In melanoma microarray data, we verified that DUSP1 gene, known by having canalization function, was the one which composed the largest number of IMP gene sets. It was also verified that all these sets have canalizing predictive logics. Moreover, computational simulations for generation of networks with 3 or more genes show that the territory size of a target gene can contribute positively to its IMP score with regard to its predictors. This could be an evidence that confirms the hypothesis stating that target genes of IMP sets are inclined to control several metabolic pathways essential to the maintenance of the vital functions of an organism.
|
Page generated in 0.1472 seconds