• Refine Query
  • Source
  • Publication year
  • to
  • Language
  • 17
  • 14
  • 4
  • 4
  • 2
  • Tagged with
  • 54
  • 54
  • 21
  • 14
  • 14
  • 14
  • 12
  • 11
  • 10
  • 10
  • 10
  • 10
  • 10
  • 10
  • 9
  • About
  • The Global ETD Search service is a free service for researchers to find electronic theses and dissertations. This service is provided by the Networked Digital Library of Theses and Dissertations.
    Our metadata is collected from universities around the world. If you manage a university/consortium/country archive and want to be added, details can be found on the NDLTD website.
21

Aspectos biométricos da detecção de QTL'S ("Quantitative Trait Loci") em espécies cultivadas. / Biometrical aspects of QTL detection in cultivated species.

Silva, Heyder Diniz 05 December 2001 (has links)
O mapeamento de QTL's difere dos demais tipos de pesquisas conduzida em genética. Por se tratar basicamente de um procedimento de testes múltiplos, surge, neste contexto, um problema que se refere ao nível de significância conjunto da análise, e consequentemente, seu poder. Deste modo, avaliou-se, via simulação computacional de dados, o poder de detecção de QTL's da análise de marcas simples, realizada por meio de regressão linear múltipla, utilizando o procedimento stepwise" para seleção das marcas e procedimentos baseados em testes individuais, utilizando os critérios FDR e de Bonferroni para determinação nível de significância conjunto. Os resultados mostraram que o procedimento baseado em regressão múltipla, utilizando o procedimento stepwise" foi mais poderoso em identificar as marcas associadas a QTL's e, mesmo nos casos em que este procedimento apresentou poder ligeiramente inferior aos demais, verificou-se que o mesmo tem como grande vantagem selecionar apenas as marcas mais fortemente ligadas aos QTL's. Dentre os critérios FDR e de Bonferroni, o primeiro mostrou-se, em geral, mais poderoso, devendo ser adotado nos procedimentos de mapeamento por intervalo. Outro problema encontrado na análise de QTL's refere-se µa abordagem da interação QTL's x ambientes. Neste contexto, apresentou-se uma partição da variância da interação genótipos x ambientes em efeitos explicados pelos marcadores e desvios, a partir da qual obtiveram-se os estimadores da proporção da variância genética (pm), e da variância da interação genótipos x ambientes (pms), explicadas pelos marcadores moleculares. Estes estimadores independem de desvios das frequências alélicas dos marcadores em relação µ as esperadas (1:2:1 em uma geração F2, 1:1 em um retrocruzamento, etc.), porém, apresentam uma alta probabilidade de obtenção de estimativas fora do intervalo paramétrico, principalmente para valores elevados destas proporções. Contudo, estas probabilidades podem ser reduzidas com o aumento do número de repetições e/ou de ambientes nos quais as progênies são avaliadas. A partir de um conjunto de dados de produtividade de grãos, referentes µ a avaliação de 68 progênies de milho, genotipadas para 77 marcadores moleculares codominantes e avaliadas em quatro ambientes, verificou-se que as metodologias apresentadas permitiram estimar as proporções pm e pms, bem como classificar as marcas associadas a QTL's, conforme seu nível de interação. O procedimento permitiu ainda a identificação de regiões cromossômicas envolvidas no controle genético do caractere sob estudo conforme sua maior ou menor estabilidade ao longo dos ambientes. / In general terms, QTL mapping di®ers from other research ac-tivities in genetics. Being basically a multiple test procedure, problems arise which are related to the joint level of signi¯cance of the analysis, and consequently, to its power. Using computational simulation of data, the power of simple marker analysis, carried out through multiple linear regression, using stepwise procedures to select the markers was obtained. Procedures based on single tests, using both the FDR and the Bonferroni criteria to determinate the joint level of signi¯cance were also used. Results showed that the procedure based on multiple regression, using the stepwise technique, was the most powerful in identifying markers associated to QTL's. However, in cases where its power was smaller, its advantage was the ability to detect only markers strongly associates with QTL's. In comparision with the Bonferroni method, the FDR criterion was in general more powerful, and should be adopted in the interval mapping procedures. Additional problems found in the QTL analysis refer to the QTL x environment interaction. We consider this aspect by par-titioning the genotype x environment interaction variance in components explained by the molecular markers and deviations. This alowed estimating the proportion of the genetic variance (pm), and genotype x environment variance (pms), explained by the markers. These estimators are not a®ected by deviations of allelic frequencies of the markers in relation to the expected values (1:2:1 in a F2 generation, 1:1 in a backcross , etc). However, there is a high probability of obtaining estimates out of the parametric range, specially for high values of this proportion. Nevertheless, these probabilities can be reduced by increasing the number of replications and/or environments where the progenies are evaluated. Based on a set of grain yield data, obtained from the evaluation of 68 maize progenies genotyped for 77 codominant molecular markers, and evaluated as top crosses in four environments, the presented methodologies allowed estimating proportions pm and pms as well the classification of markers associated to QTL's, with respect to its level of genotype x environment interaction. The procedure also allowed the identification of chromosomic regions, involved in the genetical control of the considered trait, according to its stability, in relation to the observed environmental variation.
22

Desenvolvimento de modelo genético-estatístico para mapeamento de QTLs em progênie de irmãos completos, com aplicação em cana-de-açúcar / Development and application of genétic model for QTL mapping in a full sib family

Gazaffi, Rodrigo 10 March 2009 (has links)
A cana-de-açúcar é uma espécie de elevada importância econômica, uma vez que o país é o maior produtor mundial desta cultura. Atualmente, recebe importância maior devido as questões econômico-ambientais geradas pelo seu principal produto, o etanol. Neste contexto, há um cenário de potencial crescimento para cultura, em que o melhoramento genético pode contribuir com o desenvolvimento de cultivares mais produtivos e eficientes para diversas condições de cultivo. Os programas de melhoramento genético poderiam utilizar as informações obtidas com o mapeamento de QTLs para tornarem-se mais eficientes. Para tanto, faz-se necessário o desenvolvimento de abordagem que permita o mapeamento de QTLs em cana-de-açúcar com maior precisão. Os modelos genéticos-estatisticos desenvolvidos para o mapeamento de QTLs, normalmente são baseados em populações experimentais originárias de linhagens endogâmicas e espécies diplóides. No entanto, para espécies como cana-de-açúcar, eucalipto, maracujá, a obtenção deste tipo de material é impraticável pela alta depressão por endogamia existente. Dessa forma, estudos de mapeamento são conduzidos com uso de progênies de irmãos completos, normalmente fazendo adaptações para que as metodologias existentes possam ser usadas, o que induz a várias desvantagens. Assim, o trabalho apresentou dois objetivos: i) desenvolvimento de uma abordagem para mapeamento de QTLs em progênies de irmãos completos, utilizando mapa integrado e mapeamento por intervalo composto. ii) aplicação do presente modelo em caracteres relacionados a produtividade em cana-de-açúcar. Verificou-se que o novo modelo foi superior as abordagens já existentes na literatura, pois em estudos de simulação os QTLs foram detectados com maior poder estatístico e também com maior precisão. A aplicação do modelo em dados de cana-de-açúcar permitiu a identificação de maior número de QTLs do que a abordagem comumente utilizada para esta cultura. O maior poder estatístico desta metodologia contribuiu diretamente para detecção de novas regiões que apresentam associação com caracteres de produção. Vale destacar que o modelo detectou QTLs com diferentes padrões de segregação, além de indicar a provável existência de QTLs que se expressam ao longo dos cortes. / Sugarcane has great economic importance to Brazil, which is worlds largest producer. Currently, sugarcane receives worldwide attention due to the economic and environmental issues generated by its main product, ethanol. In this context, there is a scenario of potential growth for the culture, in which breeding can contribute to the development of new cultivars, more productive and effective to explore environmental conditions. Breeding programs could use the information obtained form QTL mapping to become more efficient. Thus, it is necessary to develop new statistical methods that allow QTL mapping in sugarcane with more precision. Statistical models developed for QTL mapping are usually based on experimental populations obtained from inbred lines. However, for species such as sugarcane, eucalyptus, passion fruit, inbred lines are not avaliable and then and mapping studies are conducted using full-sib families, usually making adaptations to existing methodologies, leading to several disadvantages since the assumptions are usually unrealist. This work had two objectives: i) develop an approach for mapping QTLs in full-sibs, using integrated map and compositive interval mapping. ii) use this model to map QTL for traits related to productivity in sugarcane. Results showed that the new model provided better results then existing approaches in literature. In simulation studies, all QTL were detected with more statistical power and precision. The application of the model on data from sugarcane has allowed the identification of more QTLs than single marker analysis, which is commonly used. The statistical power contributed to detection of new regions were associated with variation of quantitative traits. The model also detected QTLs with different patterns of segregation, as well as QTL expressed across harvests.
23

Predição de valores genotípicos de híbridos de milho com desbalanceamentos de genótipos e ambientes / Predicting maize single-crosses genotypic values under unbalanced number of genotypes and environments

Fritsche Neto, Roberto 17 December 2008 (has links)
A fase mais difícil e que exige mais recursos em um programa de melhoramento de milho é a avaliação experimental dos híbridos, pois geralmente um elevado número de híbridos necessita ser avaliado em diversos ambientes. Deste modo, tanto o número de híbridos como o de ambientes são limitados pelos recursos disponíveis, o que poderia levar a uma redução do número de ambientes, e, portanto, conjuntos de híbridos comumente são avaliados em diferentes ambientes levando a comparações desbalanceadas entre os híbridos. A metodologia estatística conhecida como REM/BLUP tem sido amplamente utilizada no melhoramento animal, mas nos programas de melhoramento vegetal a sua utilização tem sido restrita a culturas perenes, onde experimentos desbalanceados são comuns. Há pouca informação na literatura sobre a confiabilidade do método REML/BLUP utilizando dados experimentais para a predição de valores genotípicos sob experimentos desbalanceados para programas de melhoramento de culturas anuais. Assim, o objetivo desta pesquisa foi avaliar se o método REML/BLUP poderia ser útil para predizer os valores genotípicos de híbridos simples de milho sob situações de desbalanceamento. Um conjunto de 256 híbridos simples foi avaliado em delineamento látice 16 x 16 com duas repetições por ambiente em 13 ambientes e as características analisadas foram produção de grãos, altura da planta e acamamento de plantas. Uma vez que a avaliação constou de 26 observações para cada híbrido simples, suas médias gerais ajustadas computadas pelo método dos quadrados mínimos foram consideradas como seus valores genotípicos, para fins de comparações com as predições dos valores genotípicos pelo método REML/BLUP. As predições dos híbridos simples foram computadas pelo método REML/BLUP considerando conjuntos desbalanceados de híbridos dentro de ambientes e perdas completas dos dados de ambientes. Os dados foram submetidos a um desbalanceamento aleatório e cada situação foi simulada 1.000 vezes utilizando o método bootstrap. Foram computados coeficientes de correlação entre os valores genotípicos preditos e as médias gerais ajustadas, e seus valores foram elevados ao quadrado para obter os valores de R2; assim 1.000 valores de R2 foram obtidos para cada situação considerada. Além disso, foi praticada seleção utilizando os valores genotípicos preditos e as médias gerais ajustadas dos híbridos simples e as percentagens de coincidência foram computadas. Independentemente do caráter analisado, os valores de R2 e o percentual de coincidência dos híbridos simples selecionados mostrou que o REML/BLUP prediz com alta acurácia os valores genotípicos dos híbridos simples com até 20% das perdas de híbridos dentro de ambientes ou com redução de até 23% dos ambientes. Nota-se que o caráter produção de grãos apresentou interação genótipos x ambientes significativa e complexa, e mesmo assim o método REML/BLUP fez a predição dos valores genotípicos com alta acurácia. Deste modo, o método REML/BLUP poderia ser considerado como uma valiosa ferramenta no melhoramento genético de milho para predizer os valores genotípicos dos híbridos sob dados desbalanceados. Entretanto, os resultados também apontaram que há um limite para a sua acurácia, o qual corresponde a cerca de 20% dos dados desbalanceados. / The more difficult phase and that demands more funding in a maize breeding program is the experimental evaluation of the hybrids, because usually a high number of hybrids needs to be evaluated in several environments. Then, both the number of environments and hybrids are limited by the resources available, which could lead to a reduction in the number of environments, and therefore, sets of hybrids are commonly tested in different environments leading to unbalanced comparisons among the hybrids. The statistical methodology known as REM/BLUP has been widely used in animal breeding, but in plant breeding programs its use has been restricted to perennial crops where unbalanced experiments are very common. There is limited information about the reliability of the REM/BLUP method using experimental data for the genotypic values prediction under unbalanced experiments for annual crops breeding programs. Thus, the objective of this research was to assess whether the REM/BLUP method could be useful to predict the genotypic values of maize single-crosses under unbalanced situations. A set of 256 single-crosses was evaluated in a 16 x 16 lattice design with two replications per environment in 13 environments, and the traits analyzed were grain yield, plant lodging and plant height. As the evaluation consisted of 26 observations for each single-cross, their adjusted overall means computed by the least squares method were considered as their genotypic values for the sake of comparisons with the genotypic predictions by REM/BLUP method. The predictions of the single-crosses were computed considering unbalanced sets of hybrids within environments and unbalanced sets of environments. The data were submitted to a random unbalance and each situation was simulated 1,000 times using the bootstrap method. Coefficients of correlation were then computed between the predicted genotypic values and the adjusted overall means, and their values were squared to obtain the R2 values; thus 1,000 R2 values were obtained for each considered situation. Also, selection were performed using the predict values and the adjusted overall means of the single-crosses, and the percentage of coincidence were computed. Regardless of the trait analyzed, the R2 values and the percentage of coincidence of the selected single-crosses showed that the REM/BLUP predict with high accuracy the genotypic values of the single-crosses up to 20% of losses of hybrids within environments and up to 23% of environments reduction. It should be noted that grain yield showed a significant cross-over interaction, and even so the REM/BLUP predicted the genotypic values of the hybrids with high accuracy. Thus, the REM/BLUP method can be considered as a valuable tool in maize breeding programs to predict the genotypic values of the hybrids under unbalanced data. However, the results also pointed out that there is a limit for its accuracy, which is around 20% of unbalanced data.
24

The statistical theory underlying human genetic linkage analysis based on quantitative data from extended families

Galal, Ushma January 2010 (has links)
<p>Traditionally in human genetic linkage analysis, extended families were only used in the analysis of dichotomous traits, such as Disease/No Disease. For quantitative traits, analyses initially focused on data from family trios (for example, mother, father, and child) or sib-pairs. Recently however, there have been two very important developments in genetics: It became clear that if the disease status of several generations of a family is known and their genetic information is obtained, researchers can pinpoint which pieces of genetic material are linked to the disease or trait. It also became evident that if a trait is quantitative (numerical), as blood pressure or viral loads are, rather than dichotomous, one has much more power for the same sample size. This led to the&nbsp / development of statistical mixed models which could incorporate all the features of the data, including the degree of relationship between each pair of family members. This is necessary because a parent-child pair definitely shares half their genetic material, whereas a pair of cousins share, on average, only an eighth. The statistical methods involved here have however been developed by geneticists, for their specific studies, so there does not seem to be a unified and general description of the theory underlying the methods. The aim of this dissertation is to explain in a unified and statistically comprehensive manner, the theory involved in the analysis of quantitative trait genetic data from extended families. The focus is on linkage analysis: what it is and what it aims to do.&nbsp / There is a step-by-step build up to it, starting with an introduction to genetic epidemiology. This includes an explanation of the relevant genetic terminology. There is also an application section where an appropriate human genetic family dataset is analysed, illustrating the methods explained in the theory sections.</p>
25

The statistical theory underlying human genetic linkage analysis based on quantitative data from extended families

Galal, Ushma January 2010 (has links)
<p>Traditionally in human genetic linkage analysis, extended families were only used in the analysis of dichotomous traits, such as Disease/No Disease. For quantitative traits, analyses initially focused on data from family trios (for example, mother, father, and child) or sib-pairs. Recently however, there have been two very important developments in genetics: It became clear that if the disease status of several generations of a family is known and their genetic information is obtained, researchers can pinpoint which pieces of genetic material are linked to the disease or trait. It also became evident that if a trait is quantitative (numerical), as blood pressure or viral loads are, rather than dichotomous, one has much more power for the same sample size. This led to the&nbsp / development of statistical mixed models which could incorporate all the features of the data, including the degree of relationship between each pair of family members. This is necessary because a parent-child pair definitely shares half their genetic material, whereas a pair of cousins share, on average, only an eighth. The statistical methods involved here have however been developed by geneticists, for their specific studies, so there does not seem to be a unified and general description of the theory underlying the methods. The aim of this dissertation is to explain in a unified and statistically comprehensive manner, the theory involved in the analysis of quantitative trait genetic data from extended families. The focus is on linkage analysis: what it is and what it aims to do.&nbsp / There is a step-by-step build up to it, starting with an introduction to genetic epidemiology. This includes an explanation of the relevant genetic terminology. There is also an application section where an appropriate human genetic family dataset is analysed, illustrating the methods explained in the theory sections.</p>
26

Rare and low-frequency variants and predisposition to complex disease

Albers, Patrick K. January 2017 (has links)
Advances in high-throughput genomic technologies have facilitated the collection of DNA information for thousands of individuals, providing unprecedented opportunities to explore the genetic architecture of complex disease. One important finding has been that the majority of variants in the human genome are low in frequency or rare. It has been hypothesised that recent explosive growth of the human population afforded unexpectedly large amounts of rare variants with potentially deleterious effects, suggesting that rare variants may play a role in disease predisposition. But, importantly, rare variants embody a source of information through which we may learn more about our recent evolutionary history. In this thesis, I developed several statistical and computational methods to address problems associated with the analysis of rare variants and, foremost, to leverage the genealogical information they encode. First, one constraint in genome-wide association studies is that lower-frequency variants are not well captured by genotyping methods, but instead are predicted through imputation from a reference dataset. I developed the meta-imputation method to improve imputation accuracy by integrating genotype data from multiple, independent reference panels, which outperformed imputations from separate references in almost all comparisons (mean correlation with masked genotypes r<sup>2</sup>&GT;0.9). I further demonstrated in simulated case-control studies that meta-imputation increased the statistical power to identify low-frequency variants of intermediate or high penetrance by 2.2-3.6%. Second, rare variants are likely to have originated recently through mutation and thereby sit on relatively long haplotype regions identical by descent (IBD). I developed a method that exploits rare variants as identifiers for shared haplotype segments around which the breakpoints of recombination are detected using non-probabilistic approaches. In coalescent simulations, I show that such breakpoints can be inferred with high accuracy (r<sup>2</sup>&GT;0.99) around rare variants at frequencies &LT;0.05%, using either haplotype or genotype data. Third, I show that technical error poses a major problem for the analysis of whole-genome sequencing or genotyping data, particularly for alleles below 0.05% frequency (false positive rate, FPR=0.1). I therefore propose a novel approach to infer IBD segments using a Hidden Markov Model (HMM) which operates on genotype data alone. I incorporated an empirical error model constructed from error rates I estimated in publicly available sequencing and genotyping datasets. The HMM was robust in presence of error in simulated data (r<sup>2</sup>&GT;0.98) while nonprobabilistic methods failed (r<sup>2</sup>&LT;0.02). Lastly, the age of an allele (the time since its creation through mutation) may provide clues about demographic processes that resulted in its observed frequency. I present a novel method to estimate (rare) allele age based on the inferred shared haplotype structure of the sample. The method operates in a Bayesian framework to infer pairwise coalescent times from which the age is estimated using a composite posterior approach. I show in simulated data that coalescent time can be inferred with high accuracy (rank correlation &GT;0.91) which resulted in a likewise high accuracy for estimated age (&GT;0.94). When applied to data from the 1000 Genomes Project, I show that estimated age distributions were overall conform with frequency-dependent expectations under neutrality, but where patterns of low frequency and old age may hint at signatures of selection at certain sites. Thus, this method may prove useful in the analysis of large cohorts when linked to biomedical phenotype data.
27

Competição intergenotípica na análise de testes de progênie em essências florestais. / Intergenotypic competition in the analysis of forest tree progeny trials.

Eduardo Leonardecz Neto 26 August 2002 (has links)
No presente trabalho buscou-se introduzir o efeito da competição entre plantas nas análises dos testes de progênie/procedências em essências florestais, com o fim de identificar os seus efeitos e as distorções devidas à sua não observância. Para tanto, foram utilizados ensaios com níveis de precisão e mortalidades diferentes, de cinco espécies, a saber: Gallesia gorarema Vell. Moq., Eucaliptus grandis Hill ex Maider, Eucaliptus citridora Hook, Pinus elliottii Engl. var. elliottii e Araucaria angustifolia (Bert.) O. Ktze. Obtiveram-se as esperanças dos quadrados médios das fontes de variação da análise de variância nos delineamentos aqui utilizados. Com base nestas derivações, foi demonstrado explicitamente o viés nas estimativas de parâmetros genéticos quantitativos. Este viés está diretamente relacionado com a magnitude do coeficiente de regressão b e com a grandeza relativa das somas de quadrados de diferentes efeitos contidos na análise de variância da variável competição. Caso ignorado o efeito de competição, quando este influencia a variável resposta Y, os ponderadores b, que compõem o índice de seleção terão estimativas viesadas, gerando erro na seleção dos indivíduos superiores. Na análise de dados observou-se que a inclusão da competição, de maneira geral, reduziu as estimativas das componentes de variância, e por conseqüência, outras estimativas de parâmetros que são função destes, quando comparado com as estimativas feitas por via das análises sem o ajuste para a competição. A análise com a variável competição não mostrou diferenças significativas para o efeito de progênies. Isto demostra que a competição comportou-se de forma aleatória, o que corrobora para que seja colocada na análise como uma covariável; caso contrário esta teria que ser considerada uma componente da performance e introduzida numa análise multicaracterística. Utilizando as análises com e sem ajuste para a competição, para estimar os valores genéticos e o ganho com a seleção, observou-se que os indivíduos selecionados não são concordantes. Isto indica que os equívocos na seleção podem ser comuns, haja vista que o fato de se ajustar os dados faz com que o posto dos indivíduos tidos por superiores seja alterado. É recomendável considerar os efeitos da competição na análise de dados em que os indivíduos estão sujeitos a competir uns com os outros, no seu desenvolvimento. / The aim of this work was to introduce competition effects in the model underlying the analysis of forest tree experiments. Results were compared with analyses in which effects were neglected. Progeny trails with different levels of precision and mortality were used, including the following species: Gallesia gorarema Vell. Moq., Eucaliptus grandis Hill ex Maider, Eucaliptus citridora Hook, Pinus elliottii Engl. var. elliottii and Araucaria angustifolia (Bert.) O. Ktze. Mathematical expectation of mean squares values were derived and the bias of estimates was explicitly shown. Competition effects were found significant in all experiments, but were primarily of random nature. Bias was shown to be directly proportional to the magnitude of the regression parameter b and to the relative magnitude of sums of squares of the competition variable. Including the variable in general lead to a reduction of estimates of variance components and to smaller expected progress from selection. The b coefficients of multi-effect selection index are also biased if competition is ignored. Results indicated that different sets of genotypes could be selected if the analyses of data were carried out with or without the competition effects. Including a competition variable in the analysis of trials in which plants are exposed to competing with each other is recommendable.
28

Aspectos biométricos da detecção de QTL'S ("Quantitative Trait Loci") em espécies cultivadas. / Biometrical aspects of QTL detection in cultivated species.

Heyder Diniz Silva 05 December 2001 (has links)
O mapeamento de QTL's difere dos demais tipos de pesquisas conduzida em genética. Por se tratar basicamente de um procedimento de testes múltiplos, surge, neste contexto, um problema que se refere ao nível de significância conjunto da análise, e consequentemente, seu poder. Deste modo, avaliou-se, via simulação computacional de dados, o poder de detecção de QTL's da análise de marcas simples, realizada por meio de regressão linear múltipla, utilizando o procedimento stepwise" para seleção das marcas e procedimentos baseados em testes individuais, utilizando os critérios FDR e de Bonferroni para determinação nível de significância conjunto. Os resultados mostraram que o procedimento baseado em regressão múltipla, utilizando o procedimento stepwise" foi mais poderoso em identificar as marcas associadas a QTL's e, mesmo nos casos em que este procedimento apresentou poder ligeiramente inferior aos demais, verificou-se que o mesmo tem como grande vantagem selecionar apenas as marcas mais fortemente ligadas aos QTL's. Dentre os critérios FDR e de Bonferroni, o primeiro mostrou-se, em geral, mais poderoso, devendo ser adotado nos procedimentos de mapeamento por intervalo. Outro problema encontrado na análise de QTL's refere-se µa abordagem da interação QTL's x ambientes. Neste contexto, apresentou-se uma partição da variância da interação genótipos x ambientes em efeitos explicados pelos marcadores e desvios, a partir da qual obtiveram-se os estimadores da proporção da variância genética (pm), e da variância da interação genótipos x ambientes (pms), explicadas pelos marcadores moleculares. Estes estimadores independem de desvios das frequências alélicas dos marcadores em relação µ as esperadas (1:2:1 em uma geração F2, 1:1 em um retrocruzamento, etc.), porém, apresentam uma alta probabilidade de obtenção de estimativas fora do intervalo paramétrico, principalmente para valores elevados destas proporções. Contudo, estas probabilidades podem ser reduzidas com o aumento do número de repetições e/ou de ambientes nos quais as progênies são avaliadas. A partir de um conjunto de dados de produtividade de grãos, referentes µ a avaliação de 68 progênies de milho, genotipadas para 77 marcadores moleculares codominantes e avaliadas em quatro ambientes, verificou-se que as metodologias apresentadas permitiram estimar as proporções pm e pms, bem como classificar as marcas associadas a QTL's, conforme seu nível de interação. O procedimento permitiu ainda a identificação de regiões cromossômicas envolvidas no controle genético do caractere sob estudo conforme sua maior ou menor estabilidade ao longo dos ambientes. / In general terms, QTL mapping di®ers from other research ac-tivities in genetics. Being basically a multiple test procedure, problems arise which are related to the joint level of signi¯cance of the analysis, and consequently, to its power. Using computational simulation of data, the power of simple marker analysis, carried out through multiple linear regression, using stepwise procedures to select the markers was obtained. Procedures based on single tests, using both the FDR and the Bonferroni criteria to determinate the joint level of signi¯cance were also used. Results showed that the procedure based on multiple regression, using the stepwise technique, was the most powerful in identifying markers associated to QTL's. However, in cases where its power was smaller, its advantage was the ability to detect only markers strongly associates with QTL's. In comparision with the Bonferroni method, the FDR criterion was in general more powerful, and should be adopted in the interval mapping procedures. Additional problems found in the QTL analysis refer to the QTL x environment interaction. We consider this aspect by par-titioning the genotype x environment interaction variance in components explained by the molecular markers and deviations. This alowed estimating the proportion of the genetic variance (pm), and genotype x environment variance (pms), explained by the markers. These estimators are not a®ected by deviations of allelic frequencies of the markers in relation to the expected values (1:2:1 in a F2 generation, 1:1 in a backcross , etc). However, there is a high probability of obtaining estimates out of the parametric range, specially for high values of this proportion. Nevertheless, these probabilities can be reduced by increasing the number of replications and/or environments where the progenies are evaluated. Based on a set of grain yield data, obtained from the evaluation of 68 maize progenies genotyped for 77 codominant molecular markers, and evaluated as top crosses in four environments, the presented methodologies allowed estimating proportions pm and pms as well the classification of markers associated to QTL's, with respect to its level of genotype x environment interaction. The procedure also allowed the identification of chromosomic regions, involved in the genetical control of the considered trait, according to its stability, in relation to the observed environmental variation.
29

Predição de valores genotípicos de híbridos de milho com desbalanceamentos de genótipos e ambientes / Predicting maize single-crosses genotypic values under unbalanced number of genotypes and environments

Roberto Fritsche Neto 17 December 2008 (has links)
A fase mais difícil e que exige mais recursos em um programa de melhoramento de milho é a avaliação experimental dos híbridos, pois geralmente um elevado número de híbridos necessita ser avaliado em diversos ambientes. Deste modo, tanto o número de híbridos como o de ambientes são limitados pelos recursos disponíveis, o que poderia levar a uma redução do número de ambientes, e, portanto, conjuntos de híbridos comumente são avaliados em diferentes ambientes levando a comparações desbalanceadas entre os híbridos. A metodologia estatística conhecida como REM/BLUP tem sido amplamente utilizada no melhoramento animal, mas nos programas de melhoramento vegetal a sua utilização tem sido restrita a culturas perenes, onde experimentos desbalanceados são comuns. Há pouca informação na literatura sobre a confiabilidade do método REML/BLUP utilizando dados experimentais para a predição de valores genotípicos sob experimentos desbalanceados para programas de melhoramento de culturas anuais. Assim, o objetivo desta pesquisa foi avaliar se o método REML/BLUP poderia ser útil para predizer os valores genotípicos de híbridos simples de milho sob situações de desbalanceamento. Um conjunto de 256 híbridos simples foi avaliado em delineamento látice 16 x 16 com duas repetições por ambiente em 13 ambientes e as características analisadas foram produção de grãos, altura da planta e acamamento de plantas. Uma vez que a avaliação constou de 26 observações para cada híbrido simples, suas médias gerais ajustadas computadas pelo método dos quadrados mínimos foram consideradas como seus valores genotípicos, para fins de comparações com as predições dos valores genotípicos pelo método REML/BLUP. As predições dos híbridos simples foram computadas pelo método REML/BLUP considerando conjuntos desbalanceados de híbridos dentro de ambientes e perdas completas dos dados de ambientes. Os dados foram submetidos a um desbalanceamento aleatório e cada situação foi simulada 1.000 vezes utilizando o método bootstrap. Foram computados coeficientes de correlação entre os valores genotípicos preditos e as médias gerais ajustadas, e seus valores foram elevados ao quadrado para obter os valores de R2; assim 1.000 valores de R2 foram obtidos para cada situação considerada. Além disso, foi praticada seleção utilizando os valores genotípicos preditos e as médias gerais ajustadas dos híbridos simples e as percentagens de coincidência foram computadas. Independentemente do caráter analisado, os valores de R2 e o percentual de coincidência dos híbridos simples selecionados mostrou que o REML/BLUP prediz com alta acurácia os valores genotípicos dos híbridos simples com até 20% das perdas de híbridos dentro de ambientes ou com redução de até 23% dos ambientes. Nota-se que o caráter produção de grãos apresentou interação genótipos x ambientes significativa e complexa, e mesmo assim o método REML/BLUP fez a predição dos valores genotípicos com alta acurácia. Deste modo, o método REML/BLUP poderia ser considerado como uma valiosa ferramenta no melhoramento genético de milho para predizer os valores genotípicos dos híbridos sob dados desbalanceados. Entretanto, os resultados também apontaram que há um limite para a sua acurácia, o qual corresponde a cerca de 20% dos dados desbalanceados. / The more difficult phase and that demands more funding in a maize breeding program is the experimental evaluation of the hybrids, because usually a high number of hybrids needs to be evaluated in several environments. Then, both the number of environments and hybrids are limited by the resources available, which could lead to a reduction in the number of environments, and therefore, sets of hybrids are commonly tested in different environments leading to unbalanced comparisons among the hybrids. The statistical methodology known as REM/BLUP has been widely used in animal breeding, but in plant breeding programs its use has been restricted to perennial crops where unbalanced experiments are very common. There is limited information about the reliability of the REM/BLUP method using experimental data for the genotypic values prediction under unbalanced experiments for annual crops breeding programs. Thus, the objective of this research was to assess whether the REM/BLUP method could be useful to predict the genotypic values of maize single-crosses under unbalanced situations. A set of 256 single-crosses was evaluated in a 16 x 16 lattice design with two replications per environment in 13 environments, and the traits analyzed were grain yield, plant lodging and plant height. As the evaluation consisted of 26 observations for each single-cross, their adjusted overall means computed by the least squares method were considered as their genotypic values for the sake of comparisons with the genotypic predictions by REM/BLUP method. The predictions of the single-crosses were computed considering unbalanced sets of hybrids within environments and unbalanced sets of environments. The data were submitted to a random unbalance and each situation was simulated 1,000 times using the bootstrap method. Coefficients of correlation were then computed between the predicted genotypic values and the adjusted overall means, and their values were squared to obtain the R2 values; thus 1,000 R2 values were obtained for each considered situation. Also, selection were performed using the predict values and the adjusted overall means of the single-crosses, and the percentage of coincidence were computed. Regardless of the trait analyzed, the R2 values and the percentage of coincidence of the selected single-crosses showed that the REM/BLUP predict with high accuracy the genotypic values of the single-crosses up to 20% of losses of hybrids within environments and up to 23% of environments reduction. It should be noted that grain yield showed a significant cross-over interaction, and even so the REM/BLUP predicted the genotypic values of the hybrids with high accuracy. Thus, the REM/BLUP method can be considered as a valuable tool in maize breeding programs to predict the genotypic values of the hybrids under unbalanced data. However, the results also pointed out that there is a limit for its accuracy, which is around 20% of unbalanced data.
30

Desenvolvimento de modelo genético-estatístico para mapeamento de QTLs em progênie de irmãos completos, com aplicação em cana-de-açúcar / Development and application of genétic model for QTL mapping in a full sib family

Rodrigo Gazaffi 10 March 2009 (has links)
A cana-de-açúcar é uma espécie de elevada importância econômica, uma vez que o país é o maior produtor mundial desta cultura. Atualmente, recebe importância maior devido as questões econômico-ambientais geradas pelo seu principal produto, o etanol. Neste contexto, há um cenário de potencial crescimento para cultura, em que o melhoramento genético pode contribuir com o desenvolvimento de cultivares mais produtivos e eficientes para diversas condições de cultivo. Os programas de melhoramento genético poderiam utilizar as informações obtidas com o mapeamento de QTLs para tornarem-se mais eficientes. Para tanto, faz-se necessário o desenvolvimento de abordagem que permita o mapeamento de QTLs em cana-de-açúcar com maior precisão. Os modelos genéticos-estatisticos desenvolvidos para o mapeamento de QTLs, normalmente são baseados em populações experimentais originárias de linhagens endogâmicas e espécies diplóides. No entanto, para espécies como cana-de-açúcar, eucalipto, maracujá, a obtenção deste tipo de material é impraticável pela alta depressão por endogamia existente. Dessa forma, estudos de mapeamento são conduzidos com uso de progênies de irmãos completos, normalmente fazendo adaptações para que as metodologias existentes possam ser usadas, o que induz a várias desvantagens. Assim, o trabalho apresentou dois objetivos: i) desenvolvimento de uma abordagem para mapeamento de QTLs em progênies de irmãos completos, utilizando mapa integrado e mapeamento por intervalo composto. ii) aplicação do presente modelo em caracteres relacionados a produtividade em cana-de-açúcar. Verificou-se que o novo modelo foi superior as abordagens já existentes na literatura, pois em estudos de simulação os QTLs foram detectados com maior poder estatístico e também com maior precisão. A aplicação do modelo em dados de cana-de-açúcar permitiu a identificação de maior número de QTLs do que a abordagem comumente utilizada para esta cultura. O maior poder estatístico desta metodologia contribuiu diretamente para detecção de novas regiões que apresentam associação com caracteres de produção. Vale destacar que o modelo detectou QTLs com diferentes padrões de segregação, além de indicar a provável existência de QTLs que se expressam ao longo dos cortes. / Sugarcane has great economic importance to Brazil, which is worlds largest producer. Currently, sugarcane receives worldwide attention due to the economic and environmental issues generated by its main product, ethanol. In this context, there is a scenario of potential growth for the culture, in which breeding can contribute to the development of new cultivars, more productive and effective to explore environmental conditions. Breeding programs could use the information obtained form QTL mapping to become more efficient. Thus, it is necessary to develop new statistical methods that allow QTL mapping in sugarcane with more precision. Statistical models developed for QTL mapping are usually based on experimental populations obtained from inbred lines. However, for species such as sugarcane, eucalyptus, passion fruit, inbred lines are not avaliable and then and mapping studies are conducted using full-sib families, usually making adaptations to existing methodologies, leading to several disadvantages since the assumptions are usually unrealist. This work had two objectives: i) develop an approach for mapping QTLs in full-sibs, using integrated map and compositive interval mapping. ii) use this model to map QTL for traits related to productivity in sugarcane. Results showed that the new model provided better results then existing approaches in literature. In simulation studies, all QTL were detected with more statistical power and precision. The application of the model on data from sugarcane has allowed the identification of more QTLs than single marker analysis, which is commonly used. The statistical power contributed to detection of new regions were associated with variation of quantitative traits. The model also detected QTLs with different patterns of segregation, as well as QTL expressed across harvests.

Page generated in 0.096 seconds