Spelling suggestions: "subject:"modelos mistos"" "subject:"odelos mistos""
11 |
Modelos mistos no ajuste de curvas de crescimento de Ricinus communis L. / Mixed model by adjustment of growth curves in Ricinus communis L.Amador, Janete Pereira 16 July 2010 (has links)
Coordenação de Aperfeiçoamento de Pessoal de Nível Superior / The world energy demand must be met, however, the conventional sources are nearing exhaustion, and cause harmful effects to the environment. In this sense, it has been researched renewable energy sources as an alternative to bioenergy, which could contribute substantially
in the future supply of energy. One of the aspects of bioenergy is that of biodiesel, a biodegradable fuel alternative to diesel oil, created from renewable energy sources, free of sulfur in its composition. In the field of oil seed, castor bean (Ricinus communis L.) has stood
out as a supplier of raw material to manufacture biodiesel. In Rio Grande do Sul, for the ricinoculture becomes sustainable production-level scale as raw material for biodiesel production in the increment becomes crucial. And this depends on the development of agricultural technologies adapted to the conditions of the state. In this context, there is a paucity of research to study the influence of density on the cultivation of oilseeds and their connection with the form of plant growth. Since this factor can influence significantly the development of castor bean, reflecting production. This research aims to evaluate the influence of three planting densities 1.0, 1.2 and 1.4 m, keeping constant the distance between
the row of 1.0 m, on the growth of castor bean. To explain this influence will be used the technique of analysis of longitudinal data using growth curve modeling using mixed model methodology. It was found that this allows to explore more fully the information provided by the data, because it is possible to accommodate the correlation of these through the selection of covariance structures. Thus, the six covariance structures tested to model the G and R were selected UN (1) and VC. The strategy used to select both of these structures as for the random
effects proved to be simpler alternative in this part of modeling. In univariate analysis of profile to choose the fixed effects model with some information provided by both techniques, you can check which one best fits the data. Shaped curve is a two densities 1 and 1.4 m that
provided the greatest plant height did not differ significantly. For the cultivation density of 1.2
m, the plant showed a lower growth, its growth behavior was modeled by another curve. Even considering the computational complexity of the procedures used, it is hoped, through the SAS routines compiled this material, contribute to greater facilitation in the use of these
procedures. / A demanda energética mundial precisa ser atendida, entretanto, as fontes convencionais estão em vias de esgotamento, além de provocarem efeitos prejudiciais ao
ambiente. Neste sentido, têm-se pesquisado fontes energéticas renováveis, como alternativa a agroenergia, que poderá contribuir de maneira substancial na oferta futura de energia. Uma das vertentes da agroenergia é a do biodiesel, um combustível biodegradável alternativo ao diesel de petróleo, criado a partir de fontes renováveis de energia, livre de enxofre em sua composição. No campo das oleaginosas, a mamona (Ricinus communis L.) vem se destacando
como fornecedora de matéria-prima para a fabricação de biodiesel. No Rio Grande do Sul, para que a ricinocultura, torna-se sustentável em nível de produção em escala como matéria prima para o biodiesel o incremento na produção torna-se fundamental. E este depende do desenvolvimento de tecnologias agrícolas adaptadas às condições do estado. Neste contexto, existe uma escassez de pesquisas que estudem a influência da densidade de plantas no cultivo
desta oleaginosa e a relação destas com a forma de crescimento da planta. Já que este fator pode influenciar, de maneira significativa, o desenvolvimento da mamoneira, refletindo na produção. Esta pesquisa objetiva avaliar a influência de três densidades de cultivo 1,0, 1,2 e
1,4 m, mantendo constante a distância entre linha de 1,0 m, sobre o crescimento da mamona. Para explicar esta influencia será utilizada a técnica de análise de dados longitudinais por
meio de modelagem de curvas de crescimento utilizando a metodologia de modelos mistos. Constatou-se que esta permite explorar de forma mais completa as informações fornecidas pelos dados, pelo fato de ser possível acomodar a correlação destes, por meio da seleção de estruturas de covariância. Sendo assim, das seis estruturas de covariância testadas para modelar G e R as selecionadas foram UN(1) e VC. A estratégia utilizada tanto para seleção destas estruturas como para os efeitos aleatórios mostrou-se como alternativa mais simples nesta parte da modelagem. Na análise univariada e multivariada de perfil para escolha dos
efeitos fixos do modelo com algumas informações fornecidas pelas duas técnicas, é possível verificar qual a que melhor se adéqua aos dados. Modelou-se duas curvas uma densidades 1 e 1,4 m que proporcionaram a maior altura de planta, não diferindo significativamente. Para a densidade de cultivo de 1,2 m, a planta apresentou um menor crescimento, seu
comportamento de crescimento foi modelado por outra curva. Mesmo considerando a complexidade computacional dos procedimentos utilizados, espera-se, através das rotinas do
SAS compiladas neste material, contribuir para uma maior facilitação no uso destes procedimentos.
|
12 |
Emprego do BLUP/REML na avaliação genética de linhagens elites de milho-pipoca / The use of BLUP/REML for genetic evaluation of popcorn elite linesValente, Mágno Sávio Ferreira 24 February 2010 (has links)
Made available in DSpace on 2015-03-26T13:42:14Z (GMT). No. of bitstreams: 1
texto completo.pdf: 836731 bytes, checksum: 1e5b214c3c6014a5c95797b0c455ae73 (MD5)
Previous issue date: 2010-02-24 / Conselho Nacional de Desenvolvimento Científico e Tecnológico / In breeding programs, it is important to use viable alternatives to reduce cost and time spent on population evaluations, combined with adequate statistical methodologies applying the maximum information available. Within this context, this work aimed to: i) study the genetic control of popping capacity and grain yield in popcorn; ii) predict the effects of general combining ability (GCA) and specific combining ability (SCA), applying mixed model analysis; iii) evaluate the performance per se of the lines used in hybrid crosses; and iv) evaluate the efficiency of Best Linear Unbiased-Prediction (BLUP) in predicting the performance of non crossed hybrids in diallelic analysis. Data from experiment evaluations of intra-population diallels of the Beija-Flor and Viçosa popcorn populations were used in the analyses. Eighteen S6 Beija-Flor elite lines were analyzed in ten environments and 29 S6 Viçosa elite lines in eight environments. Combined analyses were carried out, considering all the environments, with the additive model being adopted. The software ASREML was used in all analyses. GCA variability was verified both for grain yield and popping capacity. A significant SCA variability was verified in Beija-Flor for the two variables. In Viçosa, SCA was significant at 8% for grain yield while for popping capacity, the presence of additive effects was practically verified in its expression. Through the incorporation of sibling relationships in diallelic analysis, SCA values of combination of a line with itself (sjj) were predicted, without such cross being carried out. The use of BLUP/REML allowed the prediction of over 43 to 210% hybrid combinations, if compared only to the hybrid observed. Based on hybrid predictions, promising crosses were identified both for grain yield and popping capacity, being observed that the inclusion of a pedigree seems to make the analyses more accurate, as compared to the model not using this information. The performance per se and under S6 family crosses showed moderate correlations (r = 0.53) for popping capacity, showing that families with high popping capacity GCA can be selected, based on their performance per se. Aiming to obtain information on the efficiency in predicting S6 families based on performance per se and on S3 family crosses, a positive correlation (r = 0.76) was found for production between the GCA of top cross hybrids of the S3 families and the S6.family hybrids. When verifying BLUP efficiency in the prediction of non crossed hybrids, moderate to high Pearson and Spearman correlations were found among the predicted and observed values. Prediction of hybrids in the absence of dominance (popping capacity, r = 0.88) was more efficient than in the presence of dominance (grain yield, r = 0.53). The overall results showed that the use of mixed models is an efficient alternative in diallelic analysis, providing good precision in estimating genetic parameters, besides allowing the prediction of non crossed hybrids. / Em programas de melhoramento é importante o uso de alternativas viáveis para redução de custos e tempo nas avaliações de populações, aliadas ao uso de metodologias estatísticas adequadas, que aproveitem ao máximo as informações disponíveis. Neste contexto, o presente trabalho teve como objetivos: i) estudar o controle genético da capacidade de expansão e produção de grãos em milho-pipoca; ii) predizer os efeitos da capacidade geral de combinação (CGC) e da capacidade específica de combinação (CEC) por meio da análise de modelos mistos; iii) avaliar o desempenho per se das linhagens utilizadas nos cruzamentos híbridos; iv) avaliar a eficiência do BLUP na predição do desempenho de híbridos não realizados na análise dialélica. Nas análises, foram utilizados dados de experimentos de avaliação de dialelos intrapopulacionais das populações de milho-pipoca Beija-Flor e Viçosa. Foram analisadas 18 linhagens elites S6 de Beija-Flor, em 10 ambientes, e 29 linhagens elites S6 de Viçosa, em 8 ambientes. Foram realizadas análises conjuntas, considerando todos os ambientes, sendo adotado o modelo aditivo-dominante. Em todas as análises foi utilizado o software ASREML. Foi verificada variabilidade para CGC tanto para produção como para capacidade de expansão. Para CEC houve variabilidade significativa em Beija-Flor para as duas variáveis. Em Viçosa, a CEC foi significativa a 8% para produção de grãos, enquanto para capacidade de expansão foi verificada praticamente a presença de efeitos aditivos na sua expressão. Por meio da incorporação de informações de parentesco na análise dialélica, valores de capacidade específica de combinação de uma linhagem com ela mesma (sjj) foram preditos, sem que este cruzamento tenha sido realizado. Com o uso do BLUP/REML foi possível predizer de 43% a 210% a mais de combinações híbridas, se comparada somente aos híbridos observados. A partir das predições dos híbridos, cruzamentos promissores foram identificados tanto para produção de grãos como para capacidade de expansão, sendo que a inclusão do pedigree parece deixar as análises mais acuradas, em comparação ao modelo sem uso destas informações. O desempenho per se e em cruzamento de famílias S6 evidenciaram correlações moderadas (r=0,53) para capacidade de expansão, mostrando ser possível selecionar famílias com alta CGC em capacidade de expansão a partir do desempenho per se de suas famílias. Visando obter informações sobre a eficiência da predição de famílias S6 a partir do desempenho per se e em cruzamento de famílias S3, foi encontrada correlação positiva (r=0,76) para produção, entre a CGC dos híbridos topcross de famílias S3 e híbridos de famílias S6. Ao verificar a eficiência do BLUP na predição de híbridos não realizados, foram encontradas correlações de Pearson e Spearman de moderada a elevadas, entre os valores preditos e observados. A predição de híbridos não realizados na ausência de dominância (capacidade de expansão, r=0,88) foi mais eficiente, em comparação à presença de dominância (produção de grãos, r=0,53). Os resultados gerais demonstraram que o uso de modelos mistos é uma alternativa eficiente na análise dialélica, proporcionando boa precisão nas estimações dos parâmetros genéticos, além de permitir a previsão de cruzamentos não realizados.
|
13 |
Seleção de modelos lineares mistos utilizando critérios de informação / Mixed linear model selection using information criterionTatiana Kazue Yamanouchi 18 August 2017 (has links)
O modelo misto é comumente utilizado em dados de medidas repetidas devido a sua flexibilidade de incorporar no modelo a correlação existente entre as observações medidas no mesmo indivíduo e a heterogeneidade de variâncias das observações feitas ao longo do tempo. Este modelo é composto de efeitos fixos, efeitos aleatórios e o erro aleatório e com isso na seleção do modelo misto muitas vezes é necessário selecionar os melhores componentes do modelo misto de tal forma que represente bem os dados. Os critérios de informação são ferramentas muito utilizadas na seleção de modelos, mas não há muitos estudos que indiquem como os critérios de informação se desempenham na seleção dos efeitos fixos, efeitos aleatórios e da estrutura de covariância que compõe o erro aleatório. Diante disso, neste trabalho realizou-se um estudo de simulação para avaliar o desempenho dos critérios de informação AIC, BIC e KIC na seleção dos componentes do modelo misto, medido pela taxa TP (Taxa de verdadeiro positivo). De modo geral, os critérios de informação se desempenharam bem, ou seja, tiveram altos valores de taxa TP em situações em que o tamanho da amostra é maior. Na seleção de efeitos fixos e na seleção da estrutura de covariância, em quase todas as situações, o critério BIC teve um desempenho melhor em relação aos critérios AIC e KIC. Na seleção de efeitos aleatórios nenhum critério teve um bom desempenho, exceto na seleção de efeitos aleatórios em que considera a estrutura de simetria composta, situação em que BIC teve o melhor desempenho. / The mixed model is commonly used in data of repeated measurements because of its flexibility to incorporate in the model the correlation existing between the observations measured in the same individual and the heterogeneity of variances of observations made over time. This model is composed of fixed effects, random effects and random error and with this in the selection of the mixed model it is often necessary to select the best components of the mixed model in such a way that it represents the data well. Information criteria are tools widely used in model selection, but there are not many studies that indicate how information criteria play out in the selection of fixed effects, random effects, and the covariance structure that makes up the random error. In this work, a simulation study was performed to evaluate the performance of the AIC, BIC and KIC information criteria in the selection of the components of the mixed model, measured by the TP (True positive Rate). In general, the information criteria performed well, that is, they had high TP rate in situations where the sample size is larger. In the selection of fixed effects and in the selection of the covariance structure, in almost all situations, the BIC criterion had a better performance in relation to the AIC and KIC criteria. In the selection of random effects no criterion had a good performance, except in the selection of Random effects in which it considers the compound symmetric structure, situation in which BIC had the best performance.
|
14 |
Modelos mistos no mapeamento genético de fatores de risco cardiovascular em famílias brasileiras usando dados de SNPs / Mixed models in genetic mapping of the cardiovascular risk factors in brazilian families using SNPs dataMirian de Souza 28 May 2012 (has links)
O estudo de doenças complexas, tais como hipertensão e glicemia, é de grande importância na área médica, pois essas doenças afetam muitas pessoas no mundo e seu padrão de variação envolve componentes ambientais, genéticos e suas possíveis interações. Para o mapeamento de genes a amostragem do genoma humano é feita por meio de plataformas de marcadores moleculares e, em geral, destacam-se duas classes de marcadores: os do tipo microsatélites e os SNPs (do inglês, Single Nucleotide Polimorphisms). Os dados de famílias são comumente analisados via modelos mistos e marcadores microsatélites de efeitos aleatórios, sendo que os estudos caso-controle com indivíduos não relacionados têm sido vinculados a dados de SNPs. Neste contexto, surge a problemática de como modelar o SNP em dados de famílias, pois o mesmo pode ser modelado como um fator fixo ou aleatório. Com a finalidade de trazer contribuições a esta discussão, um dos objetivos deste trabalho é propor um exercício de simulação e análise de dados genéticos que facilite o ensino e o entendimento de conceitos de genética e do mapeamento de genes modelados a partir de efeitos fixos ou aleatórios utilizando o software R. Além disso, na análise de dados envolvendo mapas densos de SNPs é necessário contornar o problema de múltiplos testes, e a proposta em multiestágios de Aulchenko et al. (2007) é uma alternativa de análise, na qual o efeito do SNP é modelado como um fator fixo e associado a um componente residual. Logo, surge também como desafio deste trabalho, aplicar o modelo em multiestágios para o mapeamento dos genes e discutir suas vantagens e limitações. / The study of complex diseases such as hypertension and glucose is of great importance in the medical field because these diseases affect many people in the world and its pattern of variation involves environmental and genetics components and their possible interactions. For genes mapping the human genome sampling is performed by means of molecular markers platforms, generally including two kinds of markers: the type microsatellite and SNPs (Single Nucleotide Polimorphisms). The family data is commonly analyzed by mixed models and random effects microsatellite markers and the case-control studies with unrelated individuals have been linked to data from SNPs. In this context the question arises of how to model the SNP on family data because it can be modeled as a fixed or random factor. In order to bring contributions to this discussion, one of the objectives of this study is to propose a simulation exercise and analysis of genetic data to facilitate the teaching and understanding of concepts of genetics and gene mapping modeled from fixed or random effects using software R. Furthermore, analysis of data involving dense maps of SNPs is necessary to overcome the problem of multiple tests, and the proposal multistage Aulchenko et al. (2007) is an alternative analysis in which the effect of SNP is modeled as a fixed factor and associated with a residual component. So there is also a challenge of this study to apply the multistage model for the mapping of genes and discuss their advantages and limitations.
|
15 |
Análise de dados longitudinais: uma aplicação na avaliação do conforto animal / Longitudinal data analysis: an application in assessing animal comfortRicardo Klein Sercundes 28 January 2014 (has links)
Em regiões tropicais e subtropicais, a alta intensidade da radiação solar associada aos altos valores de temperatura e umidade proporcionam condições de desconforto dentro dos aviários comerciais, afetando a sanidade e produção dos lotes de frango. Nesse sentido, o presente trabalho propôs-se avaliar dados de conforto animal em aviários construídos em escala reduzida com diferentes tipos de telhas (cerâmica e fibrocimento) e forros (A e B). Modelos lineares mistos foram utilizados objetivando-se o estudo dos índices de conforto \"entalpia específica\" (h) e \"temperatura de globo e umidade\" (ITGU). A obtenção dos modelos envolveu a escolha de efeitos aleatórios, fixos e estruturas de covariância utilizando técnicas gráficas e analíticas. Para selecionar os modelos que melhor se ajustavaram aos dados, foram utilizados testes de razão de verossimilhanças, teste Wald-F e os critérios de informação AIC e BIC, em um método de seleção top-down. Para a variável entalpia específica, não houve diferença entre os tratamentos avaliados, sendo todos representados por uma parábola que apresentou ponto máximo em 50,68 kJ.kg ar seco-1 às 13h 51min. Para a variável ITGU, houve interação entre os fatores testados, sendo a combinação telha de cerâmica e forro B a de melhor desempenho, apresentando máximo em 74,08 às 14h 21min. As análises de diagnóstico confirmaram o bom ajuste dos modelos. Era esperado que os diferentes índices de conforto gerassem conclusões equivalentes, no entanto isso não foi observado. / In tropical and subtropical regions, the high intensity of solar radiation associated with high values of temperature and humidity provide discomfort inside the commercial poultry houses, which affects animal health and production batches. Therefore, this works\'s goal is to analyse data of performance of small-scale poultry houses built with different types of tiles (ceramic and cement) and liners (A and B) in animal comfort. Linear mixed models were used aiming to study two thermal comfort indexes: specific enthalpy (h) and black globe temperature and humidity (GTHI). Model building involved choosing fixed and random effects and covariance structures using graphical and analytical techniques. To select the best model fit, likelihood ratio tests were used, as well as Walf-F tests and the AIC and BIC criteria in a top-down selection method. For the specific enthalpy variable, there was no significant difference among the treatments and all were represented by a single curve which presented a peak at 50.68 kJ.kg of dry air-1 at 13h 51min. For the variable GTHI, there was a significant interaction effect between the factors and the combination of ceramic tile and liner B provided the best performance, with a maximum of 74.08 at 14h 21min. The diagnostic tests confirmed that the models were well fitted. It was expected that the different comfort indexes would generate equivalent conclusions, however this was not observed.
|
16 |
Interpretação da interação genótipos x ambientes em feijão-caupi usando modelos multivariados, mistos e covariáveis ambientais / Interpreting genotype x environment interaction in cowpea using multivariate, mixed models, and environmental covariatesLeonardo Castelo Branco Carvalho 30 April 2015 (has links)
Várias metodologias têm sido propostas com o intuito de medir a influência que a interação GxE exerce sobre os mais diversos caracteres de interesse e, dentre essas, as abordagens via modelos mistos utilizando REML/BLUP têm sido mencionadas como vantajosas. Ainda, o uso de informações ambientais pode ser útil para encontrar os fatores que estão por trás da real diferença entre os genótipos. O objetivo do estudo foi avaliar a resposta da produtividade de grãos em feijão-caupi frente às variações espaciais, e as variáveis ambientais mais relevantes para a interação GxE. Foram avaliados 20 genótipos em 47 locais entre os anos de 2010 a 2012 sob delineamento DBC. Após a análise conjunta, os padrões de adaptabilidade dos genótipos foram testados pelas metodologias GGE Biplot e MHPRVG e a estratificação ambiental foi feita via Análise de Fatores sobre a matriz dos efeitos aleatórios GGE. A importância das variáveis ambientais na produtividade foi verificada pela associação entre os efeitos da matriz GGE e cada variável ambiental. Após decomposição SVD, os componentes principais foram plotados em Covariáveis-Biplots. Os efeitos de genótipos e da interação tripla apresentaram elevada significância (p ≤ 0,01 e p ≤ 0,001, respectivamente) indicando forte influência desta última no desempenho dos genótipos avaliados. O modelo fixo GGE Biplot apresentou baixa eficiência, explicando apenas 35% da variação total, sendo os genótipos MNC03-737F-5-1, MNC03-737F-5- 4, MNC03-737F-5-9, BRS Tumucumaque, BRS Cauamé e BRS Guariba considerados os mais estáveis, e MNC03-737F-5-9 e BRS Tumucumaque apontados como amplamente adaptados. Já a estatística MHPRVG destacou os genótipos MNC02-676F-3, MNC03-737F-5-1, MNC03- 737F-5-9, BRS Tumucumaque e BRS Guariba, com adaptação ampla, e MNC02-675F-4-9, MNC02-676F-3 e MNC03-737F-5-9 como especificamente adaptados a alguns ambientes. O ajuste para o modelo aleatório revelou efeitos de genótipos e interações GxE significativos (p ≤ 0,001) e foram obtidas correlações significativas (p ≤ 0,01 e p ≤ 0,001) entre PROD e as variáveis IT, NDP, Ptotal, Tmax, Tmin, Lat, Lon, e Alt. Os genótipos MNC03-737F-5-1, MNC03-737F-5-9, BRS Tumucumaque e BRS Guariba associaram elevada produtividade de grãos à rusticidade, sendo as variáveis \"Temperatura\", \"Insolação\" e \"Precipitação\", bem como \"Latitude\" e \"Altitude\", os mais importantes para a interação GxE. A análise MHPRVG foi adequada para a identificação dos genótipos superiores e o modelo Biplot-Covariável mostrou-se como uma ferramenta útil na identificação das variáveis ambientais importantes para a produtividade de grãos em feijão-caupi. / Several methods have been proposed to measure GxE interaction influence on various traits of interest, and among these, mixed models approaches using REML/BLUP have been mentioned as advantageous. Moreover, the use of environmental information can be useful to find factors that are behind the real difference between genotypes. The aim of this study was to evaluate the response of grain yield in cowpea to spatial variations, and the most important environmental factors for GxE interaction. Twenty genotypes were evaluated at 47 locations between the years 2010 to 2012 under RCB design. After joint analysis, genotypes adaptability patterns were tested by GGE Biplot and MHPRVG methods, and an environmental stratification was performed through factor analysis on the random effects GGE matrix. The impact of environmental factors on yield was verified by the association between the effects of the GGE matrix and environmental variables. After SVD decomposition, the principal components were plotted in Covariables-Biplots. Genotype effects and triple interaction were highly significant (p ≤ 0.01 and p ≤ 0.001, respectively) indicating strong GxE influence on genotypes performance. The fixed model GGE Biplot exhibits low efficiency, explaining only 35% of the total variation, and genotypes MNC03-737F-5-1, MNC03-737F-5-4, MNC03-737F-5-9, BRS Tumucumaque, BRS Cauamé, and BRS Guariba were considered the most stable, and MNC03-737F-5-9 and BRS Tumucumaque identified as widely adapted. MHPRVG method highlighted MNC02-676F-3, MNC03-737F-5-1, MNC03-737F-5-9, BRS Tumucumaque, and BRS Guariba as genotypes with broad adaptation and MNC02-675F-4-9, MNC02-676F-3, and MNC03-737F-5-9 as specifically adapted to certain environments. The fitted random effects model revealed significant genotype effects and GxE interactions (p ≤ 0.001) and significant correlations were obtained (p ≤ 0.01 and p ≤ 0.001) between PROD and IT , NDP, Ptotal, Tmax, Tmin, Lat, Lon, and Alt variables. Genotypes MNC03-737F-5-1, MNC03-737F-5-9, BRS Tumucumaque, and BRS Guariba presented high grain yield associated with rusticity, and environmental factors \"Temperature\", \"Insolation\" and \"Precipitation\", as well as \"Latitude\" and \"Altitude\", were the most important for GxE interaction. MHPRVG analysis was adequate to identify superior genotypes, and Covariate-Biplot model proved to be a useful tool for identifying key environmental factors for grain yield in cowpea.
|
17 |
Um estudo comparativo das técnicas de validação cruzada aplicadas a modelos mistos / A comparative study of cross-validation techniques applied to mixed modelsCunha, João Paulo Zanola 28 May 2019 (has links)
A avaliação da predição de um modelo por meio do cálculo do seu risco esperado é uma importante etapa no processo de escolha do um preditor eficiente para observações futuras. Porém, deve ser evitado nessa avaliação usar a mesma base em que foi criado o preditor, pois traz, no geral, estimativas abaixo do valor real do risco esperado daquele modelo. As técnicas de validação cruzada (K-fold, Leave-One-Out, Hold-Out e Bootstrap) são aconselhadas nesse caso, pois permitem a divisão de uma base em amostra de treino e validação, fazendo assim que a criação do preditor e a avaliação do seu risco sejam feitas em bases diferentes. Este trabalho apresenta uma revisão dessas técnicas e suas particularidades na estimação do risco esperado. Essas técnicas foram avaliadas em dois modelos mistos com distribuições Normal e Logístico e seus desempenhos comparados por meio de estudos de simulação. Por fim, as metodologias foram aplicadas em um conjunto de dados real. / The appraisal of models prediction through the calculation of the expected risk is an important step on the process of the choice of an efficient predictor to future observations. However, in this evaluation it should be avoided to use the same data to calculate the predictor on which it was created, due to it brings, in general, estimates above the real expected risk value of the model. In this case, the cross-validation methods (K-fold, Leave-One-Out, Hold-Out and Bootstrap) are recommended because the partitioning of the data in training and validation samples allows the creation of the predictor and its risk evaluation on different data sets. This work presents a briefing of this methods and its particularities on the expected risk estimation. These methods were evaluated on two mixed models with Normal and Logistic distributions and their performances were compared through simulation cases. Lastly, those methods were applied on a real database.
|
18 |
Determinação de biomassa aérea em florestas nativas num ambiente agrícola do Estado de São Paulo / Determination of aboveground biomass in native forests in an agricultural environment in Sao Paulo State, BrazilSotomayor, Jaime Felipe Medina 27 March 2013 (has links)
Técnicas adequadas para quantificação de biomassa florestal têm sido demandadas devido ao grande crescimento do mercado de carbono e de aspectos relacionados às mudanças climáticas, assim, é importante desenvolver métodos de determinação e estimação da biomassa com menores custos e que apresentem estimativas confiáveis. O objetivo deste trabalho foi determinar a biomassa aérea total comparando métodos destrutivos e não destrutivos e ajustar equações alométricas para biomassa aérea total e seus componentes (biomassa do fuste e biomassa da copa) usando diferentes modelos de regressão (modelos de efeitos fixos e modelos de efeitos mistos). Para isso foi realizado um inventário selecionando sistematicamente locando 30 parcelas de 200 m2 nas áreas de floresta nativa da Fazenda Três Lagoas, localizada em Angatuba, estado de São Paulo, Brasil. Posteriormente, foram coletados indivíduos de 11 espécies nativas (as de maior frequência e maior Índice de Valor de Importância - IVI). Foi realizada uma amostragem destrutiva e a cubagem rigorosa, além de coleta de quatro discos do fuste e uma bagueta de madeira das árvores distribuídas em três classes de diâmetros e determinada a densidade básica e a biomassa. Posteriormente foram ajustados diferentes modelos de regressão linear e não linear de efeitos fixos e de efeitos mistos e escolhido o melhor modelo segundo o AIC (Critério de Akaike) e o Índice de Furnival. Quando estudada a densidade básica da madeira, o método de determinação usando bagueta é diferente dos métodos destrutivos, sendo que a densidade básica da madeira baseada na bagueta apresentou sempre a maior média. No entanto, quando a biomassa do tronco é estudada, o método não destrutivo não apresenta diferença estatística dos outros métodos de coleta destrutivos (um disco e múltiplos discos). Ainda, os métodos diretos de determinação de biomassa (volumetria e gravimetria) foram estatisticamente similares. Ao ajustar as equações para biomassa aérea, os modelos mistos foram superiores aos modelos de efeitos fixos. Modelos na escala original e modelos com função de variância não conseguiram obter um bom comportamento do resíduo, sendo os modelos com transformações em ambos os lados (logaritmo) os que obtiveram homocedasticidade. Os modelos selecionados (usando o Critério de Akaike e o Índice de Furnival) foram os modelos lineares transformados de efeitos mistos (usando espécie como variável aleatória). Quando esses modelos foram aplicados ao inventário florestal da área, a biomassa aérea total foi de 125,52 Mg.ha-.1. Conclui-se que: Os métodos volumétricos e gravimétricos para determinação de biomassa do fuste são estatisticamente iguais, e permitem o uso de técnicas não destrutivas (bagueta) para determinar a densidade básica da madeira a ser usada no cálculo da biomassa. O uso de métodos não destrutivos diminui o trabalho de campo e de laboratório, o que permite a redução de custos. Quando só a densidade básica da madeira é estudada, o método destrutivo e não destrutivo apresentam diferenças estatísticas, sendo que a bagueta apresenta a maior média de densidade básica da madeira. Quando são construídos modelos de regressão para estimação de biomassa, os modelos de efeitos mistos com a espécie como efeito aleatório apresentam um melhor AIC que os modelos de efeitos fixos. Nesta floresta os modelos com transformações de ambos os lados foram os únicos modelos que obtiveram homocedasticidade. / Adequate techniques to quantify the forest biomass have shown to be necessary due to the carbon market growth and issues related to climate change; therefore, it is important to develop less expensive biomass determination and estimation methods that provide reliable estimations. The main objective of this research was to determine the total aboveground biomass by comparing destructive and non-destructive methods and fit allometric equations for total aboveground biomass and its components (trunk biomass and crown biomass) using different regression models (fixed effects and mixed effects models). In order to do that, we inventoried 30 plots of 200 m2 in native forest areas at Três Lagoas Farm in Angatuba, Sao Paulo, Brazil. Subsequently, we collected sample trees of 11 native species (those that are more frequent and that have a higher Importance Value Index - IVi). A destructive sampling was performed in those trees and after that their volume was calculated; four discs were extracted from their trunks as well as core samples distributed in three diameter classes; and, basic density and biomass were determined. Then, we fitted different linear and non-linear models of regression of fixed and mixed effects and then we chose the best model according to AIC (Akaike Information Criterion) and Furnival\'s Index. When studying wood basic density the core sample method differs from other types of methods and presents the higher mean value. However, when analyzing trunk biomass this non-destructive method does not differ statistically from other sampling destructive methods like disc and multiple discs. Nevertheless, direct methods to determine biomass (volumetry and gravimetry) were statistically similar. When fitting equations for aboveground biomass, mixed models had a superior behavior compared with fixed effects. Models in their original scale and models with variance function did not have good residuals behavior. Two-side transformation models (logarithm) showed homoscedasticity. The selected models (using Akaike Criteria and Furnival´s Index) were linear transformed models of mixed effects (using the species as a random variable). When those models were applied to the forest inventory of the area, the value corresponding to total aboveground biomass was 125.52 Mg.ha-1. Therefore, we were able to conclude that: Volumetric and gravimetric methods to determine trunk biomass are statistically equal, and allow the use of non-destructive techniques (core sampling) to determine the wood basic density if this variable is going to be used to determine biomass. The use of non-destructive methods decreases field and lab work, allowing cost reduction. When wood basic density is the only variable, destructive and non-destructive methods showed statistic differences, being that the core sample presented the highest mean of wood basic density. When adjusting regression models to estimate biomass, mixed effects models with the species as a random effect showed a better AIC compared to fixed effects models. In this forest, models with two-side transformations were the only models to obtain homoscedasticity.
|
19 |
Modelos lineares mistos para análise de dados longitudinais bivariados provenientes de ensaios agropecuários / Linear mixed models in the analysis bivariate longitudinal data from agricultural essaysAmaral, Simone Silmara Werner Gurgel do 19 September 2013 (has links)
Em estudos longitudinais, repetidas observações de uma mesma variável resposta são coletadas na mesma unidade experimental, em diferentes ocasiões. Como diferentes observações são realizadas na mesma unidade, espera-se que estas sejam correlacionadas, e que exista uma heterogeneidade de variâncias nas diferentes ocasiões. Dados longitudinais multivariados são obtidos quando um conjunto de diferentes variáveis respostas são mensuradas na mesma unidade experimental repetidas vezes ao longo do tempo; nesse caso, além da correlação entre observações realizadas na mesma unidade experimental, deve-se considerar também a correlação entre diferentes variáveis respostas. Uma forma de analisar dados longitudinais bivariados é empregar um modelo misto para cada uma das variáveis respostas e uni-los em um modelo misto bivariado especificando a distribuição conjunta para os efeitos aleatórios. As estimativas dos parâmetros desta distribuição comum podem ser usadas para avaliar a relação entre as diferentes respostas. Para exemplificar a utilização da técnica, foram utilizados dados de armazenamento de leite UAT. Os modelos lineares mistos bivariados foram ajustados por meio do software SAS e a análise gráfica foi realizada por meio do software R. Para seleção dos modelos empregou-se os Critérios de Informação de Akaike (AIC) e Bayesiano (BIC), e o teste da razão de verossimilhanças para comparação de modelos encaixados. A utilização do modelo linear misto bivariado permitiu modelar a heterogeneidade de variâncias entre ocasiões e a correlação entre diferentes medidas na mesma unidade experimental, bem como a correlação entre as variáveis respostas. / In longitudinal studies, repeated measurements of a response variable are taken in the same experimental unit over time. . Since different observations are measured on the same experimental unit, it is expected that there is correlation among the repeated measurements and heterogeneity of variances in different occasions. Multivariate Longitudinal Data are obtained when we measure a number of different response variables in the same experimental unit repeatedly over time; in this case, we should also observe a correlation between the different response variables. One way to analyze bivariate longitudinal data is to use a mixed model for each of the response variables, and unite them in bivariate mixed models specifying the joint distribution for random effects. Parameter estimates of this common distribution may be used to evaluate the relationship between different responses. As an example of the use of the technique, UHT milk storage data were used. Models were fitted using SAS software and the graphical analysis was done with software R. To model selection, Akaike Information Criterion (AIC) and Bayesian Information Criterion (BIC) were used, and maximum likelihood ratio test was used to compare nested models. The use of bivariate mixed linear model allowed to model the heteroscedasticity of the occasions, the correlation between the different measurements in the same experimental unit and also the correlation between the different response variables.
|
20 |
Estimativas de parâmetros genéticos visando o melhoramento do café robusta (Coffea canephora Pierre ex. A. Froehner) / Estimates of genetic parameters aiming at improvement of robusta coffee (Coffea canephora Pierre ex A. Froehner)Mistro, Julio César 29 August 2013 (has links)
O presente estudo objetivou estimar parâmetros genéticos visando quantificar a variabilidade genética de uma população de café robusta (Coffea canephora Pierre ex A. Froehner) introduzida da Costa Rica e analisar o seu potencial genético para o desenvolvimento de futuras cultivares clonais para o estado de São Paulo. Outro intuito foi verificar a possibilidade de submeter essa população à seleção recorrente, tornando-a, assim, fonte de alimentação e sustentação de programas de melhoramento genético do café robusta. O experimento foi composto por 25 tratamentos, sendo 21 progênies de C. canephora e quatro cultivares de C. arabica, plantados em Mococa (SP). O delineamento experimental utilizado foi em látice balanceado 5x5 quadruplicado, com seis repetições e uma planta por parcela. Foram realizadas doze colheitas e após a sexta colheita as plantas foram podadas. Em 2004, foi realizada uma seleção fenotípica dessa população a fim de clonar os melhores indivíduos. Essa seleção resultou em novo experimento, instalado em Campinas, seguindo o delineamento de blocos ao acaso, com três repetições, 28 clones e quatro plantas por parcela, sendo realizadas cinco colheitas consecutivas. As análises estatísticas e biométricas foram realizadas considerando os modelos lineares mistos (procedimento REML/BLUP), por meio do software Selegen, cujos componentes de variância são estimados pelo método da máxima verossimilhança restrita (REML) e os valores genotípicos preditos pela melhor predição linear não viesado (BLUP). As análises mostraram que, na população em estudo, observou-se elevada variabilidade genética, passível de ser explorada tanto para a extração de clones quanto para a seleção recorrente. As adversidades climáticas severas fizeram com que a seleção fosse prejudicada. Nessa situação é preferível não considerar o período afetado e analisar os dados após a recuperação das plantas. A seleção baseada em seis colheitas forneceu estimativas de parâmetros e ganhos genéticos similares aos obtidos na seleção baseada em duas colheitas de alta produção. Os ganhos genéticos esperados nas duas formas de propagações foram elevados e a seleção clonal proporcionou maiores ganhos do que a sexual. No experimento clonal foi possível identificar materiais com potencial produtivo e que poderão vir a ser recomendados para o cultivo no estado de São Paulo. Apesar de a interação genótipos x colheitas ter sido do tipo complexa, devido ao veranico ocorrido, esta não afetou significativamente o ordenamento dos melhores clones e nem comprometeu as estimativas dos parâmetros genéticos. Os coeficientes de variação experimental e genético bem como seu valor relativo deverão ser analisados conjuntamente com o número de repetições e a acurácia seletiva. A seleção recorrente deverá ser conduzida concomitantemente com o programa de seleção clonal, a fim de evitar o esgotamento da variabilidade genética e o comprometimento do programa de melhoramento genético visando o desenvolvimento de cultivares clonais. Tendo em vista que a população inicial foi constituída por um pequeno número de progênies, é aconselhável o monitoramento do tamanho efetivo populacional e do grau de endogamia ao longo dos ciclos de seleção recorrente. / The objective of this research was to estimate genetic parameters to quantify the variability of a population of robusta coffee (Coffea canephora Pierre ex A. Froehner) introduced into Brazil from Costa Rica in 1974 aiming at determining its genetic potential for the development of clonal or seedling cultivars for the state of São Paulo, Brazil. The feasibility has also been studied to submit this population to recurrent selection, making it a continuous source of improved base material in support of varietal improvement of robusta. An experiment consisting of 21 open pollinated seedling progenies of robusta and four cultivars of arabica was established in Mococa (SP) in 1975. Yield was observed for twelve harvests and after the sixth harvest the plants were pruned. The experimental lay out was a balanced 5x5 quadruple lattice design, with six replicates and one plant per plot. In 2004 a phenotypic selection of this population for yield was carried out aiming at cloning the best individuals. These 28 clones were planted in an experiment in Campinas in 2005, following a completely randomized block design, with 28 treatments (clones), three replications and four plants per plot. In total, yields were collected over five harvests. Statistical and biometrical analyzes were performed considering the linear mixed models (REML/BLUP), through software Selegen, where the variance components are estimated by restricted maximum likelihood (REML) and genotypic values predicted by best linear unbiased prediction (BLUP). The analyzes showed that the population had high genetic variability, which can be exploited for the extraction of both clones and seedling progenies, used for recurrent selection. Selection was impaired by severe adverse weather conditions. In such situations it is preferable not to consider the affected period and analyze the data after recovery of the plants. Due to the moisture stress that occurred in the clonal trial, genotype x environment interaction was complex. However this did not affect the ranking of superior clones nor compromised the genetic parameter estimates. Selection for yield based on six yield resulted in genetic parameters and genetic gains similar to those obtained by selection based on two high yielding harvesting periods. The expected genetic gains both for clones as for open pollinated progenies were high. However, clonal selection resulted in higher genetic gains for yield than the seedling selection. In the clonal experiment it was possible to identify materials with high yield potential that may become to be recommended for cultivation in São Paulo State. The experimental, genetics and relative coefficients of variation, should be analyzed together with the number of replications and selective accuracy. Recurrent selection should be conducted concurrently with the clonal selection program in order to avoid depletion of genetic variability and to impairthe breeding program aiming at the development of clonal cultivars. Considering that the initial population was composed of a small number of progeny, it will be important monitoring adequately the effective size and the inbreeding coefficient during recurrent selection cycles.
|
Page generated in 0.0572 seconds