Spelling suggestions: "subject:"aquare least."" "subject:"equare least.""
1 |
Diagnóstico e redução da influência da multicolinearidade na estimação de efeitos genéticos aditivos e não-aditivos em uma população de bovinos compostos (Bos taurus x Bos indicus) / Diagnostic and reduction of the influence of multicollinearity in the estimation of genetic additive and non-additive effects in multibreed population of cattle (Bos taurus x Bos indicus)Dias, Raphael Antonio Prado 28 January 2009 (has links)
Os efeitos genéticos aditivos e de heterozigoses são importantes na avaliação genética de populações compostas. Quando existem fortes relações lineares entre as variáveis explanatórias, os coeficientes de regressão tem erros-padrão elevados, são sensíveis a mudanças nos dados e a adição ou eliminação de variáveis explicativas no modelo. A alternativa usada na tentativa de diminuir esse problema foi aplicar o método de regressão de cumeeira - RC, pois na presença de multicolinearidade, pode permitir a obtenção de estimativas mais estáveis dos efeitos aditivos de origem genética e de heterozigose, em relação às obtidas pelo método dos quadrados mínimos - QM. Foram analisados os dados de pesos ao nascimento - PESNAS, ao desmame - PESDES, perímetro escrotal aos 390 dias - CE e escore para musculosidade aos 390 dias - MUSC de bovinos compostos Montana Tropicalr, com diferentes composições raciais NABCs, obtidos em várias fazendas brasileiras, relativos aos animais nascidos no período de 1994 a 2008. O modelo incluiu os efeitos aditivos e não aditivos. O grau da multicolinearidade foi obtido através do valor do fator de inflação da variância - V IF, dos índices de condição e da decomposição proporcional da variância. Os parâmetros de cumeeira foram obtidos a partir da multiplicação de uma constante, pela razão entre o V IF da covariável correspondente e o maior V IF. O traço de cumeeira foi utilizado para verificar se as estimativas dos coeficientes se estabilizaram, para o parâmetro de cumeeira obtido para cada variável explicativa. Duas análises foram aplicadas: i) os efeitos foram estimados por quadrados mínimos; ii) os efeitos foram estimados por regressão de cumeeira. Para cada variável resposta foi identificado o número de colinearidades, seus respectivos graus e as variáveis explicativas envolvidas em cada uma. As covariáveis envolvidas no modelo, para peso ao nascimento participaram de uma colinearidade forte e quatro colinearidades fracas; para peso ao desmame e escore de musculosidade aos 390 dias, houve duas relações de quase dependência fortes e três fracas, enquanto que para perímetro escrotal aos 390 dias obteve-se três colinearidades fortes e três fracas. O método que estimou os coeficientes por regressao de cumeeira foi melhor que o método dos quadrados mínimos, para todas as caracter´sticas. A m´edia dos V IFs para PESNAS, PESDES, CE e MUSC reduziram de 15, 5; 16; 17, 5 e 23, 9 para 5, 8; 5, 3; 5, 7 e 5, 1 respectivamente, após o uso da RC. Os erros-padrão diminuíram fornecendo estimativas mais estáveis que as obtidas por quadrados mínimos. Apenas para a covariável A sobre a variável resposta peso ao nascimento as soluções obtidas por QM e RC diferiram em direção, no mais, houve diferenças em magnitude / The genetic additive and heterozygosity effects are important in the genetic evaluation of multibreed populations. When there is strong linear relation between the explanatory variables, the regression coefficients have large standard errors and are sensitive to changes in the data set and to the addition or removal of explanatory variables in the model. The alternative used to try to reduce this problem was to apply the method of ridge regression - RC, which could allow for the estimation of more stable coefficients of direct and maternal breed additive effects of genetic origin and heterozygosity in relation to those obtained by the method of least squares QM . The objective is to analyze the data of birth weight - PESNAS, weaning - PESDES, the scrotal perimeter 390 days - CE and scoring for the muscularity 390 days - MUSC of cattle compounds Montana Tropical r, with different racial compositions NABCs, obtained in several Brazilian farms on of animals born from 1994 to 2008. The model included additive and non-additive effects. The degrees of multicollinearity were obtained through the value of the variance inflation factor - V IF, the index conditions - IC and by proportional decomposition of Variance. The ridge parameters were obtained from the multiplication of a constant to the ratio of the VIF from each covariate and the highest VIF. For each explanatory variable, the ridge trace was used to verify that the estimated coefficients were stabilized using the ridge parameter. Two different methods were applied: i) the effects were estimated by least squares; ii) the effects were estimated by ridge regression. For each response variable the number of colinearities was identified, their degrees and the variables involved in each. The covariates used in the model for birth weight participated in a strong colinearity and four other weak colinearities; for weaning weight and muscle score for 390 days, there were two strong relations of dependency and three almost weak, while for the perimeter scrotal 390 days it was observed three strong and three weak colinearities. The ridge regression coefficients method was considered better than that of least squares for all factors. The V IFs average for PESNAS, PESDES, CE and MUSC reduced from 15.5, 16, 17.5 and 23.9 to 5.8, 5.3, 5.7 and 5.1 respectively, after using the RC. The standard errors of the estimators decreased providing estimates more stable than those obtained by least squares. Only for A covariate on the response variable weight at birth the solutions obtained by QM and RC differ in direction, where the other ones differed only in magnitude.
|
2 |
Diagnóstico e redução da influência da multicolinearidade na estimação de efeitos genéticos aditivos e não-aditivos em uma população de bovinos compostos (Bos taurus x Bos indicus) / Diagnostic and reduction of the influence of multicollinearity in the estimation of genetic additive and non-additive effects in multibreed population of cattle (Bos taurus x Bos indicus)Raphael Antonio Prado Dias 28 January 2009 (has links)
Os efeitos genéticos aditivos e de heterozigoses são importantes na avaliação genética de populações compostas. Quando existem fortes relações lineares entre as variáveis explanatórias, os coeficientes de regressão tem erros-padrão elevados, são sensíveis a mudanças nos dados e a adição ou eliminação de variáveis explicativas no modelo. A alternativa usada na tentativa de diminuir esse problema foi aplicar o método de regressão de cumeeira - RC, pois na presença de multicolinearidade, pode permitir a obtenção de estimativas mais estáveis dos efeitos aditivos de origem genética e de heterozigose, em relação às obtidas pelo método dos quadrados mínimos - QM. Foram analisados os dados de pesos ao nascimento - PESNAS, ao desmame - PESDES, perímetro escrotal aos 390 dias - CE e escore para musculosidade aos 390 dias - MUSC de bovinos compostos Montana Tropicalr, com diferentes composições raciais NABCs, obtidos em várias fazendas brasileiras, relativos aos animais nascidos no período de 1994 a 2008. O modelo incluiu os efeitos aditivos e não aditivos. O grau da multicolinearidade foi obtido através do valor do fator de inflação da variância - V IF, dos índices de condição e da decomposição proporcional da variância. Os parâmetros de cumeeira foram obtidos a partir da multiplicação de uma constante, pela razão entre o V IF da covariável correspondente e o maior V IF. O traço de cumeeira foi utilizado para verificar se as estimativas dos coeficientes se estabilizaram, para o parâmetro de cumeeira obtido para cada variável explicativa. Duas análises foram aplicadas: i) os efeitos foram estimados por quadrados mínimos; ii) os efeitos foram estimados por regressão de cumeeira. Para cada variável resposta foi identificado o número de colinearidades, seus respectivos graus e as variáveis explicativas envolvidas em cada uma. As covariáveis envolvidas no modelo, para peso ao nascimento participaram de uma colinearidade forte e quatro colinearidades fracas; para peso ao desmame e escore de musculosidade aos 390 dias, houve duas relações de quase dependência fortes e três fracas, enquanto que para perímetro escrotal aos 390 dias obteve-se três colinearidades fortes e três fracas. O método que estimou os coeficientes por regressao de cumeeira foi melhor que o método dos quadrados mínimos, para todas as caracter´sticas. A m´edia dos V IFs para PESNAS, PESDES, CE e MUSC reduziram de 15, 5; 16; 17, 5 e 23, 9 para 5, 8; 5, 3; 5, 7 e 5, 1 respectivamente, após o uso da RC. Os erros-padrão diminuíram fornecendo estimativas mais estáveis que as obtidas por quadrados mínimos. Apenas para a covariável A sobre a variável resposta peso ao nascimento as soluções obtidas por QM e RC diferiram em direção, no mais, houve diferenças em magnitude / The genetic additive and heterozygosity effects are important in the genetic evaluation of multibreed populations. When there is strong linear relation between the explanatory variables, the regression coefficients have large standard errors and are sensitive to changes in the data set and to the addition or removal of explanatory variables in the model. The alternative used to try to reduce this problem was to apply the method of ridge regression - RC, which could allow for the estimation of more stable coefficients of direct and maternal breed additive effects of genetic origin and heterozygosity in relation to those obtained by the method of least squares QM . The objective is to analyze the data of birth weight - PESNAS, weaning - PESDES, the scrotal perimeter 390 days - CE and scoring for the muscularity 390 days - MUSC of cattle compounds Montana Tropical r, with different racial compositions NABCs, obtained in several Brazilian farms on of animals born from 1994 to 2008. The model included additive and non-additive effects. The degrees of multicollinearity were obtained through the value of the variance inflation factor - V IF, the index conditions - IC and by proportional decomposition of Variance. The ridge parameters were obtained from the multiplication of a constant to the ratio of the VIF from each covariate and the highest VIF. For each explanatory variable, the ridge trace was used to verify that the estimated coefficients were stabilized using the ridge parameter. Two different methods were applied: i) the effects were estimated by least squares; ii) the effects were estimated by ridge regression. For each response variable the number of colinearities was identified, their degrees and the variables involved in each. The covariates used in the model for birth weight participated in a strong colinearity and four other weak colinearities; for weaning weight and muscle score for 390 days, there were two strong relations of dependency and three almost weak, while for the perimeter scrotal 390 days it was observed three strong and three weak colinearities. The ridge regression coefficients method was considered better than that of least squares for all factors. The V IFs average for PESNAS, PESDES, CE and MUSC reduced from 15.5, 16, 17.5 and 23.9 to 5.8, 5.3, 5.7 and 5.1 respectively, after using the RC. The standard errors of the estimators decreased providing estimates more stable than those obtained by least squares. Only for A covariate on the response variable weight at birth the solutions obtained by QM and RC differ in direction, where the other ones differed only in magnitude.
|
Page generated in 0.0489 seconds