• Refine Query
  • Source
  • Publication year
  • to
  • Language
  • 99
  • 42
  • 9
  • 6
  • 3
  • 3
  • 1
  • 1
  • Tagged with
  • 179
  • 179
  • 91
  • 88
  • 33
  • 32
  • 22
  • 22
  • 20
  • 19
  • 18
  • 17
  • 17
  • 16
  • 15
  • About
  • The Global ETD Search service is a free service for researchers to find electronic theses and dissertations. This service is provided by the Networked Digital Library of Theses and Dissertations.
    Our metadata is collected from universities around the world. If you manage a university/consortium/country archive and want to be added, details can be found on the NDLTD website.
91

Cluster-based lack of fit tests for nonlinear regression models

Munasinghe, Wijith Prasantha January 1900 (has links)
Doctor of Philosophy / Department of Statistics / James W. Neill / Checking the adequacy of a proposed parametric nonlinear regression model is important in order to obtain useful predictions and reliable parameter inferences. Lack of fit is said to exist when the regression function does not adequately describe the mean of the response vector. This dissertation considers asymptotics, implementation and a comparative performance for the likelihood ratio tests suggested by Neill and Miller (2003). These tests use constructed alternative models determined by decomposing the lack of fit space according to clusterings of the observations. Clusterings are selected by a maximum power strategy and a sequence of statistical experiments is developed in the sense of Le Cam. L2 differentiability of the parametric array of probability measures associated with the sequence of experiments is established in this dissertation, leading to local asymptotic normality. Utilizing contiguity, the limit noncentral chi-square distribution under local parameter alternatives is then derived. For implementation purposes, standard linear model projection algorithms are used to approximate the likelihood ratio tests, after using the convexity of a class of fuzzy clusterings to form a smooth alternative model which is necessarily used to approximate the corresponding maximum optimal statistical experiment. It is demonstrated empirically that good power can result by allowing cluster selection to vary according to different points along the expectation surface of the proposed nonlinear regression model. However, in some cases, a single maximum clustering suffices, leading to the development of a Bonferroni adjusted multiple testing procedure. In addition, the maximin clustering based likelihood ratio tests were observed to possess markedly better simulated power than the generalized likelihood ratio test with semiparametric alternative model presented by Ciprian and Ruppert (2004).
92

Triangulating Perspectives on Lexical Replacement : From Predictive Statistical Models to Descriptive Color Linguistics

Vejdemo, Susanne January 2017 (has links)
The aim of this thesis is to investigate lexical replacement processes from several complementary perspectives. It does so through three studies, each with a different scope and time depth. The first study (chapter 3) takes a high time depth perspective and investigates factors that affect the rate (likelihood) of lexical replacement in the core vocabulary of 98 Indo-European language varieties through a multiple linear regression model. The chapter shows that the following factors predict part of the rate of lexical replacement for non-grammatical concepts: frequency, the number of synonyms and senses, and how imageable the concept is in the mind. What looks like a straightforward lexical replacement at a high time depth perspective is better understood as several intertwined gradual processes of lexical change at lower time depths. The second study (chapter 5) narrows the focus to seven closely-related Germanic language varieties (English, German, Bernese, Danish, Swedish, Norwegian, and Icelandic) and a single semantic domain, namely color.  The chapter charts several lexical replacement and change processes in the pink and purple area of color space through experiments with 146 speakers. The third study (chapter 6) narrows the focus even more, to two generations of speakers of a single language, Swedish. It combines experimental data on how the two age groups partition and label the color space in general, and pink and purple in particular, with more detailed data on lexical replacement and change from interviews, color descriptions in historical and contemporary dictionaries, as well as botanical lexicons, and historical fiction corpora. This thesis makes a descriptive, methodological and theoretical contribution to the study of lexical replacement. Taken together, the different perspectives highlight the usefulness of method triangulation in approaching the complex phenomenon of lexical replacement.
93

Modelos COM-Poisson com correlação / Models COM-Poisson with correlation

Pereira, Glauber Márcio Silveira 23 April 2019 (has links)
Nesta tese são propostas duas distribuições discretas: COM-Poisson correlacionada (CPC) e COM-Poisson generalizada parcialmente correlacionada (CPGPC). Também foram propostos modelos de regressão para a distribuição Poisson generalizada parcialmente correlacionada (PGPC) (proposto por Luceño (1995)). Calculamos a função massa de probabilidade (fmp) para todas as distribuições com duas parametrizações. As distribuições foram construídas usando a mesma expansão feita por (Luceño, 1995) na construção da distribuição Poisson generalizada parcialmente correlacionada. A distribuição CPC(l;f;r) é a mesma expansão da distribuição COM-Poisson zero inflacionada ZICMP(m;f;r). Para a distribuição CPGPC(l;f;r;L;K) foi determinada a função característica, função geradora de probabilidade, momentos e a estimação pelo método de máxima verossimilhança para as duas parametrizações. Fizemos a fmp, quantil e gerador de números aleatórios das distribuições citadas no programa R. / In this thesis two discrete distributions are proposed: Correlated COM-Poisson (CPC) and Generalized partially correlated COM-Poisson (CPGPC). We have also proposed regression models for the Generalized partially correlated Poisson distribution (PGPC) (proposed by Luceño (1995)). We calculated the probability mass function for all distributions with two parametrizations. The distributions were constructed using the same expansion made by Luceño (1995) in the construction of the correlated generalized Poisson distribution. The CPC(l;f;r) Correlated COM-Poisson distribution is the same expansion of the zero-inflated COM-Poisson distribution ZICMP(m;f;r). For the CPGPC(l;f;r;L;K) Generalized partially correlated COM-Poisson distribution, the characteristic function, probability-generating function, moments, and the maximum likelihood estimation for the two parametrizations were determined. We performed the probability mass function, quantile and random number generator of the distributions quoted in program R.
94

Contribuições sobre o envelope simulado na análise de diagnóstico em modelos de regressão / Contributions on the simulated envelope for diagnostic analysis in regression models

Fernandes, Victor Vinicius 30 April 2019 (has links)
O envelope simulado é um método da análise de diagnóstico, utilizado para avaliar a veracidade da hipótese referente a distribuição de probabilidade assumida para a variável resposta em um modelo de regressão. Neste trabalho, descrevemos alguns procedimentos para a sua obtenção e, posteriormente, propomos um método para a rejeição do modelo a partir do envelope. No intuito de comparar nosso procedimento com as demais propostas, realizamos um estudo de simulação de Monte Carlo em duas classes de modelos de regressão. Os resultados apontam que o método proposto apresenta boa performance, uma vez que o mesmo fornece taxas estáveis de rejeição do modelo sob a distribuição correta. Já para as demais metodologias, além de possuírem um custo computacional maior, a taxa de rejeição do modelo correto cresce conforme aumenta-se o tamanho amostral. Complementando os resultados, realizamos também a comparação do gráfico de probabilidade normal e meio normal com envelope através de simulações de Monte Carlo. Os estudos sugeriram que, de maneira geral, o gráfico normal demonstrou melhor desempenho, principalmente com a utilização do procedimento proposto. Por fim, aplicamos a dados reais, provenientes da Pesquisa Nacional de Saúde (PNS) de 2013, nosso método de rejeição do modelo e as demais propostas. Constatou-se que para estes dados, nosso método sugeriu uma decisão contrária a fornecida pelos outros procedimentos. / The simulated envelope is a diagnostic analysis method used to evaluate the hypothesis about the probability distribution assumed for the response variable in a regression model. In this work, we describe some procedures to obtain the simulated envelope and, later, we propose a method to decide if we should reject a model using the envelope. In order to compare our procedure with other proposals, we performed a Monte Carlo simulation study in two classes of regression models. The results indicate that the proposed method presents good performance, since it provides stable rejection rates of the model under the correct distribution. About other methodologies, besides having a higher computational cost, the rejection rate under the correct model increases as the sample size rises. In addition, we also compare the full normal plot and the half normal plot with envelope using Monte Carlo simulations studies. The results suggest that, in general, the full normal plot performs better, especially with the proposed procedure. Finally, we apply our decision method and the other proposals to real data from the National Health Survey (Brazil) of 2013. To these data, our method suggested a different decision from that one provided by the other procedures.
95

Análise de diagnóstico em modelos de regressão ZAGA e ZAIG / Diagnostic analysis in ZAGA and ZAIG regression models

Rodrigues, Juliana Scudilio 10 March 2016 (has links)
Resíduos desempenham um papel importante na verificação do ajuste do modelo e na idenfiticação de observações discrepantes e/ou influentes. Neste trabalho, estudamos duas classes de resíduos para os modelos de regressão gama inflacionados no zero (ZAGA) e gaussiana inversa inflacionados no zero (ZAIG). Essas classes de resíduos são uma função de um resíduo para o componente contínuo do modelo e da estimativa de máxima verossimilhança da probabilidade da observação assumir o valor zero. Estudos de simulação de Monte Carlo foram realizados para examinar as propriedades dessas classes de resíduos em ambos os modelos de regressão (ZAGA e ZAIG). Os resultados mostraram que um resíduo de uma dessas classes tem algumas propriedades semelhantes à da distribuição normal padrão nos modelos estudados. Além desse objetivo principal, descrevemos os modelos de regressão ZAGA e ZAIG, estudamos propriedades de alguns resíduos em modelos lineares generalizados com resposta gama e gaussiana inversa e discutimos outros aspectos de análise de diagnóstico nos modelos ZAGA e ZAIG. Para finalizar, foi feita uma aplicação com dados reais de fundos de investimentos, em que ajustamos o modelo ZAIG, para exemplificar os tópicos discutidos e mostrar a importância desses modelos e as vantagens de um dos resíduos estudados na análise de dados reais. / Residuals play an important role in checking model adequacy and in the identification of outliers and influential observations. In this paper, we studied two class of residuals for the zero adjusted gamma regression model (ZAGA) and the zero adjusted inverse Gaussian regression model (ZAIG). These classes of residuals are function of a residual for the continuous component of the model and the maximum likelihood estimate of the probability of the observation assuming the zero value. Monte Carlo simulation studies are performed to examine the properties of this class of residuals in both models (ZAGA and ZAIG). Results showed that a residual of one of these class has some similar properties to the standard normal distribution in the studied models. We also described ZAGA and ZAIG regression models, studied properties of some residuals in generalized linear models with response gamma and inverse Gaussian and discussed other aspects of diagnostic analysis in ZAGA and ZAIG models. To finsih,we presented a real data set application from invesment funds of Brazil. We fitted the ZAIG model to illustrate the topics discussed and showed the importance of these models and the advantages of one of the studied residuals in the analysis of real dataset.
96

Condições de regularidade para o modelo de regressão com parametrização geral / Regularity conditions for the regression model with general parameterization

Loose, Laís Helen 24 May 2019 (has links)
Este trabalho objetiva apresentar um estudo detalhado e sistemático de algumas condições de regularidade para inferências baseadas em máxima verossimilhança no modelo de regressão elíptico multivariado com parametrização geral proposto em Lemonte e Patriota (2011). O modelo em estudo tem vários modelos importantes como casos particulares, entre eles temos os modelos lineares e não lineares homocedásticos e heterocedásticos, modelos mistos, modelos heterocedásticos com erros nas variáveis e na equação, modelos multiníveis, entre outros. As condições de regularidade estudadas estão associadas à identificabilidade do modelo, à existência, à unicidade, à consistência e à normalidade assintótica dos estimadores de máxima verossimilhança (EMV) e à distribuição assintótica das estatísticas de testes. Para isso, são enunciadas as condições suficientes e formalizados os teoremas que garantem a existência, unicidade, consistência e normalidade assintótica dos EMV e a distribuição assintótica das estatísticas de teste usuais. Além disso, os resultados de cada teorema são comentados e as demonstrações são apresentadas com detalhes. Inicialmente, considerou-se o modelo sob a suposição de normalidade dos erros, para, na sequência, ser possível generalizar os resultados para o caso elíptico. A fim de exemplificar os resultados obtidos, foram verificadas, analiticamente, a validade de algumas condições e os resultados de alguns teoremas em casos particulares do modelo geral. Ademais, foi desenvolvido um estudo de simulação em que uma das condições é violada adotando o modelo heterocedástico com erros nas variáveis e na equação. Por meio de simulações de Monte Carlo foram avaliados os impactos sobre a consistência e normalidade assintótica dos EMV. / This work aims to present a detailed and systematic study of some regularity conditions for inferences based on maximum likelihood in the multivariate elliptic regression model with general parameterization proposed in Lemonte and Patriota (2011). The model under study has several important models as particular cases, among them we have the linear and non-linear homocedastic and heterocedastic models, mixed models, heterocedastic models with errors in the variables and in the equation, multilevel models, among others. The regularity conditions studied are associated with the identifiability of the model, existence, uniqueness, consistency and asymptotic normality of the maximum likelihood estimators (MLE) and the asymptotic distribution of some test statistics. Sufficient conditions are stated to guarantee the existence, unicity, consistency and asymptotic normality of the MLE and the asymptotic distribution of the usual test statistics. In addition, the results of each theorem are commented and the proof are presented in detail. Initially, the model was considered under the assumption of normality of the errors, and then the results were generalized for the elliptical case. In order to exemplify the attained results, some particular cases of the general model are analyzed analytically, the validity of some conditions and the results of some theorems are verified. In addition, a simulation study is developed with one of the conditions violated under the heterocedastic model with errors in the variables and in the equation. By means of Monte Carlo simulations, the impacts of this violation on the consistency and the asymptotic normality of the MLE are evaluated.
97

Análise de sensibilidade e resíduos em modelos de regressão com respostas bivariadas por meio de cópulas / Bivariate response regression models with copulas: Sensitivity and residual analysis

Gomes, Eduardo Monteiro de Castro 01 February 2008 (has links)
Neste trabalho são apresentados modelos de regressão com respostas bivariadas obtidos através de funções cópulas. O objetivo de utilizar estes modelos bivariados é modelar a correlação entre eventos e captar nos modelos de regressão a influência da associação entre as variáveis resposta na presença de censura nos dados. Os parâmetros dos modelos, são estimados por meio dos métodos de máxima verossimilhança e jackknife. Alguns métodos de análise de sensibilidade como influência global, local e local total de um indivíduo, são introduzidos e calculados considerando diferentes esquemas de perturbação. Uma análise de resíduos foi proposta para verificar a qualidade do ajuste dos modelos utilizados e também foi proposta novas medidas de resíduos para respostas bivariadas. Métodos de simulação de Monte Carlo foram conduzidos para estudar a distribuição empírica dos resíduos marginais e bivariados propostos. Finalmente, os resultados são aplicados à dois conjuntos de dados dsponíveis na literatura. / In this work bivariate response regression models are presented with the use of copulas. The objective of this approach is to model the correlation between events and capture the influence of this correlation in the regression parameters. The models are used in the context of survival analysis and are ¯tted to two data sets available in the literature. Inferences are obtained using maximum likelihood and Jackknife methods. Sensitivity techniques such as local and global in°uence are proposed and calculated. A residual analysis is proposed to check the adequacy of the models and simulation methods are used to asses the empirical distribution of the marginal univariate and bivariate residual measures proposed.
98

Resposta hiperespectral na determinação do conteúdo de água na folha em diferentes espécies de Eucalyptus spp. / Hyperespectral response for determining the water content in leaves of different species of Eucalyptus spp.

Strabeli, Taila Fernanda 27 September 2016 (has links)
Avaliar o estado hídrico das plantas é essencial para o monitoramento das culturas agrícolas e florestais. A interação da radiação eletromagnética com as plantas é um processo estudado por sensoriamento remoto (SR). Através da técnica de SR é possível interpretar os fatores que influenciam na quantidade de energia absorvida, transmitida e refletida pela planta. Neste estudo, buscou-se estabelecer as relações existentes entre variações nos parâmetros da água com o comportamento espectral e gerar modelos matemáticos que sejam capazes de predizer o conteúdo relativo da água (CRA) e espessura equivalente da água (EEA) em 11 diferentes espécies de Eucalyptus, utilizando um sensor hiperespectral. Os dados foram obtidos por meio da pesagem e respectiva leitura espectral das folhas, sendo que estas passaram por uma metodologia de desidratação. Tal metodologia permitiu encontrar uma diferença de reflectância média de 26% entre o máximo e mínimo teor de água na folha, provando a influência do CRA no comportamento espectral, sendo a água um dos fatores de maior domínio na reflectância na região do infravermelho médio (1300nm - 2500nm). A partir das curvas espectrais foi possível avaliar que os comprimentos de onda próximo ao 1400 nm e 1900 nm foram os mais sensíveis ao conteúdo de água. A análise de componentes principais permitiu reforçar estes resultados, uma vez que as pontuações (scores) dos componentes que apresentaram correlações significativas com o CRA tiveram maiores pesos (loadings) nas regiões espectrais citadas anteriormente. A partir das respostas espectrais também foram realizados os cálculos dos índices espectrais já descritos em literatura, e estes submetidos a análise de regressão simples para predição do CRA e EEA. O índice espectral calculado com a combinação de bandas do infravermelho médio (1300nm e 1450nm) foi o que apresentou melhores resultados ao predizer os parâmetros da água, sendo que o SR1300,1450 teve um R2=0,72 para o CRA e R2=0,81 para o EEA. Os dados espectrais foram correlacionados com os parâmetros da água, e encontrou-se que para o CRA o comprimento de onda 1881 nm apresentou um coeficiente de correlação máximo negativo de r= -0,89, enquanto que o EEA apresentou um coeficiente de correlação máximo negativo de r= -0,79 no comprimento de onda 2165 nm. Foram testados três métodos de seleção das variáveis hiperespectrais para gerar um modelo matemático por meio de uma regressão linear. Para o parâmetro CRA, o método de seleção de variáveis stepwise foi o que gerou o maior (R2= 0,86) e um RMSE = 13,85%, sendo que neste método restaram apenas seis variáveis preditoras. Enquanto que o método de seleção de variáveis pelas regiões do espectro foi o mais preciso ao predizer o parâmetro EEA, com um R2= 0,87 e um RMSE = 0,00012 g/cm2, sendo necessárias apenas 5 variáveis espectrais. / The hydric condition assessment of plants is essential for monitoring agricultural and forest cultures. The interaction of electromagnetic radiation with plants is a process studied by remote sensing. Through this technique it is possible to interpret the factors that plays influence on the quantity of energy absorbed, transmitted and reflected by the plant. In this study was sought the establishment of existing relations between variations on the water parameters and the spectral behavior and then to generate mathematical models capable of predictiong the relative water content (RWC) and equivalent water thickness (EWT) among 11 different Eucalyptus species using a hyperespectral sensor. The data was obtained through weighting followed by reflectance readings of leaves in which the leaves had gone through a dehydrating methodology. The dehydrating methodology allowed finding a average reflectance difference of 26% between the maximum and the minimum water content on the leaf, proving the influence of the RWC in the spectral behavior in which the water plays great influence in the medium infrared reflectance region (1300 nm - 2500 nm). From the spectral curves it was possible to conclude that the wavelengths near 1400 nm and 1900 nm were the most sensitive to the water content. The principal content analyses reinforced these results once the scores of the components that showed significant relations with the RWC had the bigger loadings in the mentioned spectral regions. Spectral indices already described in literature were calculated using the spectral responses and their results were submitted to a simple regression for predicting RWC and EWT. The spectral index calculated by the combination of medium infrared (1300 nm and 1450 nm) was the one which had better results when prediction water parameters in which SR... had an R2=0,72 for RWC and R2=0,81 for EWT The spectral data was correlated to the water parameters and it was observed that for the RWC at 1881 nm showed a maximum negative coefficient of correlation of r=-0,89 whereas the EWT showed a maximum negative coefficient of correlation of r=-0,79 at 2165 nm. Three selection methods were tested for the hyperespectral variables in order to generate a mathematical model through linear regression. For the RWC parameter, the selection method of stepwise variables was the one which generated and R2=0,86 and a RSMSE = 13,85%. For this method just 6 predicting variables were left. While the variables selection method by spectral regions was the most precise when predicting the EWTparameter with a R2 = 0,87 and a RMSE = 0,00012 g/cm2 being just 5 spectral variables necessary.
99

Feed efficiency traits in Santa Inês sheep under genomic approaches / Eficiência alimentar em ovinos da raça Santa Inês sob abordagem genômica

Alvarenga, Amanda Botelho 28 September 2017 (has links)
The selection on genetic values predicted from markers could substantially increase the rate of genetic gain in animals by increasing accuracy of prediction and reducing generation interval, especially for difficult to measure traits, such as feed efficiency. Feed efficiency is the most important trait in animal production due to its impacts on cost of production and environmental factors. Many metrics measure the feed efficiency, such as ratio of gain to feed (FER), the ratio of feed to gain (FCR) and residual feed intake (RFI). Nevertheless, in ovine, no study with the aim of understand the genetic variants or the accuracy of genomic estimated breeding value (GEBV) for feed efficiency traits was published yet. Moreover, before to apply the genomic information, it is necessary to understand and characterized the population structure, for instance, by linkage disequilibrium (LD). Both genome-wide association studies (GWAS) and genomic selection (GS) leverage LD between marker and causal mutation. Based on the above considerations, the aim of this study was to map LD in ovine, characterized by Brazilian Santa Inês sheep; to search genetic variants for feed efficiency traits (FER, FCR and RFI) through GWAS; and to verify the accuracy of GEBV for RFI. In total, 396 samples (animals) of Longissimus dorsi muscle were collect. A high-density panel of SNP (Illumina High-Density Ovine SNP BeadChip®) comprising 54,241 SNPs was used to obtain the genotyping data. The phenotype data was comprised of 387 animals. The average LD between adjacent markers for two LD metrics, r² and |D\'|, were 0.166 and 0.617, respectively. The degree of LD estimated was lower than reported in other species and it was characterized by short haplotype blocks. Consequently, for genomic analyses, high-density panels of marker are recommended. Many markers were associated to feed efficiency traits in GWAS, mainly to RFI trait. Few candidate genes were reported in this study, highlighting NRF-1 (nuclear respiratory factor 1), which controls mitochondrial biosynthesis, the most important process responsible by a great fraction of the produced energy. Finally, we verified the accuracy of GEBV for RFI using few Bayesian regression models, and we found low accuracy, ranging from 0.033 (BayesB with π=0.9912) to 0.036 (BayesA), which might be explained by the low relationship among animals and small training population. / A seleção com base nos valores genéticos genômicos preditos pode aumentar substancialmente a taxa de ganho genético em animais por meio do aumento da acurácia de predição e redução do intervalo de gerações, especialmente para características de difícil e/ou onerosa mensuração, como eficiência alimentar. A eficiência alimentar é uma das características mais importantes na produção animal devido principalmente aos seus impactos econômicos e ambientais. Muitas métricas representam a eficiência alimentar, por exemplo: a relação do ganho de peso e consumo alimentar (EA), a proporção do consumo alimentar e ganho de peso (CA) e o consumo alimentar residual (CAR). Em ovinos, nenhum estudo com o objetivo de buscar variantes genéticas ou verificar a acurácia do valor genético genômico estimado para eficiência alimentar foi publicado. Adicionalmente, antes de aplicar a informação genômica, é necessário compreender e caracterizar a estrutura da população, como por meio do desequilíbrio de ligação (LD). O estudo de associação genômica (GWAS) e seleção genômica (GS) consideram o LD entre marcador e a mutação causal. Com base nas considerações acima, o objetivo deste estudo foi mapear o LD em ovinos, caracterizado pela raça ovina Santa Inês; localizar variantes genéticas para as características de eficiência alimentar (EA, CA e CAR) utilizando a abordagem GWAS; e verificar a acurácia da estimação dos valores genéticos genômico para o CAR. No total, foram coletadas 396 amostras (animais) do músculo Longissimus dorsi, para posterior genotipagem utilizando o painel de alta densidade (Illumina High-Density Ovine SNP BeadChip®), compreendendo 54.241 SNPs. O banco fenotípico é composto por 387 animais. O LD médio entre marcadores adjacentes para duas métricas de LD, r² e |D\'|, foram 0,166 e 0,617, respectivamente. O grau de LD estimado foi menor que o relatado em outras espécies e foi caracterizado por blocos de haplótipos curtos. Consequentemente, para as análises genômicas são recomendados painéis de marcadores de alta densidade. No GWAS, foram encontrados muitos marcadores associados aos fenótipos, em especial, à característica CAR. Alguns genes candidatos foram relatados neste estudo, destacando-se o NRF-1 (fator respiratório nuclear 1), que controla a biossíntese mitocondrial, o processo mais importante responsável por grande parte da produção de energia. Finalmente, verificamos a acurácia do valor genético genômico estimado para o CAR usando modelos de regressão Bayesiana, e encontramos baixos valores para acurácia (0,033 a 0,036) o que pode ser explicado pelo baixo grau de relacionamento entre os indivíduos e tamanho reduzido da população de treinamento.
100

Componentes de (co)variância e parâmetros genéticos para caracteristicas de crescimento de bovinos da raça Guzerá usando diferentes estratégias de análise. / (CO)Variance components and genetic parameters for growth traits in guzera breed by different analysis of strategies.

Silva, Itiberê Saldanha 25 November 2004 (has links)
Foram utilizados arquivos com 104.101, 55.063 e 60.782 registros de pesos corporais, do nascimento aos 630 de idades, de bovinos da raça Guzerá, da Associação Brasileira dos Criadores de Zebu (ABCZ), referentes ao período de 1975 a 2001, para estimar componentes de (co)variância e parâmetros genéticos, de acordo com três abordagens de análise, cada uma com um arquivo, utilizando diferentes modelos estatísticos e a metodologia REML. Nestas abordagens foram obtidos valores das estimativas de variância e parâmetros genéticos de modelos unicaracterísticos; modelos uni e bicaracterísticos e, de modelos de regressão aleatória (MRA), respectivamente. Na primeira, com quatro modelos unicaraterísticos, observou-se que o modelo 1, considerado completo, por incluir os efeitos genéticos direto e materno (GM) e os efeitos de ambiente permanente materno e residual, não diferiu significativamente (P<0,05), pelo teste razão de verossimilhança do modelo 2, que exclui o GM. As herdabilidades diretas (h2) estimadas nos modelos 1 e 2, foram muito semelhantes. Os valores de h2 cresceram da primeira idade até a segunda idade, mantiveram os valores até o desmame e depois cresceram. As estimativas de variância genética materna foram baixas, principalmente antes da desmama. Na segunda usando diferentes modelos uni e bicaracterísticos, o comportamento das estimativas foi semelhante à primeira abordagem. Os valores de h2 das análises uni e bicaracterísticas, para os pesos ajustados às idades padrão de 120(P120), 205(P205), 365(P365) e 550(P550) dias de idades foram 0,15; 0,10; 0,17; 0,14 e 0,14; 0,10; 0,16; 0,15, respectivamente. As correlações genéticas diretas (ra) semelhantes nos modelos 1 e 2 para P120/P205, P120/P365, P120P550, P205/P365, P205/P550 e P365/P550 foram 0,80; 0,54; 0,54; 0,74; 0,62 e 0,95 e, 0,80; 0,54; 0,53; 0,74; 0,62 e 0,95 respectivamente. Na comparação entre os modelos 1 e 2, das análises uni e bicaracterísticas, o modelo 2, que exclui GM, proporcionou ajuste similar ao modelo 1. Na análise de regressão aleatória foram testados dez modelos com diferentes estruturas de variâncias residuais e combinações de ordens (k) dos efeitos aleatórios. Pelos critérios de informação de Akaike e Bayesiano de Schwarz, os MRA mais adequados foram os modelos Reg666-r10 (RegkAkCkQ-r10) e Reg653-r10 (RegkAkCkQ-r10), respectivamente, para os efeitos genético aditivo direto (kA), de ambiente permanente de animal (kC) e de ambiente permanente materno (kQ), com as variâncias residuais divididas em dez (r10) classes. As estimativas de h2 de peso ao nascer (PN), 205, 365 e 550 dias de idades, foram de 0,13, 0,43, 0,46 e 0,48, para o modelo Reg666-r10; para o modelo mais parcimonioso (Reg653-10), foram de 0,13, 0,46, 0,54 e 0,56, respectivamente. As correlações fenotípicas, genéticas, de ambientes permanentes animal e materno foram todas positivas e similares entre os MRA. No modelo mais parcimonioso, Reg653-10, as ra do PN/205, PN/365, PN/550, 205/365, 205/550 e 365/550 foram, 0,40, 0,40, 0,42, 0,68, 0,74 e 0,81, respectivamente. Os modelos com homogeneidade de variância foram inadequados. A variância do resíduo dividido em dez classes distintas de variâncias foi mais adequada para modelar a variação residual. Na comparação das três abordagens de análise foi constatado que o MRA constitui alternativa importante para análise de dados de crescimento de bovinos. / Three different files containing 104,101, 55,063 and 60,782 body weight records from birth to 630 days of age, collected from 1975 to 2001, from Guzera cattle belonging to the Brazilian Association of Zebu Breeders (ABCZ) were used in this study. The data were analyzed according to three different approaches, corresponding to one of those files, in order to estimate the (co)variance components and the genetic parameters by different statistical models and the REML methodology: variance estimates and genetic parameters of single-trait models, single and two-trait models, and of random regression models (RRM). Regarding the first analysis, where four single-trait models were used, it was observed that model 1, the complete one which included the direct genetic and maternal (GM) effects, as well as the maternal permanent environmental effect and residual, did not statistically (P<0.05) differ by the likelihood ratio test from model 2, which excluded the GM. Direct heritabilities (h2) estimated by models 1 and 2 were quite similar, and increased from first to second age, remained until weaning, and then increased. Estimates of maternal genetic variance were low, especially before weaning. The second analysis, which used different single and two-trait models, resulted in similar behavior of estimates to the first analysis. The h2 estimated by single and two-trait analyses, for weight records adjusted to 120(P120), 205(P205), 365(P365) and 550(P550) days of age were 0.15, 0.10, 0.17, 0.14 and, 0.14, 0.10, 0.16, 0.15, respectively. The direct genetic correlations (ra) by models 1 and 2 for P120/P205, P120/P365, P120/P550, P205/P365, P205/P550 and P365/P550 were 0.80, 0.54, 0.54, 0.74, 0.62, 0.95 and, 0.80, 0.54, 0.53, 0.74, 0.62, 0.95, respectively. When comparing models 1 and 2, by the single and two-trait analyses, it was verified that model 2, which excluded the GM, was equivalent to the complete model. In the random regression analysis ten models presenting different residual variance structures and order combinations (k) of random effects were evaluated. According to the Akaike Information Criterion and the Schwarz Bayesian Information Criterion, the most suitable RRM were the models Reg666-r10 (RegkAkCkQ-r10) and Reg653-r10 (RegkAkCkQ-r10), respectively, for the direct additive effect (kA), the animal permanent environmental effect (kC) and the maternal permanent environmental effect (kQ), with the residue variances divided into ten distinct variance classes (r10). The h2 estimates for weights at birth (PN), 205, 365 and 550 days of age were 0.13, 0.43, 0.46, 0.48 and 0.13, 0.46, 0.54, 0.56 for the Reg666-r10 model and for the most parsimonious model (Reg653-10), respectively. The phenotypic, genetic, animal permanent environmental and maternal permanent environmental correlations were all positive and similar for all RRM. Considering the most parsimonious model, Reg653-10, the ra between PN/205, PN/365, PN/550, 205/365, 205/550 and 365/550 were 0.40, 0.40, 0.42, 0.68, 0.74 and 0.81, respectively. Models with variance homogeneity were inadequate. The residual variance divided into ten distinct variance classes was the most suitable to model the residual variation. In the comparison of the three approaches of analysis it was evidenced that the RRM constitutes important alternative for analysis of growth data of bovines.

Page generated in 0.0461 seconds