• Refine Query
  • Source
  • Publication year
  • to
  • Language
  • 251
  • 14
  • 10
  • 1
  • Tagged with
  • 279
  • 195
  • 138
  • 103
  • 76
  • 63
  • 61
  • 59
  • 56
  • 54
  • 51
  • 51
  • 47
  • 42
  • 38
  • About
  • The Global ETD Search service is a free service for researchers to find electronic theses and dissertations. This service is provided by the Networked Digital Library of Theses and Dissertations.
    Our metadata is collected from universities around the world. If you manage a university/consortium/country archive and want to be added, details can be found on the NDLTD website.
201

Modelando dados de contagem com inflação de zeros, sobredispersão e dependência espacial

Bandeira, Carla Zeline Rodrigues 09 April 2015 (has links)
Submitted by Geyciane Santos (geyciane_thamires@hotmail.com) on 2015-10-02T15:56:27Z No. of bitstreams: 1 Dissertação - Carla Zeline Rodrigues Bandeira.pdf: 2549224 bytes, checksum: aa333603d820f70948fed268d6c84524 (MD5) / Approved for entry into archive by Divisão de Documentação/BC Biblioteca Central (ddbc@ufam.edu.br) on 2015-10-09T14:13:31Z (GMT) No. of bitstreams: 1 Dissertação - Carla Zeline Rodrigues Bandeira.pdf: 2549224 bytes, checksum: aa333603d820f70948fed268d6c84524 (MD5) / Approved for entry into archive by Divisão de Documentação/BC Biblioteca Central (ddbc@ufam.edu.br) on 2015-10-09T14:19:46Z (GMT) No. of bitstreams: 1 Dissertação - Carla Zeline Rodrigues Bandeira.pdf: 2549224 bytes, checksum: aa333603d820f70948fed268d6c84524 (MD5) / Made available in DSpace on 2015-10-09T14:19:46Z (GMT). No. of bitstreams: 1 Dissertação - Carla Zeline Rodrigues Bandeira.pdf: 2549224 bytes, checksum: aa333603d820f70948fed268d6c84524 (MD5) Previous issue date: 2015-04-09 / CAPES - Coordenação de Aperfeiçoamento de Pessoal de Nível Superior / This work proposes a new model for count data with excess zeros, overdispersion and spatial dependence. To accommodate these characteristics simultaneously, we used an zeroinflated quasi-likelihood (QIZ), where the spatial dependence is incorporated in the estimation process through generalized estimating equations (GEE). The estimation algorithm used in this process was the ES (Expectation-Solution); confidence intervals for the parameters were obtained via Bootstrap Inference. Simulation studies have been performed in various scenarios. Finally, the method is illustrated using data of leprosy cases in the State of Amazonas. / Neste trabalho foi proposto um novo modelo para dados de contagem com excesso de zeros, sobredispersão e dependência espacial. Para acomodar simultaneamente essas características, utilizou-se uma quase verossimilhança inflacionada de zeros (QIZ), onde a dependência espacial foi incorporada no processo de estimação através das equações de estimação generalizadas (GEE). O algoritmo de estimação usado nesse processo foi o ES (Expectation-Solution); os intervalos de confiança para os parâmetros foram obtidos via Inferência Bootstrap. Estudos de simulação foram realizados considerando-se vários cenários. Finalmente, o método proposto foi ilustrado usando dados de casos de Hanseníase no Estado do Amazonas.
202

Inferência em um modelo de regressão com resposta binária na presença de sobredispersão e erros de medição / Inference in a regression model with overdispersed binary response and measurement errors

Sandra Maria Tieppo 15 February 2007 (has links)
Modelos de regressão com resposta binária são utilizados na solução de problemas nas mais diversas áreas. Neste trabalho enfocamos dois problemas comuns em certos conjuntos de dados e que requerem técnicas apropriadas que forneçam inferências satisfatórias. Primeiro, em certas aplicações uma mesma unidade amostral é utilizada mais de uma vez, acarretando respostas positivamente correlacionadas, responsáveis por uma variância na variável resposta superior ao que comporta a distribuição binomial, fenômeno conhecido como sobredispersão. Por outro lado, também encontramos situações em que a variável explicativa contém erros de medição. É sabido que utilizar técnicas que desconsideram esses erros conduz a resultados inadequados (estimadores viesados e inconsistentes, por exemplo). Considerando um modelo com resposta binária, utilizaremos a distribuição beta-binomial para representar a sobredispersão. Os métodos de máxima verossimilhança, SIMEX, calibração da regressão e máxima pseudo-verossimilhança foram usados na estimação dos parâmetros do modelo, que são comparados através de um estudo de simulação. O estudo de simulação sugere que os métodos de máxima verossimilhança e calibração da regressão são melhores no sentido de correção do viés, especialmente para amostras de tamanho 50 e 100. Também estudaremos testes de hipóteses assintóticos (como razão de verossimilhanças, Wald e escore) a fim de testar hipóteses de interesse. Apresentaremos também um exemplo com dados reais / Regression models with binary response are used for solving problems in several areas. In this work we approach two common problems in some data sets and they need appropriate techniques to achieve satisfactory inference. First, in some applications, the same sample unity is utilized more than once, bringing positively correlated responses, which are responsible for the response variable variance be greater than an assumption binomial distribution, phenomenon known as overdispersion. On the other hand, also we find situations where the explanatory variable has measurement errors. It is known that the use of techniques which ignores these measurement errors brings inadequate results (e. g., biased and inconsistent estimators). Taking a model with binary response, we will use a beta-binomial distribution for modeling the overdispersion. The methods of maximum likelihood, SIMEX, regression calibration and maximum pseudo-likelihood were used in the estimation of the parameters, which are compared through a simulation study. The simulation studies suggest that the maximum likelihood and regression calibration methods are better for bias correcting, especially for larger sample size. Likelihood ratio, Wald and score statistics are used in order to test hypothesis of interest. We will illustrate the techniques with an application to a real data set
203

Modelo de regressão gama-G em análise de sobrevivência / Gama-G regression model in survival analysis

Elizabeth Mie Hashimoto 15 March 2013 (has links)
Dados de tempo de falha são caracterizados pela presença de censuras, que são observações que não foram acompanhadas até a ocorrência de um evento de interesse. Para estudar o comportamento de dados com essa natureza, distribuições de probabilidade são utilizadas. Além disso, é comum se ter uma ou mais variáveis explicativas associadas aos tempos de falha. Dessa forma, o objetivo geral do presente trabalho é propor duas novas distribuições utilizando a função geradora de distribuições gama, no contexto de modelos de regressão em análise de sobrevivência. Essa função possui um parâmetro de forma que permite criar famílias paramétricas de distribuições que sejam flexíveis para capturar uma ampla variedade de comportamentos simétricos e assimétricos. Assim, a distribuição Weibull e a distribuição log-logística foram modificadas, dando origem a duas novas distribuições de probabilidade, denominadas de gama-Weibull e gama-log-logística, respectivamente. Consequentemente, os modelos de regressão locação-escala, de longa-duração e com efeito aleatório foram estudados, considerando as novas distribuições de probabilidade. Para cada um dos modelos propostos, foi utilizado o método da máxima verossimilhança para estimar os parâmetros e algumas medidas de diagnóstico de influência global e local foram calculadas para encontrar possíveis pontos influentes. No entanto, os resíduos foram propostos apenas para os modelos locação-escala para dados com censura à direita e para dados com censura intervalar, bem um estudo de simulação para verificar a distribuição empírica dos resíduos. Outra questão explorada é a introdução dos modelos: gama-Weibull inflacionado de zeros e gama-log-logística inflacionado de zeros, para analisar dados de produção de óleo de copaíba. Por fim, diferentes conjunto de dados foram utilizados para ilustrar a aplicação de cada um dos modelos propostos. / Failure time data are characterized by the presence of censoring, which are observations that were not followed up until the occurrence of an event of interest. To study the behavior of the data of that nature, probability distributions are used. Furthermore, it is common to have one or more explanatory variables associated to failure times. Thus, the goal of this work is given to the generating of gamma distributions function in the context of regression models in survival analysis. This function has a shape parameter that allows create parametric families of distributions that are flexible to capture a wide variety of symmetrical and asymmetrical behaviors. Therefore, through the generating of gamma distributions function, the Weibull distribution and log-logistic distribution were modified to give two new probability distributions: gamma-Weibull and gammalog-logistic. Additionally, location-scale regression models, long-term models and models with random effects were also studied, considering the new distributions. For each of the proposed models, we used the maximum likelihood method to estimate the parameters and some diagnostic measures of global and local influence were calculated for possible influential points. However, residuals have been proposed for data with right censoring and interval-censored data and a simulation study to verify the empirical distribution of the residuals. Another issue explored is the introduction of models: gamma-Weibull inflated zeros and gamma-log-logistic inflated zeros, to analyze production data copaiba oil. Finally, different data set are used to illustrate the application of each of the models.
204

Extensões da distribuição gama generalizada: propriedades e aplicações / Extensions of the generalized gamma distribution: properties and applications

Marcelino Alves Rosa de Pascoa 25 April 2012 (has links)
A distribuição gama generalizada (GG) possui, como casos particulares, distribuição Weibull, log-normal, gama, qui-quadrado, entre outras. Por essa razão, ela e considerada uma distribuição exvel no ajuste dos dados. A ideia de Cordeiro e Castro (2011) foi utilizada para o desenvolvimento de duas novas distribuições de probabilidade a partir da distribuição GG. Uma delas e denominada de Kumaraswamy gama generalizada (KumGG) e possui cinco parâmetros; a outra distribuição e uma modificação de um dos parmetros de forma da distribuição KumGG e foi denominada de distribuição Kumaraswamy gama generalizada estendida (KumGGE). Desenvolveu-se o modelo de regressão log-Kumaraswamy gama generalizada estendida. Alem disso, a ideia de Adamidis e Loukas (1998) para modicar distribuições foi utilizada para a distribuição GG; essa nova distribuição foi nomeada de gama generalizada geometrica (GGG). A vantagem desses novos modelos reside na capacidade de acomodar varias formas da função risco eles tambem se mostraram uteis na discriminação de modelos. Para cada um dos modelos foram calculados os momentos, função geradora de momentos, os desvios medios, a conabilidade e a função densidade de probabilidade da estatistica de ordem. Para a estimação dos parâmetros, foram utilizados os metodos de maxima verossimilhanca e bayesiano e, finalmente, para ilustrar a aplicação das novas distribuições foram analisados alguns conjuntos de dados reais. / The generalized gamma (GG) distribution has as particular cases the Weibull, log-normal, gamma and Chi-square distributions, among others. For this reason, it is considered a exible distribution for tting data. In this paper, the idea of Cordeiro and Castro (2011) is used to develop two new probability distributions based on the GG distribution. The rst is called the generalized gamma Kumaraswamy (KumGG) and has ve parameters, while the other involves a modication of one of the shape parameters of the KumGG distribution and is called the extended generalized gamma Kumaraswamy (KumGGE). Based in these, we develop the extended generalized log-Kumaraswamy regression model. Besides this, we employ the idea regarding modifying distributions of Adamidis and Loukas (1998) for the GG distribution, calling this new distribution the geometric generalized gamma (GGG). The advantage of these new models rests in their capacity to accommodate various risk function forms. They are also useful in model discrimination. We calculate the moments, moments generating function, mean deviations, reliability and probability density function of the order statistics. To estimate the parameters we use the maximum likelihood and Bayesian methods. Finally, to illustrate the application of the new distributions, we analyze some real data sets.
205

Distribuição de probabilidade e dimensionamento amostral para tamanho de partícula em gramíneas forrageiras / Probability distribution and sample dimension for particle size in forage grasses

Claudia Fernanda Navarette López 16 January 2009 (has links)
O objetivo deste trabalho foi identificar a distribuição de probabilidade da variável tamanho de partícula em gramíneas forrageiras e fazer um dimensionamento amostral. Para isto foi realizada uma analise exploratória dos dados obtidos de um experimento planejado em blocos casualizados, a cada sub-amostra do conjunto de dados foram ajustadas as distribuições normal, gama, beta e Weibull. Foram realizados os testes de aderência não paramétricos de Kolmogorov-Smirnov, Lilliefos, Cramer-von Mises e Anderson-Darling para avaliar o ajuste as distribuições. A estimativa do valor do logaritmo da função de máxima verossimilhança e indicativo da distribuição que melhor descreveu o conjunto de dados, assim como os critérios de informação de Akaike (AIC) e de informação bayesiano (BIC). Foram feitas simulações a partir dos parâmetros obtidos e feitos os testes não paramétricos para avaliar o ajuste com diferentes tamanhos de amostras. Encontrou-se que os dados n~ao seguem a distribuição normal, pois há assimetria nos histogramas melhor descritos pelas distribuições beta e Weibull. Os testes mostraram que as distribuições gama, beta e Weibull ajustam-se melhor aos dados porem pelo maior valor do logaritmo da função de verossimilhança, assim como pelos valores AIC e BIC, o melhor ajuste foi dado pela distribuição Weibull. As simulações mostraram que com os tamanhos n de 2 e 4 com 10 repetições cada, as distribuições gama e Weibull apresentaram bom ajuste aos dados, a proporção que o n cresce a distribuição dos dados tende a normalidade. O dimensionamento dado pela Amostra Aleatória Simples (ASA), mostrou que o tamanho 6 de amostra e suficiente, para descrever a distribuição de probabilidade do tamanho de partícula em gramíneas forrageiras / The purpose of this study was to identify the probability distribution of variable particle size in forages grasses and to do a sample dimension. For this was carried out an exploratory analysis of the data obtained from the experiment planned in randomized blocks. Each sample of the overall data was adjusted to Normal, Gama, Beta and Weibull distributions. Tests of adhesion not parametric of Kolmogorov-Smirnov, Lilliefos, Cramer-von Mises and Anderson-Darling were conducted to indicate the adjustment at the distributions. The estimate of the value of the logarithm of function of maximum likelihood is indicative of distribution that better describes the data set, as well as information criteria of Akaike (AIC) and Bayesian information (BIC). Simulations from parameters obtained were made and tests not parametric to assess the t with dierent sizes of samples were made too. It was found that data are not normal, because have asymmetry in the histograms, better described by Beta and Weibull distributions. Tests showed that Gamma, Beta and Weibull distributions, have a ts better for the data; for the highest value in the logarithm of the likelihood function as well as smaller AIC and BIC, best t was forWeibull distribution. Simulations showed that with 2 and 4 sizes (n), with 10 repeat each one, the Gama and Weibull distributions showed good t to data, as the proportion in which n grows, distribution of data tends to normality. Dimensioning by simple random sample (ASA), showed that 6 is a sucient sample size to describe probability distribution for particle size in forage grasses.
206

Mapeamento de QTLs utilizando as abordagens Clássica e Bayesiana / Mapping QTLs: Classical and Bayesian approaches

Elisabeth Regina de Toledo 02 October 2006 (has links)
A produção de grãos e outros caracteres de importância econômica para a cultura do milho, tais como a altura da planta, o comprimento e o diâmetro da espiga, apresentam herança poligênica, o que dificulta a obtenção de informações sobre as bases genéticas envolvidas na variação desses caracteres. Associações entre marcadores e QTLs foram analisadas através dos métodos de mapeamento por intervalo composto (CIM) e mapeamento por intervalo Bayesiano (BIM). A partir de um conjunto de dados de produção de grãos, referentes à avaliação de 256 progênies de milho genotipadas para 139 marcadores moleculares codominantes, verificou-se que as metodologias apresentadas permitiram classificar marcas associadas a QTLs. Através do procedimento CIM, associações entre marcadores e QTLs foram consideradas significativas quando o valor da estatística de razão de verossimilhança (LR) ao longo do cromossomo atingiu o valor máximo dentre os que ultrapassaram o limite crítico LR = 11; 5 no intervalo considerado. Dez QTLs foram mapeados distribuídos em três cromossomos. Juntos, explicaram 19,86% da variância genética. Os tipos de interação alélica predominantes foram de dominância parcial (quatro QTLs) e dominância completa (três QTLs). O grau médio de dominância calculado foi de 1,12, indicando grau médio de dominância completa. Grande parte dos alelos favoráveis ao caráter foram provenientes da linhagem parental L0202D, que apresentou mais elevada produção de grãos. Adotando-se a abordagem Bayesiana, foram implementados métodos de amostragem através de cadeias de Markov (MCMC), para obtenção de uma amostra da distribuição a posteriori dos parâmetros de interesse, incorporando as crenças e incertezas a priori. Resumos sobre as localizações dos QTLs e seus efeitos aditivo e de dominância foram obtidos. Métodos MCMC com saltos reversíveis (RJMCMC) foram utilizados para a análise Bayesiana e Fator calculado de Bayes para estimar o número de QTLs. Através do método BIM associações entre marcadores e QTLs foram consideradas significativas em quatro cromossomos, com um total de cinco QTLs mapeados. Juntos, esses QTLs explicaram 13,06% da variância genética. A maior parte dos alelos favoráveis ao caráter também foram provenientes da linhagem parental L02-02D. / Grain yield and other important economic traits in maize, such as plant heigth, stalk length, and stalk diameter, exhibit polygenic inheritance, making dificult information achievement about the genetic bases related to the variation of these traits. The number and sites of (QTLs) loci that control grain yield in maize have been estimated. Associations between markers and QTLs were undertaken by composite interval mapping (CIM) and Bayesian interval mapping (BIM). Based on a set of grain yield data, obtained from the evaluation of 256 maize progenies genotyped for 139 codominant molecular markers, the presented methodologies allowed classification of markers associated to QTLs.Through composite interval mapping were significant when value of likelihood ratio (LR) throughout the chromosome surpassed LR = 11; 5. Significant associations between markers and QTLs were obtained in three chromosomes, ten QTLs has been mapped, which explained 19; 86% of genetic variation. Predominant genetic action for mapped QTLs was partial dominance and (four QTLs) complete dominance (tree QTLs). Average dominance amounted to 1,12 and confirmed complete dominance for grain yield. Most alleles that contributed positively in trait came from parental strain L0202D. The latter had the highest yield rate. Adopting a Bayesian approach to inference, usually implemented via Markov chain Monte Carlo (MCMC). The output of a Bayesian analysis is a posterior distribution on the parameters, fully incorporating prior beliefs and parameter uncertainty. Reversible Jump MCMC (RJMCMC) is used in this work. Bayes Factor is used to estimate the number of QTL. Through Bayesian interval, significant associations between markers and QTLs were obtained in four chromosomes and five QTLs has been mapped, which explained 13; 06% of genetic variation. Most alleles that contributed positively in trait came from parental strain L02-02D. The latter had the highest yield rate.
207

Modelos lineares generalizados e modelos de dispersão aplicados à modelagem de sinistros agrícolas / Generalized linear models and model dispersion applied to modelling agricultural claims

Keliny Martins de Melo Sousa 12 February 2010 (has links)
O presente trabalho tem por objetivo utilizar a abordagem dos modelos lineares generalizados e os modelos de dispersão no contexto do seguro agrícola. Os modelos lineares generalizados (MLG\'s) constituem uma extensão dos modelos lineares de regressão múltipla introduzida por Nelder e Wedderburn (1972), que inclui modelos cuja variável resposta pertence à família exponencial de distribuições. O MLG é formado por um componente aleatório, que possui distribuição pertencente à família exponencial, um componente sistemático, conectados por uma função de ligação. Jorgensen (1997) estende a utilização dos MLG para uma classe mais ampla de modelos probabilísticos, denominados modelos de dispersão. A estimação dos parâmetros foi baseada no método da máxima verossimilhança, e também, em função da amostra ser relativamente pequena, optou-se pelo método de bootstrap não-paramétrico. As duas abordagens foram aplicadas a dois conjuntos de dados de sinistros de 15 municípios do estado do Rio Grande do Sul. Os resultados mostraram que a precipitação acumulada tem influência na ocorrência de sinistros. Entretanto, na modelagem do montante do sinistro não foi encontrada nenhuma variável significativa. Usando o método de bootstrap, foi encontrada influência das variáveis precipitação acumulada e a temperatura média no numero de sinistros / The main objective of this work is to use the generalized linear models and dispersion models in the agricultural insurance context. The Generalized Linear Model (GLM) are an extension of the multiple regression linear models presented by Nelder e Wedderburn (1972). This approach include situations in which the response variable can be included in exponencial the family. The GLM is composed of a randomized component, a sistematic component and the link functions. JÁrgensen (1997) extend the application of the GLM for a more general class of probability models, called dispersion models. Both approaches were applied in two insurance datasets for 15 citys in Rio Grande do Sul. The parameters estimation was based in the maximum likelihood method, in addition, because of the relatively small sample, the non-parametric Bootstrap method was used. This study show, using GLM, that only the accumulated rainfall was statistically significant . However, any of the covariates was significant when modelling the amount of claims. In the analysis using Bootstrap method the accumulated rainfall and average temperature were significant when modelling the number of insurance clains.
208

Modelagem estatística de extremos espaciais com base em processos max-stable aplicados a dados meteorológicos no estado do Paraná / Statistical modelling of spatial extremes based on max-stable processes applied to environmental data in the Parana State

Ricardo Alves de Olinda 09 August 2012 (has links)
A maioria dos modelos matemáticos desenvolvidos para eventos raros são baseados em modelos probabilísticos para extremos. Embora as ferramentas para modelagem estatística de extremos univariados e multivariados estejam bem desenvolvidas, a extensão dessas ferramentas para modelar extremos espaciais integra uma área de pesquisa em desenvolvimento muito ativa atualmente. A modelagem de máximos sob o domínio espacial, aplicados a dados meteorológicos é importante para a gestão adequada de riscos e catástrofes ambientais nos países que tem a sua economia profundamente dependente do agronegócio. Uma abordagem natural para tal modelagem é a teoria de extremos espaciais e o processo max-stable, caracterizando-se pela extensão de dimensões infinitas da teoria de valores extremos multivariados, podendo-se então incorporar as funções de correlação existentes na geoestatística e consequentemente, verificar a dependência extrema por meio do coeficiente extremo e o madograma. Neste trabalho descreve-se a aplicação de tais processos na modelagem da dependência de máximos espaciais de precipitação máxima mensal do estado do Paraná, com base em séries históricas observadas em estações meteorológicas. Os modelos propostos consideram o espaço euclidiano e uma transformação denominada espaço climático, que permite explicar a presença de efeitos direcionais, resultantes de padrões meteorológicos sinóticos. Essa metodologia baseia-se no teorema proposto por De Haan (1984) e nos modelos de Smith (1990) e de Schlather (2002), verifica-se também o comportamento isotrópico e anisotrópico desses modelos via simulação Monte Carlo. Estimativas são realizadas através da máxima verossimilhança pareada e os modelos são comparados usando-se o Critério de Informação Takeuchi. O algoritmo utilizado no ajuste é bastante rápido e robusto, permitindo-se uma boa eficiência computacional e estatística na modelagem da precipitação máxima mensal, possibilitando-se a modelagem dos efeitos direcionais resultantes de fenômenos ambientais. / The most mathematical models developed for rare events are based on probabilistic models for extremes. Although the tools for statistical modeling of univariate and multivariate extremes are well-developed, the extension of these tools to model spatial extremes data is currently a very active area of research. Modeling of maximum values under the spatial domain, applied to meteorological data is important for the proper management of risks and environmental disasters in the countries where the agricultural sector has great influence on the economy. A natural approach for such modeling is the theory of extreme spatial and max-stable process, characterized by infinite dimensional extension of multivariate extreme value theory, and we can then incorporate the current correlation functions in geostatistics and thus, check the extreme dependence through the extreme coefficient and the madogram. This thesis describes the application of such procedures in the modeling of spatial maximum dependency of monthly maximum rainfall of Paraná State, historical series based on observed meteorological stations. The proposed models consider the Euclidean space and a transformation called climatic space, which makes it possible to explain the presence of directional effects resulting from synoptic weather patterns. This methodology is based on the theorem proposed by De Haan (1984) and Smith (1990) models and Schlather (2002), checking the isotropic and anisotropic behavior these models through Monte Carlo simulation. Estimates are performed using maximum pairwise likelihood and the models are compared using the Takeuchi information criterion. The algorithm used in the fit is very fast and robust, allowing a good statistical and computational efficiency in monthly maximum rainfall modeling, allowing the modeling of directional effects resulting from environmental phenomena.
209

O modelo Burr XII geométrico: propriedades e aplicações / The model Burr XII Geometric: properties and applications

Beatriz Rezende Lanjoni 25 November 2013 (has links)
No presente trabalho são propostos dois modelos para dados censurados baseados na mistura da distribuição geométrica e na distribuição Burr XII considerando duas ativações latentes, máximo e mínimo. A distribuição Burr XII tem três parâmetros e é uma generalização da distribuição log-logística. Por sua vez a distribuição Burr XII Geométrica tipo I e tipo II tem quatro parâmetros e são generalizações da distribuição Burr XII relacionados as ativações latentes do mínimo e máximo respectivamente. Foram apresentadas algumas propriedades das duas novas distribuições tais como momentos, assimetria, curtose, função geradora de momentos e desvio médio. Além disso, foi intriduzido os modelos de regressão correspondentes, log Burr XII Geométrica tipo I e log Burr XII Geométrica tipo II. Adicionalmente foi desenvolvido um modelo de sobrevivência com fração de cura assumindo que o número de causas competitivas do evento de interesse segue a distribuição geométrica e o tempo do evento segue a distribuição Burr XII. Para todos os modelos desenvolvidos foi utilizado o método da máxima verossimilhança para estimar os parâmetros, que possibilita a construção de intervalos de confiança e testes de hipóteses. Por fim, são apresentadas três aplicações para ilustrar os modelos propostos. / In this paper are proposed two models for censored data based on the mixture of geometric distribution and Burr XII distribution considering two latent activations, maximum and minimum. The Burr XII distribution has three parameters and is a generalization of the log-logistic distribution. On the other hand Burr XII Geometric type I distribution and type II has four parameters and are a generalization of the Burr XII distribution related to minimum and maximum activations respectively. It were presented some properties of the news distributions such as moments, skewness, kurtosis, moment generating function and mean deviation. Furthermore, it was introduced two regression models, the log Burr XII Geometric type I and the log Burr XII Geometric type II. Additionally a new cure rate survival was formulated by assuming that the number of competing causes of the event of interest has the geometric distribution and the time to this event follows Burr XII distribution. For all models was developed the maximum likelihood method to estimate the parameters, which allows the construction of confidence intervals and hypothesis testing. Finally, three applications are presented to illustrate the proposed models.
210

Comparação de métodos de estimação de componentes de variância e parâmetros genéticos considerando o delineamento III aplicado a caracteres quantitativos em milho / Comparison of estimation methods for variance components and genetic parameters considering the Design III applied to quantitative characters in maize

Angela Mello Coelho 09 April 2010 (has links)
Esse trabalho teve como objetivo comparar métodos de estimação de componentes de variância e parâmetros genéticos, considerando tanto o delineamento estatístico fatorial instalado em látice quadrado como o delineamento genético III. Como referência, foram utilizados três conjuntos de dados reais, em melhoramento genético de milho, relativos aos caracteres de produção de grãos (gramas por parcela), altura da folha bandeira ao chão (centímetros) e o número de folhas entre a primeira espiga e o pendão; sendo que a altura da folha bandeira e o número de folhas foram obtidos pela média entre cinco plantas competitivas para cada parcela. O método da Análise da Variância (ANOVA), conforme indicado pelo Delineameno III, foi utilizado na análise dos dados e estimação dos componentes de variância relativos ao modelo matemático, variâncias genéticas, coeficiente de herdabilidade e grau médio de dominância para cada um dos três caracteres estudados. Essas estimativas foram utilizadas na simulação de 1000 conjuntos de dados com características semelhantes a cada um dos conjuntos de dado reais considerados. Os métodos da ANOVA e da máxima verossimilhança restrita (REML) foram utilizados na predição dos parâmetros já mencionados para cada um dos conjuntos de dados simulados dentro de cada caráter. As 1000 estimativas obtidas por cada método, para cada caráter estudado, foram utilizadas no cálculo de estatísticas descritivas (média, desvio-padrão e acurácia relativa) e na montagem de gráficos de Box-plot. Utilizando as informações obtidas a partir das estimativas fornecidas por cada método e em posse dos valores reais que essas estimativas deveriam prever (valor utilizado na simulação dos dados) foi possível comparar ambos os métodos quanto à eficiência das estimativas por eles fornecidas. Ambos os métodos apresentaram características semelhantes na predição da maioria dos componentes de variância relativos ao modelo matemático, sendo que as maiores disparidades se deram para os componentes relativos aos efeitos de progênie (?p2) e as interações entre progênie e linhagem (?pt2) e entre progênie, linhagem e ambiente (?pta2); os quais são os componentes de maior peso no cálculo das variâncias e parâmetros genéticos. O método da ANOVA foi o bastante eficiente na predição de ?p2, sendo que o método da REML se aproxima dos resultados obtidos pelo método da ANOVA conforme diminuem os valores de referência para esse componente; para ?pt2 o método da REML se mostrou mais eficiente conforme maior é o valor de referência, porém, perde eficiência e se aproxima do método da ANOVA conforme o valor de referência do componente diminui. Ambos os métodos se mostraram ineficientes na predição de ?pta2, porém o método da REML foi o menos eficiente. O melhor desempenho do método da ANOVA na predição dos componentes de variância de maior peso no cálculo das variâncias genéticas levou a um melhor desempenho desse método na predição de todos os parâmetros genéticos, com exceção da variância de dominância, a qual depende unicamente de ?pt2. Porém, foi observada uma tendência no método da ANOVA, em média, na superestimação do grau médio de dominância em cerca de 45% do seu valor de referência, independentemente do caráter estudado. / This work aimed to compare estimation methods for variance components and genetic parameters, considering the factorial statistical design set in randomized blocks and the genetic Design III. As reference, three sets of real data were used, on maize genetic improvement, related to the characters: grain yield (grams by plot), plant height, measured from the ground to the °ag leaf in centimeters, and the number of leaves above the uppermost ear. The analysis of variance method (ANOVA), accordingly to the proposed by the Design III, was used on the analysis of the data and estimation of the variance components derived from the mathematical model, genetic variances, heritability and average degree of dominance for each of the studied characters. This estimatives were used on the simulation of 1000 data sets with similar characteristics to the real data analyzed. The ANOVA and restricted maximum likelihood (REML) methods were used on the prediction of the already mentioned parameters for each of the simulated data sets within each character. The 1000 estimatives obtained by each method, for each studied character, were used on the calculation of descriptive statistics (mean, standard deviation and relative accuracy) and for the ¯tting of box-plot graphics. Through the information obtained from the estimatives given by each method and in possession of the actual values that they should predict (values used in the simulation of the data sets) it was possible to compare both methods as to the e±ciency of the estimatives given by them. Both methods presented similar characteristics on the prediction of most of the variance components derived from the mathematical model, being that most di®erences were pertinent to the components related to the e®ects of progeny (¾2 p) and to the interactions between progeny and parental inbred (¾2 pt) and between progeny, parental inbred and environment (¾2 pta); which are the components of greater importance on the calculation of the genetic parameters. The ANOVA method was very e±cient on the prediction of ¾2 p, being that the smaller the reference value for this component, more the REML method approached the results obtained by the ANOVA method; for larger values of ¾2 pt the most e±cient was the REML method, but its e±ciency decayed and approached the ANOVA method for smaller reference values for this component. Both methods were poorly e±cient on the prediction of ¾2 pta, but the REML method was the least e±cient. The better performance of the ANOVA method on the prediction of the variance components of greater importance on the calculation of the genetic variances lead to a better performance of the ANOVA method on the prediction of all genetic parameters, with exception to the dominance variance, which depended solely on ¾2 pt. However, it was observed a tendency on the ANOVA method, in average, on the overestimation of the average degree of dominance of around 45% of the actual reference value, independently of the studied character.

Page generated in 0.0865 seconds