• Refine Query
  • Source
  • Publication year
  • to
  • Language
  • 66
  • 21
  • 2
  • 1
  • 1
  • 1
  • 1
  • Tagged with
  • 98
  • 98
  • 64
  • 63
  • 51
  • 28
  • 24
  • 20
  • 19
  • 16
  • 14
  • 14
  • 14
  • 12
  • 12
  • About
  • The Global ETD Search service is a free service for researchers to find electronic theses and dissertations. This service is provided by the Networked Digital Library of Theses and Dissertations.
    Our metadata is collected from universities around the world. If you manage a university/consortium/country archive and want to be added, details can be found on the NDLTD website.
41

Contribuições em inferência e modelagem de valores extremos / Contributions to extreme value inference and modeling.

Pinheiro, Eliane Cantinho 04 December 2013 (has links)
A teoria do valor extremo é aplicada em áreas de pesquisa tais como hidrologia, estudos de poluição, engenharia de materiais, controle de tráfego e economia. A distribuição valor extremo ou Gumbel é amplamente utilizada na modelagem de valores extremos de fenômenos da natureza e no contexto de análise de sobrevivência para modelar o logaritmo do tempo de vida. A modelagem de valores extremos de fenômenos da natureza tais como velocidade de vento, nível da água de rio ou mar, altura de onda ou umidade é importante em estatística ambiental pois o conhecimento de valores extremos de tais eventos é crucial na prevenção de catátrofes. Ultimamente esta teoria é de particular interesse pois fenômenos extremos da natureza têm sido mais comuns e intensos. A maioria dos artigos sobre teoria do valor extremo para modelagem de dados considera amostras de tamanho moderado ou grande. A distribuição Gumbel é frequentemente incluída nas análises mas a qualidade do ajuste pode ser pobre em função de presença de ouliers. Investigamos modelagem estatística de eventos extremos com base na teoria de valores extremos. Consideramos um modelo de regressão valor extremo introduzido por Barreto-Souza & Vasconcellos (2011). Os autores trataram da questão de corrigir o viés do estimador de máxima verossimilhança para pequenas amostras. Nosso primeiro objetivo é deduzir ajustes para testes de hipótese nesta classe de modelos. Derivamos a estatística da razão de verossimilhanças ajustada de Skovgaard (2001) e cinco ajustes da estatística da razão de verossimilhanças sinalizada, que foram propostos por Barndorff-Nielsen (1986, 1991), DiCiccio & Martin (1993), Skovgaard (1996), Severini (1999) e Fraser et al. (1999). As estatísticas ajustadas são aproximadamente distribuídas como uma distribuição $\\chi^2$ e normal padrão com alto grau de acurácia. Os termos dos ajustes têm formas compactas simples que podem ser facilmente implementadas em softwares disponíveis. Comparamos a performance do teste da razão de verossimilhanças, do teste da razão de verossimilanças sinalizada e dos testes ajustados obtidos neste trabalho em amostras pequenas. Ilustramos uma aplicação dos testes usuais e suas versões modificadas em conjuntos de dados reais. As distribuições das estatísticas ajustadas são mais próximas das respectivas distribuições limites comparadas com as distribuições das estatísticas usuais quando o tamanho da amostra é relativamente pequeno. Os resultados de simulação indicaram que as estatísticas ajustadas são recomendadas para inferência em modelo de regressão valor extremo quando o tamanho da amostra é moderado ou pequeno. Parcimônia é importante quando os dados são escassos, mas flexibilidade também é crucial pois um ajuste pobre pode levar a uma conclusão completamente errada. Uma revisão da literatura foi feita para listar as distribuições que são generalizações da distribuição Gumbel. Nosso segundo objetivo é avaliar a parcimônia e flexibilidade destas distribuições. Com este propósito, comparamos tais distribuições através de momentos, coeficientes de assimetria e de curtose e índice da cauda. As famílias mais amplas obtidas pela inclusão de parâmetros adicionais, que têm a distribuição Gumbel como caso particular, apresentam assimetria e curtose flexíveis enquanto a distribuição Gumbel apresenta tais características constantes. Dentre estas distribuições, a distribuição valor extremo generalizada é a única com índice da cauda que pode ser qualquer número real positivo enquanto os índices da cauda das outras distribuições são zero. Observamos que algumas generalizações da distribuição Gumbel estudadas na literatura são não identificáveis. Portanto, para estes modelos a interpretação e estimação de parâmetros individuais não é factível. Selecionamos as distribuições identificáveis e as ajustamos a um conjunto de dados simulado e a um conjunto de dados reais de velocidade de vento. Como esperado, tais distribuições se ajustaram bastante bem ao conjunto de dados simulados de uma distribuição Gumbel. A distribuição valor extremo generalizada e a mistura de duas distribuições Gumbel produziram melhores ajustes aos dados do que as outras distribuições na presença não desprezível de observações discrepantes que não podem ser acomodadas pela distribuição Gumbel e, portanto, sugerimos que tais distribuições devem ser utilizadas neste contexto. / The extreme value theory is applied in research fields such as hydrology, pollution studies, materials engineering, traffic management, economics and finance. The Gumbel distribution is widely used in statistical modeling of extreme values of a natural process such as rainfall and wind. Also, the Gumbel distribution is important in the context of survival analysis for modeling lifetime in logarithmic scale. The statistical modeling of extreme values of a natural process such as wind or humidity is important in environmental statistics; for example, understanding extreme wind speed is crucial in catastrophe/disaster protection. Lately this is of particular interest as extreme natural phenomena/episodes are more common and intense. The majority of papers on extreme value theory for modeling extreme data is supported by moderate or large sample sizes. The Gumbel distribution is often considered but the resulting fit may be poor in the presence of ouliers since its skewness and kurtosis are constant. We deal with statistical modeling of extreme events data based on extreme value theory. We consider a general extreme-value regression model family introduced by Barreto-Souza & Vasconcellos (2011). The authors addressed the issue of correcting the bias of the maximum likelihood estimators in small samples. Here, our first goal is to derive hypothesis test adjustments in this class of models. We derive Skovgaard\'s adjusted likelihood ratio statistics Skovgaard (2001) and five adjusted signed likelihood ratio statistics, which have been proposed by Barndorff-Nielsen (1986, 1991), DiCiccio & Martin (1993), Skovgaard (1996), Severini (1999) and Fraser et al. (1999). The adjusted statistics are approximately distributed as $\\chi^2$ and standard normal with high accuracy. The adjustment terms have simple compact forms which may be easily implemented by readily available software. We compare the finite sample performance of the likelihood ratio test, the signed likelihood ratio test and the adjusted tests obtained in this work. We illustrate the application of the usual tests and their modified versions in real datasets. The adjusted statistics are closer to the respective limiting distribution compared to the usual ones when the sample size is relatively small. Simulation results indicate that the adjusted statistics can be recommended for inference in extreme value regression model with small or moderate sample size. Parsimony is important when data are scarce, but flexibility is also crucial since a poor fit may lead to a completely wrong conclusion. A literature review was conducted to list distributions which nest the Gumbel distribution. Our second goal is to evaluate their parsimony and flexibility. For this purpose, we compare such distributions regarding moments, skewness, kurtosis and tail index. The larger families obtained by introducing additional parameters, which have Gumbel embedded in, present flexible skewness and kurtosis while the Gumbel distribution skewness and kurtosis are constant. Among these distributions the generalized extreme value is the only one with tail index that can be any positive real number while the tail indeces of the other distributions investigated here are zero. We notice that some generalizations of the Gumbel distribution studied in the literature are not indetifiable. Hence, for these models meaningful interpretation and estimation of individual parameters are not feasible. We select the identifiable distributions and fit them to a simulated dataset and to real wind speed data. As expected, such distributions fit the Gumbel simulated data quite well. The generalized extreme value distribution and the two-component extreme value distribution fit the data better than the others in the non-negligible presence of outliers that cannot be accommodated by the Gumbel distribution, and therefore we suggest them to be applied in this context.
42

Modelos de curvas de crescimento e regressão aleatória em linhagens nacionais de frango caipira / Models of growth curves and random regression lines in national free-range chickens

Rovadoscki, Gregorí Alberto 07 December 2012 (has links)
A avicultura é uma das principais atividades agropecuárias do Brasil, em 2011 o país produziu 12.230 toneladas de carne de frango, sendo o 3º maior produtor de frango do mundo, apenas atrás dos EUA e China. Parte deste êxito se deve principalmente ao melhoramento genético animal implantado nas últimas décadas. Os objetivos nesse estudo foram: 1º - Comparar as funções das curvas de crescimento: von Bertalanffy, Gompertz, Logística, Richards e Brody, pelo método dos Mínimos Quadrados Ordinários (QMO) e Quadrados Mínimos Ponderados (QMP) a dados de peso vivo para as linhagens experimentais de frango caipira (7P, Caipirão da ESALQ, Caipirinha da ESALQ e Carijó Barbado) e selecionar uma curva de crescimento que melhor descreva o padrão de crescimento para cada linhagem, e estimar os componentes genéticos (herdabilidades e correlações genéticas) dos parâmetros destas funções sob análise bicaracterística; 2º - Comparar modelos com diferentes ordens de ajuste por meio de funções polinomiais de Legendre, sob modelos de regressão aleatória, com variância residual heterogênea, para a estimação dos componentes de (co) variância e avaliação genética de linhagens experimentais de frango caipira (7P, Caipirão da ESALQ, Caipirinha da ESALQ e Carijó Barbado). O modelo que melhor se adequou a curva de crescimento para as linhagens estudadas foi à função de Gompertz ajustado pelo método dos Quadrados Mínimos Ponderados (QMP). Os parâmetros genéticos estimados para as medidas e dos modelos Gompertz ponderado podem ser utilizados como critérios de seleção, pois parecem ter efeito genético considerável para estas características. No entanto, deve-se haver cautela na utilização do parâmetro como critério de seleção para a linhagem Carijó Barbado devido a baixa herdabilidade. As correlações genéticas e fenotípicas entre as características e foram negativas e altas. Indicando que quanto maior o peso assintótico menor a taxa de crescimento. Dentre os modelos de Regressão Aleatória estudados o polinômio de 3ª ordem foi o que melhor se adequou para descrever as curvas de crescimento das linhagens estudadas. As estimativas de variâncias, herdabilidades foram afetadas pela modelagem da variância residual. Em geral as herdabilidades estimadas para as idades de 1 a 84 dias variaram de moderadas a altas para as linhagens estudadas, indicando que qualquer idade pode ser utilizada como critério de seleção. A seleção aos 42 dias de idade pode ser mantida como critério de seleção. / Aviculture is one of the main agribusiness activities in Brazil, in 2011 the country produced 12,230 tons of broiler meat, was the 3rd largest producer of broiler in the world, only behind the USA and China. Part of this success is mainly due to animal genetic improvement implemented in recent decades. In this study, our objectives were: 1 - to compare the functions of the Von Bertalanffy, Gompertz, Logistic, Richards and Brody growth curves by the Ordinary Least Squares and Weighted Least Squares method, from data for body weight from experimental free-range chicken lines (7P, Caipirão da ESALQ, Caipirinha da ESALQ and Carijó Barbado) and select a growth curve that best describes their growth. From this, estimates of the genetic components (heritability and genetic correlations) of the parameters of these functions under bivariate analysis; 2 - Comparing models with different orders of adjustment by means of Legendre polynomial functions under random regression models with heterogeneous residual variance for the estimation of (co) variance and genetic evaluation of experimental free-range chicken lines (7P, Caipirão da ESALQ, Caipirinha da ESALQ and Carijó Barbado). The model that best adapted the growth curve for all lines studied was the Gompertz function adjusted using weighted least squares. Genetic parameters for measurements and can be used as selection criteria because they seem to have considerable genetic effects for these characteristics. There should be caution in using the parameter as a selection criterion for the Carijó Barbado line due to low heritability. The genetic and phenotypic correlations between traits and were negative and high, indicating that the higher the asymptotic weight, the lower the growth rate. Among the Random Regression models studied the 3rd order polynomial was best adapted to describe the growth curves of the lines studied. Estimates of variances and heritabilities were affected by residual variance modeling. Overall heritability estimates between 1 to 84 days of age ranged from moderate to high for all lines, indicating that any age can be used as a selection criterion, including maintaining the current selection at 42 days of age.
43

Uso dos métodos clássico e bayesiano para os modelos não-lineares heterocedásticos simétricos / Use of the classical and bayesian methods for nonlinear heterocedastic symmetric models

Macêra, Márcia Aparecida Centanin 21 June 2011 (has links)
Os modelos normais de regressão têm sido utilizados durante muitos anos para a análise de dados. Mesmo nos casos em que a normalidade não podia ser suposta, tentava-se algum tipo de transformação com o intuito de alcançar a normalidade procurada. No entanto, na prática, essas suposições sobre normalidade e linearidade nem sempre são satisfeitas. Como alternativas à técnica clássica, foram desenvolvidas novas classes de modelos de regressão. Nesse contexto, focamos a classe de modelos em que a distribuição assumida para a variável resposta pertence à classe de distribuições simétricas. O objetivo geral desse trabalho é a modelagem desta classe no contexto bayesiano, em particular a modelagem da classe de modelos não-lineares heterocedásticos simétricos. Vale ressaltar que esse trabalho tem ligação com duas linhas de pesquisa, a saber: a inferência estatística abordando aspectos da teoria assintótica e a inferência bayesiana considerando aspectos de modelagem e critérios de seleção de modelos baseados em métodos de simulação de Monte Carlo em Cadeia de Markov (MCMC). Uma primeira etapa consiste em apresentar a classe dos modelos não-lineares heterocedásticos simétricos bem como a inferência clássica dos parâmetros desses modelos. Posteriormente, propomos uma abordagem bayesiana para esses modelos, cujo objetivo é mostrar sua viabilidade e comparar a inferência bayesiana dos parâmetros estimados via métodos MCMC com a inferência clássica das estimativas obtidas por meio da ferramenta GAMLSS. Além disso, utilizamos o método bayesiano de análise de influência caso a caso baseado na divergência de Kullback-Leibler para detectar observações influentes nos dados. A implementação computacional foi desenvolvida no software R e para detalhes dos programas pode ser consultado aos autores do trabalho / The normal regression models have been used for many years for data analysis. Even in cases where normality could not be assumed, was trying to be some kind of transformation in order to achieve the normality sought. However, in practice, these assumptions about normality and linearity are not always satisfied. As alternatives to classical technique new classes of regression models were developed. In this context, we focus on the class of models in which the distribution assumed for the response variable belongs to the symmetric distributions class. The aim of this work is the modeling of this class in the bayesian context, in particular the modeling of the nonlinear models heteroscedastic symmetric class. Note that this work is connected with two research lines, the statistical inference addressing aspects of asymptotic theory and the bayesian inference considering aspects of modeling and criteria for models selection based on simulation methods Monte Carlo Markov Chain (MCMC). A first step is to present the nonlinear models heteroscedastic symmetric class as well as the classic inference of parameters of these models. Subsequently, we propose a bayesian approach to these models, whose objective is to show their feasibility and compare the estimated parameters bayesian inference by MCMC methods with the classical inference of the estimates obtained by GAMLSS tool. In addition, we use the bayesian method of influence analysis on a case based on the Kullback-Leibler divergence for detecting influential observations in the data. The computational implementation was developed in the software R and programs details can be found at the studys authors
44

Modelos com sobreviventes de longa duração paramétricos e semi-paramétricos aplicados a um ensaio clínico aleatorizado / Parametric and semiparametric long-term survival models applied to a randomized clinical trial

Frazão, Italo Marcus da Mota 14 December 2012 (has links)
Diversos modelos têm sido propostos na literatura com o objetivo de analisar dados de sobrevivência em que a população sob estudo é assumida ser uma mistura de indivíduos suscetíveis (em risco) e não suscetíveis a um específico evento de interesse. Tais modelos são usualmente denominados modelos com sobreviventes de longa duração ou modelos com fração de cura. Neste trabalho, diversos desses modelos (nos contextos paramétrico e semi-paramétrico) foram considerados para analisar os dados de um ensaio clínico aleatorizado conduzido com o objetivo de comparar três estratégias terapêuticas (cirurgia, angioplastia e medicamentoso) utilizadas no tratamento de pacientes com doença coronariana multiarterial. Em todos os modelos, as funções de ligação logito e complemento log-log foram utilizadas para modelar a proporção de sobreviventes de longa duração (indivíduos não suscetíveis). Quanto à função de sobrevivência dos indivíduos suscetíveis, foram utilizados os modelos de Weibull e de Cox. Covariáveis foram consideradas tanto na proporção de sobreviventes de longa duração quanto na função de sobrevivência dos indivíduos suscetíveis. De modo geral, os modelos considerados se mostraram adequados para analisar os dados do ensaio clínico aleatorizado, indicando a cirurgia como a estratégia terapêutica mais eficiente. Indicaram também, que as covariáveis idade, hipertensão e diabetes mellitus exercem influência na ocorrência do óbito cardíaco, mas não no tempo até a ocorrência deste óbito nos pacientes suscetíveis. / Several models have been proposed in the literature with the aim of analyzing survival data when the population under study is assumed to be a mixture of susceptible (at risk) and not susceptible individuals to a specific event of interest. Such models are usually called long-term survivors models or cure rate models. In this work, several of these models (under both parametric and semi-parametric approaches) were considered to analyze the data from a randomized clinical trial conducted in order to compare three therapeutic strategies (surgery, angioplasty and medicine) used in the treatment of patients with multivessel coronary artery disease. For all models the logit and complementary log-log link functions were used to model the proportion of long-term survivors (not susceptible individuals). In regards to the survival function of the susceptible individuals, the Weibull and Cox models were used. Covariates were considered both in the proportion of longterm survivors and in the survival function of the susceptible individuals. Overall, the models considered were suitable for analyzing the data from the randomized clinical trial indicating surgery as the most effective therapeutic strategy. They also indicated that the covariates age, hypertension and diabetes mellitus exhibit influence on the occurrence of cardiac death, but not on the time to the occurrence of this death in susceptible patients.
45

Métodos estatísticos aplicados ao teste de Salmonella/microssoma: modelos, seleção e suas implicações / Statistical methods applied for Salmonella/microsome test data: models, selection and their entailments

Butturi-Gomes, Davi 03 December 2015 (has links)
O teste de Salmonella/microssoma é um ensaio biológico amplamente utilizado para avaliar o potencial mutagênico de substâncias que podem colocar em risco a saúde humana e a qualidade ambiental. A variável resposta é constituída pela contagem do número de colônias revertentes em cada placa, entretanto geralmente há dois efeitos confundidos, o de toxicidade e o de mutagenicidade. Alguns modelos foram propostos para a análise dos dados desses experimentos, que nem sempre apresentam bons ajustes e não consideram explicitamente interações. Há, ainda, poucas plataformas computacionais disponíveis que integram todas essas propostas e forneçam critérios para a seleção adequada de um modelo. Além disso, geralmente é difícil comparar os efeitos de diferentes substâncias sobre as várias linhagens da bactéria, então medidas com interpretação biológica direta são necessárias. Neste trabalho, foram investigadas as propriedades dos preditores dos modelos tradicionais, bem como o comportamento das distribuições amostrais dos estimadores dos parâmetros desses modelos, na presença de diversos níveis de superdispersão. Também, foram realizados experimentos com as linhagens TA98 e TA100 da bactéria, expostas aos inseticidas, metabolizados e não-metabolizados, Fipronil e Tiametoxam, dois agroquímicos bastante utilizados no Brasil. Aos dados desses experimentos foram ajustados diversos modelos, tanto aqueles tradicionalmente utilizados, quanto novos modelos, alguns baseados na regressão de Skellam e outros com interações explícitas. Para tal, foi obtida uma nova classe de modelos chamada de modelos não-lineares vetoriais generalizados e foi desenvolvido um pacote computacional em linguagem R, intitulado \"ames\", para o ajuste, diagnóstico e seleção de modelos. Por fim, foram propostas medidas de interesse biológico, baseadas nos modelos selecionados, para avaliação de risco e do comprometimento do material genético e intervalos de confiança bootstrap paramétrico foram obtidos. Dentre os modelos tradicionais, aqueles cujas distribuições amostrais dos estimadores possuem melhor aproximação normal foram os de Bernstein, Breslow e Myers. Estes resultados forneceram um critério prático para a seleção de modelos, particularmente nas situações em que as medidas de AIC e de bondade de ajuste, os testes de razão de verossimilhanças e a análise de resíduos ou são pouco informativos ou simplesmente não podem ser aplicados. A partir dos modelos selecionados, pode-se concluir que a interação do fator de metabolização é significativa para a linhagem TA98 exposta ao Fipronil, tanto com relação aos efeitos tóxicos quanto aos efeitos mutagênicos; que o mecanismo de ação do Tiametoxam sobre a linhagem TA98 é completamente diferente quando o produto está metabolizado; e que, para a linhagem TA100, não houve efeito de metabolização considerando ambos os agroquímicos. Baseando-se nas medidas propostas, pode-se concluir que o Tiametoxam oferece os maiores riscos de contaminação residual, ainda que o Fipronil apresente os maiores índices de mutagenicidade. / The Salmonella/microsome test is a widely accepted biological assay used to evaluate the mutagenic potential of substances, which can compromise human health and environment quality. The response variable in such experiments is typically the total number of reverts per plate, which, in turn, is the result of the confounded effects of mutagenicity and toxicity. Despite of some statistical models have already been established in the literature, they do not always fit well and neither explicitly consider interaction terms. Besides, there is just a number of available software able to handle these different approaches, usually lacking of global performance and model selection criteria. Also, it is often a hard task to compare the effects of different chemicals over the several available strains to perform the assay, and, thus, direct measures of biological implications are required. In this work, the properties of the predictors in each traditional model were investigated, as well as the behavior of the sampling distributions of the parameter estimators of these models, in different levels of overdispersion. Also, experiments using TA98 and TA100 strains were perfomed, by exposition to two insecticides, namely Fipronil and Thiamethoxam, currently used in Brazil, each of them prior and after to a metabolization processes. Then, the traditional models, empirical regression models based on the Skellam distribution and also compound mechanistic-empirical models with explicit interaction terms were fitted to the data. In order to use a single fitting framework, a new class of models was presented, namely the vector generalized nonlinear models, and a R language package, entitled \"ames\", was developed for fitting, diagnosing and selection of models. Finally, some measures of biological interest were approached based on the selected models for the data, in the contexts of risk evaluation and of DNA damage cautioning. Confidence intervals for such measures were provided using bootstrap percentiles. Among the traditional models, the ones from Bernstein, Breslow and Myers were those whose sampling distributions presented the best normal approximations. These results provided a practical criterion for model selection, particularly in situations where measures as AIC and goodness of fit, likelihood ratio tests, and residual analysis are non informative or simply cannot be applied. From the final selected models, it was inferred that the interactions between the metabolization factor is significative for TA98 strain exposed to Fipronil, regarding both, mutagenic and toxic effects; that the dynamics between mutagenicity and toxicity are different when Thiamethoxam is metabolized compared to when it is not; and that there was no evidence to consider metabolization factor interactions for the TA100 strain data exposed to neither of the insecticides. By appling the referred measures of biological interest, it was concluded that the use of Thiamethoxam provides greater residual contamination risks and that Fipronil causes higher mutagenicity indices.
46

Ajustes para o teste da razão de verossimilhanças em modelos de regressão beta / Adjusted likelihood ratio statistics in beta regression models

Pinheiro, Eliane Cantinho 23 March 2009 (has links)
O presente trabalho considera o problema de fazer inferência com acurácia para pequenas amostras, tomando por base a estatística da razão de verossimilhanças em modelos de regressão beta. Estes, por sua vez, são úteis para modelar proporções contínuas que são afetadas por variáveis independentes. Deduzem-se as estatísticas da razão de verossimilhanças ajustadas de Skovgaard (Scandinavian Journal of Statistics 28 (2001) 3-32) nesta classe de modelos. Os termos do ajuste, que têm uma forma simples e compacta, podem ser implementados em um software estatístico. São feitas simulações de Monte Carlo para mostrar que a inferência baseada nas estatísticas ajustadas propostas é mais confiável do que a inferência usual baseada na estatística da razão de verossimilhanças. Aplicam-se os resultados a um conjunto real de dados. / We consider the issue of performing accurate small-sample likelihood-based inference in beta regression models, which are useful for modeling continuous proportions that are affected by independent variables. We derive Skovgaards (Scandinavian Journal of Statistics 28 (2001) 3-32) adjusted likelihood ratio statistics in this class of models. We show that the adjustment terms have simple compact form that can be easily implemented from standard statistical software. We presentMonte Carlo simulations showing that inference based on the adjusted statistics we propose is more reliable than that based on the usual likelihood ratio statistic. A real data example is presented.
47

Modelos não lineares para dados de contagem longitudinais / Non linear models for count longitudinal data

Araujo, Ana Maria Souza de 16 February 2007 (has links)
Experimentos em que medidas são realizadas repetidamente na mesma unidade experimental são comuns na área agronômica. As técnicas estatísticas utilizadas para análise de dados desses experimentos são chamadas de análises de medidas repetidas, tendo como caso particular o estudo de dados longitudinais, em que uma mesma variável resposta é observada em várias ocasiões no tempo. Além disso, o comportamento longitudinal pode seguir um padrão não linear, o que ocorre com freqüência em estudos de crescimento. Também são comuns experimentos em que a variável resposta refere-se a contagem. Este trabalho abordou a modelagem de dados de contagem, obtidos a partir de experimentos com medidas repetidas ao longo do tempo, em que o comportamento longitudinal da variável resposta é não linear. A distribuição Poisson multivariada, com covariâncias iguais entre as medidas, foi utilizada de forma a considerar a dependência entre os componentes do vetor de observações de medidas repetidas em cada unidade experimental. O modelo proposto por Karlis e Meligkotsidou (2005) foi estendido para dados longitudinais provenientes de experimentos inteiramente casualizados. Modelos para experimentos em blocos casualizados, supondo-se efeitos fixos ou aleatórios para blocos, foram também propostos. A ocorrência de superdispersão foi considerada e modelada através da distribuição Poisson multivariada mista. A estimação dos parâmetros foi realizada através do método de máxima verossimilhança, via algoritmo EM. A metodologia proposta foi aplicada a dados simulados para cada uma das situações estudadas e a um conjunto de dados de um experimento em blocos casualizados em que foram observados o número de folhas de bromélias em seis instantes no tempo. O método mostrou-se eficiente na estimação dos parâmetros para o modelo considerando o delineamento completamente casualizado, inclusive na ocorrência de superdispersão, e delineamento em blocos casualizados com efeito fixo, sem superdispersão e efeito aleatório para blocos. No entanto, a estimação para o modelo que considera efeito fixo para blocos, na presença de superdispersão e para o parâmetro de variância do efeito aleatório para blocos precisa ser aprimorada. / Experiments in which measurements are taken in the same experimental unit are common in agriculture area. The statistical techniques used to analyse data from those experiments are called repeated measurement analysis, and longitudinal study, in which the response variable is observed along the time, is a particular case. The longitudinal behaviour can be non linear, occuring freq¨uently in growth studies. It is also common to have experiments in which the response variable refers to count data. This work approaches the modelling of count data, obtained from experiments with repeated measurements through time, in which the response variable longitudinal behaviour is non linear. The multivariate Poisson distribution, with equal covariances between measurements, was used to consider the dependence between the components of the repeated measurement observation vector in each experimental unit. The Karlis and Meligkotsidou (2005) proposal was extended to longitudinal data obtained from completely randomized. Models for randomized blocks experiments, assuming fixed or random effects for blocks, were also proposed. The occurence of overdispersion was considered and modelled through mixed multivariate Poisson distribution. The parameter estimation was done using maximum likelihood method, via EM algorithm. The methodology was applied to simulated data for all the cases studied and to a data set from a randomized block experiment in which the number of Bromeliads leaves were observed through six instants in time. The method was efficient to estimate the parameters for the completely randomized experiment, including the occurence of overdispersion, and for the randomized blocks experiments assuming fixed effect, with no overdispersion, and random effect for blocks. The estimation for the model that considers fixed effect for block, with overdispersion and for the variance parameters of the random effect for blocks must be improved.
48

Avaliação da qualidade de ajuste e predição de modelos não lineares: uma aplicação em dados de crescimento de frutos de cacaueiro / Evaluation of the quality of fit and prediction of nonlinear models: an application in growth data of cacao fruits

Eloy, Raquel Aline Oliveira 09 February 2018 (has links)
Atualmente o Brasil é o quinto maior produtor de cacau no mundo e a sua produção está diretamente ligada ao ponto certo da colheita, colher frutos verdes ou verdoengos faz com que suas sementes tenham menor peso, em 1000 frutos maduros as amêndoas secas pesam em média 40 kg, colher frutos verdoengos, ou seja, frutos que estão parcialmente maduros, faz com que esse peso caia para 36 kg em média uma perda verificada de 10%, já quando os frutos estão verdes o peso passa a ser em média de 32 kg, possuindo uma perda de 20%, por isso é importante conhecer as fases de crescimento, que permite estabelecer formas adequadas de manejo, adubação e irrigação. Dentre as características biométricas do fruto do cacaueiro as que tem maior relevância econômica são o comprimento, o diâmetro e o volume. Uma forma de explicar relações de crescimento e produtividade de plantas, árvores, frutos ou animais é por meio da utilização de modelos de crescimento, pois possuem parâmetros com interpretação biológica. Os mais utilizados nestas áreas são os modelos: Logístico, Gompertz, Von Bertalanffy, Richards e Brody, sendo os dois últimos mais utilizados para descrever o crescimento animal. O objetivo do trabalho é avaliar a qualidade de ajuste e de predição dos modelos não lineares, Logístico, Gompertz e Von Bertalanffy, para medidas de comprimento e diâmetro do fruto do cacau, com a finalidade de predizer o seu volume. Para predizer o volume do fruto foi utilizado a fórmula de volume do esferoide prolato. Os critérios AIC e BIC foram utilizados para verificar qual dos modelos se ajusta melhor à essas medidas, já para verificar qual modelo se ajusta melhor na predição do volume do fruto, foram relacionadas as estatísticas: viés médio, índice de concordância, eficiência da modelagem e o desdobramento do quadrado médio do erro de predição. / Currently Brazil is the fifth largest producer of cocoa in the world and its production is directly linked to the right point of harvest, harvesting green or green fruits makes their seeds have less weight, in 1000 mature fruits dry almonds weight on average 40 kg, harvested green fruits, that is, fruits that are partially ripe, causes this weight to fall to 36 kg on average a verified loss of 10%, when the fruits are green the weight becomes an average of 32 kg, with a loss of 20%, so it is important to know the growth phases, which allows to establish appropriate forms of management, fertilization and irrigation. Among the biometric characteristics of the cacao fruit, the most economically important are length, diameter and volume. One way to explain growth and productivity relationships of plants, trees, fruits or animals is through the use of growth models, since they have parameters that with biological interpretation are the most used in these areas: Logistics, Gompertz, Von Bertalanffy, Richards and Brody, the last two being most used to describe animal growth. The objective of this work is to evaluate the quality of fit and prediction of the non linear models, Logistic, Gompertz and Von Bertalanffy, for measures of length and diameter of the fruit of the cocoa, in order to predict its volume. To predict the volume of the fruit, the volume formula of the prolate spheroid was used. The AIC and BIC criteria were used to verify which model best fits these measures, and to verify which model best fits the fruit volume prediction, the statistics were related: mean bias, concordance index, modeling efficiency, and the unfolding of the mean square of the prediction error.
49

Ajustes para o teste da razão de verossimilhanças em modelos de regressão beta / Adjusted likelihood ratio statistics in beta regression models

Eliane Cantinho Pinheiro 23 March 2009 (has links)
O presente trabalho considera o problema de fazer inferência com acurácia para pequenas amostras, tomando por base a estatística da razão de verossimilhanças em modelos de regressão beta. Estes, por sua vez, são úteis para modelar proporções contínuas que são afetadas por variáveis independentes. Deduzem-se as estatísticas da razão de verossimilhanças ajustadas de Skovgaard (Scandinavian Journal of Statistics 28 (2001) 3-32) nesta classe de modelos. Os termos do ajuste, que têm uma forma simples e compacta, podem ser implementados em um software estatístico. São feitas simulações de Monte Carlo para mostrar que a inferência baseada nas estatísticas ajustadas propostas é mais confiável do que a inferência usual baseada na estatística da razão de verossimilhanças. Aplicam-se os resultados a um conjunto real de dados. / We consider the issue of performing accurate small-sample likelihood-based inference in beta regression models, which are useful for modeling continuous proportions that are affected by independent variables. We derive Skovgaards (Scandinavian Journal of Statistics 28 (2001) 3-32) adjusted likelihood ratio statistics in this class of models. We show that the adjustment terms have simple compact form that can be easily implemented from standard statistical software. We presentMonte Carlo simulations showing that inference based on the adjusted statistics we propose is more reliable than that based on the usual likelihood ratio statistic. A real data example is presented.
50

Contribuições em inferência e modelagem de valores extremos / Contributions to extreme value inference and modeling.

Eliane Cantinho Pinheiro 04 December 2013 (has links)
A teoria do valor extremo é aplicada em áreas de pesquisa tais como hidrologia, estudos de poluição, engenharia de materiais, controle de tráfego e economia. A distribuição valor extremo ou Gumbel é amplamente utilizada na modelagem de valores extremos de fenômenos da natureza e no contexto de análise de sobrevivência para modelar o logaritmo do tempo de vida. A modelagem de valores extremos de fenômenos da natureza tais como velocidade de vento, nível da água de rio ou mar, altura de onda ou umidade é importante em estatística ambiental pois o conhecimento de valores extremos de tais eventos é crucial na prevenção de catátrofes. Ultimamente esta teoria é de particular interesse pois fenômenos extremos da natureza têm sido mais comuns e intensos. A maioria dos artigos sobre teoria do valor extremo para modelagem de dados considera amostras de tamanho moderado ou grande. A distribuição Gumbel é frequentemente incluída nas análises mas a qualidade do ajuste pode ser pobre em função de presença de ouliers. Investigamos modelagem estatística de eventos extremos com base na teoria de valores extremos. Consideramos um modelo de regressão valor extremo introduzido por Barreto-Souza & Vasconcellos (2011). Os autores trataram da questão de corrigir o viés do estimador de máxima verossimilhança para pequenas amostras. Nosso primeiro objetivo é deduzir ajustes para testes de hipótese nesta classe de modelos. Derivamos a estatística da razão de verossimilhanças ajustada de Skovgaard (2001) e cinco ajustes da estatística da razão de verossimilhanças sinalizada, que foram propostos por Barndorff-Nielsen (1986, 1991), DiCiccio & Martin (1993), Skovgaard (1996), Severini (1999) e Fraser et al. (1999). As estatísticas ajustadas são aproximadamente distribuídas como uma distribuição $\\chi^2$ e normal padrão com alto grau de acurácia. Os termos dos ajustes têm formas compactas simples que podem ser facilmente implementadas em softwares disponíveis. Comparamos a performance do teste da razão de verossimilhanças, do teste da razão de verossimilanças sinalizada e dos testes ajustados obtidos neste trabalho em amostras pequenas. Ilustramos uma aplicação dos testes usuais e suas versões modificadas em conjuntos de dados reais. As distribuições das estatísticas ajustadas são mais próximas das respectivas distribuições limites comparadas com as distribuições das estatísticas usuais quando o tamanho da amostra é relativamente pequeno. Os resultados de simulação indicaram que as estatísticas ajustadas são recomendadas para inferência em modelo de regressão valor extremo quando o tamanho da amostra é moderado ou pequeno. Parcimônia é importante quando os dados são escassos, mas flexibilidade também é crucial pois um ajuste pobre pode levar a uma conclusão completamente errada. Uma revisão da literatura foi feita para listar as distribuições que são generalizações da distribuição Gumbel. Nosso segundo objetivo é avaliar a parcimônia e flexibilidade destas distribuições. Com este propósito, comparamos tais distribuições através de momentos, coeficientes de assimetria e de curtose e índice da cauda. As famílias mais amplas obtidas pela inclusão de parâmetros adicionais, que têm a distribuição Gumbel como caso particular, apresentam assimetria e curtose flexíveis enquanto a distribuição Gumbel apresenta tais características constantes. Dentre estas distribuições, a distribuição valor extremo generalizada é a única com índice da cauda que pode ser qualquer número real positivo enquanto os índices da cauda das outras distribuições são zero. Observamos que algumas generalizações da distribuição Gumbel estudadas na literatura são não identificáveis. Portanto, para estes modelos a interpretação e estimação de parâmetros individuais não é factível. Selecionamos as distribuições identificáveis e as ajustamos a um conjunto de dados simulado e a um conjunto de dados reais de velocidade de vento. Como esperado, tais distribuições se ajustaram bastante bem ao conjunto de dados simulados de uma distribuição Gumbel. A distribuição valor extremo generalizada e a mistura de duas distribuições Gumbel produziram melhores ajustes aos dados do que as outras distribuições na presença não desprezível de observações discrepantes que não podem ser acomodadas pela distribuição Gumbel e, portanto, sugerimos que tais distribuições devem ser utilizadas neste contexto. / The extreme value theory is applied in research fields such as hydrology, pollution studies, materials engineering, traffic management, economics and finance. The Gumbel distribution is widely used in statistical modeling of extreme values of a natural process such as rainfall and wind. Also, the Gumbel distribution is important in the context of survival analysis for modeling lifetime in logarithmic scale. The statistical modeling of extreme values of a natural process such as wind or humidity is important in environmental statistics; for example, understanding extreme wind speed is crucial in catastrophe/disaster protection. Lately this is of particular interest as extreme natural phenomena/episodes are more common and intense. The majority of papers on extreme value theory for modeling extreme data is supported by moderate or large sample sizes. The Gumbel distribution is often considered but the resulting fit may be poor in the presence of ouliers since its skewness and kurtosis are constant. We deal with statistical modeling of extreme events data based on extreme value theory. We consider a general extreme-value regression model family introduced by Barreto-Souza & Vasconcellos (2011). The authors addressed the issue of correcting the bias of the maximum likelihood estimators in small samples. Here, our first goal is to derive hypothesis test adjustments in this class of models. We derive Skovgaard\'s adjusted likelihood ratio statistics Skovgaard (2001) and five adjusted signed likelihood ratio statistics, which have been proposed by Barndorff-Nielsen (1986, 1991), DiCiccio & Martin (1993), Skovgaard (1996), Severini (1999) and Fraser et al. (1999). The adjusted statistics are approximately distributed as $\\chi^2$ and standard normal with high accuracy. The adjustment terms have simple compact forms which may be easily implemented by readily available software. We compare the finite sample performance of the likelihood ratio test, the signed likelihood ratio test and the adjusted tests obtained in this work. We illustrate the application of the usual tests and their modified versions in real datasets. The adjusted statistics are closer to the respective limiting distribution compared to the usual ones when the sample size is relatively small. Simulation results indicate that the adjusted statistics can be recommended for inference in extreme value regression model with small or moderate sample size. Parsimony is important when data are scarce, but flexibility is also crucial since a poor fit may lead to a completely wrong conclusion. A literature review was conducted to list distributions which nest the Gumbel distribution. Our second goal is to evaluate their parsimony and flexibility. For this purpose, we compare such distributions regarding moments, skewness, kurtosis and tail index. The larger families obtained by introducing additional parameters, which have Gumbel embedded in, present flexible skewness and kurtosis while the Gumbel distribution skewness and kurtosis are constant. Among these distributions the generalized extreme value is the only one with tail index that can be any positive real number while the tail indeces of the other distributions investigated here are zero. We notice that some generalizations of the Gumbel distribution studied in the literature are not indetifiable. Hence, for these models meaningful interpretation and estimation of individual parameters are not feasible. We select the identifiable distributions and fit them to a simulated dataset and to real wind speed data. As expected, such distributions fit the Gumbel simulated data quite well. The generalized extreme value distribution and the two-component extreme value distribution fit the data better than the others in the non-negligible presence of outliers that cannot be accommodated by the Gumbel distribution, and therefore we suggest them to be applied in this context.

Page generated in 0.1271 seconds