Spelling suggestions: "subject:"nonnormal distributions"" "subject:"nonformal distributions""
1 |
The Robustness of O'Brien's r Transformation to Non-NormalityGordon, Carol J. (Carol Jean) 08 1900 (has links)
A Monte Carlo simulation technique was employed in this study to determine if the r transformation, a test of homogeneity of variance, affords adequate protection against Type I error over a range of equal sample sizes and number of groups when samples are obtained from normal and non-normal distributions. Additionally, this study sought to determine if the r transformation is more robust than Bartlett's chi-square to deviations from normality. Four populations were generated representing normal, uniform, symmetric leptokurtic, and skewed leptokurtic distributions. For each sample size (6, 12, 24, 48), number of groups (3, 4, 5, 7), and population distribution condition, the r transformation and Bartlett's chi-square were calculated. This procedure was replicated 1,000 times; the actual significance level was determined and compared to the nominal significance level of .05. On the basis of the analysis of the generated data, the following conclusions are drawn. First, the r transformation is generally robust to violations of normality when the size of the samples tested is twelve or larger. Second, in the instances where a significant difference occurred between the actual and nominal significance levels, the r transformation produced (a) conservative Type I error rates if the kurtosis of the parent population were 1.414 or less and (b) an inflated Type I error rate when the index of kurtosis was three. Third, the r transformation should not be used if sample size is smaller than twelve. Fourth, the r transformation is more robust in all instances to non-normality, but the Bartlett test is superior in controlling Type I error when samples are from a population with a normal distribution. In light of these conclusions, the r transformation may be used as a general utility test of homogeneity of variances when either the distribution of the parent population is unknown or is known to have a non-normal distribution, and the size of the equal samples is at least twelve.
|
2 |
Inferência e diagnósticos em modelos assimétricos / Inference and diagnostics in asymmetric modelsFerreira, Clécio da Silva 20 March 2008 (has links)
Este trabalho apresenta um estudo de inferência e diagnósticos em modelos assimétricos. A análise de influência é baseada na metodologia para modelos com dados incompletos, que é relacionada ao algoritmo EM (Zhu e Lee, 2001). Além dos modelos de regressão Normal Assimétrico (Azzalini, 1999) e t-Normal Assimétrico (Gómez, Venegas e Bolfarine, 2007) existentes, são desenvolvidas duas novas classes de modelos, denominados modelos de misturas de escala normal assimétricos (englobando as distribuições Normal, t-Normal, Slash, Normal-Contaminada e Exponencial-potência Assimétricas) e modelos lineares mistos robustos assimétricos, utilizando distribuições de misturas de escalas normais assimétricas para o efeito aleatório e distribuições de misturas de escalas para o erro aleatório. Para o modelo misto, a matriz de informação de Fisher observada é calculada utilizando a aproximação de Louis (1982) para dados incompletos. Para todos os modelos, algoritmos tipo EM são desenvolvidos de forma a fornecer uma solução numérica para os parâmetros dos modelos de regressão. Para cada modelo de regressão, medidas de bondade de ajuste são realizadas via inspeção visual do gráfico de envelope simulado. Para os modelos de misturas de escalas normais assimétricos, um estudo de robustez do algoritmo EM proposto é desenvolvido, determinando a eficácia dos estimadores apresentados. Aplicações dos modelos estudados são realizadas para os conjuntos de dados do Australian Institute of Sports (AIS), para o conjunto de dados sobre qualidade de vida de pacientes (mulheres) com câncer de mama, em um estudo realizado pelo Centro de Atenção Integral à Saúde da Mulher (CAISM) em conjunto com a Faculdade de Ciências Médicas, da Universidade Estadual de Campinas e para o conjunto de dados de colesterol de Framingham. / This work presents a study of inference and diagnostic in asymmetric models. The influence analysis is based in the methodology for models with incomplete data, that is related to the algorithm EM (Zhu and Lee, 2001). Beyond of the existing asymmetric normal (Azzalini, 1999) and t-Normal asymmetric (Gómez, Venegas and Bolfarine, 2007) regression models, are developed two new classes of models, namely asymmetric normal scale mixture models (embodying the asymmetric Normal, t-Normal, Slash, Contaminated-Normal and Power-Exponential distributions) and asymmetric robust linear mixed models, utilizing asymmetric normal scale mixture distributions for the random effect and normal scale mixture distributions for the random error. For the mixed model, the observed Fisher information matrix is calculated using the Louis\' (1982) approach for incomplete data. For all models, EM algorithms are developed, that provide a numeric solution for the parameters of the regression models. For each regression model, measures of goodness of fit are realized through visual inspection of the graphic of simulated envelope. For the asymmetric normal scale mixture models, a study of robustness of the proposed EM algorithm is developed to determine the efficacy of the presented estimators. Applications of the studied models are made for the data set of the Australian Institute of Sports (AIS), for the data set about quality of life of patients (women) with breast cancer, in a study made by Centro de Atenção Integral à Saúde da Mulher (CAISM) in conjoint with the Medical Sciences Faculty, of the Campinas State\'s University and for the data set of Framingham\'s cholesterol study.
|
3 |
Inferência e diagnósticos em modelos assimétricos / Inference and diagnostics in asymmetric modelsClécio da Silva Ferreira 20 March 2008 (has links)
Este trabalho apresenta um estudo de inferência e diagnósticos em modelos assimétricos. A análise de influência é baseada na metodologia para modelos com dados incompletos, que é relacionada ao algoritmo EM (Zhu e Lee, 2001). Além dos modelos de regressão Normal Assimétrico (Azzalini, 1999) e t-Normal Assimétrico (Gómez, Venegas e Bolfarine, 2007) existentes, são desenvolvidas duas novas classes de modelos, denominados modelos de misturas de escala normal assimétricos (englobando as distribuições Normal, t-Normal, Slash, Normal-Contaminada e Exponencial-potência Assimétricas) e modelos lineares mistos robustos assimétricos, utilizando distribuições de misturas de escalas normais assimétricas para o efeito aleatório e distribuições de misturas de escalas para o erro aleatório. Para o modelo misto, a matriz de informação de Fisher observada é calculada utilizando a aproximação de Louis (1982) para dados incompletos. Para todos os modelos, algoritmos tipo EM são desenvolvidos de forma a fornecer uma solução numérica para os parâmetros dos modelos de regressão. Para cada modelo de regressão, medidas de bondade de ajuste são realizadas via inspeção visual do gráfico de envelope simulado. Para os modelos de misturas de escalas normais assimétricos, um estudo de robustez do algoritmo EM proposto é desenvolvido, determinando a eficácia dos estimadores apresentados. Aplicações dos modelos estudados são realizadas para os conjuntos de dados do Australian Institute of Sports (AIS), para o conjunto de dados sobre qualidade de vida de pacientes (mulheres) com câncer de mama, em um estudo realizado pelo Centro de Atenção Integral à Saúde da Mulher (CAISM) em conjunto com a Faculdade de Ciências Médicas, da Universidade Estadual de Campinas e para o conjunto de dados de colesterol de Framingham. / This work presents a study of inference and diagnostic in asymmetric models. The influence analysis is based in the methodology for models with incomplete data, that is related to the algorithm EM (Zhu and Lee, 2001). Beyond of the existing asymmetric normal (Azzalini, 1999) and t-Normal asymmetric (Gómez, Venegas and Bolfarine, 2007) regression models, are developed two new classes of models, namely asymmetric normal scale mixture models (embodying the asymmetric Normal, t-Normal, Slash, Contaminated-Normal and Power-Exponential distributions) and asymmetric robust linear mixed models, utilizing asymmetric normal scale mixture distributions for the random effect and normal scale mixture distributions for the random error. For the mixed model, the observed Fisher information matrix is calculated using the Louis\' (1982) approach for incomplete data. For all models, EM algorithms are developed, that provide a numeric solution for the parameters of the regression models. For each regression model, measures of goodness of fit are realized through visual inspection of the graphic of simulated envelope. For the asymmetric normal scale mixture models, a study of robustness of the proposed EM algorithm is developed to determine the efficacy of the presented estimators. Applications of the studied models are made for the data set of the Australian Institute of Sports (AIS), for the data set about quality of life of patients (women) with breast cancer, in a study made by Centro de Atenção Integral à Saúde da Mulher (CAISM) in conjoint with the Medical Sciences Faculty, of the Campinas State\'s University and for the data set of Framingham\'s cholesterol study.
|
4 |
Mixture models for estimating operation time distributions.Chen, Yi-Ling 12 July 2005 (has links)
Surgeon operation time is a useful and important information for hospital management, which involves operation time estimation for patients under different diagnoses, operation room scheduling, operating room utilization improvements and so on. In this work, we will focus on studying the operation time distributions of thirteen operations performed in the gynecology (GYN) department of one major teaching hospital in southern Taiwan. We firstly investigate what types of distributions are suitable in describing these operation times empirically, where log-normal and mixture log-normal distribution are identified to be acceptable statistically in describing these operation times. Then we compare and characterize the operations into different categories based on the operation time distribution estimates. Later we try to illustrate the possible reason why distributions
for some operations with large data set turn out to be mixture of certain log-normal distributions. Finally we end with discussions on possible future work.
|
5 |
Making Heads and Tails of Distributional Patterns: A Value-Creation-Type and Sector-Based Analysis Among Private-Equity-Owned CompaniesTuretsky, Abraham I. 04 June 2018 (has links)
No description available.
|
6 |
Statistical identification of metabolic reactions catalyzed by gene products of unknown functionZheng, Lianqing January 1900 (has links)
Doctor of Philosophy / Department of Statistics / Gary L. Gadbury / High-throughput metabolite analysis is an approach used by biologists seeking to identify the functions of genes. A mutation in a gene encoding an enzyme is expected to alter the level of the metabolites which serve as the enzyme’s reactant(s) (also known as substrate) and product(s). To find the function of a mutated gene, metabolite data from a wild-type organism and a mutant are compared and candidate reactants and products are identified. The screening principle is that the concentration of reactants will be higher and the concentration of products will be lower in the mutant than in wild type. This is because the mutation reduces the reaction between the reactant and the product in the mutant organism.
Based upon this principle, we suggest a method to screen the possible lipid reactant and product pairs related to a mutation affecting an unknown reaction. Some numerical facts are given for the treatment means for the lipid pairs in each treatment group, and relations between the means are found for the paired lipids. A set of statistics from the relations between the means of the lipid pairs is derived. Reactant and product lipid pairs associated with specific mutations are used to assess the results.
We have explored four methods using the test statistics to obtain a list of potential reactant-product pairs affected by the mutation. The first method uses the parametric bootstrap to obtain an empirical null distribution of the test statistic and a technique to identify a family of distributions and corresponding parameter estimates for modeling the null distribution. The second method uses a mixture of normal distributions to model the empirical bootstrap null. The third method uses a normal mixture model with multiple components to model the entire distribution of test statistics from all pairs of lipids. The argument is made that, for some cases, one of the model components is that for lipid pairs affected by the mutation while the other components model the null distribution. The fourth method uses a two-way ANOVA model with an interaction term to find the relations between the mean concentrations and the role of a lipid as a reactant or product in a specific lipid pair. The goal of all methods is to identify a list of findings by false discovery techniques. Finally a simulation technique is proposed to evaluate properties of statistical methods for identifying candidate reactant-product pairs.
|
7 |
Aplicações estatísticas na área industrial / Statistical applications in the industrial areaSilva, Gecirlei Francisco da 10 June 2009 (has links)
Apresentamos algumas aplicações de ferramentas estatísticas que são comumente utilizadas na melhoria da qualidade de processos industriais. Inicialmente, desenvolveu-se procedimentos para testar a competência de laboratórios que participam de programas de ensaios de proficiência. Em situações onde os laboratórios medem várias vezes no mesmo ponto, utilizou-se o modelo de erros de medição, proposto por Jaech [39](1985). Além disso, a inferência sobre os parâmetros de tendência aditiva foi generalizada para a classe de distribuições elípticas. A competência dos laboratórios é avaliada pelo teste da razão de verossimilhança generalizada, do qual, obtemos a distribuição exata para a estatística proposta. Em situações onde os laboratórios medem várias vezes em vários pontos e a variável em análise apresenta variações naturais, utilizou-se o modelo com erro nas variáveis. Diante disso, vamos estender o modelo estrutural definido em Barnett [13] (1969) para o modelo ultra-estrutural com réplicas. Neste caso, vamos avaliar não somente a tendência aditiva, mas também, a tendência multiplicativa, ou seja, avaliar a linearidade das medições. As estimativas dos parâmetros foram obtidas via procedimento do algorítmo EM, com isso, desenvolvemos os teste de Wald, razão de verossimilhança e escore para avaliar a competência dos laboratórios. Nos dois modelos propostos, generalizamos o erro normalizado (En) sugerido pelo Guia 43 [37] para testar a competência dos laboratórios participantes de programas de ensaio de proficiência. Apresentamos também, um procedimento para calcular índices de performance para processos univariados e multivariados. Nestes casos, consideramos que a distribuição dos dados segue uma distribuição Normal assimétrica. Além disso, apresentamos uma análise de simulação onde concluímos que a presença de assimetria nos dados pode causar interpretações erradas sobre o processo, quando a distribuição assumida para os dados é a Normal / We present some applications of statistical tools that are used in the improvement of the quality of industrial processes. Initially, we develop procedures to test the ability of laboratories that participate of programs of proficiency test. In situations where the laboratories measure several times in the same point, we use the model of errors of measurement, considered for Jaech [39](1985). Moreover, the inference on the parameters additive bias was generalized for the class of elliptical distributions. The ability of the laboratories is evaluated by the generalized likelihood ratio test, of which, we get the accurate distribution for the statistics proposal. In situations where the laboratories measure some times in some points and the variable in analysis presents natural variations, uses the model with error in the variable. With this, we go to extend the model structural defined in Barnett [13] (1969) for the ultrastructural model with replicate. In this case, we go to not only evaluate the bias additive, but also, the bias multiplicative, that is, to evaluate the linearity of the measurements. The estimates of the parameters had been gotten by the procedure of the EM algorithm, with this, develop of Wald, likelihood ratio and score test to evaluate the ability of the laboratories. In the two considered models, we generalize the normalized error (En) suggested for Guide 43 [37] to test the ability of the participant laboratories of programs of proficiency test. We also present, a procedure to calculate index of performance for univariate and multivariate processes. In these cases, we consider that the distribution of the data follows a skew Normal distribution. Moreover, we present a simulation analysis where we conclude that the presence of asymmetry in the data can cause interpretations missed on the process, when the distribution assumed for the data is the Normal
|
8 |
Moments and Quadratic Forms of Matrix Variate Skew Normal DistributionsZheng, Shimin, Knisley, Jeff, Wang, Kesheng 01 February 2016 (has links)
In 2007, Domínguez-Molina et al. obtained the moment generating function (mgf) of the matrix variate closed skew normal distribution. In this paper, we use their mgf to obtain the first two moments and some additional properties of quadratic forms for the matrix variate skew normal distributions. The quadratic forms are particularly interesting because they are essentially correlation tests that introduce a new type of orthogonality condition.
|
9 |
Diagnóstico de influência em modelos com erros na variável skew-normal/independente / Influence of diagnostic in models with errors in variable skew-normal/independentCarvalho, Rignaldo Rodrigues 17 August 2018 (has links)
Orientadores: Victor Hugo Lachos Dávila, Filidor Edilfonso Vilca Labra / Dissertação (mestrado) - Universidade Estadual de Campinas, Instituto de Matemática, Estatística e Computação Científica / Made available in DSpace on 2018-08-17T09:37:18Z (GMT). No. of bitstreams: 1
Carvalho_RignaldoRodrigues_M.pdf: 1849605 bytes, checksum: 07ea5638a2dbfa2227f9a949d4723bbf (MD5)
Previous issue date: 2010 / Resumo: O modelo de medição de Barnett é frequentemente usado para comparar vários instrumentos de medição. é comum assumir que os termos aleatórios têm uma distribuição normal. Entretanto, tal suposição faz a inferência vulnerável a observações atípicas por outro lado distribuições de misturas de escala skew-normal tem sido uma interessante alternativa para produzir estimativas robustas tendo a elegância e simplicidade da teoria da máxima verossimilhança. Nós usamos resultados de Lachos et al. (2008) para obter a estimação dos parâmetros via máxima verossimilhança, baseada no algoritmo EM, o qual rende expressões de forma fechada para as equações no passo M. Em seguida desenvolvemos o método de influência local de Zhu e Lee (2001) para avaliar os aspectos de estimação dos parâmetros sob alguns esquemas de perturbação. Os resultados obtidos são aplicados a conjuntos de dados bastante estudados na literatura, ilustrando a utilidade da metodologia proposta / Abstract: The Barnett measurement model is frequently used to comparing several measuring devices. It is common to assume that the random terms have a normal distribution. However, such assumption makes the inference vulnerable to outlying observations whereas scale mixtures of skew-normal distributions have been an interesting alternative to produce robust estimates keeping the elegancy and simplicity of the maximum likelihood theory. We used results in Lachos et al. (2008) for obtaining parameter estimation via maximum likelihood, based on the EM-algorithm, which yields closed form expressions for the equations in the M-step. Then we developed the local influence method to assessing the robustness aspects of these parameter estimates under some usual perturbation schemes. Results obtained for one real data set are reported, illustrating the usefulness of the proposed methodology / Mestrado / Métodos Estatísticos / Mestre em Estatística
|
10 |
Aplicações estatísticas na área industrial / Statistical applications in the industrial areaGecirlei Francisco da Silva 10 June 2009 (has links)
Apresentamos algumas aplicações de ferramentas estatísticas que são comumente utilizadas na melhoria da qualidade de processos industriais. Inicialmente, desenvolveu-se procedimentos para testar a competência de laboratórios que participam de programas de ensaios de proficiência. Em situações onde os laboratórios medem várias vezes no mesmo ponto, utilizou-se o modelo de erros de medição, proposto por Jaech [39](1985). Além disso, a inferência sobre os parâmetros de tendência aditiva foi generalizada para a classe de distribuições elípticas. A competência dos laboratórios é avaliada pelo teste da razão de verossimilhança generalizada, do qual, obtemos a distribuição exata para a estatística proposta. Em situações onde os laboratórios medem várias vezes em vários pontos e a variável em análise apresenta variações naturais, utilizou-se o modelo com erro nas variáveis. Diante disso, vamos estender o modelo estrutural definido em Barnett [13] (1969) para o modelo ultra-estrutural com réplicas. Neste caso, vamos avaliar não somente a tendência aditiva, mas também, a tendência multiplicativa, ou seja, avaliar a linearidade das medições. As estimativas dos parâmetros foram obtidas via procedimento do algorítmo EM, com isso, desenvolvemos os teste de Wald, razão de verossimilhança e escore para avaliar a competência dos laboratórios. Nos dois modelos propostos, generalizamos o erro normalizado (En) sugerido pelo Guia 43 [37] para testar a competência dos laboratórios participantes de programas de ensaio de proficiência. Apresentamos também, um procedimento para calcular índices de performance para processos univariados e multivariados. Nestes casos, consideramos que a distribuição dos dados segue uma distribuição Normal assimétrica. Além disso, apresentamos uma análise de simulação onde concluímos que a presença de assimetria nos dados pode causar interpretações erradas sobre o processo, quando a distribuição assumida para os dados é a Normal / We present some applications of statistical tools that are used in the improvement of the quality of industrial processes. Initially, we develop procedures to test the ability of laboratories that participate of programs of proficiency test. In situations where the laboratories measure several times in the same point, we use the model of errors of measurement, considered for Jaech [39](1985). Moreover, the inference on the parameters additive bias was generalized for the class of elliptical distributions. The ability of the laboratories is evaluated by the generalized likelihood ratio test, of which, we get the accurate distribution for the statistics proposal. In situations where the laboratories measure some times in some points and the variable in analysis presents natural variations, uses the model with error in the variable. With this, we go to extend the model structural defined in Barnett [13] (1969) for the ultrastructural model with replicate. In this case, we go to not only evaluate the bias additive, but also, the bias multiplicative, that is, to evaluate the linearity of the measurements. The estimates of the parameters had been gotten by the procedure of the EM algorithm, with this, develop of Wald, likelihood ratio and score test to evaluate the ability of the laboratories. In the two considered models, we generalize the normalized error (En) suggested for Guide 43 [37] to test the ability of the participant laboratories of programs of proficiency test. We also present, a procedure to calculate index of performance for univariate and multivariate processes. In these cases, we consider that the distribution of the data follows a skew Normal distribution. Moreover, we present a simulation analysis where we conclude that the presence of asymmetry in the data can cause interpretations missed on the process, when the distribution assumed for the data is the Normal
|
Page generated in 0.123 seconds