Spelling suggestions: "subject:"type d'error"" "subject:"type d’error""
21 |
An Exercise to Introduce PowerSeier, Edith, Liu, Yali 01 March 2013 (has links)
In introductory statistics courses, the concept of power is usually presented in the context of testing hypotheses about the population mean. We instead propose an exercise that uses a binomial probability table to introduce the idea of power in the context of testing a population proportion.
|
22 |
Controlling Type I Errors in Moderated Multiple Regression: An Application of Item Response Theory for Applied Psychological ResearchMorse, Brendan J. 21 September 2009 (has links)
No description available.
|
23 |
A Monte Carlo Study of Several Alpha-Adjustment Procedures Used in Testing Multiple Hypotheses in Factorial AnovaAn, Qian 20 July 2010 (has links)
No description available.
|
24 |
Item Discrimination and Type I Error Rates in DIF Detection Using the Mantel-Haenszel and Logistic Regression ProceduresLi, Yanju 11 September 2012 (has links)
No description available.
|
25 |
Um estudo de simulação para comparação entre métodos de cálculo do número aproximado de graus de liberdade da estatística F em dados desbalanceados / A simulation study to compare the approximate number calculation methods of degrees of freedom of the F statistic in unbalanced dataHilário, Andréia Pereira Maria 21 January 2015 (has links)
O desbalanceamento de dados em experimentos está muitas vezes presente em diversas pesquisas nas mais variadas áreas do conhecimento. Embora existam muitas maneiras de análise de tais dados, além de diversos recursos computacionais já implementados em diversos softwares estatísticos, ainda perdura dúvidas entre os pesquisadores a respeito da opção de análise mais eficiente. A literatura fornece ao pesquisador direção na escolha da metodologia de análise a obter maior eficácia nos resultados de sua pesquisa, mas o número elevado de opções pode tornar a escolha difícil. Em se tratando de testes estatísticos, algumas das opções para se trabalhar com dados desbalanceados são os testes t e Wald-F, mas ainda resta ao pesquisador decidir entre as várias opções disponíveis nos pacotes, pois nem sempre as opções padrões são as mais indicadas. No presente trabalho foram realizadas simulações com diferentes cenários experimentais, utilizando-se o delineamento casualizado em blocos com um fator de tratamento em uma situação e o esquema de tratamentos em parcelas subdividas em outra, sendo comparados quatro métodos de cálculo do número aproximado de graus de liberdade (Containment, Residual, Satterthwaite e Kenward-Roger). Verificou-se que o método de Kenward-Roger controla de maneira mais eficiente a taxa de erro tipo I e não é inferior aos outros métodos com respeito ao poder do teste Wald-F. / The data imbalance in experiments is often present in several researches in various fields of knowledge. While there are many ways to analyze these data in addition to various computer resources already implemented in many statistical software, doubt still lingers among researchers about the most efficient analysis option. The literature provides the researcher direction in choosing the analysis methodology to get better in your search results, but the large number of options can make the difficult choice. When it comes to statistical tests, some of the options for working with unbalanced data are the tests t and Wald-F, but there is still the researcher to decide between the various options available in the packages because the defaults are not always the most suitable. This experiment was carried out simulations with different experimental scenarios, using the randomized block design with one factor in a situation treatment and treatment regimen subdivided parcels in another, and compared four methods of calculating the approximate number of degrees of freedom (Containment, Residual, Satterthwaite and Kenward-Roger). It has been found that the method of Kenward-Roger controls more efficiently the type I error rate and is not inferior to other methods with respect to the power of the test Wald-F.
|
26 |
Implicações evolutivas da integração morfológica do crânio em Caniformia (Carnivora; Mammalia) / Evolutionary consequences of morphological integration in the skull of Caniformia (Carnivora; Mammalia)Fábio de Andrade Machado 21 February 2017 (has links)
O fenótipo de caracteres complexos é o produto final da inter-relação entre genes, vias ontogenéticas e efeitos ambientais. A variação desses fatores não apenas influencia o fenótipo final, mas também como caracteres covariam e evoluem de forma integrada. A seleção natural pode influenciar a integração entre caracteres, levando a mudança de padrões de correlação ao longo do tempo. Assim, uma visão integrativa e dinâmica de fenótipos complexos é essencial para a compreensão da história evolutiva destas estruturas. Na tese atual investiguei a integração morfológica de caracteres cranianos em Caniformes sob duas perspectivas. Em uma primeira abordagem investiguei o padrão de integração morfológica das espécies a partir da comparação das variâncias e covariâncias dos caracteres. Os resultados evidenciam dois principais pontos. O primeiro é que houve uma considerável estabilidade na covariância entre caracteres ao longo de toda a história evolutiva de Carnivora, sugerindo a manutenção dos padrões de desenvolvimento no grupo como um todo. O segundo ponto é que, apesar desta estabilidade, espécies da família Canidae apresentam modificações em sua integração morfológica que os tornam mais similares entre si e mais dissimilares com os demais Carnivora. Essas diferenças estão relacionadas principalmente com caracteres da região facial, que apresentaram maior flexibilidade evolutiva, maiores correlações entre caracteres, e contêm uma maior proporção da variância em Canidae que nos demais Carnivora. Em uma segunda abordagem investiguei as propriedades estatísticas de dois testes baseados na teoria de genética quantitativa: o teste de regressão de autovalores e o teste de correlação de componentes principais (PCs). Estes testes avaliam a proporcionalidade entre padrões de covariância genética e entre-espécies como forma de testar a hipótese nula de deriva genética. Os resultados mostram que o uso de contrastes filogenéticos independentes (PIC) reduz erros do tipo I inflados, principalmente no caso do teste de correlação. Quando PIC são utilizados, o teste de correlação apresenta taxas de erro tipo I nominais para todos os números de espécies. Entretanto, a flutuação do número efetivo populacional (Ne) infla o erro tipo I deste testes. O teste de regressão, apesar de apresentar erro do tipo I inadequado para número de espécies baixo, é robusto a flutuações de Ne. A redução do número de PCs reduz o erro do tipo I a valores nominais à custa de uma redução no poder do teste. O poder de ambos os testes é similar nos diversos cenários avaliados, com uma leve tendência de maior poder para o teste de correlação em números amostrais mais baixos. Adicionalmente, as famílias de Caniformes foram utilizadas como estudo de caso para ambos testes. Os testes foram realizados com métodos paramétricos e não-paramétricos (simulações) e com e sem PIC. Houve rejeição de deriva para quase todas as famílias, com exceção de Mephitidae e Ursidae. Os testes de regressão baseados em simulações se mostraram consistentes com e sem o uso de PIC, apresentando intervalos de confiança menores que os testes paramétricos. Os resultados da presente tese abrem diversas possibilidades de investigação futura, tanto do ponto de vista empírico (em relação a modificações de Canidae e dos processos evolutivos deste grupo e de Ursidae e Mephitidae), assim como metodológicos (aprofundamento das investigações sobre as propriedades dos métodos para investigações macroevolutivas baseados em genética quantitativa) / The phenotype of complex characters is the end-product of the interrelations between genes, ontogenetic pathways and environmental effects. The variation in these factors influences not only the final phenotype, but also how characters covary and evolve in an integrated way. Natural selection can influence the interaction among characters, leading to changes in the patterns of integration. Therefore, a integrative and dynamic view of complex phenotypes is essential to the understanding of the evolutionary history of such structures. In the present thesis I investigated the morphological integration of cranial characters in Caniform species in two perspectives. In the first approach I investigated the pattern of morphological integration of the species through the comparison of character variances and covariances. The results of this investigation highlighted two points. The first is that there is considerable stability in the covariance among characters along the evolutionary history of Carnivora, suggesting the maintenance of ontogenetic pathways in the group. The second is that, despite this stability, Canidae species show changes in their morphological integration that make them more similar among each other and more different from the rest of Carnivora. These changes are related mainly to characters from the facial region, which showed a greater evolutionary flexibility, greater correlation among characters, and concentrate a greater proportion of the variance in Canidae than in the rest of Carnivora. In a second approach I evaluated the statistical properties of tests based on quantitative genetics theory: the test of regression of eigenvalues and the test of correlation of principal components (PCs). These tests investigate the proportionality between patterns of genetic and between-species covariance as a way to test the null hypothesis of genetic drift. The results show that the use of phylogenetic independent contrasts (PIC) reduces the inflated type I error, especially in the case of the correlation test. When PIC are employed, the correlation test shows nominal type I error rates for all species sample sizes. However, the oscillation of the effective population size (Ne) inflates type I error rates of these tests. The regression test, despite showing inadequate type I error rates at small species sample sizes, is robust to the oscillation of Ne. The reduction of the number of PCs reduces type I error rates to nominal values at the expense of statistical power. The power of both tests is similar under different scenarios evaluated, with a slight tendency of the correlation test to perform better at small number of species. Additionally, the Caniform families were used as case studies for both tests. Tests were performed using parametric and non-parametric (simulations) techniques, with and without PIC. The drift hypothesis was rejected for almost all families, with the exception of Mephitidae and Ursidae. The regression tests based on simulations were consistent with and without the use of PIC, showing narrower confidence intervals than the ones for parametric tests. The results of the present thesis open a wide range of future investigation opportunities, both from the empirical (relative to the differences in Canidae patterns of morphological integration or the evolutionary processes underlying Ursidae and Mephitidae diversification) and methodological (further investigations of the properties of the quantitative genetics-based tests for macroevolution) points of view
|
27 |
The Two-Sample t-test and the Influence of Outliers : - A simulation study on how the type I error rate is impacted by outliers of different magnitude.Widerberg, Carl January 2019 (has links)
This study investigates how outliers of different magnitude impact the robustness of the twosample t-test. A simulation study approach is used to analyze the behavior of type I error rates when outliers are added to generated data. Outliers may distort parameter estimates such as the mean and variance and cause misleading test results. Previous research has shown that Welch’s ttest performs better than the traditional Student’s t-test when group variances are unequal. Therefore these two alternative statistics are compared in terms of type I error rates when outliers are added to the samples. The results show that control of type I error rates can be maintained in the presence of a single outlier. Depending on the magnitude of the outlier and the sample size, there are scenarios where the t-test is robust. However, the sensitivity of the t-test is illustrated by deteriorating type I error rates when more than one outlier are included. The comparison between Welch’s t-test and Student’s t-test shows that the former is marginally more robust against outlier influence.
|
28 |
Implicações evolutivas da integração morfológica do crânio em Caniformia (Carnivora; Mammalia) / Evolutionary consequences of morphological integration in the skull of Caniformia (Carnivora; Mammalia)Machado, Fábio de Andrade 21 February 2017 (has links)
O fenótipo de caracteres complexos é o produto final da inter-relação entre genes, vias ontogenéticas e efeitos ambientais. A variação desses fatores não apenas influencia o fenótipo final, mas também como caracteres covariam e evoluem de forma integrada. A seleção natural pode influenciar a integração entre caracteres, levando a mudança de padrões de correlação ao longo do tempo. Assim, uma visão integrativa e dinâmica de fenótipos complexos é essencial para a compreensão da história evolutiva destas estruturas. Na tese atual investiguei a integração morfológica de caracteres cranianos em Caniformes sob duas perspectivas. Em uma primeira abordagem investiguei o padrão de integração morfológica das espécies a partir da comparação das variâncias e covariâncias dos caracteres. Os resultados evidenciam dois principais pontos. O primeiro é que houve uma considerável estabilidade na covariância entre caracteres ao longo de toda a história evolutiva de Carnivora, sugerindo a manutenção dos padrões de desenvolvimento no grupo como um todo. O segundo ponto é que, apesar desta estabilidade, espécies da família Canidae apresentam modificações em sua integração morfológica que os tornam mais similares entre si e mais dissimilares com os demais Carnivora. Essas diferenças estão relacionadas principalmente com caracteres da região facial, que apresentaram maior flexibilidade evolutiva, maiores correlações entre caracteres, e contêm uma maior proporção da variância em Canidae que nos demais Carnivora. Em uma segunda abordagem investiguei as propriedades estatísticas de dois testes baseados na teoria de genética quantitativa: o teste de regressão de autovalores e o teste de correlação de componentes principais (PCs). Estes testes avaliam a proporcionalidade entre padrões de covariância genética e entre-espécies como forma de testar a hipótese nula de deriva genética. Os resultados mostram que o uso de contrastes filogenéticos independentes (PIC) reduz erros do tipo I inflados, principalmente no caso do teste de correlação. Quando PIC são utilizados, o teste de correlação apresenta taxas de erro tipo I nominais para todos os números de espécies. Entretanto, a flutuação do número efetivo populacional (Ne) infla o erro tipo I deste testes. O teste de regressão, apesar de apresentar erro do tipo I inadequado para número de espécies baixo, é robusto a flutuações de Ne. A redução do número de PCs reduz o erro do tipo I a valores nominais à custa de uma redução no poder do teste. O poder de ambos os testes é similar nos diversos cenários avaliados, com uma leve tendência de maior poder para o teste de correlação em números amostrais mais baixos. Adicionalmente, as famílias de Caniformes foram utilizadas como estudo de caso para ambos testes. Os testes foram realizados com métodos paramétricos e não-paramétricos (simulações) e com e sem PIC. Houve rejeição de deriva para quase todas as famílias, com exceção de Mephitidae e Ursidae. Os testes de regressão baseados em simulações se mostraram consistentes com e sem o uso de PIC, apresentando intervalos de confiança menores que os testes paramétricos. Os resultados da presente tese abrem diversas possibilidades de investigação futura, tanto do ponto de vista empírico (em relação a modificações de Canidae e dos processos evolutivos deste grupo e de Ursidae e Mephitidae), assim como metodológicos (aprofundamento das investigações sobre as propriedades dos métodos para investigações macroevolutivas baseados em genética quantitativa) / The phenotype of complex characters is the end-product of the interrelations between genes, ontogenetic pathways and environmental effects. The variation in these factors influences not only the final phenotype, but also how characters covary and evolve in an integrated way. Natural selection can influence the interaction among characters, leading to changes in the patterns of integration. Therefore, a integrative and dynamic view of complex phenotypes is essential to the understanding of the evolutionary history of such structures. In the present thesis I investigated the morphological integration of cranial characters in Caniform species in two perspectives. In the first approach I investigated the pattern of morphological integration of the species through the comparison of character variances and covariances. The results of this investigation highlighted two points. The first is that there is considerable stability in the covariance among characters along the evolutionary history of Carnivora, suggesting the maintenance of ontogenetic pathways in the group. The second is that, despite this stability, Canidae species show changes in their morphological integration that make them more similar among each other and more different from the rest of Carnivora. These changes are related mainly to characters from the facial region, which showed a greater evolutionary flexibility, greater correlation among characters, and concentrate a greater proportion of the variance in Canidae than in the rest of Carnivora. In a second approach I evaluated the statistical properties of tests based on quantitative genetics theory: the test of regression of eigenvalues and the test of correlation of principal components (PCs). These tests investigate the proportionality between patterns of genetic and between-species covariance as a way to test the null hypothesis of genetic drift. The results show that the use of phylogenetic independent contrasts (PIC) reduces the inflated type I error, especially in the case of the correlation test. When PIC are employed, the correlation test shows nominal type I error rates for all species sample sizes. However, the oscillation of the effective population size (Ne) inflates type I error rates of these tests. The regression test, despite showing inadequate type I error rates at small species sample sizes, is robust to the oscillation of Ne. The reduction of the number of PCs reduces type I error rates to nominal values at the expense of statistical power. The power of both tests is similar under different scenarios evaluated, with a slight tendency of the correlation test to perform better at small number of species. Additionally, the Caniform families were used as case studies for both tests. Tests were performed using parametric and non-parametric (simulations) techniques, with and without PIC. The drift hypothesis was rejected for almost all families, with the exception of Mephitidae and Ursidae. The regression tests based on simulations were consistent with and without the use of PIC, showing narrower confidence intervals than the ones for parametric tests. The results of the present thesis open a wide range of future investigation opportunities, both from the empirical (relative to the differences in Canidae patterns of morphological integration or the evolutionary processes underlying Ursidae and Mephitidae diversification) and methodological (further investigations of the properties of the quantitative genetics-based tests for macroevolution) points of view
|
29 |
Pressuposto da normalidade multivariada para o teste de razão de verossimilhança entre dois grupos de caracteres de mamoneira / Assumption of multivariate normality for the likelihood ratio test between two groups of characters of castor beansBrum, Betânia 29 February 2012 (has links)
Conselho Nacional de Desenvolvimento Científico e Tecnológico / The likelihood ratio test for independence between two groups of variables allows us to
identify whether there is a dependency relationship between two groups of variables, ie, if the
covariance between the two groups are zero. This test assumes normality multivariate data,
which limits its application, in many studies of agronomic area, times when you need use, for
example, the canonical correlation analysis. The objective of this study is to evaluate the type
I error and power of the likelihood ratio test (LRT) for independence between two groups of
variables in different scenarios, consisting of combinations of: sample sizes 16, 40 number of
combinations of two variables groups, and nine degrees of correlation between variables in
matrices (for power); multivariate normal distribution under normal and contaminated, as well
as compare the different scenarios, two formulas for calculating the test statistic. Thus, were
evaluated the effect of 640 and 5760 scenarios on rates of type I error and power,
respectively, in each one of probability distributions and formulas. The assessment of
performance of LRT was performed through computational simulation by Monte Carlo
method, using 2000 simulations in each of the scenarios generated. In multivariate normal
situation: when the number of variables is large (p = 24), the LRT for independence between
two groups of variables, controls the type I error rates and has high power in sample sizes
greater than 100 and 500, with use of formulas for small and large samples, respectively; and,
for sample sizes small (n = 25, 30 and 50), the test presents good performance, provided that,
the number of variables does not exceed to 12; and, the formula chosen, whether for small
samples. Under contaminated multivariate normal distribution, the LRT for independence
between two groups of variables have high values of power, but is not robust, because it has
high rates of type I error in any scenario evaluated. / O teste de razão de verossimilhança para a independência entre dois grupos de variáveis
permite identificar se há ou não relação de dependência entre dois grupos de variáveis, ou
seja, se as covariâncias entre os dois grupos são nulas. Esse teste pressupõe normalidade
multivariada dos dados, o que limita sua aplicação, em muitos estudos da área agronômica,
em que se necessita utilizar, por exemplo, a análise de correlação canônica. O objetivo deste
trabalho é avaliar o erro tipo I e o poder do teste de razão de verossimilhança (TRV) para
independência entre dois grupos de variáveis em diversos cenários, constituídos pelas
combinações de: 16 tamanhos de amostra; 40 combinações de número de variáveis dos dois
grupos; e, nove graus de correlação entre as variáveis (para o poder); sob distribuição normal
multivariada e distribuição normal multivariada contaminada, bem como, comparar, nos
diferentes cenários, duas fórmulas para cálculo da estatística do teste. Dessa forma, foram
avaliados o efeito de 640 e 5760 cenários sobre as taxas de erro tipo I e poder,
respectivamente, em cada uma das distribuições de probabilidade e fórmulas. A avaliação do
desempenho do TRV foi realizada por meio de simulação computacional pelo método Monte
Carlo, utilizando-se 2000 simulações em cada um dos cenários gerados. Em situação de
normalidade multivariada: quando o número de variáveis é grande (p= 24), o TRV para a
independência entre dois grupos de variáveis, controla as taxas de erro tipo I e apresentou
poder elevado, em tamanhos de amostra superiores a 100 e 500, com uso das fórmulas para
pequenas e grandes amostras, respectivamente; e, para tamanhos amostrais pequenos (n= 25,
30 e 50), o teste apresenta bom desempenho, desde que, o número de variáveis não exceda a
12; e, a fórmula escolhida, seja para pequenas amostras. Sob distribuição normal multivariada
contaminada, o TRV para a independência entre dois grupos de variáveis possui elevados
valores de poder, mas não é robusto, pois apresenta elevadas taxas de erro tipo I, em qualquer
cenário avaliado.
|
30 |
Um estudo de simulação para comparação entre métodos de cálculo do número aproximado de graus de liberdade da estatística F em dados desbalanceados / A simulation study to compare the approximate number calculation methods of degrees of freedom of the F statistic in unbalanced dataAndréia Pereira Maria Hilário 21 January 2015 (has links)
O desbalanceamento de dados em experimentos está muitas vezes presente em diversas pesquisas nas mais variadas áreas do conhecimento. Embora existam muitas maneiras de análise de tais dados, além de diversos recursos computacionais já implementados em diversos softwares estatísticos, ainda perdura dúvidas entre os pesquisadores a respeito da opção de análise mais eficiente. A literatura fornece ao pesquisador direção na escolha da metodologia de análise a obter maior eficácia nos resultados de sua pesquisa, mas o número elevado de opções pode tornar a escolha difícil. Em se tratando de testes estatísticos, algumas das opções para se trabalhar com dados desbalanceados são os testes t e Wald-F, mas ainda resta ao pesquisador decidir entre as várias opções disponíveis nos pacotes, pois nem sempre as opções padrões são as mais indicadas. No presente trabalho foram realizadas simulações com diferentes cenários experimentais, utilizando-se o delineamento casualizado em blocos com um fator de tratamento em uma situação e o esquema de tratamentos em parcelas subdividas em outra, sendo comparados quatro métodos de cálculo do número aproximado de graus de liberdade (Containment, Residual, Satterthwaite e Kenward-Roger). Verificou-se que o método de Kenward-Roger controla de maneira mais eficiente a taxa de erro tipo I e não é inferior aos outros métodos com respeito ao poder do teste Wald-F. / The data imbalance in experiments is often present in several researches in various fields of knowledge. While there are many ways to analyze these data in addition to various computer resources already implemented in many statistical software, doubt still lingers among researchers about the most efficient analysis option. The literature provides the researcher direction in choosing the analysis methodology to get better in your search results, but the large number of options can make the difficult choice. When it comes to statistical tests, some of the options for working with unbalanced data are the tests t and Wald-F, but there is still the researcher to decide between the various options available in the packages because the defaults are not always the most suitable. This experiment was carried out simulations with different experimental scenarios, using the randomized block design with one factor in a situation treatment and treatment regimen subdivided parcels in another, and compared four methods of calculating the approximate number of degrees of freedom (Containment, Residual, Satterthwaite and Kenward-Roger). It has been found that the method of Kenward-Roger controls more efficiently the type I error rate and is not inferior to other methods with respect to the power of the test Wald-F.
|
Page generated in 0.0552 seconds