É objeto deste trabalho é mostrar, aos pesquisadores de ciências aplicadas, diferenças existentes entre os modelos adotados por diversos sistemas estatísticos utilizados para realização de análise de variância, relacionando-os com as hipóteses referentes às somas de quadrados resultantes, para conjunto de dados desbalanceados com casei as vazias. Para tanto, são abordados, além do modelo superparametrizado de posto incompleto, os seguintes modelos lineares de posto completo: com Restrição Σ, de Médias de Caselas, com Restrição Zero, com Restrição Ponderada e de Regressão. Eles, são relacionados, respectivamente, com os sistemas estatísticos: SAS/PROC GLM, BMDP, GLlM, SPSS/ANOVA e MINITAB. Um conjunto de dados com duas caselas vazias, é utilizado para ilustrar que os diferentes sistemas proporcionam, muitas vezes, formas diversas de particionamento da soma de quadrados de parâmetros. Nesse contexto, as hipóteses testadas pelos modelos aqui discutidos são comparadas com aquelas usualmente testadas através do modelo superparametrizado (posto incompleto), universalmente adotado pela facilidade que proporciona ao usuário na descrição dos fatores de interesse em seus experimentos. Cada sistema possui sua forma peculiar de abordar conjunto de dados desbalanceados, marcadamente em presença de caselas vazias. E a sua posição pode ser, muitas vezes, fundamental para obtenção das somas de quadrados. Os modelos apresentam semelhanças e diferenças. Ressalta-se aqui, que mesmo em se tratando de modelos equivalentes, os diferentes métodos incorporados aos sistemas estatísticos podem levar a testar diferentes hipóteses. Proporcionando, em geral, no caso de caselas vazias diferentes somas de quadrados. / The objective of this work is to demonstrate, to researchers of the applied sciences, differences between underlying models of various statistical systems used for Analysis of Variance, and to relate the hypotheses tested by these models and the resulting sums of squares for a set of unbalanced data with missing cells. Other than the non-full-rank, overparametrized model, the following full-rank linear models are examined: L restriction, cells means, zero restriction, weighted restriction, and regression. These models are implicit in the following statistical systems, respectively: SAS/PROC GLM, BMOP, GLIM, SPSS/ANOVA e MINITAB. A set of data with two missing cells is used to demonstrate that the sums of squares of the parameters are frequently partitioned in different manners by these systems. In this context, the hypotheses tested by these models are compared with those usually tested by the overparametrized model (non-full-rank), which is universally adopted because of the ease in which the factors of interest are described by the user. Each system has its own way of handling a set of unbalanced data, markedly when missing cells are present. The position of the missing cell(s) in relation to the rest of the data, can often be fundamental to the obtainment of the sums of squares. The models have similarities and differences. It is emphasized that, although the models are equivalent, the different methods incorporated by the statistical systems may result in different hypotheses being tested. In the case of missing cells, the resulting sums of squares are usually different.
Identifer | oai:union.ndltd.org:usp.br/oai:teses.usp.br:tde-20190821-125850 |
Date | 09 April 1997 |
Creators | Nekatschalow, Marcos Custódio |
Contributors | Iemma, Antonio Francisco |
Publisher | Biblioteca Digitais de Teses e Dissertações da USP |
Source Sets | Universidade de São Paulo |
Language | Portuguese |
Detected Language | English |
Type | Dissertação de Mestrado |
Format | application/pdf |
Rights | Liberar o conteúdo para acesso público. |
Page generated in 0.0025 seconds