Spelling suggestions: "subject:"outliers detection inn then correlation"" "subject:"outliers detection inn them correlation""
1 |
Restrições da correlação nos testes de germinação de sementes e emergência de plântulas / Restrictions of the correlation in the tests of seed germination and seedling emergenceCursino, Celso 27 December 2006 (has links)
Coefficient of Pearson r is used to compare scientific tests. In seeds technology
it is used to compare results of procedures that measure vigour. When the correspondly
similar results are not found in very similar conditions, Person s correlation faces
criticism mainly due to two factors. The first one comes from statistics for whose usage
of Person s correlation there are prescriptions that are not always observed, when they
are not understood as assumption. Variables naturally associated are required with
bivariated normal distribution, pairing; homoscedasticity, rectilinear dispersion;
detection of outliers. Added to them, there are practical observations in what refers the
correlation to be valid only in a restrict range of the data series, the necessity to create
value ranges to consider this correlation as good or bad , the need of the graphical
analysis, the use and interpretation of the significance, among others. The second cause
of odd results would be the existence of several biological factors, which are sometimes
support for the reserarcher conclusions. With the objective of identifying applicability
of correlations and the causes for odd results of r, there have been compared data
existent in the Seeds Analysis Laboratory of ICIAG of the Universidade Federal de
Uberlândia-MG, as well as tests of germination of acelerated aging in optimal
conditions of repetibility done in laboratory, and tests of field seedling emergency, as
well as other simulated variables. The results showed odd results. The normal
scattergram between X and Y is enough clear to elucidate only correlated variables of
large samples. Although, if the covariance is not as obvious the dispersion Y=f(X) is not
enough to show simultaneous increasing or decreasing between variables. With an
alternative methodology of plotting the variables related to another auxiliar variable Z of
the same n elements of X and Y, we could study the variable behavior in an individual
way. It was possible to create graphic criteria to assess non-valid correlations, such as
similarity of variables comparable to homoscedastity; influence of outliers on small or
big n; grouping of outliers in a dissident range , influence of treatments effect. In the
analysed cases, we concluded that, comparing seeds vigour with only laboratory results,
as well as its relation with the field results and among simulated data, the results
inconsistency of correlations are prevalent as they do not follow the literature
prescriptions, among others. The magnitude of the distortions due to statistical causes
did not leave space for measuring effects of the variation of the biological seeds
conditions, temporal alterations related to management or the edafoclimatic ones.
Keywords: 1. Failure in correlations 2. Correlation reliability / Coeficiente de Pearson r é usado para comparar experimentos científicos. Em
tecnologias de sementes serve para comparar resultados de procedimentos que medem
vigor. Quando se prognosticam resultados de correlações baseados em condições
similares e eles não acontecem, a correlação de Pearson enfrenta críticas, atribuídas
principalmente a duas causas. Primeiramente pela estatística, para cuja utilização da
correlação de Pearson existem prescrições nem sempre observadas, talvez por não
serem entendidas como pressuposições. Exigem-se variáveis métricas naturalmente
associadas, com distribuição normal bivariada, pareamento, homoscedasticidade, nuvem
de dispersão retilínea; detectção de outliers. Somam-se observações práticas quanto à
validade restrita a um trecho da série de dados, da criação de faixas de valores para
considerá-la de baixa a alta , da necessidade da análise gráfica, da interpretação de
significância, entre outras. A segunda causa seria justamente a existência de variação
biológica devido a fatores diversos externos e interno às sementes, servindo às vezes de
sustentáculo para conclusões de interesse do pesquisador. No objetivo de identificar
aplicabilidade das correlações e as causas de resultados estranhos, foram comparados
dados existentes no Laboratório de Análises de Sementes do ICIAG da Universidade
Federal de Uberlândia-MG, testes germinação de envelhecimento acelerado em
condições ideais de repetibilidade em laboratório, e teste de emergência de plântulas em
campo, e outras variáveis simuladas, havendo incidência de resultados estranhos. A
representação gráfica normal da dispersão entre X e Y mostra satisfatoriamente o
correlacionamento de variáveis naturalmente associadas com n grande. Entretanto, se a
covariância não é tão óbvia, a disperção Y=f(X) não é suficiente para mostrar
crescimento ou decréscimo simultâneo entre as variáveis. Usando metodologia
alternativa de plotagem das variáveis em relação a uma variável auxiliar Z, de mesmos n
elementos que X e Y, pôde-se estudar individualmente o comportamento das variáveis.
O método gráfico permitiu taxar correlações em válidas ou não pela similaridade das
variáveis, comparável à homoscedasticidade; verificar outliers em n pequeno ou grande;
agrupamento de outliers em trecho dissidente e mostrar efeito de tratamentos. Nos
casos analisados, concluiu-se que, comparando vigor de sementes com resultados só de
laboratório, tão bem como no seu relacionamento com os de campo; e entre dados
simulados, as inconsistências de resultados de correlações são preponderantes por não
seguirem as prescrições da literatura, entre outras. A magnitude das distorções por
causas estatísticas não deixou espaço para mensurar efeitos da variação de condições
biológicas de sementes, alterações temporais relativas a manuseio ou edafoclimáticas. / Mestre em Agronomia
|
Page generated in 0.1705 seconds