Spelling suggestions: "subject:"seleção dde variáveis"" "subject:"seleção dee variáveis""
1 |
Seleção de covariáveis para ajuste de regressão logística na análise de abundância de invertebrados edáficos em diferentes agroecossistemas / Covariates selection for logistic regression adjustment in analysis of edaphic invertebrates abundance in different agroecosystemsOliveira, Luciane da Silva 25 February 2011 (has links)
Made available in DSpace on 2015-03-26T13:32:11Z (GMT). No. of bitstreams: 1
texto completo.pdf: 852842 bytes, checksum: 70e1222560798c97f05cf66d73772591 (MD5)
Previous issue date: 2011-02-25 / Logistic regression is the analysis usual statistical method used to verify the relationship between a dichotomous variable response and the interest explanatory variables. This work aimed to carry out a study about the factors influencing the invertebrates abundance on the soil under different management forms, using the logistic regression. This objective is that these invertebrates are considered excellent indicators of the use type and soil quality, working in several fundamental processes for maintaining the soil fertility and quality in agroecosystems and natural ecosystems, according to Brown et al. (1998), Hendrix et al. (2006), and Souza (2010). For covariates selection, the Collett (1994) proposal was used and the involved parameters estimators in each model, their interpretations, statistical properties, and some criteria for judging the suitability of the selected models were presented. The methodology presented by this work was applied to two real datasets (dry and rainy season). In the final adjusted model for the analyzed dataset in the dry season, it was verified that the covariates System Type, Calcium in litter, Soil organic matter, Potassium in litter, and the interaction between Calcium and Potassium in litter were important to explain the presence of more than nine individuals on the soil. In the final adjusted model for the analyzed dataset in the rainy season, the significant covariates to explain the presence of one hundred and one individuals on average on the soil were Magnesium in litter, Total organic carbon in the litter, Litter organic matter, and Ambient temperature. For two mentioned models, there were a good discriminatory performance and excellent areas under the ROC (Receiver Operating Characteristic) curve, thus confirming the validity of using logistic regression techniques for the models construction to describe the analyzed data. / A regressão logística é o método estatístico usual de análise utilizado com a finalidade de verificar a relação entre uma variável resposta dicotômica e variáveis explicativas de interesse. Este trabalho teve como objetivo realizar um estudo sobre os fatores que influenciam a abundância de invertebrados no solo sob diferentes formas de manejo utilizando a Regressão Logística. Tal objetivo reside no fato destes invertebrados serem considerados excelentes indicadores do tipo de uso e qualidade do solo, atuando em vários processos fundamentais para a manutenção da fertilidade e qualidade dos solos de agroecossistemas e ecossistemas naturais de acordo com Brown et al. (1998) e Hendrix et al. (2006), citado Souza (2010). Para seleção de covariáveis foi utilizada a proposta de Collett (1994) e foram apresentados estimadores dos parâmetros envolvidos em cada modelo e suas interpretações, propriedades estatísticas e critérios para se julgar a adequabilidade dos modelos selecionados. A metodologia apresentada neste trabalho foi aplicada a dois conjuntos de dados reais (período seco e chuvoso). No modelo final ajustado para o conjunto de dados analisado no período seco verificou-se que as covariáveis Tipo de Sistema, Cálcio em serapilheira, Matéria orgânica do solo, Potássio em serapilheira e a interação entre Cálcio e Potássio em serapilheira foram importantes para explicar a presença de mais de 9 indivíduos, em média, no solo. Já no modelo final ajustado para o conjunto de dados analisado no período chuvoso, as covariáveis significativas para explicar a presença de 101 indivíduos, em média, no solo foram Magnésio em serapilheira, Carbono orgânico total na serapilheira, Matéria orgânica da serapilheira e Temperatura ambiente. Para os dois modelos citados houve bom desempenho discriminatório e excelentes áreas sob a curva ROC, confirmando assim a validade da utilização de técnicas de regressão logística na construção dos modelos para descrever os dados analisados.
|
Page generated in 0.0908 seconds