Introdução: Muitos estudos epidemiológicos utilizam amostragem complexa para coleta de dados. A amostragem complexa pode ter uma ou mais das seguintes características: estratos, conglomerados e probabilidades desiguais de seleção. Se estas características não forem incorporadas na análise de dados, as estimativas pontuais e erros-padrões são incorretos. Assim é necessário ampliar a compreensão do impacto de cada característica nos resultados para incentivar os pesquisadores a utilizarem metodologias adequadas para análise dos dados, obtendo conclusões válidas para a população de onde provém a amostra. Para tratar as estruturas complexas do plano amostral existem duas principais metodologias: abordagem da amostragem complexa e abordagem de modelos multinível. Objetivos: Descrever e comparar métodos para tratamento de dados provindos de planos amostrais complexos através de duas abordagens: amostragem complexa e modelos multinível, utilizando dados de dois estudos epidemiológicos. Métodos: Para avaliar o impacto do plano amostral complexo, assim como de cada característica do plano amostral nas estimativas de média, proporção, coeficientes da regressão de Poisson e seus correspondentes erros padrões utilizaram-se os dados da busca ativa domiciliar dos participantes na Campanha Nacional de Detecção de Diabetes Mellitus – CNDDM de 2001, obtidos por amostragem estratificada com conglomerado em três estágios. Para comparar a abordagem da amostragem complexa e a abordagem de modelos multinível ajustaram-se modelos de regressão linear com e sem pesos amostrais utilizando os dados de um estudo do desempenho das crianças na avaliação de conhecimento, percepções e crenças sobre aleitamento materno, realizado com escolares da quinta série do ensino fundamental, no município de Ijuí/RS, estudo aleatorizado, com amostra estratificada por conglomerados. Resultados: As estimativas pontuais de média e proporção são semelhantes comparando-se amostragem complexa e amostragem aleatória simples, porém observou-se grande diferença nos erros padrões. O mesmo foi observado nas estimativas dos coeficientes da regressão de Poisson com menor efeito do plano amostral. Na comparação da abordagem da amostragem complexa com modelos multinível observou-se diferença nos erros padrões dos coeficientes da regressão entre as duas abordagens, sendo que os mesmos são maiores na amostragem complexa. Também, na análise não ponderada, as significâncias dos coeficientes no modelo final foram semelhantes entre as duas abordagens, porém houve diferença na análise ponderada para um dos coeficientes. Conclusões: Os resultados encontrados a partir dos dois estudos evidenciaram a necessidade de incorporar a complexidade do plano amostral na análise dos dados. A questão de pesquisa poderá ser um fator importante na escolha entre a abordagem da amostragem complexa e a abordagem de modelos multinível. / Introduction: Many epidemiological studies use complex samples for data collection. Complex sampling may have one or more of the following characteristics: stratification, clustering and unequal selection probabilities. If these characteristics are not incorporated into data analysis, point estimates and standard errors are incorrect. Greater understanding of the effect of each characteristic on results should stimulate researchers to use adequate methods for data analysis and, therefore, to reach conclusions that are valid for the population that generated the sample. Two major methods are used to deal with complex sampling designs: the complex sample approach and the multilevel model approach. Objective: To describe and compare methods to deal with data in complex sampling designs using complex sample and multilevel model approaches in two epidemiological studies. Method: Data retrieved from a house-to-house survey of participants in the 2001 Brazilian Diabetes Detection Campaign (Campanha Nacional de Detecção de Diabetes Melitus - CNDDM) and collected by stratified clustering sampling in three stages were used to evaluate the impact of complex sampling designs, as well as of each of their characteristics, on the estimates of means, proportions, Poisson regression coefficients and their corresponding standard errors. To compare the complex sample and the multilevel model approaches, linear regression models were adjusted with and without sample weights using data from a random study that used stratified cluster sampling and investigated the performance of children in the evaluation of knowledge, perceptions and beliefs about maternal breastfeeding conducted with fifth grade students in Ijuí, Brazil. Results: Mean and proportion point estimates were similar when complex sampling and simple random sampling were compared, but there was a great difference in standard errors. The same was found for estimates of Poisson regression coefficients that were less affected by sampling design. The complex sample approach showed significantly greater standard errors of the regression coefficients than the multilevel model approach. Also, unweighted analysis showed that the significance of coefficients in the final models was similar in the two approaches, but there was a difference in one of the coefficients in weighted analysis. Conclusions: Results of the two studies showed that sampling design complexity should be incorporated into data analysis. Research questions seem to be a determinant factor in the choice of either a complex sample or a multilevel model approach.
Identifer | oai:union.ndltd.org:IBICT/oai:lume56.ufrgs.br:10183/14675 |
Date | January 2008 |
Creators | Battisti, Iara Denise Endruweit |
Contributors | Fachel, Jandyra Maria Guimarães, Riboldi, João |
Source Sets | IBICT Brazilian ETDs |
Language | Portuguese |
Detected Language | Portuguese |
Type | info:eu-repo/semantics/publishedVersion, info:eu-repo/semantics/doctoralThesis |
Format | application/pdf |
Source | reponame:Biblioteca Digital de Teses e Dissertações da UFRGS, instname:Universidade Federal do Rio Grande do Sul, instacron:UFRGS |
Rights | info:eu-repo/semantics/openAccess |
Page generated in 0.0027 seconds