Return to search

Om imputationsmetoder i statistisk analys : En simuleringsstudie om bortfallshantering och påverkan i en regressionsanalys

Bortfall är ett vanligt problem vid genomförandet av statistiska analyser. Studien undersöker hur val av metod för bortfallshantering påverkar en regressionsanalys estimerad från ett dataset med slumpmässigt saknad data. Genom simulerad data och en Monte Carlo-simulation har resultaten jämförts utifrån olika storlekar på bortfall. De saknade värdena har hanterats med fem metoder; imputationer med medelvärde, stokastisk regression, random forest, predictive mean matching (PMM) samt estimation med complete case analysis (CCA). Bortfallshanteringen utvärderas genom modellernas goodness of fit och betakoefficientens bias. Studien visar att CCA och imputering med stokastisk regression, random forest och PMM kan estimera betakoefficienten utan bias men att det ökar med större andel bortfall, vidare påverkas risken för att begå ett typ I-fel.

Identiferoai:union.ndltd.org:UPSALLA1/oai:DiVA.org:uu-413634
Date January 2020
CreatorsEricsson, Axel, Zetterberg, Johannes
PublisherUppsala universitet, Statistiska institutionen, Uppsala universitet, Statistiska institutionen
Source SetsDiVA Archive at Upsalla University
LanguageSwedish
Detected LanguageSwedish
TypeStudent thesis, info:eu-repo/semantics/bachelorThesis, text
Formatapplication/pdf
Rightsinfo:eu-repo/semantics/openAccess

Page generated in 0.0021 seconds