This is a statistical analysis where various factors related to the Sustainable Development Goals (SDGs) have been used to explain life expectancy. The dataset contained information on how countries perform in different aspects over several years. The factors used have been considered to be well-linked to one or more of the SDGs by studying how the United Nations (UN) and Globalis have categorized them under different goals. After the dataset was investigated and measures were implemented, a multiple regression analysis was performed. The analysis showed which factors had statistically significant effects on life expectancy for the observations that were used. From this information, the final linear regression model could be obtained. Then it was discussed whether important information was omitted from the final model and another regression analysis was performed. This time, the dataset was divided into smaller subgroups where one group contained all observations where life expectancy was 75 years or more and the other data set contained all observations where life expectancy was 56 years or less. From these datasets, it was analyzed whether significant factors change depending on the associated life expectancy, which was proved to be the case. The conclusion that was drawn was therefore that the final model is a weighting of observations with different life expectancy, but the differences between observations with different life expectancies are omitted. / Det här är en statistisk analys där olika faktorer med koppling till de Globala Hållbarhetsmålen har används för att förklara den förväntade livslängden. Datasetet som användes innehöll information om hur länder presterar i olika avseenden under flera olika år. De faktorer som används har ansetts ha god koppling till något av de globala hållbarhetsmålen genom att studera hur FN samt Globalis har kategoriserat olika index under de respektive målen. Efter att datasetet undersökts och eventuella åtgärder genomförts så gjordes en multipel linjär regressionsanalys. Analysen visade vilka faktorer som hade signifikant påverkan på förväntad livslängd hos de observationer som använts. Ur denna information kunde den slutgiltiga linjära regressionsmodellen tas fram. Sedan skedde ett resonemang kring validiteten av denna modell och huruvida viktigt information utelämnas i den slutgiltiga modellen. Då genomfördes ytterligare en regressionsanalys, men denna gång hade datasetet delats upp i mindre grupper. En grupp innehöll alla observationer då den förväntade livslängden var 75 år eller mer, och den andra gruppen innehöll alla observationer då förväntad livslängd var 56 år eller mindre. Med hjälp av dessa dataset utreddes huruvida olika faktorer är olika viktiga vid olika förväntade livslängder, vilket var fallet. Slutsatsen som drogs var därför att den slutgiltiga modellen som togs fram var en sammanvägning av alla observationer med olika förväntade livslängder, men där skillnaderna mellan länder utelämnades.
Identifer | oai:union.ndltd.org:UPSALLA1/oai:DiVA.org:kth-311146 |
Date | January 2021 |
Creators | Loft, My |
Publisher | KTH, Matematisk statistik |
Source Sets | DiVA Archive at Upsalla University |
Language | English |
Detected Language | Swedish |
Type | Student thesis, info:eu-repo/semantics/bachelorThesis, text |
Format | application/pdf |
Rights | info:eu-repo/semantics/openAccess |
Relation | TRITA-SCI-GRU ; 2021:308 |
Page generated in 0.0018 seconds