Return to search

A Multi-Variate Regression Analysis on Telecommunication Sites in a Sub-Saharan Country / En regressionsanalys i flera variabler på telekommunikationsmaster i ett land i subsahariska Afrika

The purpose of this bachelor thesis is to investigate how different variables impact voice and data traffic for a telecom operator that operates in an undisclosed Sub-Saharan African country. The data has been provided by said company. The models, generated by using multivariate linear regression analysis, have a high explanatory power, as evidenced by high coefficients of determination. However, it is important to recognize the persistence of certain systematic issues, which are most likely due to the absence of key explanatory variables. Addressing these limitations in future research efforts will lead to a more comprehensive understanding of the subject and more robust findings to determine which factors drive voice and data traffic. In the report, the telecommunication sites are segmented based on generated income. Two segmentation models were created to categorize sites based on their data and voice revenue quartiles. A color matrix was used to depict the results. The hypothesis that nearby sites are more likely to perform similarly was tested using a quartile-based scoring method. The regression analysis uncovered significant variables and revealed information about the relationship between various factors and data and voice traffic. The regression residuals were analyzed using qualitative cluster analysis, which revealed distinct clustering patterns. Overall, the study provides useful insights into data and voice traffic segmentation and performance analysis in the analyzed region. / Syftet med detta kandidatarbete är att undersöka hur olika variabler påverkar röst- och datatrafik för en telekom-operatör som är verksam i ett Subsahariskt afrikanskt land. Studien använder sig av linjär regressionsanalys för att utveckla modeller som visar med en bra förklaringsgrad. Förklaringsgraden visas genom höga determinationskoefficienter. Men, trots ett bra resultat är det viktigt att ta hänsyn till systematiska problem hos modellerna. problemen beror troligtvis på att viktiga förklarande variabler saknas i datan. Framtida forskningsinsatse bör därför sträva efter att åtgärda dessa begränsningar, och på så sätt uppnå en mer omfattande förståelse av ämnet och mer korrekt resultat. I rapporten segmenteras telekommunikationsmasterna baserat på genererad inkomst. Två segmenteringsmodeller har utvecklats för att kategorisera masterna enligt deras kvartiler för data- och röstintäkter. Resultaten visas visuellt med hjälp av en färgmatris. Dessutom prövades hypotesen att närliggande master uppvisar liknande prestanda med hjälp av en kvartilsbaserad poängmetod. Regressionsanalysen identifierar signifikanta variabler och ger insikter i relationen mellan olika faktorer mellan data- och rösttrafik. Vidare upptäcks, via kvalitativ klusteranalys av regressionsresterna, tydliga klustringsmönster i resultatet. Sammantaget ger denna studie värdefulla insikter i data- och rösttrafiksegmentering samt prestandaanalys i den analyserade regionen.

Identiferoai:union.ndltd.org:UPSALLA1/oai:DiVA.org:kth-342954
Date January 2023
CreatorsBerisha, Elza, Holma, Hampus
PublisherKTH, Matematisk statistik
Source SetsDiVA Archive at Upsalla University
LanguageEnglish
Detected LanguageSwedish
TypeStudent thesis, info:eu-repo/semantics/bachelorThesis, text
Formatapplication/pdf
Rightsinfo:eu-repo/semantics/openAccess
RelationTRITA-SCI-GRU ; 2023:257

Page generated in 0.0023 seconds