Return to search

Endometriosis and Its Correlation with Lifestyle Factors and Health Indicators : A Data Mining Approach Using R and Python / Endometrios och dess samband med livsstilsfaktorer och hälsoindikatorer : En datautvinningsmetod med R och Python

Around 10% of women in fertile age have endometriosis, despite this there is little known about its origin. It can take years from the first experienced symptoms to an established diagnosis, which is done using invasive methods. A database from the Lucy application containing 11720 questionnaires with up to 41 questions each was examined for signs of associations between lifestyle factors and health indicators with endometriosis. The database was restructured and unusable questionnaires were pruned, leaving 5719 questionnaires for analysis. Questionnaires were assigned a label depending on whether the respondent had an endometriosis diagnosis, some other diagnosis or no diagnosis. Histograms were created for 36 questions to visualize answer distributions among the labels while wordclouds were created for 3 questions to determine commonly used words. Pearson’s chi-square test was performed on 24 questions to determine whether there were statistically significant differences in how respondents answered with regards to their diagnosis. Then, 26 questions were divided between seven question groups based on their similarities. The relative prevalence of endometriosis for every answer alternative was determined and compared withthe average for that group. This was then followed up by a multi-correspondence analysis for every question group. It was found that there are associations between endometriosis and 12 health indicators. These being: affected by infertility, always being tired, regarding own health as bad, having more than 100 birthmarks, severe chronic pelvic pain, dysmenorrhea, regularly whole-body pain, muscle stiffness, neck and shoulder tension, forgetfulness, concentration difficulties, regularly experiencing that stress worsens physical symptoms. No statistically significant association between lifestyle factors and endometriosis could be found in the survey database. There were findings of socioeconomic differences between respondents with endometriosis and those without a diagnosis which may have affected the result. / Runt 10% av kvinnor i fertil ålder har endometrios, trots detta är lite känt om dess ursprung. Det kan gå flera år från första upplevda symptom till en etablerad diagnos, som kräver invasiva metoder. En databas från Lucy applikationen med 11 720 enkäter upp till 41 frågor vardera undersöktes efter tecken på kopplingar mellan livsstilsfaktorer och hälsoindikatorer med endometrios. Som ett första steg omstrukturerades databasen och oanvändbara enkäter sållades bort, vilket lämnar 5719 enkäter för analys. Enkäterna blev tilldelad en etikett baserad på huruvida respondenten hade en endometriosdiagnos, någon annan diagnos eller ingen diagnos. Histogram skapades för 36 frågor för att visualisera svarsfördelningen mellan etiketter medan ordmoln skapades för 3 frågor för att bestämma vanligt förekommande ord. Pearsons chi-kvadrattest utfördes på 24 frågor för att bestämma huruvida det fanns signifikanta statistiska skillnader i hur respondenter svarade med avseende på deras diagnos. 26 frågor blev uppdelade i 7 olika grupper baserade på deras liknelser och den relativa utbredningen av endometrios bestämdes för varje grupp och jämfördes med snittet i varje grupp. Slutligen följdes detta upp med multikorrespondensanalys för varje grupp av frågor. Det hittades associationer mellan endometrios och 12 hälsofaktorer. Dessa var: infertilitet, alltid vara trött, betrakta sin egna hälsa som dålig, ha fler än 100 födelsemärken, uppleva allvarlig kronisk bäckensmärta, dysmenorré, regelbunden helkroppssmärta, muskelstelhet, spändhet i nacke och axlar, glömskhet, koncentrationssvårigheter, regelbundet uppleva att stress förvärrar fysiska symptom. Ingen statistisk signifikant association kunde hittas mellan livsstilsfaktorer och endometrios från undersökningsdatabasen. Det hittades socioekonomiska skillnader mellan respondenter med endometrios och de utan diagnos vilket kan ha påverkat resultatet. / FEMaLe

Identiferoai:union.ndltd.org:UPSALLA1/oai:DiVA.org:kth-344208
Date January 2023
CreatorsStylbäck, Jonas, Villför, Ella
PublisherKTH, Medicinteknik och hälsosystem
Source SetsDiVA Archive at Upsalla University
LanguageEnglish
Detected LanguageEnglish
TypeStudent thesis, info:eu-repo/semantics/bachelorThesis, text
Formatapplication/pdf
Rightsinfo:eu-repo/semantics/openAccess
RelationTRITA-CBH-GRU ; 2023:111

Page generated in 0.002 seconds