Return to search

Exploring the Phenomenon of Data Science : An Exploratory Study of the Field and its Scientists / Utforskning av Fenomenet Data Science

The recent abundance of data combined with the current digitalisation all over the globe has made organisations across various industries become more involved with data-driven processes. The power of data is harnessed through wrangling and analysis in order to not only create valuable insights to guide strategic decision-making but to also improve efficiency and productivity. These data-driven processes often involve combining statistical analysis with sophisticated software such as machine learning, and while it shares similarities to business intelligence or big data analytics, it truly belongs to Data Science. The field is young and ever growing with rapid developments in both the industry and in academia, but its lack of maturity has made it challenging to determine how it fares in the landscape of other fields. Academic contributions have been made towards the field's interdisciplinary nature and suggest that Data Scientists are able to extract knowledge and insights from data and turn it into action. However, the constituents of the field have seen less attention and it is still unclear what the title entails. In this thesis, the phenomenon of Data Science is explored by investigating the field's possible interdisciplinary nature and what its possible constituents might be. Further, this thesis investigated the practical responsibilities and duties of a Data Scientist. The thesis followed a qualitative approach that consisted of interviews with experts within Data Science, an extensive review of relevant literature, and an analysis of a current education in Data Science. The conclusions suggest that the practical responsibilities of a Data Scientist are best described according to the workflow that permeates Data Science projects. The claim of the field being of interdisciplinary nature is strengthened, and the results suggest that its main constituents are mathematics and practices related to computer science. It also includes elements from less technical domains. / Den senaste tidens överflöd av data tillsammans med den pågående digitaliseringen över hela världen har gjort att organisationer inom olika branscher blir mer involverade i datadrivna processer. Kraften i data utnyttjas genom bearbetning och analys för att inte bara skapa värdefulla insikter som vägleder strategiska beslut, utan också för att förbättra effektivitet och produktivitet. Dessa datadrivna processer innefattar ofta kombinationer av statistisk analys med sofistikerad programvara som maskininlärning, och även om det har likheter med affärsintelligens eller storskalig dataanalys, hör det verkligen hemma inom Data Science. Fältet är ungt och ständigt växande med snabba framsteg både inom branschen och inom akademin, men dess brist på mognad har gjort det utmanande att bedöma hur det står sig i förhållande till andra områden. Akademiska bidrag har gjorts för att belysa fältets tvärvetenskapliga natur och antyder att Data Scientists har förmågan att utvinna kunskap och insikter från data och omsätta det i handling. Dock har mindre uppmärksamhet ägnats åt fältets beståndsdelar, och det är fortfarande oklart vad titeln egentligen innebär. I detta examensarbete utforskas fenomenet Data Science genom att undersöka fältets tvärvetenskapliga natur och vilka dess möjliga beståndsdelar kan vara. Dessutom undersöker avhandlingen de praktiska ansvar och uppgifter som en Data Scientist har. Avhandlingen följde en kvalitativ metod som bestod av intervjuer med experter inom Data Science, en omfattande granskning av relevant litteratur och en analys av en aktuell utbildning inom Data Science. Slutsatserna tyder på att de praktiska ansvar som en Data Scientist har bäst beskrivs utifrån arbetsflödet som genomsyrar Data Scienceprojekt. Påståendet om att fältet är tvärvetenskapligt stärks och resultaten tyder på att dess huvudsakliga beståndsdelar är statistisk matematik och metoder relaterade till datavetenskap. Det inkluderar också element från mindre tekniska områden.

Identiferoai:union.ndltd.org:UPSALLA1/oai:DiVA.org:kth-336629
Date January 2023
CreatorsBäck, Filip
PublisherKTH, Skolan för industriell teknik och management (ITM)
Source SetsDiVA Archive at Upsalla University
LanguageEnglish
Detected LanguageSwedish
TypeStudent thesis, info:eu-repo/semantics/bachelorThesis, text
Formatapplication/pdf
Rightsinfo:eu-repo/semantics/openAccess
RelationTRITA-ITM-EX ; 2023:546

Page generated in 0.0135 seconds