• Refine Query
  • Source
  • Publication year
  • to
  • Language
  • 1
  • 1
  • Tagged with
  • 2
  • 2
  • 2
  • 2
  • 2
  • 1
  • 1
  • 1
  • 1
  • 1
  • 1
  • 1
  • 1
  • 1
  • 1
  • About
  • The Global ETD Search service is a free service for researchers to find electronic theses and dissertations. This service is provided by the Networked Digital Library of Theses and Dissertations.
    Our metadata is collected from universities around the world. If you manage a university/consortium/country archive and want to be added, details can be found on the NDLTD website.
1

Frequent sequence mining on longitudinaldata : Segregation of Swedish employees

Hietala, Isak January 2015 (has links)
This thesis is based on longitudinal data of the Swedish population provided byStatistics Sweden and is conducted on behalf of the Institute for Analytical Sociology.The focus is on investigating the effectiveness of a frequent sequence miningmethod called constrained Sequential PAttern Discovery using Equivalence classes(cSPADE). The method is applied to data on segregation within workplaces, specificallyreasons for Swedish employees moving to more segregated workplaces. Thethesis found that no unique pattern of age, gender, education, unemployment, income,workplace size or foreignness index explain why a Swedish employee movesto a more segregated workplace. Evaluating the algorithm, it was found that thenumber of observations need to be smaller or an alteration of the algorithm needsto be done to reduce the process time for this specific data set.
2

Mönster som leder till sjukfrånvaro : Sekvensanalys på longitudinella data / Patterns that lead to sick leave : Sequence analysis on longitudinal data

Jesperson, Sara, Johansson, Sara January 2017 (has links)
Sjukfrånvaro innebär en kostnad för både arbetsgivare och arbetstagare. För en anonym fullgrossist är detta ett problem på en av deras lagerlokaler, där sjukfrånvaron är hög. Uppsatsen syftar till att identifiera intressanta mönster över tid som leder till sjukfrånvaro genom att analysera data från företagets lönesystem och tidssystem. Datamaterialet är longitudinellt och för att upptäcka mönster som leder till sjukfrånvaro används sekvensanalys. För att generera de sekventiella mönstren används algoritmen cSPADE då den möjliggör att tidsbegränsningar kan anges för sekvenserna. Relevansen hos de genererade sekvenserna utvärderas med tre intressemått: support, konfidens och lift. Tre separata analyser genomförs där olika antal variabler används, beroende på om de förändras över tid eller har ett konstant värde, och för dessa analyser aggregeras data veckovis. De vanligaste händelserna som leder till sjukfrånvaro hos expeditörer är olika anställningstider, kön och födelseår. Några dagars sjukfrånvaro under en vecka, det vill säga mellan 8 och 40 timmar, är mer förekommande bland expeditörerna jämfört med kortare respektive längre sjukfrånvaro. Det går att konstatera att mönster med tidigare sjukfrånvaro ofta leder till fortsatt sjukfrånvaro. Uppsatsen belyser även de problem som uppstår inom sekvensanalys, till exempel att konstanta variabler överskuggar de icke-konstanta variablerna i de genererade sekvenserna. Detta händer när variabler som förändras över tiden används i kombination med variabler som har konstanta värden, något som kan förekomma i longitudinella datamaterial. / Absence due to sickness results in a cost to both employers and employees. For an unnamed wholesaler this is a problem at one of their warehouses, where the rate of sick leave is high. The aim of this thesis is to identify interesting patterns over time that lead to sick leave by analyzing data from the company's payroll system and their attendance system. The data is longitudinal and to detect the patterns that lead to sick leave, sequence analysis is used. To generate the sequential patterns the algorithm cSPADE is used since it allows time constraints to be specified for the sequences. The relevance of the generated sequences is evaluated with three interest measures: support, confidence and lift. Three separate analyses are performed where different variables are used, depending on whether they change over time or have a constant value, and for these analyses the data is aggregated weekly. The most common events that lead to sick leave for the employees are different duration of employment, gender and birth year. A few days sick leave during a week, namely between 8 and 40 hours, is more common among the employees compared to shorter and longer sick leave. It can be noted that the pattern of previous sick leave usually leads to continued sick leave. The thesis also highlights the problems that arise in sequence analysis, for example that the constant variables overshadow the non-constant variables in the resulting sequences. This happens when variables that change over time are used in combination with variables that have a constant value, which may occur in longitudinal data.

Page generated in 0.02 seconds