En rumslig studie gällande barns rörelse i Stockholms stad : påverkan av socioekonomiska faktorer på val av transportsätt / A spatial study of children's movement in Stockholm city : influence of socio-economic factors regarding the choice of transportation mode

Salmijärvi, Robert January 2019 (has links)
Den allmänna fysiska aktiviteten har stadigt minskat i stora delar av världen. Aktiva skoltransporter, till vilka gång och cykel räknas, visar på en liknande trend. Samtidigt kan fysisk aktivitet bland annat motverka olika former av cancer, hjärt- och kärlsjukdomar samt fetma och övervikt. Det har visats att det finns ett samband mellan socioekonomiska variabler och grad av fysisk aktivitet. Socioekonomi kan således vara en viktig påverkande faktor i frågan om hälsa och välbefinnande, både för vuxna och barn. Statistiska analyser, i kombination med geografisk metodik och rumslig analys är användbart när ojämlikhet studeras då socioekonomiska skillnader ofta är platsbunden och hänger samman med den byggda miljön. Studien visar att en nätverksanalys tillsammans med en friktionsekvation kan användas i arbetet med förändringar av den fysiska miljön för att skapa säkrare vägar där barn och vuxna vill gå och cykla till skola, arbete och fritidsaktiviteter. Verktyget som arbetats fram i studien kan exempelvis vara användbart för kommuner, länsstyrelser och stadsplanerare i arbetet för att främja en mer aktiv livsstil. Fokus ligger i första hand på att underlätta samhällsplaneringsarbete i syfte att gynna användandet av aktiva transportsätt för barn och ungdomar. Vidare visar studien att barn från familjer med högre inkomst tenderar att transportera sig med bil framför aktiva transportsätt. Även gällande vårdnadshavarnas födelseland och utbildningsnivå syns skillnader i val av transportsätt. Rörande utbildningsnivå finns indikationer på att aktiva transportsätt väljs bort när utbildningsnivån ökar. Angående födelseland verkar barn vars vårdnadshavare är födda utanför Europa välja bort bilen och istället använda sig av aktiva transportsätt, vilket är det motsatta gällande barn vars vårdnadshavare är födda i Sverige. Kopplingen mellan socioekonomiska faktorer och transportsätt förefaller vara förknippad till resurser i Stockholms kommun. Studien visar på hur en harmonisering mellan olika aktörer såsom forskare, myndigheter och kommuner skulle kunna leda till förbättrade förutsättningar för aktiva transporter och i förlängningen till ett mer hållbart samhälle ur ett socialt, ekonomiskt och miljömässigt perspektiv. / General physical activity has steadily declined in large parts of the world, concurrently active school transport, e.g. walking and cycling, shows a similar trend. The decrease in the amount of physical activity is urgent since it can counteract various forms of cancer, cardiovascular disease as well as obesity. It has been shown that there is a relationship between socioeconomic variables and degree of physical activity. Socioeconomics can thus be an important influencing factor regarding health and well-being, both for adults and children. Statistical analysis, in combination with geographical methodology and spatial analysis, is useful when studying inequality as socio-economic differences often are local and related to the built environment. The study shows that a network analysis together with a friction equation can be used in the work of changing the physical environment to create safer roads where children and adults want to walk and cycle to school, work and leisure activities. The tool developed in the study can be useful for municipalities, county councils and city planners in their work to promote a more active lifestyle. The focus is primarily on facilitating community planning work with the aim of promoting the use of active modes of transport for children and adolescents. Furthermore, the study shows that children from families with higher incomes tend to transport themselves by car over active modes of transport. Differences in the choice of mode of transport are also apparent regarding the country of birth and the level of education. Regarding education level there are indications that active modes of transport are neglected when the education level increases. Concerning the country of birth, children whose guardians are born outside Europe appear not to use the car as a mode of transport, and instead use active modes of transport. On the contrary, children whose guardians are born in Sweden tend to have the car as their primary mode of transport. The connection between socio-economic factors and modes of transport seems to be linked to resources in Stockholm municipality. Moreover, this study shows how a harmonization between different actors such as researchers, authorities and municipalities could lead to improved conditions for active transport and, by extension, to a more sustainable society from a social, economic and environmental perspective.

Analys av hörnsekvenser i svensk elitfotboll : Gruppering av hörnsekvenser och utvärdering av sannolikhet för skott med logistisk hierarkisk modellstruktur / Analysis of corner sequences in the top Swedish football leagues : Clustering of corner sequences and evaluation of the probability of shot with logistical hierarchical model structure

Rydström, Sidney, Lindén, Jakob January 2020 (has links)
Sportanalys definieras av Alamar (2013) som användning av historisk data för att applicera modeller som kan ge information till beslutstagare inom en viss organisation. Det ger dem möjlighet att assistera sin organisation för att få en sportslig fördel. I den här studien utförs sportanalys, mer specifikt analyseras hörnsekvenser inom svensk elitfotboll. En hörnsekvens är den sekvens av händelser som sker från att bollen sätts i spel från hörnans startposition tills det att något av följande villkor uppfylls: 8 händelser sker givet att hörnan slås kort 6 händelser sker givet att hörnan slås långt 15 sekunder passerar Försvarande lag tar över bollen Något lag utför ett regelbrott Skott utförs av attackerande lag Datamaterialet som används är framtaget av företaget Wyscout och tillhandahållet av Football Analytics Sweden AB. De ligor och säsonger som betraktas är de svenska herrligorna Allsvenskan och Superettan för säsongerna 2017, 2018 och 2019. I datamaterialet erhålls information om varje händelse som sker under matchen. Utifrån information om händelsen samt koordinater om var händelsen sker framställs variabler som ska kunna beskriva vad som sker inom en hörnsekvens. Syftet med studien är att först identifiera hörnsekvenser med liknande egenskaper och gruppera dem. Utifrån gruppindelningen undersöks sedan sannolikheten för att en hörnsekvens leder till skott samt vad som påverkar sannolikheten. Algoritmen Partitioning Around Medoids (PAM) används med avståndsmåttet Gower och utvärderingsmåttet silhouette för att identifiera följande fem hörnsekvenstyper: Utåtskruvade hörnor från vänsterhörn med tendens mot främre stolpen och relativt nära mållinjen. Inåtskruvade hörnor från vänsterhörn med tendens mot främre stolpen och längre förflyttning ut från mållinjen. Utåtskruvade hörnor från högerhörn med tendens mot främre stolpen och relativt nära mållinjen. Korta varianter som har längre varaktighet, innefattar fler händelser och involverar fler spelare. Inåtskruvade hörnor från högerhörn med tendens mot främre stolpen och längre förflyttning ut från mållinjen. Betraktas förekomsten av skott i datamaterialet givet klusterstrukturen konstateras att hörnsekvenstyp 4 i störst utsträckning lett till skott med förekomsten 19 procent inom klustret. Hörnsekvenstyperna 2 och 5 är något sämre med respektive 18 procent av hörnsekvenserna som lett till skott. Med dessa hörnsekvenstyper i fokus anpassas flera Bayesianska hierarkiska logitmodeller för att undersöka sannolikheten för att en hörnsekvens leder till skott givet de framtagna variablerna. Vid skapandet av modellerna undersöktes om en hierarkisk modellstruktur var behövlig för att undersöka sannolikheten för skott. Slutsatsen blev att det är väsentligt att tillämpa en hierarkisk modellstruktur. Av vald modell så dras slutsatsen att det som påverkar sannolikheten att komma till skott allra mest, med avseende de variabler som undersökts, är antalet händelser som sker i hörnsekvensen. Den hörnsekvenstyp som påverkas mest av antalet händelser är den korta varianten. Det diskuteras om hur det kan vara problematiskt att undersöka den linjära påverkan på log-oddset. Detta eftersom påverkan på sannolikheten för skott inte är densamma för en ökning mellan en och två händelser som mellan tre och fyra händelser. Det är även näst intill omöjligt att komma till skott på första händelsen i hörnsekvensen då händelsen utgörs av att hörnan slås. / Sports analysis is defined by Alamar (2013) as the management of structured historical data, the application of analytical models that utilize that data, and the use of information systems to inform decision makers and enable them to help their organization in gaining a competitive advantage on the field of play. This study focuses on sports analysis, more specifically corner sequences in Swedish elite football. A corner sequence is defined as the sequence of events that occur after the ball have been put into play from the corners start position up until that one of the following conditions are met: 8 events occur given a short corner is played 6 events occur given a long corner is played 15 seconds passes The defending team overtake the ball Some team performs a foul The attacking team performs a shot The data set used comes from Wyscout and is provided by Football Analytics Sweden AB. The data consist of games from the top Swedish football leagues for men: Allsvenskan and Superettan, and consists of games played in the seasons 2017, 2018 and 2019. In the data, information about every event that occur during the game is provided, where all events are classified to provide information about what happens at the specific event. The information about each event and its coordinates is then used produce variables to describe what occurs during a corner sequence. The purpose is to identify corner sequences with similar characteristics and group them together. Then use these groups to examine the probability that a corner sequence leads to a shot, and what influences this probability. The clustering algorithm Partitioning Around Medoids (PAM) is used with Gower as the dissimilarity measure and silhouette to evaluate the clusters, then the five following clusters are identified: Corners curled away from goal from the left corner with a tendency towards the front post and relatively close to the goal line. Corners curled towards goal from the left corner with a tendency towards the front post further away from the goal line. Corner curled away from goal from the right corner with a tendency towards the goal line. Short corner variant with longer duration, more events occurring and more players involved. Corners curled towards goal from the right corner with a tendency towards the front post and further away from the goal line. Given the clustering structure it is noted that the corner sequence of type 4 has led to the greatest extent of shots with the proportion of 19 percent within the cluster. The corner sequences of type 2 and 5 have a slightly lower shot occurrence with 18 percent per corner seqence type. With these corner sequence types in focus, several Hierarchical Bayesian Logistic Regression models are fitted to analyze the probability that a corner sequence leads to a shot given the produced explanatory variables. When fitting the models it is examined if it is necessary to apply a hierarchichal strutcture to the model. The conclusion is drawn that the hierarchical model structure is crucial to the model's performance. The conclusion is drawn from the final model that the explanatory variable which explains the probability to shoot best is the number of events that occur during the corner sequence. The corner sequence type that is most influenced by the number of events that occur during the corner sequence is the short corner variant. In the study it is discussed if there is an issue to suppose that this variable has a linear effect on the log-odds, since the impact on the probability to shoot is not the same for an increase between one and two as three and four events. Furthermore it is near impossible to shoot in the first event that occurs in the corner sequence.

Identifying Optimal Throw-in Strategy in Football Using Logistic Regression / Identifiering av Optimal Inkaststrategi i Fotboll med Logistisk Regression

Nieto, Stephan January 2023 (has links)
Set-pieces such as free-kicks and corners have been thoroughly examined in studies related to football analytics in recent years. However, little focus has been put on the most frequently occurring set-piece: the throw-in. This project aims to investigate how football teams can optimize their throw-in tactics in order to improve the chance of taking a successful throw-in. Two different definitions of what constitutes a successful throw-in are considered, firstly if the ball is kept in possession and secondly if a goal chance is created after the throw-in. The analysis is conducted using logistic regression, as this model comes with high interpretability, making it easier for players and coaches to gain direct insights from the results. A substantial focus is put on the investigation of the logistic regression assumptions, with the greatest emphasis being put on the linearity assumption. The results suggest that long throws directed towards the opposition’s goal are the most effective for creating goal-scoring opportunities from throw-ins taken in the attacking third of the pitch. However, if the throw-in is taken in the middle or defensive regions of the pitch, the results interestingly indicate that throwing the ball backwards leads to increased chance of scoring. When it comes to retaining the ball possession, the results suggest that throwing the ball backwards is an effective strategy regardless of the pitch position. Moreover, the project outlines how feature transformations can be used to improve the fitting of the logistic regression model. However, it turns out that the most significant improvement in accuracy of logistic regression occurs when incorporating additional relevant features into the model. In such case, the logistic regression model achieves a predictive power comparable to more advanced machine learning methods. / Fasta situationer såsom frisparkar och hörnor har varit välstuderade i studier rörande fotbollsanalys de senaste åren. Lite fokus har emellertid lagts på den vanligast förekommande fasta situationen: inkastet. Detta projekt syftar till att undersöka hur fotbollslag kan optimera sin inkasttaktik för att förbättra möjligheterna till att genomföra ett lyckat inkast. Två olika definitioner av vad som utgör ett lyckat inkast beaktas, dels om bollinnehavet behålls och dels om en målchans skapas efter inkastet. Analysen görs med logistisk regression eftersom denna modell har hög tolkningsbarhet, vilket gör det lättare för spelare och tränare att få direkta insikter från resultaten. Stort fokus läggs på undersökning av de logistiska regressionsantagandena, där störst vikt läggs på antagandet gällande linjäritet. Resultaten tyder på att långa inkast riktade mot motståndarnas mål är de mest gynnsamma för att skapa en målchans från inkast tagna i den offensiva tredjedelen av planen. Om inkastet istället tas från de mellersta eller defensiva delarna av planen tyder resultaten intressant nog på att inkast riktade bakåt leder till ökad chans till att göra mål. När det kommer till att behålla bollinnehavet visar resultaten att kast bakåt är en gynnsam strategi, oavsett var på planen inkasten tas ifrån. Vidare visar projektet hur variabeltransformationer kan användas för att förbättra modellanpassningen för logistisk regression. Det visar sig dock att den tydligaste förbättringen fås då fler relevanta variabler läggs till i modellen. I sådant fall, får logistisk regression en prediktiv förmåga som är jämförbar med mer avancerade maskininlärningsmetoder.

Building Predictive Models for Stock Market Performance : En studie om maskininlärning och deras prestanda

Wennmark, Gabriel, Lindgren, Felix January 2023 (has links)
Today it is important for investors to identify which stocks that will result in positive returns in order for the right decision to be made when trading on the stock market. For decades it has been an area of interest for academics, and it is still challenging due to many difficulties and problems. A large number of studies has been carried out in machine learning and stock trading,where many of the studies has resulted in promising results despite these challenges. The aim of this study was to develop and evaluate predictive models for identifying stocks that outperform the Swedish market index OMXSPI. The research utilized a dataset of historical stock data and applied three various machine learning algorithms, Support Vector Machine, Logistic Regression and Decision Trees to predict if excess performance was met. With the help of ten-fold cross-validation and hyperparameter tuning the results were an IT-artefact that produced satisfying results. The results showed that hyperparameter tuning techniques marginally improved the metrics focused-on, namely accuracy and precision. The support vector machine model achieved an accuracy of 58,52% and a precision of 57,51%. The logistic regression model achieved an accuracy of 55,75% and a precision of 54,81%. Finally, the decision tree model which was the best performer, achieved an accuracy of 64,84% and a precision of 65,00%.

Bankruptcy Distributions and Modelling for Swedish Companies Using Logistic Regression / Konkursfördelning och Modellering för Svenska Företag Genom Användning av Logistisk Regression

Ewertzh, Jacob January 2019 (has links)
This thesis discusses the concept of bankruptcy, or default, for Swedish companies. The actual distribution over time is considered both on aggregate level and within different industries. Several models are constructed to best possible describe the default frequency. Mainly logistic regression models are designed for this purpose, but various other models are considered. Some of these are constructed for comparison and for the ambition to produce the most accurate model possible. A large data set of nearly 30 million quarterly observations is used in the analysis. Taking into account micro and macro economic data. The derived models cover different time periods, considering different variables and display varying levels of accuracy. The most exact model is a logistic regression model considering both micro and macro data. It is tested both in sample and out of sample and perform very well in both areas. This model is estimated on first a subset of the data set to be able to compare with a real scenario. Then an equivalent model is constructed from the whole data set to best possibly describe future scenarios. Here Vector Auto-Regressive (VAR) models, and empirical models constructed by OLS regression estimating the firm values, are used in combination with the logistic regression model to predict the future. All three models are used to describe the most likely scenarios, as well as the worst case scenarios. From the worst case scenarios risk measures, such as the empirical value at risk, can be derived. From all this analysis the most significant results are compiled. Namely, that the Logistic regression model performs remarkably well both in-sample and out-of-sample, if macro variables are taken into account. Further, the future results are harder to interpret. Yet, the analysis has arguments for prediction accuracy and interesting results of a continued low default frequency within the next year. / Den här uppsatsen avhandlar konceptet konkurs, för svenska företag. Den faktiska konkursfördelningen över tid analyseras, både på en sammanlagd nivå och inom olika industrier. Flera modeller konstrueras i syfte att bäst beskriva konkursfördelningen. Huvudsakligen är logistiska regressions modeller utformade för detta syfte, men andra typer av modeller är inkluderade i analysen. Några av dessa modeller är skapade för jämförelse, men också för att kunna producera en så exakt modell som möjligt. Ett stort data set med nästan 30 miljoner kvartalsvisa observationer används i analysen. Mikro- och makroekonomiska faktorer är inkluderade i detta data set. De framtagna modellerna omfattar olika tidsperioder mellan 1990–2018, tar in olika faktorer i analysen och visar på olika nivåer av noggrannhet. Modellen som har högst förklaringsgrad är en logistisk regressionsmodell som tar hänsyn till både mikro- och makroekonomiska faktorer. Denna modell analyseras både i och utanför sitt samplingsintervall, och visar på goda resultat i båda områdena. Modellen är först skattad på en delmängd av tidsperioden, för att kunna jämföra den förutspådda fördelningen med en faktisk fördelning. Sedan är en ekvivalent modell skattad på hela intervallet, för att bäst möjligt förutspå framtida scenarion. För detta syfte är Logistiska regressionsmodellen kombinerad med Vektor Autoregressiva (VAR)-modeller som förutspår makroekonomiska faktorer, och empiriska regressionsmodeller som förutspår mikroekonomiska faktorer. Alla tre modelltyper används för att kunna beskriva det mest sannolika scenariot, samt de värsta tänkbara scenariona. Från de värsta tänkbara scenariona kan riskmått, så som empiriska Value at Risk, tas fram. All analys producerar resultat och de viktigaste sammanställs. Dessa är att den logistiska regression modell som tar hänsyn till makroekonomiska faktorer ger bra resultat både i och utanför samplingsintervallet. Vidare är de framtida simulerade resultaten svårare att tolka, men den genomförda analysen har argument för exakthet i förutsägelserna. Därmed presenteras ett troligt framtida scenario med fortsatt låg konkurs frekvens inom det närmaste året.

Predicting Large Claims within Non-Life Insurance / Prediktion av storskador inom sakförsäkring

Barnholdt, Jacob, Grafford, Josefin January 2018 (has links)
This bachelor thesis within the field of mathematical statistics aims to study the possibility of predicting specifically large claims from non-life insurance policies with commercial policyholders. This is done through regression analysis, where we seek to develop and evaluate a generalized linear model, GLM. The project is carried out in collaboration with the insurance company If P&C Insurance and most of the research is conducted at their headquarters in Stockholm. The explanatory variables of interest are characteristics associated with the policyholders. Due to the scarcity of large claims in the data set, the prediction is done in two steps. Firstly, logistic regression is used to model the probability of a large claim occurring. Secondly, the magnitude of the large claims is modelled using a generalized linear model with a gamma distribution. Two full models with all characteristics included are constructed and then reduced with computer intensive algorithms. This results in two reduced models, one with two characteristics excluded and one with one characteristic excluded. / Det här kandidatexamensarbetet inom matematisk statistik avser att studera möjligheten att predicera särskilt stora skador från sakförsäkringspolicys med företag som försäkringstagare. Detta görs med regressionsanalys, där vi ämnar att utveckla och bedöma en generaliserad linjär modell, GLM. Projektet utförs i samarbete med försäkringsbolaget If Skadeförsäkring och merparten av undersökningen sker på deras huvudkontor i Stockholm. Förklaringsvariablerna som är av intresse att undersöka är egenskaper associerade med försäkringstagarna. På grund av sällsynthet av storskador i datamängden görs prediktionen i två steg. Först används logistisk regression för att modellera sannolikheten för en storskada att inträffa. Sedan modelleras storskadornas omfattning genom en generaliserad linjär modell med en gammafördelning. Två grundmodeller med alla förklaringsvariabler konstrueras för att sedan reduceras med datorintensiva algoritmer. Det resulterar i två reducerade modeller, med två respektive en kundegenskap utesluten.

Nyckeln till överlevnad : Revisorns roll i småföretags långsiktiga överlevnad / The key to survival : The Auditor’s Role in the Long-Term Survival of Small Businesses

Issazadhe, Johanna, Dinov Gustafsson, Vanessa, Walichnowska, Weronika Zofia January 2023 (has links)
Reformen för frivillig revision genomfördes med syfte att möjliggöra valfrihet för revisionsfrågan utefter småföretagens egna behov och resurser. Trots att reformen genomfördes för över ett decennium sedan är forskarna fortfarande oense om effekterna av den avskaffade revisionsplikten. Det senaste åren har debatten kring återinförandet av revisionsplikten varit aktuell där argumenten bakom återinförandet baseras på den ökade ekonomiska brottsligheten och minskade lönsamheten hos de bolag som valt bort revisionen. Även de olika fördelar som revisorns kompetens och legitimitet som skapar trygghet för företagens intressenter är argument för återinförandet av revisionsplikten. Denna studie bidrar med en ökad förståelse och vägledning för småföretag i valet om frivillig revision. Syftet med denna studie är därför att undersöka om reformen för frivillig revision har påverkat konkursrisken hos svenska aktiebolag, samt om det finns andra finansiella faktorer som kan påverka småföretagens långsiktiga överlevnad. Syftet besvaras med utgångspunkt i tre teorier: legitimitetsteori, informationsasymmetri och signalteori, som dessutom utgör en del av den teoretiska referensramen. Den kvantitativa studien utvecklar hypoteser genom teorierna och den tidigare forskningen. Dessa ligger till grund för dataanalysen som sker genom logistisk regression för att skapa en konkursprognostiseringsmodell. Datamaterialet som undersökts består av sekundärdata genererad från Retriever Business av småföretag i Västra Götaland under period 2019. Studiens resultat visar att det finns ett signifikant negativt samband mellan revisorn och konkursrisk. Studien visar därmed att revisorn har en effekt på konkursrisken, även om det är svårt att fastställa den exakta påverkan som revisorn har på konkursrisken. Resultatet ger trots det indikationer på att återinförande av revisionsplikten skulle gynna såväl småföretagare som myndigheter och bidrar på så sätt med stöd till debatten om återinförandet av revisionsplikten. / The reform for voluntary audit was implemented with the aim of enabling freedom of choice regarding audit matters based on the needs and resources of small businesses. Despite the reform being implemented over a decade ago, researchers are still divided on the effects of abolishing the mandatory audit requirement. In recent years, there has been a debate on reintroducing the mandatory audit requirement, with arguments based on increased economic crime and decreased profitability among companies that have opted out of audits. The various advantages of the auditor's expertise and legitimacy in providing security for stakeholders are also arguments for the reintroduction of the mandatory audit requirement. This study contributes to a better understanding and guidance for small businesses in the decision-making process regarding voluntary audits. Therefore, the purpose of this study is to examine whether the reform for voluntary audit has influenced the bankruptcy risk of Swedish limited liability companies and to identify other financial factors that may affect the long-term survival of small businesses. The purpose is addressed based on three theories: legitimacy theory, information asymmetry, and signaling theory, which also form part of the theoretical framework. The quantitative study formulates hypotheses based on these theories and previous research. These hypotheses form the basis for data analysis using logistic regression to create a bankruptcy prediction model. The data analyzed consist of secondary data generated from Retriever Business on small businesses in Västra Götaland during the period 2019. Therefore, this study is written in Swedish. The study's results show a significant negative correlation between the auditor and bankruptcy risk. Thus, the study demonstrates that the auditor has an effect on bankruptcy risk, although it is difficult to determine the exact impact of the auditor on bankruptcy risk. In spite of that, the results provide indications that reintroducing the mandatory audit requirement would benefit both small business owners and authorities, thus offering support to the debate on reintroducing the mandatory audit requirement.

How Unlucky People Continue to be Unlucky: : A Study of the Predictive Capabilities of Insurance Claim Data / Hur Olycksdrabbade Människor Fortsätter vara Olycksdrabbade: : En Studie av de Prediktiva Förmågorna hos Anspråksdata inom Försäkring

Gustavsson, Jacob, Lövgren, Alex January 2023 (has links)
This bachelor thesis in the field of mathematical statistics was carried out in collaboration with an upcoming insurance start-up, Hedvig, and had the objective of investigating the predictive capabilities of different types of insurance claims. This was done through regression analysis, and more specifically the area in regression analysis called generalized linear models. Logistic regression was employed as the modeling technique, and data points were modeled in various ways to then be used to fit models in order to determine the most optimal one based on some pre-determined statistical evaluation metrics. The final model had an accuracy of above 96%, and the results showed that certain types of claims had a bigger contribution to the probability of a claim occurring the next period. This study contributes to the understanding of the predictive capabilities of insurance claim data and provides insights that could aid in the development of more accurate and efficient insurance pricing models. / Denna kandidatuppsats inom området matematisk statistik utfördes i samarbete med ett nyetablerat försäkringsföretag, Hedvig, och hade som syfte att undersöka den prediktiva förmågan hos olika typer av ersättningsanspråk. Detta gjordes genom regressionsanalys, och mer specifikt det område inom regressionanalys som kallas generaliserade linjära modeller. Logistisk regression användes som modelleringsteknik, och datapunkterna modellerades på olika sätt för att sedan skapa modeller, med syfte att fastställa den mest optimala modellen utifrån vissa förutbestämda statistiska utvärderingsmått. Den slutliga modellen hade en exakthet på över 96%, och resultaten visade att vissa typer av anspråk bidrog i större utsträckning till sannolikheten för att ett anspråk skulle inträffa under nästa period. Den här studien bidrar till förståelsen av den prediktiva förmågan hos data på ersättningsanspråk och ger insikter som kan bidra till utvecklingen av mer exakta och effektiva modeller för prissättning av försäkringar.

A Predictive Analysis of Customer Churn / : En Prediktiv Analys av Kundbortfall

Eskils, Olivia, Backman, Anna January 2023 (has links)
Churn refers to the discontinuation of a contract; consequently, customer churn occurs when existing customers stop being customers. Predicting customer churn is a challenging task in customer retention, but with the advancements made in the field of artificial intelligence and machine learning, the feasibility to predict customer churn has increased. Prior studies have demonstrated that machine learning can be utilized to forecast customer churn. The aim of this thesis was to develop and implement a machine learning model to predict customer churn and identify the customer features that have a significant impact on churn. This Study has been conducted in cooperation with the Swedish insurance company Bliwa, who expressed interest in gaining an increased understanding of why customers choose to leave.  Three models, Logistic Regression, Random Forest, and Gradient Boosting, were used and evaluated. Bayesian optimization was used to optimize the models. After obtaining an indication of their predictive performance during evaluation using Cross-Validation, it was concluded that LightGBM provided the best result in terms of PR-AUC, making it the most effective approach for the problem at hand. Subsequently, a SHAP-analysis was carried out to gain insights into which customer features that have an impact on whether or not a customer churn. The outcome of the SHAP-analysis revealed specific customer features that had a significant influence on churn. This knowledge can be utilized to proactively implement measures aimed at reducing the probability of churn. / Att förutsäga kundbortfall är en utmanande uppgift inom kundbehållning, men med de framsteg som gjorts inom artificiell intelligens och maskininlärning har möjligheten att förutsäga kundbortfall ökat. Tidigare studier har visat att maskinlärning kan användas för att prognostisera kundbortfall. Syftet med denna studie var att utveckla och implementera en maskininlärningsmodell för att förutsäga kundbortfall och identifiera kundegenskaper som har en betydande inverkan på varför en kund väljer att lämna eller inte. Denna studie har genomförts i samarbete med det svenska försäkringsbolaget Bliwa, som uttryckte sitt intresse över att få en ökad förståelse för varför kunder väljer att lämna. Tre modeller, Logistisk Regression, Random Forest och Gradient Boosting användes och utvärderades. Bayesiansk optimering användes för att optimera dessa modeller. Efter att ha utvärderat prediktiv noggrannhet i samband med krossvalidering drogs slutsatsen att LightGBM gav det bästa resultatet i termer av PR-AUC och ansågs därför vara den mest effektiva metoden för det aktuella problemet. Därefter genomfördes en SHAP-analys för att ge insikter om vilka kundegenskaper som påverkar varför en kund riskerar, eller inte riskerar att lämna. Resultatet av SHAP-analysen visade att vissa kundegenskaper stack ut och verkade ha en betydande påverkan på kundbortfall. Denna kunskap kan användas för att vidta proaktiva åtgärder för att minska sannolikheten för kundbortfall.

Increasing Availability Through Reduced Delays in Large Systems : A Case Study Based in Systems Engineering, Integrated Support Logistics, and Lean / Förbättrad tillgänglighet genom minskade väntetider i stora system : En fallstudie baserad på systemteknik, integrerat logistikstöd och lean

Nilsson Nordahl, Erik January 2022 (has links)
Increased trends towards servitization within previously exclusively manufacturing industries makes a larger part of maintenance become the responsibility of the manufacturer. This increased responsibility makes it more important for suppliers to know how different parameters contribute to cost, to be able to price their contracts correctly. Systems Engineering (SE) and Integrated Logistics Support (ILS) are two current methodologies on how to manage large systems. These methodologies are mainly used within defence industries and large capital-intensive infrastructure projects but are today also utilised in civilian industries. With the new methodology of Model Based Systems Engineering (MBSE) and the new demands of servitization it becomes more important to know how different parameters affect the final cost of a project during the very early phases of development. Within ILS the parameters Administrative Delay Time (ADT) and Logistics Delay Time (LDT) have previously not received attention proportional to their contribution to overall availability in projects. This thesis is based in literature, interviews of industry professionals, and the study of a real case of an electrical charging infrastructure project currently in development. From these sources multiple paths to resolve the issues with support from ILS, MBSE, SE, and other management literature are explored. Several attributes of the case, and characteristics of MBSE and ILS leads to the conclusion that coupling the methodologies with Lean methods would lead to better insight into where critical points in the explored system are and give ways of resolving issues with ADT and LDT that exist. The combination of MBSE and Lean methods could successfully identify possible critical points in the error handling of the electrical charging infrastructure system early in the process of implementation. Conclusionary the combination of MBSE, ILS, and Lean is a possibly powerful way to identify and improve the availability and consequently the cost of a project in the early stages. / Tjänstefiering är en trend som gör att en allt större del av underhåll inom tidigare endast tillverkande industrier blir tillverkarens ansvar. När detta ansvar ökar blir det viktigare för tillverkaren and veta vilka parametrar som är kostnadsdrivande. Detta för att kunna prissätta sina tjänster korrekt. Systemteknik (SE) och Integrerat Logistikstöd (ILS) är två metodologier som används till att hantera underhåll av stora system. Dessa nyttjas främst inom försvarsindustrin och inom kapitalintensiva infrastrukturprojekt, men används även i privat industri. Med hjälp av en utveckling inom SE, Modellbaserad Systemteknik (MBSE), och med de krav som tjänstefiering innebär så blir vikten av att ha korrekt angivna parametrar tidigt i projektet mer tydlig. Inom ILS är särskilt parametrarna administrativ väntetid (ADT) och logistisk väntetid (LDT) särskilt eftersatta med hänsyn till hur mycket de påverkar tillgängligheten och kostnaderna för systemet. Detta examensarbete baseras på tillgänglig litteratur inom nämnda områden, intervjuer med industrirepresentanter, och dokumentation och intervjuer i ett riktigt fall. Det riktiga fallet är ett pågående projekt för uppbyggnad och underhåll av laddningsinfrastruktur för eldrivna fordon. Från dessa källor utforskades och analyserades flera vägar för hur man skulle kunna förbättra hanteringen av ADT och LDT med grund i litteraturen kring ILS, MBSE, och SE med annan litteratur inom mangament som stöd. Fallets egenskaper, och egenskaper hos ILS och MBSE leder till slutsatsen att en kombination av MBSE och Lean skulle leda till att man lättare kan utforska kritiska delar av ett underhållssystem, och åtgärda existerande problem med ADT och LDT. En kombination av dessa principer kunde identifiera kritiska punkter i felhanteringssystemet hos laddarna i infrastrukturprojektet trots att projektet befann sig tidigt i implementationen. Slutligen kan konstateras att MBSE, ILS och Lean är en möjlig kraftfull kombination för att förbättra tillgängligheten tidigt i ett projekts livscykel.

