Modeling Patterns of Transactions after Companies Implementation of Getswish AB’s Payment Service / Modellering av transaktionsmönster efter företagsimplementering av Getswish AB:s betalningstjänst

Amaya Scott, Jakob, Skålberg, Amanda January 2022 (has links)
This thesis is a case study in collaboration with the company Getswish AB. GetswishAB provides the mobile application and payment service Swish with the purpose ofdelivering smooth money transfers for individuals and companies in Sweden. About80 percent of the Swedish population are connected to Swish, and the majority seethe service as an apparent part of everyday life. This work studies a small part of alltransactions that take place daily between individuals and companies. Specifically, thispaper examines which factors affect the Swish transaction amount (TA) to companieswithin five different industries. The five industries studied are: Sports, leisure,and entertainment activities; Restaurant, catering, and bar activities; Retail trade,except for motor vehicles and motorcycles; Trade and repair of motor vehicles andmotorcycles; and Telecommunications. In combination with descriptive analysis andseasonality studies, a multiple linear regression model is used to evaluate patternsin the amount transferred to companies within the various industries. The responsevariable is the daily aggregated TA and the seven responding regressors examined are:i) The number of employees of the company, ii) The revenue of the company, iii) Thedate for registration to Swish service for companies, iv) The age of the customers, v) Thegender of the customers, vi) The number of transactions, and vii) The transaction date.The estimated parameters for each regressor are studied to evaluate correlations withthe TA. This thesis states that it is possible to construct a model from the regressorsanalyzed, which can predict the amount with an explanation degree of above 85% forfour of the five industries. The model constructed for the motor vehicle industry nevergives satisfactory results and must be further investigated to conclude. / Detta examensarbete är en fallstudie i samarbete med företaget GetSwish AB.GetSwish AB tillhandahåller mobilapplikationen och betaltjänsten Swish, vars syfteär att leverera smidig pengaöverföring för privatpersoner och företag i Sverige. Idagär cirka 80 procent av Sveriges befolkning anslutna till Swish och majoriteten sertjänsten som en självklar del av vardagen. Detta arbete kommer dock endast fokuserapå en liten del av alla transaktioner som dagligen sker mellan privatpersoner ochföretag. Specifikt undersöker denna rapport vilka faktorer som påverkar Swishstransaktionsbelopp till företag inom fem olika branscher. De fem branschernasom studeras är: Sport-, fritids- och nöjesverksamhet; Restaurang-, catering ochbarverksamhet; Detaljhandel utom med motorfordon och motorcyklar; Handelsamt reparation av motorfordon och motorcyklar; och Telekommunikation. Ikombination med en deskriptiv analys och säsongsstudier skapades en multipel linjärregressionsmodell för att utvärdera mönster i transaktionsbeloppet från kund tillföretag inom de olika branscherna. Responsvariablen är det dagliga aggregeradebeloppet och de förklarande variablerna som undersöktes var: antalet anställda,omsättning, datum för registrering till Swish för företag, kundernas ålder och könsamt antal transaktioner och transaktionsdatum. De skattade parametrarna förvarje regressor studerades för att utvärdera magnitud samt positiva eller negativakorrelationer med beloppet. Denna rapport visar att det är möjligt att konstrueraen modell från de analyserade regressorerna som kan förutsäga beloppet med enförklaringsgrad på över 85% för fyra av de fem branscherna och kan användas föratt förutspå beloppen på de dagliga transaktionerna. Modellen som konstruerats förfordonsindustrin gav aldrig tillfredsställande resultat och bör undersökas vidare innanslutsatser dras.

Exploring a personal property pricing method in insurance context using multiple regression analysis / Prismodellering av personlig egendom ur ett försäkringsmässigt perspektiv genom multipel linjär regression

Guterstam, Rasmus, Trojenborg, Vidar January 2019 (has links)
In general, insurance companies and especially their clients face long and complicated claims processes where payments rarely, and almost reluctantly, are made the same day. A part of this slow moving procedure is the fact that in some cases the insurer has to value the personal property themselves, which can be a tedious process. In conjunction with the insurance company Hedvig, this project address this issue by examining a pricing model for a specific personal property; smartphones - one of the most common occurring claim types in the insurance context. Using multiple linear regression with data provided by PriceRunner, 10 key characteristics out of 91 where found to have significant explanatory power in predicting the market price of a smartphone. The model successfully simulates this market price with an explained variance of 90%. Furthermore this thesis illustrates an intuitive example regarding pricing models for personal property of other sorts, identifying limiting key components to be data availability and product complexity. / I dagsläget står försäkringsbolag och deras kunder allt för ofta inför långa och komplicerade försäkringsärenden, där utbetalningar i regel aldrig sker samma dag. En del i denna långsamma och utdragna utbetalningsprocess är det faktum att försäkringsbolaget på egen hand måste uppskatta egendomens värde, vilket kan vara en mycket komplicerad process. I samarbete med försäkringsbolaget Hedvig undersöker denna rapport en värderingsmodell för ett av de vanligaste försäkringsärendena gällande personlig egendom, nämligen smartphones. Genom att använda multipel linjär regression med data försedd av PriceRunner har 10 av 91 nyckelfaktorer identifierats ha signifikant förklaringsgrad vid modellering av marknadsvärdet av en smartphone. Den framtagna modellen simulerar framgångsrikt marknadsvärdet med en 90-procentig förklaringsgrad av variansen. Vidare illustrerar denna rapport intuitiva riktlinjer för värderingsmodellering till andra typer av personlig egendom, samtidigt som den identifierar begränsande nyckelaspekter som exempelvis tillgången på data och egendomens inneboende komplexitet.

A Return Maximizing Strategy in Market Rebounds for Swedish Equity Funds / En Avkastningsmaximerande Strategi för Svenska Aktiefonder i Marknadsåterhämtningar

Sävendahl, Carl, Flodmark, Erik January 2019 (has links)
The growing interest in savings on the financial markets implicates that the competition is expanding and managers of Swedish equity funds need to create shareholder value, independent of the macroeconomic situation. The Swedish financial market experienced a rapid rebound during the first quarter of 2019, following the plunge in the preceding quarter. This thesis utilizes multiple linear regression to analyze Swedish equity funds during the first quarter of 2019. The aim is to identify variables affecting fund performance in a market rebound in order to formulate a performance maximizing strategy. Based on the results of the performance influencing variables, the strategy is to underweight small cap stocks, overweight the energy and technology sector, underweight the communication services sector and staying neutral to overweighted in remaining sectors. Furthermore, the strategy proposes an overweighted exposure to North American stocks and an underweight to Western European stocks. The overexposure to North America should be larger in absolute value compared to the underexposure to Western Europe. The strategy is ambiguous since data from only one market rebound is analyzed. Therefore, the strategy is not significantly proven to be adaptable in any market rebound. The model analysis is based on modern macroeconomic and financial theories. In addition, the discussion problematizes the neoclassical view on economics based on the notion that a combination of rationality and irrationality is prevalent among investors. Further research is essential either to support or reject the performance affecting variables and the allocation strategy specified in the thesis. / Det växande intresset att investera på de finansiella marknaderna implicerar att konkurrensen hårdnar bland fondförvaltare. Fondförvaltare för svenska aktiefonder måste därmed skapa andelsägarvärde, oberoende av det makroekonomiska läget. Den finansiella marknaden återhämtade sig snabbt under det första kvartalet 2019 efter den branta nedgången under det föregående kvartalet. Studien avser att identifiera de bidragande faktorerna till avkastning för svenska aktiefonder under denna återhämtning. Multipel linjär regression används för detta ändamål samt för att formulera en avkastningsmaximerande strategi. Strategin föreslår att förvaltare för svenska aktiefonder bör undervikta småbolag, övervikta aktier inom energi och teknik samt undervikta aktier i kommunikationssektorn. Strategin är vidare att vara neutral till överviktad i övriga sektorer. Dessutom är strategin att övervikta nordamerikanska aktier och att undervikta västeuropeiska aktier. Övervikten i Nordamerika ska vara större i absoluta termer än undervikten i Västeuropa. Strategin är tvetydig då den bygger på data från enbart en marknadsåterhämtning. Därmed är den framtagna strategin inte bevisad att vara applicerbar på vilken marknadsåterhämtning som helst. Analysen är baserad på modern makroekonomisk och finansiell teori. Diskussionen problematiserar den neoklassiska synen på ekonomi baserat på uppfattningen att investerare är både irrationella och rationella i sina investeringsbeslut. Fortsatt forskning är essentiell för att antingen stärka eller förkasta dragna slutsatser i denna studie.

Driving factors for growing companies / Drivande faktorer för växande företag

Liljedahl, Ida, Rondahl, Ebba January 2020 (has links)
Finding a way to forecast what characteristics make a fast growing company would be useful, both for companies trying to succeed and for investment companies wanting to make successful investments. This thesis aims to develop a model describing the relationship between 9 chosen characteristics, based on real data from 2015 concerning companies that were rewarded with a DI Gasell in 2018. The final result show that half of the variables chosen to form the model have little to no relationship with the response variable EBIT margin. However, the final model consists of four variables that with statistic significance correlates with the response variable. The explanatory level is low and implies that forecasting companies growth probably can’t be done using this model. The four regressors that correlate with EBIT margin are Year of Incorporation, Operatingrevenue, Number of subsidiaries & SNI code. Although a forecast can’t be performed other insight are obtained from the research. Companies with SNI code 4, which corresponds to operating in the economic sector, affects EBIT margin in a more positive way than other sectors. Number of subsidiaries correlates fairly linearly with the response variable. Contradictory to previous research CEO characteristics are shown to be the least important factor contributing to profitability. / Att hitta ett sätt att förutspå vilka egenskaper som skapar ett snabbväxande företag kan vara användbart, både för företag som vill växa men också för investeringsbolag som letar efter gynnsamma investeringar med bra avkastning. Denna avhandling strävar efter att utveckla en modell som beskriver relationen mellan 9 utvalda variabler, baserat på data från år 2015 gällande företag som 2018 tilldelades utmärkelsen ”DI Gasell”. Den slutgiltiga modellen visar att hälften av regressorerna statistiskt signifikant påverkar responsvariabeln EBIT-marginal. Förklaringsgraden för modellen är låg, vilket antyder att sambanden inte är starka nog att kunna förutspå vilka företag som kommer att bli ”DI Gasell” med denna modell. De fyra regressorer som påverkar EBIT-marginalen mest är registreringsår, omsättning, antal dotterbolag och SNI-kod. Trots modellens låga förklaringsvärde kan andra slutsatser dras av undersökningen. Företag i ekonomisektorn påverkar EBIT-marginalen mer positivt än företag inom andra sektorer. Antal dotterbolag korrelerar relativt linjärt med respons variabeln. Till motsats från tidigare studier visar avhandlingen att ålder och kön på VD inte påverkar lönsamheten.

An investigation of the relationship between online activity on Studi.se and academic grades of newly arrived immigrant students : An application of educational data mining

Menon, Akash, Islam, Nahida January 2017 (has links)
This study attempts to analyze the impact of an online educational resource on academic performances among newly arrived immigrant students in Sweden between the grade six to nine in the Swedish school system. The study focuses on the web based educational resource called Studi.se made by Komplementskolan AB.The aim of the study was to investigate the relationship between academic performance and using Studi.se. Another purpose was to see what other factors that can impact academic performances.The study made use of the data mining process, Cross Industry Standard for Data Mining (CRISP-DM), to understand and prepare the data and then create a regression model that is evaluated. The regression model tries predict the dependent variable of grade based on the independent variables of Studi.se activity, gender and years in Swedish schools. The used data set includes the grades in mathematics, physics, chemistry, biology and religion of newly arrived students in Sweden from six municipalities that have access to Studi.se. The data used also includes metrics of the student’s activity on Studi.se.The results show negative correlation between grade and gender of the student across all subjects. In this report, the negative correlation means that female students perform better than male students. Furthermore, there was a positive correlation between number of years a student has been in the same school and their academic grade. The study could not conclude a statistically significant relationship between the activity on Studi.se and the students’ academic grade.Additional explanatory independent variables are needed to make a predictive model as well as investigating alternative regression models other than multiple linear regression. In the sample, a majority of the students have little or no activity on Studi.se despite having free access to the resource through the municipality. / Denna studie analyserar inverkan som digitala läromedel har på skolbetyg bland nyanlända elever i Sverige mellan årskurs sex och nio i det svenska skolsystemet. Studien fokuserar på den webbaserade pedagogisk resursen Studi.se, gjord av Komplementskolan AB.Målet med studien var att undersöka relationen mellan skolresultat och användandet av Studi.se. Ett annat syfte var att undersöka vad för andra faktorer som kan påverka skolresultat.Studien använder sig av datautvinningsprocessen, Cross Industry Standard for Datamining (CRISP-DM), för att förstå, förbereda och analysera datan i form av en regressionsmodell som sedan evalueras. Datasamlingen som används innehåller bland annat skolbetyg i ämnena matematik, fysik, kemi, biologi och religion från sex kommuner som har tillgång till Studi.se. Aktivitet hos eleverna från dessa kommuner på Studi.se hemsidan användes också för studien.Resultaten visar en negativ korrelation mellan betyg och kön hos eleverna i alla ämnena. Den negativa korrelationen betyder i denna rapport att tjejer får bättre betyg i genomsnitt än killar hos urvalet av nyanlända från de sex kommunerna. Dessutom fanns det en positiv korrelation mellan antal år en elev varit i skolan alternativt i svenska skolsystemet och deras betyg. Studien kunde inte säkerställa ett statistisk signifikant resultat mellan aktivitet på Studi.se och elevernas skolresultat.Ett flertal förklarande oberoende variabler behövs för att kunna skapa en prognastisk modell för skolresultat samt bör en undersökning på alternativa regressions modeller förutom linjär multipel regression göras. I studiens urval av nyanlända elever från kommunerna, har majoriteten inte använt eller knappt använt Studi.se även om dessa kommuner haft tillgång till denna resurs.

Using Multiple Linear Regression to Estimate Customer Profitability in Consumer Credits / Använda Multipel Linjär Regression för att Estimera Kundlönsamhet i Konsumentkrediter

Almgren, Andreas January 2021 (has links)
In cooperation with a consumer credit company based in Stockholm, this bachelor thesis investigates if the customer profitability in the consumer credit market can be predicted with multiple linear regression. Data collected before the initial credit was accepted and data connected to the account activity of the customers' first nine months are analyzed. Further, it is examined if the findings could be useful in a profitability analysis and as a reduction of adverse selection. The findings show that a number of covariates express promising correlations with the costumer profitability. However, the prediction error is high and not efficient in individual cases. Further, some reduction in adverse selection, due to a decrease in asymmetric information between the customers and the company, can be identified, but further research is encouraged. Finally, potential improvements are discussed, especially concerning the choice of regression algorithm. / I samarbete med ett konsumentkreditbolag baserat i Stockholm undersöker detta kandidatexamensarbete om kundlönsamhet inom marknaden för konsumentkrediter kan förutsägas med hjälp av multipel linjär regression. Data består av information som insamlades innan den initiala kreditförfrågningen accepterades, och av kontoaktivitet under kundens nio första månader. Vidare undersöks om resultatet kan användas i en lönsamhetsanalys och som en metod för att minska snedvridet urval.  Resultatet visar att ett antal kovariat uttrycker en lovande korrelation med kundlönsamheten. Dessvärre är felen från förutsägelserna stora och därför ineffektiva gällande estimering av individuella kunder. Fortsättningsvis kan det identifieras viss reduktion av snedvridet urval som en följd av minskad informationsasymmetri mellan kunderna och företaget, men vidare undersökning uppmuntras. Avslutningsvis diskuteras ett antal förbättringsmöjligheter, framför allt gällande val av regressionsalgoritm.

Evaluation of Machine Learning Methods for Time Series Forecasting on E-commerce Data / Utvärdering av Maskininlärningsmodeller för tidsserie-prognotisering på e-handels data

Abrahamsson, Peter, Ahlqvist, Niklas January 2022 (has links)
Within demand forecasting, and specifically within the field of e-commerce, the provided data often contains erratic behaviours which are difficult to explain. This induces contradictions to the common assumptions within classical approaches for time series analysis. Yet, classical and naive approaches are still commonly used. Machine learning could be used to alleviate such problems. This thesis evaluates four models together with Swedish fin-tech company QLIRO AB. More specifically, a MLR (Multiple Linear Regression) model, a classic Box-Jenkins model (SARIMAX), an XGBoost model, and a LSTM-network (Long Short-Term Memory). The provided data consists of aggregated total daily reservations by e-merchants within the Nordic market from 2014. Some data pre processing was required and a smoothed version of the data set was created for comparison. Each model was constructed according to their specific requirements but with similar feature engineering. Evaluation was then made on a monthly level with a forecast horizon of 30 days during 2021. The results shows that both the MLR and the XGBoost provides the most consistent results together with perks for being easy to use. After these two, the LSTM-network showed the best results for November and December on the original data set but worst overall. Yet it had good performance on the smoothed data set and was then comparable to the first two. The SARIMAX was the worst performing of all the models considered in this thesis and was not as easy to implement. / Inom efterfrågeprognoser, och specifikt inom området e-handel, innehåller den tillhandahållna informationen ofta oberäkneliga beteenden som är svåra att förklara. Detta motsäger vanliga antaganden inom tidsserier som används för de mer klassiska tillvägagångssätten. Ändå är klassiska och naiva metoder fortfarande vanliga. Maskininlärning skulle kunna användas för att lindra sådana problem. Detta examensarbete utvärderar fyra modeller tillsammans med det svenska fintechföretaget QLIRO AB. Mer specifikt en MLR-modell (Multiple Linear Regression), en klassisk Box-Jenkins-modell (SARIMAX), en XGBoost-modell och ett LSTM-nätverk (Long Short-Term Memory). Den tillhandahållna informationen består av aggregerade dagliga reservationer från e-handlare inom den nordiska marknaden från 2014. Viss dataförbehandling krävdes och en utjämnad version av datamängden skapades för jämförelse. Varje modell konstruerades enligt deras specifika krav men med liknande \textit{feature engineering}. Utvärderingen gjordes sedan på månadsnivå med en prognoshorisont på 30 dagar under 2021. Resultaten visar att både MLR och XGBoost ger de mest pålitliga resultaten tillsammans med fördelar som att vara lätta att använda. Efter dessa visar LSTM-nätverket de bästa resultaten för november och december på den ursprungliga datamängden men sämst totalt sett. Ändå visar den god prestanda på den utjämnade datamängden och var sedan jämförbar med de två första modellerna. SARIMAX var den sämst presterande av alla jämförda modeller och inte lika lätt att implementera.

Factors Affecting Employment Duration in the Food Retail Industry / Faktorer som Påverkar Anställningens Varaktighet i Dagligvaruhandeln

Sundling, Beata, Höft, Lova January 2023 (has links)
Measuring and tracking the employee turnover rate is a crucial part when evaluating a company’s performance. An important part of this is measuring the employment duration within an organization. The purpose of this report is to investigate if employment duration in a food retail company can be explained by predetermined variables using multiple linear regression. Data from five years ago until today has been collected and processed to analyze and fit the best choice of the linear model. Gender, employment rate, industry experience and age are the predictors used for conducting the analysis. The result shows that a low linear correlation can be seen between employment duration and the explanatory variables: gender, employment rate, industry experience and age. In the discussion, the results are analyzed as well as potential problems and improvements of the regression.

Travel time estimation in congested urban networks using point detectors data

Mahmoud, Anas Mohammad 02 May 2009 (has links)
A model for estimating travel time on short arterial links of congested urban networks, using currently available technology, is introduced in this thesis. The objective is to estimate travel time, with an acceptable level of accuracy for real-life traffic problems, such as congestion management and emergency evacuation. To achieve this research objective, various travel time estimation methods, including highway trajectories, multiple linear regression (MLR), artificial neural networks (ANN) and K –nearest neighbor (K-NN) were applied and tested on the same dataset. The results demonstrate that ANN and K-NN methods outperform linear methods by a significant margin, also, show particularly good performance in detecting congested intervals. To ensure the quality of the analysis results, set of procedures and algorithms based on traffic flow theory and test field information, were introduced to validate and clean the data used to build, train and test the different models.

Modelling Factors Affecting Academic Performance in Swedish Schools with Multiple Linear Regression / Modellering av faktorer som påverkar studieresultat i svenska skolor med multipel linjär regression

Breivold, Johanna January 2023 (has links)
This bachelor thesis examines factors affecting the academic performance in Swedish schools. Specifically, the average qualification point among ninth grade students in schools in Stockholm municipality during the academic year 2021-2022 are studied. Multiple linear regression is used to identify individual, social, and school specific factors which have a significant impact on the average qualification point in schools. The purpose is to identify factors affecting the academic performance, and by that contribute to the knowledge base constituting the foundation for the work to improve the academic performance and provide equal opportunities for all students. The Swedish grading system, previous research on factors affecting students' performance, and the Swedish school in a societal perspective are also discussed. The findings indicate that the background of the students, the parents' level of education, and the number of students per teacher are good predictors for academic performance. / Denna kandidatuppsats undersöker faktorer som påverkar studieresultatet i svenska skolor. Specifikt studeras det genomsnittliga betyget bland elever i årskurs nio i Stockholms kommuns skolor under läsåret 2021-2022. Multipel linjär regression används för att identifiera individfaktorer, sociala faktorer och skolspecifika faktorer som har en signifikant inverkan på skolors genomsnittliga betyg. Syftet är att identifiera faktorer som påverkar studieresultatet och därmed bidra till kunskapsbasen som utgör grunden för arbetet med att förbättra studieresultat och tillhandahålla lika möjligheter för alla elever. Det svenska betygssystemet, tidigare forskning kring faktorer som påverkar elevers studieprestation samt den svenska skolan i ett samhälleligt perspektiv diskuteras också. Resultatet tyder på att elevernas bakgrund, föräldrarnas utbildningsnivå och antalet elever per lärare är bra prediktorer för akademisk prestation.

