Spelling suggestions: "subject:"multipel linjär degression"" "subject:"multipel linjär aregression""
31 |
An investigation of the relationship between online activity on Studi.se and academic grades of newly arrived immigrant students : An application of educational data miningMenon, Akash, Islam, Nahida January 2017 (has links)
This study attempts to analyze the impact of an online educational resource on academic performances among newly arrived immigrant students in Sweden between the grade six to nine in the Swedish school system. The study focuses on the web based educational resource called Studi.se made by Komplementskolan AB.The aim of the study was to investigate the relationship between academic performance and using Studi.se. Another purpose was to see what other factors that can impact academic performances.The study made use of the data mining process, Cross Industry Standard for Data Mining (CRISP-DM), to understand and prepare the data and then create a regression model that is evaluated. The regression model tries predict the dependent variable of grade based on the independent variables of Studi.se activity, gender and years in Swedish schools. The used data set includes the grades in mathematics, physics, chemistry, biology and religion of newly arrived students in Sweden from six municipalities that have access to Studi.se. The data used also includes metrics of the student’s activity on Studi.se.The results show negative correlation between grade and gender of the student across all subjects. In this report, the negative correlation means that female students perform better than male students. Furthermore, there was a positive correlation between number of years a student has been in the same school and their academic grade. The study could not conclude a statistically significant relationship between the activity on Studi.se and the students’ academic grade.Additional explanatory independent variables are needed to make a predictive model as well as investigating alternative regression models other than multiple linear regression. In the sample, a majority of the students have little or no activity on Studi.se despite having free access to the resource through the municipality. / Denna studie analyserar inverkan som digitala läromedel har på skolbetyg bland nyanlända elever i Sverige mellan årskurs sex och nio i det svenska skolsystemet. Studien fokuserar på den webbaserade pedagogisk resursen Studi.se, gjord av Komplementskolan AB.Målet med studien var att undersöka relationen mellan skolresultat och användandet av Studi.se. Ett annat syfte var att undersöka vad för andra faktorer som kan påverka skolresultat.Studien använder sig av datautvinningsprocessen, Cross Industry Standard for Datamining (CRISP-DM), för att förstå, förbereda och analysera datan i form av en regressionsmodell som sedan evalueras. Datasamlingen som används innehåller bland annat skolbetyg i ämnena matematik, fysik, kemi, biologi och religion från sex kommuner som har tillgång till Studi.se. Aktivitet hos eleverna från dessa kommuner på Studi.se hemsidan användes också för studien.Resultaten visar en negativ korrelation mellan betyg och kön hos eleverna i alla ämnena. Den negativa korrelationen betyder i denna rapport att tjejer får bättre betyg i genomsnitt än killar hos urvalet av nyanlända från de sex kommunerna. Dessutom fanns det en positiv korrelation mellan antal år en elev varit i skolan alternativt i svenska skolsystemet och deras betyg. Studien kunde inte säkerställa ett statistisk signifikant resultat mellan aktivitet på Studi.se och elevernas skolresultat.Ett flertal förklarande oberoende variabler behövs för att kunna skapa en prognastisk modell för skolresultat samt bör en undersökning på alternativa regressions modeller förutom linjär multipel regression göras. I studiens urval av nyanlända elever från kommunerna, har majoriteten inte använt eller knappt använt Studi.se även om dessa kommuner haft tillgång till denna resurs.
|
32 |
Using Multiple Linear Regression to Estimate Customer Profitability in Consumer Credits / Använda Multipel Linjär Regression för att Estimera Kundlönsamhet i KonsumentkrediterAlmgren, Andreas January 2021 (has links)
In cooperation with a consumer credit company based in Stockholm, this bachelor thesis investigates if the customer profitability in the consumer credit market can be predicted with multiple linear regression. Data collected before the initial credit was accepted and data connected to the account activity of the customers' first nine months are analyzed. Further, it is examined if the findings could be useful in a profitability analysis and as a reduction of adverse selection. The findings show that a number of covariates express promising correlations with the costumer profitability. However, the prediction error is high and not efficient in individual cases. Further, some reduction in adverse selection, due to a decrease in asymmetric information between the customers and the company, can be identified, but further research is encouraged. Finally, potential improvements are discussed, especially concerning the choice of regression algorithm. / I samarbete med ett konsumentkreditbolag baserat i Stockholm undersöker detta kandidatexamensarbete om kundlönsamhet inom marknaden för konsumentkrediter kan förutsägas med hjälp av multipel linjär regression. Data består av information som insamlades innan den initiala kreditförfrågningen accepterades, och av kontoaktivitet under kundens nio första månader. Vidare undersöks om resultatet kan användas i en lönsamhetsanalys och som en metod för att minska snedvridet urval. Resultatet visar att ett antal kovariat uttrycker en lovande korrelation med kundlönsamheten. Dessvärre är felen från förutsägelserna stora och därför ineffektiva gällande estimering av individuella kunder. Fortsättningsvis kan det identifieras viss reduktion av snedvridet urval som en följd av minskad informationsasymmetri mellan kunderna och företaget, men vidare undersökning uppmuntras. Avslutningsvis diskuteras ett antal förbättringsmöjligheter, framför allt gällande val av regressionsalgoritm.
|
33 |
Evaluation of Machine Learning Methods for Time Series Forecasting on E-commerce Data / Utvärdering av Maskininlärningsmodeller för tidsserie-prognotisering på e-handels dataAbrahamsson, Peter, Ahlqvist, Niklas January 2022 (has links)
Within demand forecasting, and specifically within the field of e-commerce, the provided data often contains erratic behaviours which are difficult to explain. This induces contradictions to the common assumptions within classical approaches for time series analysis. Yet, classical and naive approaches are still commonly used. Machine learning could be used to alleviate such problems. This thesis evaluates four models together with Swedish fin-tech company QLIRO AB. More specifically, a MLR (Multiple Linear Regression) model, a classic Box-Jenkins model (SARIMAX), an XGBoost model, and a LSTM-network (Long Short-Term Memory). The provided data consists of aggregated total daily reservations by e-merchants within the Nordic market from 2014. Some data pre processing was required and a smoothed version of the data set was created for comparison. Each model was constructed according to their specific requirements but with similar feature engineering. Evaluation was then made on a monthly level with a forecast horizon of 30 days during 2021. The results shows that both the MLR and the XGBoost provides the most consistent results together with perks for being easy to use. After these two, the LSTM-network showed the best results for November and December on the original data set but worst overall. Yet it had good performance on the smoothed data set and was then comparable to the first two. The SARIMAX was the worst performing of all the models considered in this thesis and was not as easy to implement. / Inom efterfrågeprognoser, och specifikt inom området e-handel, innehåller den tillhandahållna informationen ofta oberäkneliga beteenden som är svåra att förklara. Detta motsäger vanliga antaganden inom tidsserier som används för de mer klassiska tillvägagångssätten. Ändå är klassiska och naiva metoder fortfarande vanliga. Maskininlärning skulle kunna användas för att lindra sådana problem. Detta examensarbete utvärderar fyra modeller tillsammans med det svenska fintechföretaget QLIRO AB. Mer specifikt en MLR-modell (Multiple Linear Regression), en klassisk Box-Jenkins-modell (SARIMAX), en XGBoost-modell och ett LSTM-nätverk (Long Short-Term Memory). Den tillhandahållna informationen består av aggregerade dagliga reservationer från e-handlare inom den nordiska marknaden från 2014. Viss dataförbehandling krävdes och en utjämnad version av datamängden skapades för jämförelse. Varje modell konstruerades enligt deras specifika krav men med liknande \textit{feature engineering}. Utvärderingen gjordes sedan på månadsnivå med en prognoshorisont på 30 dagar under 2021. Resultaten visar att både MLR och XGBoost ger de mest pålitliga resultaten tillsammans med fördelar som att vara lätta att använda. Efter dessa visar LSTM-nätverket de bästa resultaten för november och december på den ursprungliga datamängden men sämst totalt sett. Ändå visar den god prestanda på den utjämnade datamängden och var sedan jämförbar med de två första modellerna. SARIMAX var den sämst presterande av alla jämförda modeller och inte lika lätt att implementera.
|
34 |
Factors Affecting Employment Duration in the Food Retail Industry / Faktorer som Påverkar Anställningens Varaktighet i DagligvaruhandelnSundling, Beata, Höft, Lova January 2023 (has links)
Measuring and tracking the employee turnover rate is a crucial part when evaluating a company’s performance. An important part of this is measuring the employment duration within an organization. The purpose of this report is to investigate if employment duration in a food retail company can be explained by predetermined variables using multiple linear regression. Data from five years ago until today has been collected and processed to analyze and fit the best choice of the linear model. Gender, employment rate, industry experience and age are the predictors used for conducting the analysis. The result shows that a low linear correlation can be seen between employment duration and the explanatory variables: gender, employment rate, industry experience and age. In the discussion, the results are analyzed as well as potential problems and improvements of the regression.
|
35 |
Modelling Factors Affecting Academic Performance in Swedish Schools with Multiple Linear Regression / Modellering av faktorer som påverkar studieresultat i svenska skolor med multipel linjär regressionBreivold, Johanna January 2023 (has links)
This bachelor thesis examines factors affecting the academic performance in Swedish schools. Specifically, the average qualification point among ninth grade students in schools in Stockholm municipality during the academic year 2021-2022 are studied. Multiple linear regression is used to identify individual, social, and school specific factors which have a significant impact on the average qualification point in schools. The purpose is to identify factors affecting the academic performance, and by that contribute to the knowledge base constituting the foundation for the work to improve the academic performance and provide equal opportunities for all students. The Swedish grading system, previous research on factors affecting students' performance, and the Swedish school in a societal perspective are also discussed. The findings indicate that the background of the students, the parents' level of education, and the number of students per teacher are good predictors for academic performance. / Denna kandidatuppsats undersöker faktorer som påverkar studieresultatet i svenska skolor. Specifikt studeras det genomsnittliga betyget bland elever i årskurs nio i Stockholms kommuns skolor under läsåret 2021-2022. Multipel linjär regression används för att identifiera individfaktorer, sociala faktorer och skolspecifika faktorer som har en signifikant inverkan på skolors genomsnittliga betyg. Syftet är att identifiera faktorer som påverkar studieresultatet och därmed bidra till kunskapsbasen som utgör grunden för arbetet med att förbättra studieresultat och tillhandahålla lika möjligheter för alla elever. Det svenska betygssystemet, tidigare forskning kring faktorer som påverkar elevers studieprestation samt den svenska skolan i ett samhälleligt perspektiv diskuteras också. Resultatet tyder på att elevernas bakgrund, föräldrarnas utbildningsnivå och antalet elever per lärare är bra prediktorer för akademisk prestation.
|
36 |
Macroeconomic Factors' Impact on Sweden’s CO2e Emissions - A Multiple Linear Regression Analysis / Makroekonomiska faktorers påverkan på Sveriges CO2e-utsläpp - En multipel linjär regressionsanalysMagnusson, Johan, Nilsson, Axel January 2023 (has links)
This study investigated the relationship between Sweden’s CO2e (Carbon Dioxide Equivalent) emissions and key macroeconomic factors, for the period 2008Q1- 2022Q3. The aim was to enhance the understanding of the link between macroeconomic factors and greenhouse gas emissions in a post-industrial economy, using multiple regression analysis. The study identified several significant macroeconomic factors affecting CO2e emissions and examined the extent to which these variables explain the fluctuations in Sweden’s emissions. Additionally, the study assessed the validity of the Environmental Kuznets Curve and Porter Hypothesis within Sweden’s environmental context. In the study, two multiple regression models were developed. Model 1 had an R^2 of 0.90, using the macroeconomic variables Industry Fuel Consumption, Population, Net Export, and Oil Prices. However, since the first model displayed moderate autocorrelation, a second model was also built by introducing a lagged dependent variable which yielded an R^2 of 0.92. / Denna studie undersökte förhållandet mellan Sveriges CO2e (koldioxidekvivalent) utsläpp och centrala makroekonomiska faktorer för perioden 2008K1-2022K3. Syftet var att öka förståelsen för sambandet mellan makroekonomiska faktorer och växthusgasutsläpp i en postindustriell ekonomi, med användning av multipel regressionsanalys. Studien identifierade flera betydande makroekonomiska faktorer som påverkar CO2e-utsläpp och undersökte i vilken utsträckning dessa variabler förklarar fluktuationerna i Sveriges utsläpp. Dessutom utvärderade studien giltigheten av Miljökuznetskurvan och Porters hypotes inom ramen för Sveriges miljökontext. I studien skapades två multipel regressionsmodeller. Modell 1 hade ett R^2 på 0,90, med de makroekonomiska variablerna Industriell Bränsleförbrukning, Befolkning, Nettoexport och Oljepriser. Eftersom den första modellen visade måttlig autokorrelation byggdes dock även en andra modell genom att införa en fördröjd beroende variabel, vilket resulterade i ett R^2 på 0,92.
|
37 |
Bid Forecasting in Public Procurement / Budgivningsmodeller i offentliga upphandlingarStiti, Karim, Yape, Shih Jung January 2019 (has links)
Public procurement amounts to a significant part of Sweden's GDP. Nevertheless, it is an overlooked sector characterized by low digitization and inefficient competition where bids are not submitted based on proper mathematical tools. This Thesis seeks to create a structured approach to bidding in cleaning services by determining factors affecting the participation and pricing decision of potential buyers. Furthermore, we assess price prediction by comparing multiple linear regression models (MLR) to support vector regression (SVR). In line with previous research in the construction sector, we find significance for several factors such as project duration, location and type of contract on the participation decision in the cleaning sector. One notable deviant is that we do not find contract size to have an impact on the pricing decision. Surprisingly, the performance of MLR are comparable to more advanced SVR models. Stochastic dominance tests on price performance concludes that experienced bidders perform better than their inexperienced counterparts and companies place more competitive bids in lowest price tenders compared to economically most advantageous tenders (EMAT) indicating that EMAT tenders are regarded as unstructured. However, no significance is found for larger actors performing better in bidding than smaller companies. / Offentliga upphandlingar utgör en signifikant del av Sveriges BNP. Trots detta är det en förbisedd sektor som karakteriseras av låg digitalisering och ineffektiv konkurrens där bud läggs baserat på intuition snarare än matematiska modeller. Denna avhandling ämnar skapa ett strukturerat tillvägagångssätt för budgivning inom städsektorn genom att bestämma faktorer som påverkar deltagande och prissättning. Vidare undersöker vi prisprediktionsmodeller genom att jämföra multipel linjära regressionsmodeller med en maskininlärningsmetod benämnd support vector regression. I enlighet med tidigare forskning i byggindustrin finner vi att flera faktorer som typ av kontrakt, projekttid och kontraktsplats har en statistisk signifikant påverkan på deltagande i kontrakt i städindustrin. En anmärkningsvärd skillnad är att kontraktsvärdet inte påverkar prissättning som tidigare forskning visat i andra områden. För prisprediktionen är det överraskande att den enklare linjära regressionsmodellen presterar jämlikt till den mer avancerade maskininlärningsmodellen. Stokastisk dominanstest visar att erfarna företag har en bättre precision i sin budgivning än mindre erfarna företag. Därtill lägger företag överlag mer konkurrenskraftiga bud i kontrakt där kvalitetsaspekter tas i beaktning utöver priset. Vilket kan indikera att budgivare upplever dessa kontrakt som mindre strukturerade. Däremot finner vi ingen signifikant skillnad mellan större och mindre företag i denna bemärkning.
|
38 |
Using Regression Analysis to Evaluate KPI Implementation at Volvo Penta North America / Användning av regressionsanalys för att utvärdera implementeringen av en ny KPI på Volvo Penta North AmericaH. Granlund, Gustav, Söderholm, Marcus January 2022 (has links)
Most companies want to measure the performance of various areas of their operations. By doing so, it is easier to identify weaknesses or problems and take action to improve the performance in those areas. This study is conducted in collaboration with Volvo Penta North America and seeks to evaluate the possibilities of implementing a performance indicator for their dealers. The aim of this thesis is to investigate if there is a correlation between Volvo Penta’s evaluation system for their dealers, their Dealer Operating Standard score (DOS-Score) and their respective Sales Revenue, as well as the individual segments of the DOS and the Sales Revenue. In other words, if the evaluation system can be used as a performance indicator for how good the financial performance of a dealer is. The analysis is based on first-party data from Penta regarding the operation of Penta’s dealers. By using Linear Regression, it was found that the Adjusted R-Squared of the model with Aggregated DOS against Sales Revenue was 0.1403 and the Adjusted R-Squared for the model with the Segmented DOS against Sales Revenue was 0.1983. Thus, there is no significant correlation between the Aggregated DOS and Sales Revenue. However the results from the Segmented DOS-score against Sales Revenue indicates that it is possible to improve on the current DOS algorithm. Further research with more confounders considered is required to improve the model. / De flesta företag vill mäta resultatet av olika delar av verksamheten. På så sätt är det lättare att identifiera svagheter eller problem och vidta åtgärder för att förbättra resultaten inom dessa områden. Den här studien genomförs i samarbete med Volvo Penta North America och syftar till att utvärdera möjligheterna att införa en performance indicator för deras återförsäljare. Syftet med denna studie är att undersöka om det finns ett samband mellan Volvo Pentas utvärderingssystem, Dealer Operating Standard (DOS), för sina återförsäljare och deras respektive försäljningsintäkter, samt de enskilda segmenten av DOS och försäljningsintäkterna. Med andra ord, om utvärderingssystemet kan användas som en performance indicator för hur bra en återförsäljares ekonomiska resultat är. Analysen bygger på förstahandsdata från Penta om verksamheten hos återförsäljarna. Genom att använda linjär regression fann man att Adjusted R-Squared för modellen med Aggregerad DOS mot försäljningsintäkter var 0,1403 och Adjusted R-Squared för modellen med Segmenterad DOS mot försäljningsintäkter var 0,1983. Det finns alltså ingen signifikant korrelation mellan Aggregated DOS och försäljningsintäkter. Resultaten från det segmenterade DOS-värdet mot försäljningsintäkterna visar dock att det är möjligt att förbättra den nuvarande DOS-algoritmen. Det krävs ytterligare forskning där fler utomstående faktorer beaktas för att förbättra modellen.
|
39 |
Determining the impact of ESG metrics on the financial performance of public Nordic companies / Betydelsen av ESG-mått på finansiell prestation för publika Nordiska företagHagéus, Tom, Nyhrén, Malin January 2021 (has links)
The use of sustainability within the investment community is becoming increasingly common. More specifically, investors are now more than ever leaning towards ESG scores as a way of incorporating a more holistic approach when making investment decisions. However, the evidence for a relationship between financial performance and ESG scores is inconsistent. Besides, a recent study has also shown a large divergence between ESG scores. Together this urges a need for a more in-depth understanding of which, if any, non-financial metrics have an impact on financial performance. Therefore, this study investigated if there is any relationship between ESG metrics and financial performance for Nordic public companies by performing a multiple linear regression analysis. Our results concluded that such a relationship exists, both for accounting-based ROA and market-based Tobin’s Q between 2017-2018. This study also shows that there is an overall concentration towards social metrics for both models. Secondly, it shows that some metrics such as “Percentage of Female Employees” are positively significant for ROA but not valued by the market model. The opposite outcome also exists where “Code of Conduct/Ethics Policy” is positively significant for Tobin’s Q but not for ROA. Lastly, it is also shown that some important metrics are negative significant for ROA and therefore urging for inclusion of non-financial measurements when making strategic decisions. / Användandet av hållbarhet inom investeringssfären blir allt vanligare. Investerare förlitar sig allt mer på ESG-betyg som ett sätt att integrera en helhetssyn när de fattar investeringsbeslut. Bevisen för ett samband mellan finansiell prestation och ESG-betyg är dock inkonsekventa. Dessutom har en ny studie också påvisat stora skillnader mellan ESG-betyg. Tillsammans skapar detta ett behov av mer fördjupad förståelse för vilka, om ens några, icke finansiella mått som har en inverkan på den finansiella prestationen. Därför undersökte denna studie om det finns något samband mellan ESG-mått och finansiell prestation för nordiska börsnoterade företag genom att utföra en multipel linjär regressionsanalys. Resultaten konkluderade att en sådan relation existerar, både för det bokföringsbaserade måttet ROA och marknadsbaserade måttet Tobin’s Q mellan 2017-2018. Studien visar också att det finns en övergripande koncentration mot sociala mått för båda modellerna. Efter det visas det även att mått som exempelvis “Percentage of Female Employees” är positivt signifikanta för ROA men inte signifikanta alls för Tobin’s Q. Ett liknande men motsatt resultat finns också då måttet “Code of Conduct/Ethics Policy” är positivt signifikant för Tobin’s Q men inte för ROA. Slutligen visar också denna studie på att det finns viktiga mått som visar en negativ signifikans med ROA och att det därför är viktigt att även inkludera icke-finansiella mått när strategiska beslut ska fattas.
|
40 |
ML implementation for analyzing and estimating product prices / ML implementation för analys och estimation av produktpriserKenea, Abel Getachew, Fagerslett, Gabriel January 2024 (has links)
Efficient price management is crucial for companies with many different products to keep track of, leading to the common practice of price logging. Today, these prices are often adjusted manually, but setting prices manually can be labor-intensive and prone to human error. This project aims to use machine learning to assist in the pricing of products by estimating the prices to be inserted. Multiple machine learning models have been tested, and an artificial neural network has been implemented for estimating prices effectively. Through additional experimentation, the design of the network was fine-tuned to make it compatible with the project’s needs. The libraries used for implementing and managing the machine learning models are mainly ScikitLearn and TensorFlow. As a result, the trained model has been saved into a file and integrated with an API for accessibility.
|
Page generated in 0.1116 seconds