• Refine Query
  • Source
  • Publication year
  • to
  • Language
  • 220
  • 48
  • Tagged with
  • 268
  • 268
  • 264
  • 263
  • 107
  • 106
  • 93
  • 79
  • 79
  • 54
  • 50
  • 37
  • 36
  • 28
  • 27
  • About
  • The Global ETD Search service is a free service for researchers to find electronic theses and dissertations. This service is provided by the Networked Digital Library of Theses and Dissertations.
    Our metadata is collected from universities around the world. If you manage a university/consortium/country archive and want to be added, details can be found on the NDLTD website.
91

Modelling of Corneal Surface - A Method for Reconstruction of Corneal Surface in a Wearable Eye Tracking Device / Modellering av Hornhinnans Yta - En Metod för Rekonstruktion av Hornhinnans Yta i en Bärbar Blickberäkningsenhet

Frost, Johanna January 2022 (has links)
We investigate a method for reconstructing the anterior corneal surface using wearable eye tracking devices. The presented method assumes that the four reflection points from two light sources viewed by two cameras lie on a locally spherical surface of a cornea. We then can iteratively estimate the points on the cornea surface by optimizing the local spheres’ center points and radii. Reconstructed surface heights and curvatures are thereafter obtained by polynomial regression. Synthetic data consisting of recordings of images capturing the eyes and corneal reflections from different gaze angles and different corneal shapes are generated for reconstruction and evaluation. The estimated polynomial parameters are compared to the ground truth values of the synthetic data. A spherical cornea, the simplest case used for method verification, can be reconstructed with an order of accuracy of 10−3mm for the cornea radius. We also investigate the impact of different distances between eye and camera setup on the cornea surface reconstruction. For shorter distances, fewer surface points can be computed, and the distance between points of reflection on the surface increases, making the assumption of a local spherical surface less accurate. Therefore, only a lower order of polynomials can be accurately estimated. Contrarily, for longer distances, more surface points can be computed and the assumption of a local spherical surface is more accurate. More accurate and stable results can then be obtained with surface height errors of the order 10−1mm. Given the simple setup using two cameras and ten light sources per eye, the presented method showed great potential for capturing the anterior corneal height and curvature over time. The results should not be generalized to real data without further investigation. / Vi undersökte en metod för att rekonstruera den främre hornhinneytan med hjälp av en bärbar ögonspårningsenhet. Den presenterade metoden baseras på antagandet att reflektionspunkter på hornhinnans yta från två belysare, sett från två kameror, ligger på en lokal sfärisk yta. Vi kan då då iterativt estimera punkterna genom att optimera mittpunkt och radie för lokala sfärer. Syntetisk data består av inspelningar med bilder på ögonen och reflektioner på hornhinnan för olika blickvinklar och former på hornhinnan. Beräknade parametrar för polynomen jämförs med sanna värden för den syntetiska datan. En sfärisk hornhinna, det enklaste fallet som undersöktes för att verifiera metoden kunde rekonstrueras med precision 10−3mm för radien. Vi undersökte även hur avståndet mellan öga och kameror påverkade resultaten. För kortare avstånd kunde färre punkter på ytan beräknas och antaget om lokala sfäriska ytor är mindre korrekt då reflektionspunkter ligger längre från varandra. Dimensionaliteten på rekonstruktionspolynomet behöver därmed begränsas. Vid längre avstånd kan istället fler punkter beräknas, och antagandet om en lokal sfärisk yta är mer korrekt. Mer exakta och stabila resultat kan då fås med fel i storleksordningen 10−1mm. Givet den enkla uppsättningrn med två kameror och tio belysare per öga, visar den presenterade metoden potential för att kunna beräkna höjd samt kurvatur för den främre hornhinneytan över tid. Resultaten bör inte generaliseras till riktig data utan vidare undersökningar.
92

p-Laplacian Spectral Clustering Applied in Software Testing / p-Laplacian Spektralklustring tillämpat på mjukvarutestning

Ghafoory, Jones January 2019 (has links)
Software testing plays a vital role in the software development life cycle. Having a more accurate and cost-efficient testing process is still demanded in the industry. Thus, test optimization becomes an important topic in both state of the art and state of the practice. Software testing today can be performed manually, automatically or semi-automatically. A manual test procedure is still popular for testing for instance in safety critical systems. For testing a software product manually, we need to create a set of manual test case specifications. The number of required test cases for testing a product is dependent on the product size, complexity, the company policies, etc. Moreover, generating and executing test cases manually is a time and resource consuming process. Therefore, ranking the test cases for execution can help us reduce the testing cost and also release the product faster to the market. In order to rank test cases for execution, we need to distinguish test cases from each other. In other words, the properties of each test case should be detected in advance. Requirement coverage is detected as a critical criterion for test cases optimization. In this thesis we propose an approach based on a $p$-Laplacian Spectral Clustering for detecting the traceability matrix between manual test cases and the requirements, in order to find the requirement coverage for the test cases. However, the feasibility of the proposed approach is studied by an empirical evaluation which has been performed on a railway use-case at Bombardier Transportation in Sweden. Through the experiments performed using our proposed method it was able to achieve an $F_1$-score up to $4.4\%$. Although the proposed approach under-performed for this specific problem compared to previous studies, it was possible to get some insights on what limitations $p$-Laplacian Spectral Clustering have and how it could potentially be modified for similar kind of problems. / Mjukvarutestning har en viktig roll inom mjukvaruutveckling. Att ha en mer exakt och kostnadseffektiv testprocess är efterfrågad i industrin. Därför är testoptimering ett viktigt ämne inom forskning och i praktiken. Idag kan mjukvarutestning utföras manuellt, automatiskt eller halvautomatiskt. En manuell testprocess är fortfarande populär för att testa säkerhetskritiska system. För att testa en programvara manuellt så måste vi skapa en uppsättning specifikationer för testfall. Antalet testfall som behövs kan bero på bland annat produktens storlek, komplexitet, företagspolicys etc. Att generera och utföra testfall manuellt är ofta en tids- och resurskrävande process. För att minska testkostnader och för att potentiellt sett kunna släppa produkten till marknaden snabbare kan det därför vara av intresse att rangordna vilka test fall som borde utföras. För att göra rangordningen så måste testfallens särskiljas på något vis. Med andra ord så måste varje testfalls egenskaper upptäckas i förväg. En viktig egenskap att urskilja från testfallen är hur många krav testfallet omfattar. I det här projektet tar vi fram en metod baserad på $p$-Laplacian spektralklustring för att hitta en spårbarhetsmatris mellan manuella testfall och krav för att ta reda på vilka krav som omfattas av alla testfall. För att evaluera metodens lämplighet så jämförs den mot en tidigare empirisk studie av samma problem som gjordes på ett järnvägsbruk hos Bombardier Transportation i Sverige. Från de experiment som utfördes med vår framtagna metod så kunde ett $F_1$-Score på $4.4\%$ uppnås. Även om den metod som togs fram i detta projekt underpresterade för det här specifika problemet så kunde insikter om vilka begränsningar $p$-Laplacian spektralklustring har och hur de potentiellt sett kan behandlas för liknande problem.
93

Modeling and Optimization of the Early Baggage Storage at Stockholm Arlanda Airport Terminal 5 / Modellering och Optimering av Early Baggage Storage på Stockholm Arlanda Airport Terminal 5

Ageling, Lisette, Alm, Ture January 2022 (has links)
This report was written in cooperation with Swedavia and aimed to examine and optimize the time before flight departure the chutes should open. Chutes are the last state before the baggage is transported to the plane. Currently, the chutes open two hours before departure. If baggage arrives while its corresponding chute is closed it will go to the Early Baggage System (EBS) where it will stay until two hours before departure. Afterward, the baggage will be transported to its corresponding chute. By reducing the time in the chute, the airport would utilize the EBS more efficiently and make the chutes available to more planes. To examine the resilience of the system it was modeled and simulated in Matlab. The parameters that were used to simulate the model were taken from a data set provided by Swedavia. The conclusion is that there's a possibility for higher utilization of the EBS by lowering the allotted times of chutes per flight and thereby freeing capacity in the makeup sector. This should be further investigated to see the effects of additional processes in the baggage handling system. / Denna rapport skrevs i samarbete med Swedavia och syftar till att undersöka och optimera tiden innan avgång som utsorteringsfickorna bör öppna. Utsorteringsfickorna är det sista stadiet innan bagaget transporteras till planet. I dagsläget öppnar utsorteringsfickorna två timmar innan avgång. Om bagaget anländer mer än två timmar innan avgång så hamnar väskan i Early Baggage System (EBS). Där kommer väskan att stanna tills det är två timmar till avgång och sedan transporteras till den korresponderande utsorteringsfickan. Genom att minska tiden som bagaget spenderar i utsorteringsfickan skulle flygplatsen kunna utnyttja EBS:en mer effektivt och göra utsorteringsfickor mer tillgängliga för fler plan.  För att undersöka systemets resiliens så modellerades systemet för att sedan simuleras i Matlab. Parametrarna som användes för att simulera modellen estimerades ifrån ett data set som Swedavia tillhandahöll. Slutsatsen från simuleringen var att det är möjligt att använda EBS mer effektivt genom att minska tiden i utsorteringsfickorna. Man bör därmed undersöka vidare för att se effekterna på det resterande bagagehanteringssystemet.
94

Kalman filters as an enhancement to object tracking using YOLOv7 / Kalman filter som en förbättring till objekt spårning som använder YOLOv7

Jernbäcker, Axel January 2022 (has links)
In this paper we study continuous tracking of airplanes using object detection models, namely YOLOv7, combined with a Kalman filter. The tracking should be able to be done in real-time. The idea of combining Kalman filters with an object detection model comes from the lack of time-dependent context in models such as YOLOv7. The model analyzes each frame independently and outputs airplane detections for the analyzed frame. Therefore, if an airplane flies behind a tree or a cloud, the object detection model will say that there is no object there. The Kalman filter is used to construct an object with a state consisting of position and velocity for every airplane. As such if an airplane flies behind a tree, it is possible to extrapolate the trajectory and resume tracking once the airplane is visible again, much like a human would extrapolate the trajectory naturally. In the report I describe the implementation and training of a YOLOv7 model, I further describe the construction and implementation of a Kalman filter as well as how observations are mapped on to objects in the Kalman filter. During this I introduce a parameter called cumulative confidence. This describes how long something is being tracked after observations cease. After losing sight of an object, the cumulative confidence starts to drop. When it reaches zero and the object is removed. This can take anywhere between 100 ms to 6 seconds depending on how much confidence the object has accumulated. Objects accumulate confidence by being observed and detected by the object detection model. In the results section I describe how the performance of the program changed when using a Kalman filter or when not using a Kalman filter. The results showed that continuous tracking of airborne airplanes was superior when using a Kalman filter as opposed to only using the YOLOv7 model. Continuous tracking was never lost in these 2 airborne cases when using the integrated Kalman filter. Continuous tracking was lost 5 respectively 11 times on the same cases when not using the Kalman filter. The last case in the results section, an airplane on a runway, showed the same performance with and without the Kalman filter. I go into detail why this is in both the results section and in Section 5.1 (Interpreting the results). / I detta pappret studeras kontinuerlig spårning av flygplan med hjälp av objektdetekterings-modeller, mer specifikt YOLOv7 modellen i kombination med Kalman filter. Spårningen ska kunna göras i realtid. Idén att kombinera Kalman filter med modeller för objektdetektering kommer från avsaknaden på tidsberoende kontext i modeller som YOLOv7. Modellen analyserar varje bild i en dataström oberoende och ger en utmatning med positioner av flygplan i den analyserade bilden. Därmed, om ett flygplan flyger in bakom ett träd eller ett moln så kommer modellen konstatera att det inte är ett objekt där. Kalman filtret används för att konstruera ett objekt med ett tillstånd som består av position och hastigheten av varje flygplan. På så vis om ett flygplan flyger in bakom ett träd är det möjligt att extrapolera vägen planet kommer flyga samt återuppta spårning när flygplanet blir synligt igen, på samma vis som en människa extrapolerar planets bana naturligt. I rapporten beskriver jag en implementering och träning av en YOLOv7 modell. Vidare beskriver jag konstruktionen och implementationen av ett Kalman filter, samt hur observationer mappas till objekt i Kalman filtret. Jag introducerar även en parameter som kallas “kumulativt förtroende”. Denna beskriver hur länge något spåras även efter att observationer upphör. När ett objekt ej får observationer längre så börjar det kumulativa förtroendet minska. När det når noll så tas objektet bort. Detta kan ta mellan 100 ms och sex sekunder, beroende på hur mycket förtroende objektet har ackumulerat. Objekt ackumulerar förtroende genom att bli observerade och detekterade av YOLOv7 modellen. I resultatdelen beskriver jag hur prestandan skiljer sig om programmet använder ett Kalman filter eller inte ett Kalman filter. Resultaten visar att kontinuerlig spårning av flygplan i luften var bättre när man använder ett Kalman filter. Spårningen av flygplan upphörde aldrig i de 2 fallen då flygplan var i luften. På dessa fallen så tappade modellen spårningen 5 respektive 11 gånger när den inte använde Kalman filtret. Det tredje och sista fallet i resultatdelen, ett flygplan på banan, visade samma prestanda med eller utan Kalman filtret. Jag går in i detalj kring varför det var så i resultatdelen och i diskussionen.
95

A Multiple Linear Regression Model To Assess The Effects of Macroeconomic Factors On Small and Medium-Sized Enterprises / En multipel linjär regressionsmodell för att bedöma effekterna av makroekonomiska faktorer på små och medelstora företag

Book, Emil, Ekelöf, Linus January 2019 (has links)
Small and medium-sized enterprises (SMEs) have long been considered the backbone in any country’s economy for their contribution to growth and prosperity. It is therefore of great importance that the government and legislators adopt policies that optimise the success of SMEs. Recent concerns of an impending recession has made this topic even more relevant since small companies will have greater difficulty withstanding such an event. This thesis will focus on the effects of macroeconomic factors on SMEs in Sweden, with the usage of multiple linear regression. Data was collected for a 10 year period, from 2009 to 2019 at a monthly interval. The end result was a five variable model with an coefficient of determination of 98%. / Små- och medelstora företag (SMEs) har länge varit ansedda som en av de viktigaste komponenterna i ett lands ekonomi, främst för deras bidrag till tillväxt och framgång. Det är därför mycket viktigt att regeringar och lagstiftare för en politik som främjar SMEs optimala tillväxt. Flera år av högkonjunktur och oro över kommande lågkonjunktur har gjort detta ämne ytterst relevant då små företag är de som kommer att drabbas värst av en svårare ekonomisk tillvaro. Denna rapport använder multipel linjär regression för att utvärdera effekterna av olika makroekonomiska faktorer på SMEs i Sverige. Data har insamlats månadsvis för en 10 årsperiod mellan 2009 till 2010. Resultatet blev en modell med fem variabler och en förklaringsgrad på 98%.
96

Estimation of early termination of financial derivatives / Estimera tidigt avslut av finansiella derivat

Pousette, Marcus, Domeij, Jim January 2019 (has links)
In terms of pricing financial derivatives, contractual length plays a important role in pricing risk. A contract with long duration will have more associated risk in comparison with a contract with low duration, everything else equal. In this thesis work we examine whether information about the derivative contract and involved parties (the counterparty) could be used in a model to accurately predict both probability and time if the contract would terminate earlier than the predetermined contractual length. By modelling the termination time with deep neural networks and assuming the probability distribution of termination time directly, we find that it is possible to predict when early termination of derivative contracts would occur significantly more accurate than assuming that contracts will always live to their original maturity date. / För prissättningen av finansiella derivat har kontraktets längd stor roll i värderingen av risken. Ett kontrakt som sträcker sig över lång tid har mer associerad risk i jämförelse med ett kontrakt som sträcker sig över kort tid, under förutsättningen av att kontraktet i övrigt är detsamma. I detta examensarbete undersöker vi om information om derivaten och kontraktets parter (motparten) kan användas för att med kunna förutspå sannolikheten för att ett kontrakt stängs ner tidigt samt vad den verkliga tidslängden är om så är fallet. Genom att modellera tidpunkten för avslut med hjälp av neurala nätverk och genom att anta sannolikhetsfördelningen för tidpunkten för avslut, fann vi att det är möjligt att förutspå tidpunkten för tidigt avslut signifikant bättre i jämförelse mot att anta att kontraktet alltid lever till dess ursprungliga livslängd.
97

Smart Choices of Logistic Flows in Autonomous Transport System / Smarta val av logistikflöden i autonomt transportsystem

Ma, Hanna January 2020 (has links)
PLAS is a cloud-based software used for planning and scheduling fleets of vehicles for material transport. PLAS consists of two components; the Logistic Flow Solver (LFS) and the Material Transport Scheduler (MTS). Based on transportation requests, the LFS generates a set of logistic flows. The MTS then transforms the logistic flows into tasks that are assigned to the vehicles. The LFS is implemented with Mixed Integer Linear Programming (MILP). Currently, the LFS and the MTS are decoupled from each other and there is information that is not considered in the LFS. Thus, the choice of logistic flows generated with the current formulation may negatively impact the final transport plan. The objective of this thesis is to investigate how the generation of logistic flows can be improved. Two alternative mathematical models for the LFS were developed using MILP formulation. Compared to the current model, more information is taken into account in the two new models. Three different objective functions were considered. Scheduling of the vehicles were modelled as pickup and delivery problems, where pickup and delivery pairs correspond to the generated logistic flows. The models were implemented using Google OR-Tools, an open-source software suite for optimization. The different mathematical formulations were evaluated based on their performance for test problems with different fleet compositions. The results show that problem characteristics influence the performance of the models and that there is no model that gives the best result for every type of problem. Therefore, it is necessary to analyse problem characteristics in order to choose a suitable model for generation of logistic flows. / PLAS är en molnbaserad mjukvara som används för planering och schemaläggning av fordonsflottor för materialtransport. PLAS består av två komponenter; Logistic Flow Solver (LFS) and Material Transport Scheduler (MTS). Baserat på transportbehov genererar LFS ett antal logistikflöden. MTS omvandlar sedan logistikflödena till uppdrag som är tilldelade till fordonen. LFS är implementerad med blandad heltalsprogrammering. För närvarande är LFS och MTS frikopplade från varandra och det finns information som inte tas hänsyn till i LFS. Därför kan valet av logistikflöden genererade med den nuvarande formuleringen negativt påverka den slutliga transportplanen. Målet med detta examensarbete är att undersöka hur genereringen av logistikflöden kan förbättras. Två alternativa matematiska modeller utvecklades med MILP-formulering. Jämfört med den nuvarande modellen, tar de två nya modellerna hänsyn till mer information. Tre olika målfunktioner beaktades. Modellerna implementerades med Google OR-Tools, en öppen programvara för optimering. De matematiska formuleringarna utvärderades baserat på deras prestation på testproblem med olika kompositioner av fordonsflottor. Resultaten visar att problemegenskaper påverkar modellernas prestationer och att det inte finns någon modell som ger bäst resultat för varje problemtyp. Därför är det nödvändigt att analysera problemegenskaper för att kunna välja en lämplig modell för generering av logistikflöden.
98

Designing bus route networks with algorithms / Designa busslinjenät med algoritmer

Svensson, Philip January 2020 (has links)
The aim of this thesis is to make use of real world travel time and demand data and implement an algorithm which designs bus networks. Consideration is taken to both passenger and bus operator interests. Thereafter answering the questions: How well does the algorithm perform when applied to Södertälje, Sweden? Can the proposed method assist in the network design stage of real bus network planning? Heuristics and the multiobjective genetic algorithm NSGA-II (Non-dominated Sorting Genetic Algorithm II) were chosen. Three different problem cases were set up. It was found that the high computation time poses a great obstacle, over 80 hours for a network of 58 stations and 18 routes. Even then a longer run time would have led to improved results. When comparing a smaller problem, 24 stations and four routes, to the real bus routes it is based on, a superior solution was found based on the model. It is however not possible to argue for the proposed network being superior to the existing one if replaced in reality due to the fact a subsystem is modelled. It is believed that the proposed algorithm may be of assistance to traffic planners in the way of suggesting single links or routes, not replacing the complete bus network design process. / Målet med denna studie är att använda verklig resedata och efterfrågan och implementera en algoritm som designar busslinjenät med avseende på passagerar -och operatörsintressen. Därefter svara på frågorna: Hur bra presterar algoritmen när den tillämpas på Södertälje, Sverige? Kan den föreslagna algoritmen bidra i designfasen av ett verkligt busslinjenät? Heuristik och den multiobjektiva genetiska algoritmen NSGA-II (Non-dominated Sorting Genetic Algorithm II) användes. Tre olika problem ställdes upp. Det framkom att den långa beräkningstiden är ett stort hinder, över 80 timmar för ett busslinjenät med 58 stationer och 18 busslinjer. Den begränsande faktorn var den långa körtiden, bättre lösningar hade kunnat hittas om programmet fått fortsätta köra. Endast ett mindre nätverk, 24 stationer med fyra busslinjer, baserades på verkliga busslinjer och kunde jämföras. Det resulterade i lösningar som var bättre än de verkliga busslinjerna inom ramen för modellen. Det kan dock inte betraktas som bättre än det verkliga nätverket i mån av att ersätta det, då endast ett subsystem modellerades. Det anses att den föreslagna algoritmen kan vara av assistans för trafikplanerare genom att föreslå länkar mellan busstationer eller hela busslinjer, däremot inte ersätta den nuvarande processen av att designa bussnätverk.
99

En belysning av hur läroboksförfattare i matematik kan påverka elevers lärande

Glenberg, Ove January 2012 (has links)
En nedåtgående trend hos svenska elevers matematikkunskaper föranleder behov av att finna lösningar för att bryta denna trend. Studien som presenteras här har som syfte att undersöka hur man via läroboken kan underlätta lärarens undervisningsplanering, och möjlighet till att formativt bedöma eleverna, samtidigt som elevens möjlighet till ett mer självständigt lärande förbättras. Först utförs en litteraturstudie för att sammanfatta väsentliga begrepp och didaktiska aspekter, för att sedan följa upp med att presentera några tidigare forskningsresultat vad gäller matematiklärobokens utförande och användande av idag. Resultatet från denna litteraturgenomgång verifieras och kompletteras i nästa steg via kvalitativa intervjuer av både lärare och elever på högskolan och gymnasiet. Även en del egna observationer via deltagande i undervisning ger ytterligare data till undersökningen. Genom att skapa insikter kring vad som förbättrar elevers lärande, samt hur aktörerna bl.a. upplever läroboken av idag, är tanken att kunna presentera ett underlag för konstruktion av läroböcker som förbättrar elevens lärande och intresse i matematik. Resultatet visar på att de flesta av läroböckerna i matematik har flera brister vad gäller det pedagogiska utförandet och hur de följer styrdokumentens anvisningar. Läroboken har en viktig roll för undervisningens kontinuitet och ännu viktigare är lärarens ämneskompetens. Resultatet visar dessutom på att elevernas åsikter kring hållbar skolutveckling fokuseras på fler lärare samt lösta exempel i läroboken, medan lärarna fokuserar mer på digitala hjälpmedel. Slutsatsen är att det ska vara elevens egen lärande konstruktion som ska vara det centrala i samband med författande av läroböcker i matematik. Detta innebär att feedback från elever som t ex. studerar första året på högskoleingenjörsutbildningen kan erbjuda ett viktigt bidrag i uppdatering av läroböcker. Dessutom innebär det en tydligare följning av styrdokumentens anvisningar samt att elevernas förkunskaper ska beaktas i läroböckernas innehåll och progression mellan ämnesavsnitten. / A downward trend of Swedish pupils' mathematical knowledge leads to the necessity finding ways, which may reverse this trend. The study presented here aims to explore ways through how textbooks can facilitate teacher education planning, and the ability to formatively assess students while students opportunity for a more independent learning improves. First, a literature review to summarize the essential concepts and didactic aspects is made, and then followed up by presenting some previous research in terms of mathematics textbook design and use of today. The results of this literature review are verified and completed in the next step through qualitative interviews of both teachers and students at college and high school. Even some of my own observations through participation in education provides additional data to the study. By providing insights into what improves student learning, and how actors experiencing textbook of today, the idea is to present a basis for the design of textbooks that enhances student learning and interest in mathematics. The results show that most of the textbooks in mathematics has several shortcomings in the educational performance and how they follow the policy documents instructions. The textbook has an important role in teaching and even more important is the teacher's subject competence. The results also show that students' views on sustainable school improvement are focused mainly on teachers and solved examples in the textbook, while the teachers focus more on digital tools. The conclusion is that it should be the student's own learning that should be central in the writing of textbooks in mathematics. This means that feedback from students such as studying the first year of Bachelor of education can provide an important contribution in updating textbooks. It also means that a clearer tracking of policy documents and instructions to students prior knowledge should be considered in textbook content and progression between subject sections.
100

Predicting Customer Conversion using Supervised Machine Learning / Prediktering av Kundkonvertering med hjälp av Övervakad Maskininlärning

Aboud, Stephanie January 2021 (has links)
The growth of e-commerce has been evident over the past years and for companies like Klarna that provides payment solutions, focusing on the purchase experience is more important than ever. With that goal in mind, more companies are using machine learning methods and tools to make predictions and forecast future outcomes, giving them a competitive advantage on the market. This thesis aims to apply supervised machine learning techniques to predict customer conversion, i.e. predict if a customer with a started shopping session will complete the purchase. The purpose of the project is to also determine which supervised learning algorithm performs the best when predicting customer conversion, with regards to a set of model evaluation metrics. The classical classification method Logistic Regression was tested, as well as the machine learning methods Support vector Machine, Random forest and XGBoost. The metrics used to evaluate the model performances were Precision, Recall, F1- and AUC-scores. Furthermore, the SHapley Additive exPlanations approach was implemented for feature importance and for interpreting tree-based models. The results showed that it is in fact possible to predict customer conversion using machine learning. All models yielded good performance and the difference in performance was relatively small. XGBoost performed slightly better than the rest of the models. / Tillväxten av e-handel har varit tydlig de senaste åren och för företag som Klarna, som erbjuder betalningslösningar, är det viktigare än någonsin förr att lägga stor fokus på kundernas köpupplevelse. Som hjälp använder allt fler företag maskininlärnings- metoder och verktyg för att prediktera och göra framtidsprognoser, något som gör dem konkurrenskraftiga på marknader. Syftet med detta examensarbete är att tillämpa övervakad maskininlärning för att prediktera kundkonvertering, med andra ord prediktera om en kund som påbörjat en shoppingsession kommer att slutföra beställningen. Syftet med projektet är även att avgöra vilken övervakad inlärningsalgoritm som presterar bäst vid predikteringen, med avseende på en uppsättning av valideringsmått. Den klassiska klassificeringsmetoden Logistisk Regression testades, så väl som maskininlärnings metoderna Stödvektormaskin, Random Forest och XGBoost. För att validera modellerna användes Precision, Recall, F1- och AUC-scores. Dessutom implementerades metoden SHapley Additive exPlanations för att företaget enklare ska förstå vikten av de olika variablerna och tolka de trädbaserade modellerna. Resultaten visade att det går att prediktera kundkonvertering med hjälp av maskininlärning. Alla modeller påvisade bra resultat och skillnaden i prestation var relativt liten. XGBoost presterade lite bättre än resterande modeller.

Page generated in 0.064 seconds