161 |
Solving the Facility Location Problem using Graph Theory and Shortest Path Algorithms / Optimal lagerplacering med hjälp av grafteori och kortaste vägen algoritmerZarabi, Patrick, Denes, August January 2018 (has links)
This thesis in systems engineering and optimization theory aims to solve a facility location problem within the context of a confined space with path and proximity constraints. The thesis was commissioned by LKAB Kiruna, to help in their decision of where to construct a new facility on their industrial premises. The facility location problem was divided into a main problem of finding the best position of the facility, and a sub-problem of how to model distances and feasible areas within this particular context. The distance and feasibility modeling was solved by utilizing graph theory to construct a graph representation of a geographic area and then obtain the necessary distances using Dijkstra’s shortest path algorithm. The main problem was then solved using a mixed integer linear programming formulation which utilizes the distances obtained through the Dijkstra algorithm. The model is also extended to not only decide the placement of one facility but to accommodate the placement of two facilities. The extended model was solved in three ways, a heuristic algorithm, a mixed integer non linear formulation and a mixed integer linear formulation. The results concluded that the implementation of the single facility model was able to obtain optimal solutions consistently. Regarding the extension, the mixed integer linear formulation was deemed to be the best model as it was computationally fast and consistently produced optimal solutions. Finally, several model improvements are identified to increase the applicability to different cases. These improvements could also allow the model to provide more strategical and managerial insights to the facility location decision process. Some future research into metaheuristics and machine learning are also suggested to further improve the usability of the models. / Detta examensarbete inom systemteknik och optimeringslära syftar till att lösa ett lagerplaceringsproblem. Lagret ska ställas inom en liten yta med hänsyn till ruttbegränsningar och närhet till andra byggnader. Denna uppsats är begärd av LKAB Kiruna for att underlätta i deras beslut om var ett nytt lager skulle kunna byggas inom deras industriområde. Lagerplaceringsproblemet delades upp i två problem, huvudproblemet var att lokalisera den basta platsen för lagret att byggas. Subproblemet var hur distanser och tillåtna placeringar ska modelleras i denna specifika kontext med rutt- och narhetsbegränsningar. Distans- och platsmodelleringen gjordes genom att skapa en grafrepresentation av industriområdet. Sedan användes Dijkstras kortaste vägen algoritm för att erhålla alla distanser mellan möjliga byggområden och de produktionsanläggningar som behöver tillgång till lagret. Huvudproblemet kunde sedan lösas med hjälp av dessa distanser och en linjär heltalsoptimeringsmodell. Modellen utökades sedan för att tillåta placeringen av två separata lagerbyggnader. Den utökade modellen löstes med hjälp av tre olika implementeringar, en heuristisk algoritm, en ickelinjär heltalsoptimeringsmodell samt en linjär heltalsoptimeringsmodell. Resultaten visade att implementeringen av det ursprungliga lagerplaceringsproblemet konsekvent kunde beräkna optimala lösningar. Den utökade modellen löstes bäst av den linjära heltalsoptimeringsimplementeringen, då denna implementering konsekvent resulterade i bäst (lägst) värde i målfunktion samt löste problemet med låg beräkningstid. Slutligen identifierades flertalet potentiella modellförbättringar som skulle kunna implementeras för att ge modellen mer generaliserbarhet. Detta skulle även innebära att modellen själv kan utvärdera hur många lager som bör byggas givet en satt budget. Således kan modellen även erbjuda mer strategiska beslut om dessa förbättringar implementeras. Ytterligare forskning skulle även kunna göras inom metaheuristik och maskininlärning för att ytterligare förbättra distansmodelleringen.
|
162 |
Modeling News Data Flows using Multivariate Hawkes Processes / Modellering av nyhetsdataflöden med multivariata hawkesprocesserAlpsten, Erik January 2018 (has links)
This thesis presents a multivariate Hawkes process approach to model flows of news data. The data is divided into classes based on the news' content and sentiment levels, such that each class contains a homogeneous type of observations. The arrival times of news in each class are related to a unique element in the multivariate Hawkes process. Given this framework, the massive and complex flow of information is given a more compact representation that describes the excitation connections between news classes, which in turn can be used to better predict the future flow of news data. Such a model has potential applications in areas such as finance and security. This thesis focuses especially on the different bucket sizes used in the discretization of the time scale as well as the differences in results that these imply. The study uses aggregated news data provided by RavenPack and software implementations are written in Python using the TensorFlow package. For the cases with larger bucket sizes and datasets containing a larger number of observations, the results suggest that the Hawkes models give a better fit to training data than the Poisson model alternatives. The Poisson models tend to give better performance when models trained on historic data are tested on subsequent data flows. Moreover, the connections between news classes are given to vary significantly depending on the underlying datasets. The results indicate that lack of observations in certain news classes lead to over-fitting in the training of the Hawkes models and that the model ought to be extended to take into account the deterministic and periodic behaviors of the news data flows. / Detta examensarbete presenterar en multivariat hawkesprocess som modell för flöden av nyhetsdata. Den givna datan delas upp i klasser baserat på nyheternas ämnen och sentimentnivåer. På sådant sätt ges att varje klass innehåller en mer homogen typ av datapunkter. Ankomsttiden för nyheterna inom varje klass relateras till ett unikt element i den multivariata hawkesprocessen. Givet denna modell ges det massiva och komplexa informationsflödet en mer kompakt representation som beskriver kopplingarna mellan nyhetsgrupperna och som kan användas för att bättre predicera det framtida flödet av nyheter, vilket är av intresse inom områden som säkerhet och finans. Arbetet fokuserar framförallt på de olika storleksordningar som används vid diskretisering av tidsskalan, samt de skillnader i resultat som dessa implicerar. Studien använder aggregerad nyhetsdata från RavenPack och implementationen skrevs i Python med hjälp av TensorFlow. För testerna med större tidsskalor och dataset som innehåller större mängd observationer ger resultaten att hawkesmodellerna anpassas bättre till träningsdata än de enklare poissonmodellerna. Dock tenderar poissonmodellerna ge bättre prestanda när modellerna som tränats på historiska data sedan testas på efterföljande nyhetsdataflöden. Dessutom fås att kopplingarna mellan nyhetsklasserna varierar avsevärt beroende på underliggande dataset. Resultaten tyder på att bristen på observationer i vissa nyhetsgrupper leder till överpassning i träningen av hawkesmodellerna och att modellen bör utvidgas för att bättre ta hänsyn till de fenomen i nyhetsdataflödet som är deterministiska och periodiska.
|
163 |
Solar Power Forecasting with Machine Learning Techniques / Prediktion av solcellsproduktion med maskininlärningsmetoderIsaksson, Emil, Karpe Conde, Mikael January 2018 (has links)
The increased competitiveness of solar PV panels as a renewable energy source has increased the number of PV panel installations in recent years. In the meantime, higher availability of data and computational power have enabled machine learning algorithms to perform improved predictions. As the need to predict solar PV energy output is essential for many actors in the energy industry, machine learning and time series models can be employed towards this end. In this study, a comparison of different machine learning techniques and time series models is performed across five different sites in Sweden. We find that employing time series models is a complicated procedure due to the non-stationary energy time series. In contrast, machine learning techniques were more straightforward to implement. In particular, we find that the Artificial Neural Networks and Gradient Boosting Regression Trees perform best on average across all sites. / Sänkta produktionskostnader och ökad effektivitet har de senaste åren gjort solceller till ett attraktivt alternativ som energikälla. Detta har lett till en stor ökning av dess användning runt om i världen. Parallellt med denna utveckling har större tillgänglighet av data samt datorers förbättrade beräkningskapacitet möjliggjort förbättrade prediktionsresultat för maskininlärningsmetoder. Det finns för många aktörer anledning att intressera sig för prediktion av solcellers energiproduktion och från denna utgångspunkt kan maskininlärningsmetoder samt tidsserieanalys användas. I denna studie jämför vi hur metoder från de båda fälten presterar på fem olika geografiska områden i Sverige. Vi finner att tidsseriemodeller är komplicerade att implementera på grund av solcellernas icke-stationära tidsserier. I kontrast till detta visar sig maskininlärningstekniker enklare att implementera. Specifikt finner vi att artificiella neurala nätverk och så kallade Gradient Boosting Regression Trees presterar bäst i genomsnitt över de olika geografiska områdena.
|
164 |
Examining Handovers in a Telecommunications Network Using Markov Chains and Dissimilarity Matrices / Undersökning av handovers i ett telekommunikationsnätverk med hjälp av markovkedjor och olikhetsmatriserResare, Pontus January 2018 (has links)
A telecommunications network is divided into cells, which have radio properties to lessen interference. Users move between these cells with their equipment. If the equipment is actively used, it goes through a process called handover when it moves between cells, this creates sequences of visited cells. This thesis investigates these handovers and the corresponding sequences of visited cells. In this thesis there are two objectives related to the handovers between cells. The first is to determine if different types of sequences have different proportions of unwanted behaviour, the second is to develop a method to detect changes in the patterns of the handovers, between different time periods. For both objectives it is examined if the sequences of visited cells can be modelled as r-order Markov chains. For the first objective, it is examined if there are different proportions of unwanted behaviour for the r most recently visited cells, using a Markov chain approach. The sequences are also examined as a whole with a clustering method using dissimilarity matrices. For the second objective, it is first examined if it is possible to model the sequences of visited cells from different time periods as Markov chains and then perform a homogeneity test between them. After that it is examined if dissimilarity metrics could be used to detect changes between time periods, this is done using dissimilarity matrices. In the end it can be concluded that different types of sequences have different proportions of unwanted behaviour. Furthermore, it can be concluded that the approach of modelling the sequences as Markov chains in order to detect changes in handover behaviour between time periods, does not work. Finally, it is concluded that dissimilarity metrics could be used to detect changes between time periods, and additionally, some suitable dissimilarity metrics are presented. / Ett telekommunikationsnätverk är uppdelat i celler, dessa har radioegenskaper som ska minska interferensen. Användare rör sig mellan cellerna med sin utrustning. Om utrustningen används aktivt, så kommer den gå igenom en process kallad handover när den rör sig mellan celler, och sekvenser av besökta celler skapas. Detta examensarbete undersöker dessa handovers och de motsvarande cellsekvenserna. I detta examensarbete finns det två mål relaterade till handover mellan celler. Det första målet är att bestämma om olika typer av cellsekvenser har olika proportioner av oönskat beteende, det andra målet är att skapa en metod som kan upptäcka skillnader i handovermönster mellan olika tidsperioder. För båda målen så undersöks det om cellsekvenserna kan modelleras som Markovkedjor av ordning r. För att uppnå det första målet, så undersöks det med hjälp av en Markovkedjemetod, om sekvenser med samma r första celler har samma proportion av oönskat beteende. Cellsekvenserna undersöks också i sin helhet genom att de klassificeras med hjälp av en olikhetsmatris. För att uppnå det andra målet, så undersöks det först om det är möjligt att modellera cellsekvenserna från olika tidsperioder som Markovkedjor för att sedan göra ett homogenitetstest dem emellan. Efter detta så undersöks det om olikhetsmått kan användas för att upptäcka skillnader mellan tidsperioder, detta görs med hjälp av olikhetsmatriser. I detta examensarbete så kan man konstatera att olika typer av sekvenser har olika proportioner av oönskat beteende. Dessutom så kan det konstateras att det inte fungerar att detektera skillnader i handovermönster genom att modellera cellsekvenserna som Markovkedjor och sedan göra homogenitetstest. Slutligen så kan det även konstateras att det fungerar att använda olikhetsmått för att upptäcka skillnader i handovermönster, dessutom så finns det förslag på några lämpliga olikhetsmått.
|
165 |
A Neural Networks Approach to Portfolio Choice / Några tillämpningar av neurala nätverk i portföljvalDjehiche, Younes January 2018 (has links)
This study investigates a neural networks approach to portfolio choice. Linear regression models are extensively used for prediction. With the return as the output variable, one can come to understand its relation to the explanatory variables the linear regression is built upon. However, if the relationship between the output and input variables is non-linear, the linear regression model may not be a suitable choice. An Artificial Neural Network (ANN) is a non-linear statistical model that has been shown to be a “good” approximator of non-linear functions. In this study, two different ANN models are considered, Feed-forward Neural Networks (FNN) and Recurrent Neural Networks (RNN). Networks from these models are trained to predict monthly returns on asset data consisting of macroeconomic data and market data. The predicted returns are then used in a long-short portfolio strategy. The performance of these networks and their corresponding portfolios are then compared to a benchmark linear regression model. Metrics such as average hit-rate, mean squared prediction error, portfolio value and riskadjusted returns are used to evaluate the model performances. The linear regression and the feed-forward model yielded good average hit-rates and mean squared-errors, but poor portfolio performances. The recurrent neural network models yielded worse average hit-rates and mean squared prediction errors, but had outstanding portfolio performances / Den här studien undersöker portföljval med hjälp av neurala nätverk. Linjära regressionsmodeller används extensivt vid prediktion. Med avkastning som responsvariabel kan man ta reda på dess relation med förklaringsvariablerna som regressionsmodellen är byggd på. Men, om förhållandet är icke-linjärt, kan en linjär regressionsmodell vara opassande. Neurala nätverk är en ickelinjär statistisk modell som har visats vara en god skattare av icke-linjära funktioner. I den här studien kommer två olika neurala nätverksmodeller att undersökas, framåtkopplade nätverk och rekurrenta nätverk. Nätverk från dessa två modeller tränas för att prediktera månatlig avkastning för data på tillgångar som består av makroekonomisk data samt marknadsdata. De predikterade avkastningarna används sedan i en “long-short extended risk parity” portföljstrategi. Prestandan för nätverken samt deras respektive portföljer undersöks och jämförs med en refrensmodell som består av en linjär regression. Olika metriker, såsom genomsnittligt träffvärde, genomsnittligt kvadratiskt fel, portföljvärde och riskjusterad avkastning, används för att evaluera modellernas prestanda. Den linjära regressionsmodellen samt det framåtkopplade nätverket gav en god genomsnittligt träffvärde samt ett lågt genomsnittligt kvadratiskt prediktionsfel, men inte ett bra portföljvärde. De rekurrenta modellerna gav sämre genomsnittligt träffvärde samt ett lite högre genomsnittligt kvadratiskt fel, däremot presterade portföljen mycket bättre.
|
166 |
Deep Learning models for turbulent shear flow / Djupinlärningsmodeller för turbulent skjuvflödeAlathur Srinivasan, Prem Anand January 2018 (has links)
Deep neural networks trained with spatio-temporal evolution of a dynamical system may be regarded as an empirical alternative to conventional models using differential equations. In this thesis, such deep learning models are constructed for the problem of turbulent shear flow. However, as a first step, this modeling is restricted to a simplified low-dimensional representation of turbulence physics. The training datasets for the neural networks are obtained from a 9-dimensional model using Fourier modes proposed by Moehlis, Faisst, and Eckhardt [29] for sinusoidal shear flow. These modes were appropriately chosen to capture the turbulent structures in the near-wall region. The time series of the amplitudes of these modes fully describe the evolution of flow. Trained deep learning models are employed to predict these time series based on a short input seed. Two fundamentally different neural network architectures, namely multilayer perceptrons (MLP) and long short-term memory (LSTM) networks are quantitatively compared in this work. The assessment of these architectures is based on (i) the goodness of fit of their predictions to that of the 9-dimensional model, (ii) the ability of the predictions to capture the near-wall turbulence structures, and (iii) the statistical consistency of the predictions with the test data. LSTMs are observed to make predictions with an error that is around 4 orders of magnitude lower than that of the MLP. Furthermore, the flow fields constructed from the LSTM predictions are remarkably accurate in their statistical behavior. In particular, deviations of 0:45 % and 2:49 % between the true data and the LSTM predictions were obtained for the mean flow and the streamwise velocity fluctuations, respectively. / Djupa neuronät som är tränade med rum-tids utveckling av ett dynamiskt system kan betraktas som ett empiriskt alternativ till konventionella modeller som använder differentialekvationer. I denna avhandling konstruerar vi sådana djupinlärningsmodeller för att modellera en förenklad lågdimensionell representation av turbulensfysiken. Träningsdata för neuronäten erhålls från en 9-dimensionell modell (Moehlis, Faisst och Eckhardt [29]) för olika Fourier-moder i ett skärskikt. Dessa moder har ändamålsenligt valts för att avbilda de turbulenta strukturerna i regionen nära väggen. Amplitudernas tidsserier för dessa moder beskriver fullständigt flödesutvecklingen, och tränade djupinlärningsmodeller används för att förutsäga dessa tidsserier baserat på en kort indatasekvens. Två fundamentalt olika neuronätsarkitekturer, nämligen flerlagerperceptroner (MLP) och långa närminnesnätverk (LSTM), jämförs kvantitativt i denna avhandling. Utvärderingen av dessa arkitekturer är baserad på (i) hur väl deras förutsägelser presterar jämfört med den 9-dimensionella modellen, (ii) förutsägelsernas förmåga att avbilda turbulensstrukturerna nära väggar och (iii) den statistiska överensstämmelsen mellan nätverkets förutsägelser och testdatan. Det visas att LSTM gör förutsägelser med ett fel på ungefär fyra storleksordningar lägre än för MLP. Vidare, är strömningsfälten som är konstruerade från LSTM-förutsägelser anmärkningsvärt noggranna i deras statistiska beteende. I synnerhet uppmättes avvikelser mellan de sanna- och förutsagda värdena för det genomsnittliga flödet till 0; 45 %, och för de strömvisa hastighetsfluktionerna till 2; 49 %.
|
167 |
Hedging Error in CVA : Impact of inconsistency between simulation and pricing models / HedgingFel i CVA : Effekten av missanpassning mellan simulerings- och prissättningsmodellerGraziani, Greta January 2018 (has links)
The aim of this thesis is to investigate thehedging error in Credit Value Adjustment (CVA) produced by using a model forthe simulation of the risk factors different from the one used in the pricingof the derivative contract. The hypothesis is that this inconsistency betweensimulation and pricing models affects the CVA leading to an error in thehedging of credit counterparty risk. When computing the CVA, market factors aresimulated forward in time and the portfolio is priced in each scenario toobtain the Expected Positive Exposure (EPE). To hedge the market risk of CVA weuse a dynamic Delta-hedging strategy. We investigate the hedging error for adefault free portfolio and for its CVA and how it is affected by the mismatchbetween the models. / Denna studie ämnar att analysera hedgingfelet i kreditvärdesjustering(CVA) som uppstår när simuleringsmodellen för riskfaktorerna är annorlunda änden som används för derivatets prissättning. Hypotesen är att diskrepansen imodellerna påverkar CVA och leder till en hedgingportfölj med ett avvikandevärde från det egentliga som krävs för att optimalt hedga motpartenskredit-risk. För att beräkna CVA simulerar vi marknadsfaktorerna framåt i tidenoch portföljen är prissatt i varje scenario för att beräkna förväntade positivaexponeringen (EPE). För att hedga marknadsrisken av CVA använder vi en dynamiskDelta hedging strategi. Vi undersöker hedgingfelet för en portfölj utan och medkreditrisk och hur det påverkas av diskrepansen mellan modellerna.
|
168 |
Modeling implied correlation matrices using option prices / Modellering av implicita korrelationsmatriser baserat på optionspriserEklund, Sofie, Estaifo, Randa January 2018 (has links)
In the process of calculating a fair value it is preferable to price the asset from observable market data. Some assets are valued using variables which can not be directly observed in the market but are instead implied from observable market data. One such variable is the correlation between assets. The purpose of this thesis is to model correlations between stocks based on observable market data. Three different approaches are used to construct implied correlation matrices on OMXS30. All matrices are constructed using implied volatilities from the option market. The methods are then compared in order to determine which method that generates the most reliable implied correlation matrix. This is done by looking at deviations from counterparty prices on basket options. The used basket options have two different types of underlying autocallable products; Phoenix Autocall and Autocall Uncapped. It was found that the method with an equicorrelation matrix had the smallest deviations from the counterparty price in a majority of the tested cases. Another result was that the implied correlation matrices performed better on the basket options with Autocall Uncapped than Phoenix Autocall as underlying. An interesting topic for further research is to examine other markets but also to study the methods when more than one market is considered. / I processen att skapa en rättvis värdering av en tillgång föredras observerbar marknadsdata. Vissa tillgångar värderas med hjälp av variabler som inte direkt kan observeras på marknaden men som kan skapas implicit från observerbar marknadsdata. En sådan variabel är korrelationen mellan tillgångar. Syftet med detta examensarbete är att modellera korrelationer mellan aktier baserat på observerbar marknadsdata. Tre olika tillvägagångssätt används för att konstruera implicita korrelationsmatriser på OMXS30. Alla matriser är konstruerade med hjälp av implicita volatiliteten från optionsmarknaden. Metoderna jämförs sedan för att bestämma vilken metod som genererar den mest tillförlitliga implicita korrelationsmatrisen. Metoderna jämförs sedan genom att granska avvikelser från motpartspriser på optionskorgar. De använda optionskorgarna består av två olika typer av underliggande autocalls; Phoenix Autocall och Autocall Uncapped. Det konstaterades att metoden med en ekvi-korrelationsmatris hade i en majoritet av fallen de minsta avvikelserna från motpartspriset. Ett annat resultat var att de implicita korrelationsmatriserna presterade bättre på de optionskorgar med Autocall Uncapped än Phoenix Autocall som underliggande. Ett intressant ämne för vidare forskning är att undersöka andra marknader men också att studera metoderna när mer än en marknad granskas.
|
169 |
Recurrent neural networks for financial asset forecastingTegnér, Gustaf January 2018 (has links)
The application of neural networks in finance has found renewed interest in the past few years. Neural networks have a proven capability of modeling non-linear relationships and have been proven widely successful in domains such as image and speech recognition. These favorable properties of the Neural Network make them an alluring choice of model when studying the financial markets. This thesis is concerned with investigating the use of recurrent neural networks for predicting future financial asset price movements on a set of futures contracts. To aid our research, we compare them to a set of simple feed-forward networks. We conduct further research into the various networks by considering different objective loss functions and how they affect our networks performance. This discussion is extended by considering multi-loss networks as well. The use of different loss functions sheds light on the importance of feature selection. We study a set of simple and complex features and how they affect our model. This aids us in further examining the difference between our networks. Lastly, we analyze of the gradients of our model to provide additional insight into the properties of our features. Our results show that recurrent networks provide superior predictive performance compared to feed-forward networks both when evaluating the Sharpe ratio and accuracy. The simple features show better results when optimizing for accuracy. When the network aims to maximize Sharpe, the complex features are preferred. The use of multi-loss networks proved successful when we consider achieving a high Sharpe ratio as our main objective. Our results show significant improved performance compared to a set of simple benchmarks. Through ensemble methods, we achieve a Sharpe ratio of 1.44 and an accuracy of 52.77% on the test set / Tillämpningen av neurala nätverk i finans har fått förnyat intresse under de senaste åren. Neurala nätverk har en erkänd förmåga att kunna modellera icke-linjära förhållanden och har bevisligen visat sig användbara inom områden som bild och taligenkänning. Dessa egenskaper gör neurala nätverk till ett attraktivt val av model för att studera finansmarknaden Denna uppsats studerar användandet av rekurrenta neurala nätverk för pre-diktering av framtida prisrörelser av ett antal futures kontrakt. För att underlätta får analys jämför vi dessa nätverk med en uppsättning av enkla framåtkopplade nätverk. Vi dyker sedan djupare in i vår analys genom att jämföra olika målfunktioner för nätverken och hur de påverkar våra nätverks prestation. Vi utökar sedan den här diskussionen genom att också undersöka multi-förlust nätverk. Användandet av flera förlust funktioner visar på betydelsen av vårt urval av attribut från indatan. Vi studerar ett par simpla och komplexa attribut och hur de påverkar vår modell. Det hjälper oss att göra en ytterligare jämförelse mellan våra nätverk. Avslutningsvis så undersöker vi vår modells gradienter för att få en utökad förståelse över hur vår modell agerar med olika attribut. Resultaten visar på att rekurrenta nätverk utpresterar framåtkopplade nät-verk, både i uppgiften att maximera sharpe ration och precision. De enkla attributen visar på bättre resultat när nätverket optimeras för precision. När vi optimerar för att maximera Sharpe ration fungerar de komplexa attributen bättre. Tillämpningen av multi-förlust nätverk visade sig framgångsrik när vårt huvudmål var at maximera sharpe ration. Våra resultat visar på en signifikant ökad prestation av våra nätverk jämfört med ett par enkla benchmarks. Genom ensemble metoder uppnår vi en Sharpe ratio på 1.44 samt en precision på 52.77% på test datan.
|
170 |
RegressionModeling from the Statistical Learning Perspective - with an Application toAdvertisement Data / Regressionsmodellering från perspektivet av statistiskinlärning med tillämpning på annonsdataÖwall, Max January 2018 (has links)
Advertising on social media, and on Facebook in specific, is a global industry from which the social media platforms get their biggest revenues. The performance of these advertisements in relation to the money invested in the advertisement can be measured in the metric cost per thousand impressions (CPM). Various regression modelling strategies combined with statistical learning approaches for model assessment are explored in this thesis with the objective of finding the model that best predicts CPM. Using advertisement data for 540 companies in Sweden during 2017, it is found that the data set comprising of 12 covariates suffers from a high degree of multicollinearity. To tackle this problem efficiently we apply different shrinkage regression methods. Starting from the Ridge and Lasso regression methods, combining the two by an elastic net and then finally expanding Lasso to adaptive Lasso, using cross-validation we find that the elastic net with approximately equal weightson Ridge and Lasso component is the best performing model. In conclusion, when regressing a metric such as CPM, on a set of variables which suffers from severe problems of multicollinearity, the shrinkage regression techniques are needed. / Annonsering på sociala medier, och speciellt på Facebook, är en global industri som de sociala medieplattformarna har som största intäktskälla. Hur lyckosamma dessa annonser är i förhållande till hur mycket pengar som investeras i dem kan mätas med nyckeltalet kostnad per tusen intryck (eng: Cost per thousand impressions, CPM). I den här uppsatsen är olika regressionsmodeller av statistisk inlärning byggda för prediktering av CPM med syftet att hitta den modell som bäst kan prediktera CPM. Genom att använda 540 företags annonsdata i Sverige under 2017 upptäcks det att de 12 förklaringsvariablerna kraftigt samvarierar varav olika shrinkage regressionsmodeller byggs. Genom att först använda Ridge och Lasso, vilka sen kombineras i ett elastiskt nät och slutligen genom att utvidga Lasso till elastisk Lasso, upptäcks det att den modell som presterar bäst utifrån cross-validation är det elastiska nätet där ungefärligen lika stora vikter läggs på Ridge och Lasso. Slutsatsen är att för att regressera ett nyckeltal som CPM, där det är sannolikt att förklaringsvariablerna samvarierar, är shrinkage regressionsmodeller att föredra.
|
Page generated in 0.1183 seconds