Enhancing Business Support Systems through Data Science and Machine Learning : A study on possible applications within BSS

Castello, Jacopo January 2021 (has links)
The companies’ support phase, as all of business’ functional areas and components, went through a heavy and rapid digitalization which has unlocked the availability of an unprecedented amount of data. Unlike other relevant business areas and components, the support phase seems to have experienced fewer improvements attributable to Data Science and machine learning. By focusing on two well-known problems of these two fields, Time Series Analysis and Regression Analysis, this project aims at understanding which techniques are applicable within the support phase and how these can improve the effectiveness and pro-activeness of this area. The goal within this project is to apply them to improve the handling of support tickets, the digital entity used to track issues and requests within support systems. Through the use of Time Series Analysis, we aim at forecasting the volume of tickets to be expected in a near-future time frame. Using Regression Analysis we intend to estimate the resolution time of a newly submitted ticket. The results produced by the two tasks were satisfactory. On one hand, the Time Series task produced accurate results and the models could be directly employed and bring some added value to help Elvenite’s support team. On the other hand, while the Regression Analysis results were not as good, they nonetheless proved that the task’s aim is achievable through improvements on both the data used and the models applied. Finally, both tasks successfully showcased how to investigate and evaluate the application of such techniques within the support phase of a business. / Supportfasen, likväl samtliga andra delar av företags affärsfunktionella områden och komponenter, har genomgått en intensiv och snabb digitalisering som har öppnat upp tillgången till en enastående mängd data. Till skillnad från andra relevanta affärsområden och komponenter verkar supportfasen ha upplevt färre förbättringar som kan attribueras till Datavetenskap och maskininlärning. Projektet syftar till att förstå det ovanstående genom att fokusera på två välkända tekniker: tidsserieanalys och regressionsanalys. Det är följaktligen viktigt att undersöka vilka metoder från föregående nämnda områden som är användbara inom supportsystemen, samt hur dessa kan förbättra effektiviteten och proaktiviteten inom området. Det genomgående målet för projektet är att tillämpa analysmetoderna för att förbättra hanteringen av supportbiljetter. Supportbiljetter är den digitala enheten som används för att spåra frågor och förfrågningar inom supportsystem. Genom att använda tidsserieanalys eftersträvas att prognostisera volymen av biljetter som kan förväntas inom en snar framtid. Regressionsanalys användas för att tillhandahålla en uppskattad tid för en nyanländ biljett att bli löst, baserat på lösningstiden för tidigare lösta liknande biljetter. De två tillvägagångssätten gav olika, men tillfredställande resultat. Till att börja med anses tidsserieanalysen vara tillfredsställande och kan vara av värde samt hjälp för Elvenites supportteam. Dessvärre var resultaten från regressionsanalysen inte lika optimala och modellerna skulle behöva förbättras ytterligare före de appliceras i verkligheten. De båda teknikerna kunde ändock framgångsrikt bevisa och påvisa hur man kan undersöka samt utvärdera liknande metoder inom supportfasen av ett företag.

A Comparative Study : Time-Series Analysis Methods for Predicting COVID-19 Case Trend / En jämförande studie : Tidsseriens analysmetoder för att förutsäga fall av COVID-19

Xu, Chenhui January 2021 (has links)
Since 2019, COVID-19, as a new acute respiratory disease, has struck the whole world, causing millions of death and threatening the economy, politics, and civilization. Therefore, an accurate prediction of the future spread of COVID-19 becomes crucial in such a situation. In this comparative study, four different time-series analysis models, namely the ARIMA model, the Prophet model, the Long Short-Term Memory (LSTM) model, and the Transformer model, are investigated to determine which has the best performance when predicting the future case trends of COVID-19 in six countries. After obtaining the publicly available COVID-19 case data from Johns Hopkins University Center for Systems Science and Engineering database, we conduct repetitive experiments which exploit the data to predict future trends for all models. The performance is then evaluated by mean squared error (MSE) and mean absolute error (MAE) metrics. The results show that overall the LSTM model has the best performance for all countries that it can achieve extremely low MSE and MAE. The Transformer model has the second-best performance with highly satisfactory results in some countries, and the other models have poorer performance. This project highlights the high accuracy of the LSTM model, which can be used to predict the spread of COVID-19 so that countries can be better prepared and aware when controlling the spread. / Sedan 2019 har COVID-19, som en ny akut andningssjukdom, drabbat hela världen, orsakat miljontals dödsfall och hotat ekonomin, politiken och civilisationen. Därför blir en korrekt förutsägelse av den framtida spridningen av COVID-19 avgörande i en sådan situation. I denna jämförande studie undersöks fyra olika tidsseriemodeller, nämligen ARIMA-modellen, profetmodellen, Long Short-Term Memory (LSTM) -modellen och transformatormodellen, för att avgöra vilken som har bäst prestanda när man förutsäger framtida falltrender av COVID-19 i sex länder. Efter att ha fått offentligt tillgängliga COVID-19-falldata från Johns Hopkins University Center for Systems Science and Engineering-databasen utför vi repetitiva experiment som utnyttjar data för att förutsäga framtida trender för alla modeller. Prestandan utvärderas sedan med medelvärde för kvadratfel (MSE) och medelvärde för absolut fel (MAE). Resultaten visar att LSTM -modellen överlag har den bästa prestandan för alla länder att den kan uppnå extremt låg MSE och MAE. Transformatormodellen har den näst bästa prestandan med mycket tillfredsställande resultat i vissa länder, och de andra modellerna har sämre prestanda. Detta projekt belyser den höga noggrannheten hos LSTM-modellen, som kan användas för att förutsäga spridningen av COVID-19 så att länder kan vara bättre förberedda och medvetna när de kontrollerar spridningen.

Drivmedelsskatten – miljöeffektsanalys : En deskriptiv studie om drivmedelsskattens effekt på CO2 utsläppen från inrikes biltransporter i Sverige

Hermansson, Emil January 2021 (has links)
The climate changes have arguably been one of the main concerns during the last centuries.The largest contribution of the climate change derives from humanly created greenhouse gases.One third of the greenhouse gas emissions in Sweden comes from domestic transportation.This has led the government to set a taxation on fuels to reduce the carbon dioxide emissionsfrom transportation. The Swedish government has set a target of reducing the CO2 fromdomestic transportation by 70% of 2010th level by 2030 as a part of the long run target of zeronet emissions by 2045.This thesis aims to develop the knowledge about the relation between fuel taxation and carbonemissions from domestic car traveling in Sweden. One previous study has been conductedcovering the same problem. The previous study analyzed older data which creates theopportunity for this thesis to give updated results about the issue. This analysis is based ontime-series data from Sweden between 1990-2019. Regression models will be estimated usingordinary least squares (OLS) estimates to find the coefficient values. The results indicate anegative relationship between fuel taxation and carbon emission from cars in Sweden with a99% confidence level. An increase by the fuel tax by 1 SEK/liter would save approximately600 kilotons CO2 from domestic car traveling on a year. The value of the CO2 saved by anincrease of fuel tax by 1 SEK would be approximately 4 178 062 000 SEK. However, the resultshould not be interpreted as a recommendation for a policy. A more comprehensive analysisabout the effects of fuel taxation is needed to make decisions about whether the policy shouldbe implemented. The extended analysis should account for more ecological effects but also,economic, cultural, and social effects of the fuel tax. / Klimatkrisen är onekligen ett av de oftast debatterade problemen i modern tid. Klimatetsförändringar hotar flera arters överlevnadsmöjligheter, inte minst människan. Utsläpp avväxthusgaser är i dagsläget den största orsaken till de pågående klimatförändringarna. AvSveriges växthusgasutsläpp kommer en tredjedel från inrikestransporter. För att reduceraväxthusgaserna från inrikestransporter skattesätter staten drivmedel. Staten har en målsättningom att CO2 utsläppen från inrikestransporter ska minska med 70% av 2010 års nivå till år 2030.Detta är ett etappmål för att nå det långsiktiga målet om obefintliga nettoutsläpp avväxthusgaser år 2045.Denna studie avser att undersöka sambandet mellan drivmedelsskatten och koldioxidutsläppfrån inrikes biltransporter i Sverige. Liknande studier har genomförts tidigare, men då dessastudier analyserat äldre data kan denna studie ge en mer uppdaterad bild av problemet.Analysen bygger på tidsseriedata från Sverige mellan 1990–2019. Regressionsmodellerkommer att skattas med minsta kvadratmetoden (OLS) för att finna drivmedelsskattenssamband med koldioxidutsläppen från inrikes biltransporter. Resultatet visar att det finns ensignifikant negativ relation mellan drivmedelsskatten och koldioxidutsläpp från bilar i Sverigepå 99% konfidensnivå. En ökning av drivmedelsskatten med 1 krona per liter leder till enminskning av CO2 utsläpp från bilar med cirka 600 kiloton under ett år. Denna minskningmotsvarar ett värde av cirka 4 178 062 000 SEK. Resultatet bör dock inte tolkas som enrekommendation angående drivmedelsskatt. Vid beslutsfattande kring drivmedelsskatten bören mer omfattande analys genomföras. Den mer omfattande analysen bör innehålla flerekologiska effekter, men även ekonomiska, kulturella och sociala effekter avdrivmedelsskatten.

Håller PPP i Östersjöns handelsområde? / Does PPP holds in the Baltic trade area

Agerstig Rosenqvist, Therese January 2014 (has links)
Östersjön har alltid varit en viktig knutpunkt för de länder som angränsar dit för att göra det möjligt att handla med varandra och på så sätt skapa en internationell marknad sinsemellan varandra. Under 1700-1800-talet tog produktionen fart och tack vare merkantilismen utvecklades den internationella handeln. För att fastställa deras växelkurs har många länder använt sig av olika myntfot såsom till exempel guldmyntfoten där valutans värde bestämdes utifrån värdet på motsvarande mängd guld vilket innebär att växelkurserna var fasta. Utifrån guldmyntfoten utvecklades teorierna lagen om ett pris och köpkraftsparitet med principerna om att en enhet valuta ska ha samma köpkraft även i andra länder vilket innebär att en vara ska kunna köpas för samma mängd av valutan oavsett om det är inrikes eller utrikes. Dessa teorier har studerats flertalet gånger, både för kort och lång sikt, med fåtalet länder till ett större antal. Denna studie använder sig av teoriernas grundidé och testar huruvida PPP i dess absoluta samt relativa form håller för Östersjöns handelsområde. För att kunna testa detta har två ekonometriska tester av de variabler som används gjorts, stationäritetstest och kointegrationstest. Stationäritetstestet visade att alla variabler förutom de tidsserier som användes för att testa relativ PPP led av icke-stationäritet och därmed behövdes differentieras för att kunna användas för att testa PPP. Kointegrationstestet visade att ingen av tidsserierna led av kointegration vilket medförde att vidare korrigeringsmodeller ej behövdes göras. Resultatet från de ekonometriska skattningarna visade på att absolut och relativ PPP ej kunde bekräftas, ej heller förnekas, då inga signifikanta koefficienter kunde konstateras. Vid testandet av real växelkurs för relativ PPP gavs signifikanta tidsserier men ej i enlighet med nollhypotesen och därmed förkastades nollhypotesen om att relativ PPP håller. Utifrån resultatet dras slutsatsen att PPP ej kan bekräftas utan att vidare studier måste göras. / The Baltic sea has always been an important transit hub for neighboring countries and the sea have made ​​it possible for the countries to trade with each other and thus create an international trade among themselves to each other. During 1700-1800's, the production took off and because of the mercantilism international trade developed. To establish their exchange rate, many countries have followed different standards, such as the gold standard where the currency's value was determined from the value of the corresponding quantity of gold which implies that the exchange rates were fixed. Based on the gold standard different theories was developed, such as the law of one price and purchasing power parity with the principles that a single currency will have the same purchasing power in other countries, which implies that a commodity should be bought for the same amount of currency, whether it is domestic or foreign. These theories have been studied several times, both for the short and long term, with the few countries to a greater number. In order to test this, two econometric tests of the variables were made​​, stationarity test and cointegration test. The stationarity test showed that all variables except the time series that was used to test relative PPP suffered from non-stationarity and therefore needed to be differentiated to be used to test the PPP. The cointegration test showed that no one of the time series suffered of cointegration and therefore further correction models was not needed to be done. The results from the econometric estimates showed that absolute and relative PPP could not be confirmed, nor denied, since no significant coefficients were identified. In the testing of real exchange rate for relative PPP significant time series were given but not in accordance with the nullhypothesis and therefore the null hypothesis is rejected that the relative PPP holds. From the results it is concluded that the PPP cannot be confirmed without that further studies must be done.

Studies in Local Public Transport Demand

Holmgren, Johan January 2008 (has links)
This thesis consists of four papers where the overall purpose is to contribute to the understanding of how local public transport demand is affected by different factors. An underlying theme running trough the thesis is the two-way relationship between public transport demand and the service level caused by the fact that capacity and quality are joint products. In Paper I the relationship between public transport demand and the service level (in terms of vehicle-kilometres) is investigated using panel data from Swedish counties. A Granger causality test is performed in order to test if the level of service cause public transport demand or if demand cause service level, or if they cause each other. It is found that demand and service cause each other, which is to say that there is a two-way relationship between them.In Paper II elasticity estimates for local public transport demand from previous research are summarised and the variation in results is analysed using meta-regression. The variation is explained by model specification, type of data used and origin of data. In Paper III a demand function for local public transport is estimated using panel data from Swedish counties. Instrument variable estimation is used in order to avoid the problem of a two-way relationship between demand and service level (vehicle-kilometres). Demand elasticities with respect to public transport fare, price of petrol, vehicle-kilometres and car ownership are found to be -0.4, 0.34, 0.55, and -1.37. After also taking the effects of income on car ownership into account, it is found that the total effect of income on public transport demand is close to zero. In Paper IV it is found that the strong increase in public transport demand in the town of Linköping between 1946 and 1983, in addition to fare, vehicle-kilometres and car ownership, can be explained by the rapid increase in female labour force participation and the expansion of the city’s outer areas. The city expansion is thought to have increased average trip distance and thereby reduced the number of trips that could be made walking or by bicycle. After 1983, female labour force participation decreased slightly and the expansion of the areas in question has stopped. Without these positive forces to counterbalance the rising levels of car ownership bus trips per capita has fallen by 71%. The effects of a policy change, including peak-load pricing, straighter bus routes, smaller bus size and staggered school hours, is analysed. It is found that the proposed changes would increase public transport travel by 42 % compared to present policy. / Denna avhandling består av fyra artiklar där det övergripande syftet är att bidra till ökad förståelse av hur olika faktorer påverkar benägenheten att gör lokala kollektivtrafikresor. Ett genomgående tema i samtliga artiklar är att det sannolikt föreligger ett dubbelriktat samband mellan antalet resor som genomförs och mängden vagnkilometer som kollektivtrafikproducenten tillhandahåller. Detta eftersom kapacitet och kvalitet är intimt förknippade när det gäller kollektivtrafikutbud. Vid en given fordonsstorlek, innebär fler fordon i trafik att fler passagerare kan transporteras men också att väntetider och/eller avståndet till närmaste linje minskar, vilket utgör en kvalitetsförbättring. I den första artikeln undersöks det lokala kollektivtrafikresandet och vagnkilometerutbudet med hjälp av Grangers kausalitetstest. Syftet är att fastställa huruvida orsakssambandet dem emellan går från vagnkilometer till resande, från resande till vagnkilometer, eller om sambandet är dubbelriktat. Materialet som används kommer från svenska län och täcker perioden 1986 – 2001. Slutsatsen är att det föreligger ett dubbelriktat orsakssamband mellan variablerna. I den andra artikeln sammanställs resultat, i termer av elasticitetsskattningar, från tidigare studier av efterfrågan av lokal kollektivtrafik och variationen i dessa analyseras med hjälp av regressionsanalys, så kallad metaregression. Variationen kan delvis förklaras med modellspecifikation, typ av data som använts samt av geografiska skillnader. I den tredje artikeln estimeras en eftefrågefunktion för lokala kollektivtrafikresor med hjälp av data från svenska län. För att undvika problemet med det dubbelriktade sambandet mellan antal resor och vagnkilometer estimeras funktionen med hjälp av instrumentvariabler. Efterfrågeelasticiteter för lokal kollektivtrafik med avseende på pris, bensinpris, vagnkilometer och bilinnehav finnes vara -0.4, 0.34, 0.55, and -1.37. Efter att ha tagit hänsyn till att inkomsten påverkar kollektivtrafikresandet direkt såväl som indirekt via bilinnehavet, konstateras att totaleffekten är nära noll. I avhandlingens fjärde artikel studeras kollektivtrafikresandet i Linköping. Mellan 1946 och 1983 ökade antalet resor per innevånare kraftigt för att därefter minska. Under perioden 1983 till 2006 minskade antalet resor per person med 71 %. Förutom pris, vagnkilometer och bilinnehav kan det konstateras att kvinnlig förvärvsfrekvens och andel av innevånarna som bor utanför stadskärnan utgör viktiga förklaringsvariabler till resandet. Under expansionsperioden, 1946 – 1983, ökade kvinnors deltagande på arbetsmarknaden kraftigt samtidigt som det skedde en snabb uppbyggnad av förorter med hög befolkningstäthet. Sedan 1983 har kvinnlig förvärvsfrekvens upphört att öka och de befolkningstäta områdena i stadens ytterkanter inte längre växer i förhållande till de centrala delarna. Utan dessa positiva faktorer har utvecklingen dominerats av de negativa influenserna från ökat bilinnehav, ökade biljettpriser och minskat trafikutbud. Effekterna av ett åtgärdspaket bestående av differentierad (mellan hög- och lågtrafik) prissättning, uträtade busslinjer, minskad busstorlek och utspridd skolstart utreds. Slutsatsen är att åtgärderna skulle resultera i 42 % högre kollektivtrafikresande.

Modelling and forecasting economic time series with single hidden-layer feedforward autoregressive artificial neural networks

Rech, Gianluigi January 2001 (has links)
This dissertation consists of 3 essays In the first essay, A Simple Variable Selection Technique for Nonlinear Models, written in cooperation with Timo Teräsvirta and Rolf Tschernig, I propose a variable selection method based on a polynomial expansion of the unknown regression function and an appropriate model selection criterion. The hypothesis of linearity is tested by a Lagrange multiplier test based on this polynomial expansion. If rejected, a kth order general polynomial is used as a base for estimating all submodels by ordinary least squares. The combination of regressors leading to the lowest value of the model selection criterion is selected.  The second essay, Modelling and Forecasting Economic Time Series with Single Hidden-layer Feedforward Autoregressive Artificial Neural Networks, proposes an unified framework for artificial neural network modelling. Linearity is tested and the selection of regressors performed by the methodology developed in essay I. The number of hidden units is detected by a procedure based on a sequence of Lagrange multiplier (LM) tests. Serial correlation of errors and parameter constancy are checked by LM tests as well. A Monte-Carlo study, the two classical series of the lynx and the sunspots, and an application on the monthly S&amp;P 500 index return series are used to demonstrate the performance of the overall procedure. In the third essay, Forecasting with Artificial Neural Network Models (in cooperation with Marcelo Medeiros), the methodology developed in essay II, the most popular methods for artificial neural network estimation, and the linear autoregressive model are compared by forecasting performance on 30 time series from different subject areas. Early stopping, pruning, information criterion pruning, cross-validation pruning, weight decay, and Bayesian regularization are considered. The findings are that 1) the linear models very often outperform the neural network ones and 2) the modelling approach to neural networks developed in this thesis stands up well with in comparison when compared to the other neural network modelling methods considered here. / <p>Diss. Stockholm : Handelshögskolan, 2002. Spikblad saknas</p>

Modelling and forecasting economic time series with single hidden-layer feedforward autoregressive artificial neural networks /

Rech, Gianluigi, January 1900 (has links)
Diss. Stockholm : Handelshögskolan, 2002.

Hur oförväntade makroekonomiska svängningar påverkar aktiemarknadens branschindex : En komparativ analys mellan Sverige, Danmark, Finland och Tyskland / The impact of unanticipated macroeconomic fluctuations on the stock market’s sector index : A comparative analysis between Sweden, Denmark, Finland and Germany

Utterberg, Jennie, Bååth, Johanna January 2023 (has links)
Med bakgrund till det ökade intresset för aktier och dagens ekonomiska läge är det högst aktuellt att undersöka relationen mellan makroekonomiska svängningar och aktiepriserna på den svenska börsen. Det finns flera teorier som försöker förklara hur aktiepriser förändras, en allmän slutsats är att externa faktorer påverkar priset genom oförväntade händelser. Chen, Roll och Ross konstruerade en tidsseriemodell för att studera hur oförväntade makroekonomiska faktorer påverkar aktieavkastningen på New York-börsen. Deras slutsatser landade i att oförväntade förändringar i samtliga variabler har en signifikant relation till aktieprisavkastningen. Med detta i åtanke är syftet med uppsatsen att undersöka om avkastningen på olika branscher på den svenska börsen påverkas av oförväntade månatliga förändringar i inflation (KPI), konjunkturläget (BNP), avkastningskurvan, riskpremien samt växelkursen under tidsperioden 2000-2023. Det genomförs även en jämförande analys mellan de europeiska länderna Sverige, Tyskland, Danmark och Finland. De branschindex som studeras är finans, industri, teknologi, sjukvård och detaljhandel för respektive land. Genom en multipel regressionsmodell har få signifikanta samband påvisats, däremot finner vi ett mönster i negativa respektive positiva relationer mellan oförväntade makroekonomiska händelser och aktieavkastningen för samtliga länder. Sammanfattningsvis finner vi inga tydliga skillnader i vilka branscher som påverkas av respektive riskfaktor, däremot finns en skillnad i antal signifikanta värden mellan länderna. Nationella makroekonomiska händelser påvisar flest signifikanta samband till tyska branschindex, följt av danska och finska. Minst signifikanta samband påvisas för de svenska branschindexen. En förklaring bakom resultatet kan vara att ländernas aktiemarknader är mer eller mindre effektiva och investerare på respektive marknad är olika mottagliga till ny information. Avslutningsvis ser vi det vara rimligt att både branscher och länder påverkas av riskfaktorerna i olika stor utsträckning. Att bygga en aktieportfölj med tillgångar från både olika branscher och länder är därmed betydelsefullt för att sprida sina risker. / Considering the increased interest in the stock market and the current economic situation, it is highly relevant to examine the relationship between macroeconomic fluctuations and share prices on the Swedish stock exchange. There are several theories that try to explain how stock prices change, a general conclusion is that external factors affect the price through unexpected events. Chen, Roll, and Ross constructed a time series model in order to study how unexpected macroeconomic factors affect stock returns on the New York Stock Exchange. Their conclusions resulted in that unexpected changes in all variables have a significant relationship to share price returns. With this in mind, the purpose of the essay is to investigate whether the return on various sector indexes on the Swedish stock exchange is affected by unexpected monthly changes in inflation (CPI), economic state (GNP), the term structure, the risk premium and the exchange rate during the time period 2000-2023. A comparative analysis is also carried out between the European countries Sweden, Germany, Denmark and Finland. The examined sector indexes are finance, industry, technology, healthcare and retail for each country. Through a multiple regression model, the result shows that few macroeconomic variables are significant in explaining stock returns. However, we find a pattern in negative as well as positive relationships between unexpected risk factors and stock returns for all countries. We find no significant differences in which sectors are affected by each risk factor but there is a difference in the number of significant values ​​between the countries. National macroeconomic events show the most significant relations to German sector indexes, followed by Danish and Finnish. Least significant relationships are found for the Swedish sector indexes. An explanation behind the result could be that the countries stock markets are more or less efficient and investors in each market are differently receptive to new information. Our conclusion is that we see it as reasonable that both sectors and countries are affected by the risk factors to varying degrees. Building a stock portfolio with assets from both different sectors and countries is therefore important for spreading your risks.

Algorithmic Trading and Prediction of Foreign Exchange Rates Based on the Option Expiration Effect / Algoritmisk handel och prediktion av valutakurser baserade på effekten av FX-optioners förfall

Mozayyan Esfahani, Sina January 2019 (has links)
The equity option expiration effect is a well observed phenomenon and is explained by delta hedge rebalancing and pinning risk, which makes the strike price of an option work as a magnet for the underlying price. The FX option expiration effect has not previously been explored to the same extent. In this paper the FX option expiration effect is investigated with the aim of finding out whether it provides valuable information for predicting FX rate movements. New models are created based on the concept of the option relevance coefficient that determines which options are at higher risk of being in the money or out of the money at a specified future time and thus have an attraction effect. An algorithmic trading strategy is created to evaluate these models. The new models based on the FX option expiration effect strongly outperform time series models used as benchmarks. The best results are obtained when the information about the FX option expiration effect is included as an exogenous variable in a GARCH-X model. However, despite promising and consistent results, more scientific research is required to be able to draw significant conclusions. / Effekten av aktieoptioners förfall är ett välobserverat fenomen, som kan förklaras av delta hedge-ombalansering och pinning-risk. Som följd av dessa fungerar lösenpriset för en option som en magnet för det underliggande priset. Effekten av FX-optioners förfall har tidigare inte utforskats i samma utsträckning. I denna rapport undersöks effekten av FX-optioners förfall med målet att ta reda på om den kan ge information som kan användas till prediktioner av FX-kursen. Nya modeller skapas baserat på konceptet optionsrelevanskoefficient som bestämmer huruvida optioner har en större sannolikhet att vara "in the money" eller "out of the money" vid en specificerad framtida tidpunkt och därmed har en attraktionseffekt. En algoritmisk tradingstrategi skapas för att evaluera dessa modeller. De nya modellerna baserade på effekten av FX-optioners förfall överpresterar klart jämfört med de tidsseriemodeller som användes som riktmärken. De bästa resultaten uppnåddes när informationen om effekten av FX-optioners förfall inkluderas som en exogen variabel i en GARCH-X modell. Dock, trots lovande och konsekventa resultat, behövs mer vetenskaplig forskning för att kunna dra signifikanta slutsatser.

Unsupervised Anomaly Detection on Multi-Process Event Time Series

Vendramin, Nicoló January 2018 (has links)
Establishing whether the observed data are anomalous or not is an important task that has been widely investigated in literature, and it becomes an even more complex problem if combined with high dimensional representations and multiple sources independently generating the patterns to be analyzed. The work presented in this master thesis employs a data-driven pipeline for the definition of a recurrent auto-encoder architecture to analyze, in an unsupervised fashion, high-dimensional event time-series generated by multiple and variable processes interacting with a system. Facing the above mentioned problem the work investigates whether it is possible or not to use a single model to analyze patterns produced by different sources. The analysis of log files that record events of interaction between users and the radio network infrastructure is employed as realworld case-study for the given problem. The investigation aims to verify the performances of a single machine learning model applied to the learning of multiple patterns developed through time by distinct sources. The work proposes a pipeline, to deal with the complex representation of the data source and the definition and tuning of the anomaly detection model, that is based on no domain-specific knowledge and can thus be adapted to different problem settings. The model has been implemented in four different variants that have been evaluated over both normal and anomalous data, gathered partially from real network cells and partially from the simulation of anomalous behaviours. The empirical results show the applicability of the model for the detection of anomalous sequences and events in the described conditions, with scores reaching above 80% in terms of F1-score, and varying depending on the specific threshold setting. In addition, their deeper interpretation gives insights about the difference between the variants of the model and thus, their limitations and strong points. / Att fastställa huruvida observerade data är avvikande eller inte är en viktig uppgift som har studerats ingående i litteraturen och problemet blir ännu mer komplext, om detta kombineras med högdimensionella representationer och flera källor som oberoende genererar de mönster som ska analyseras. Arbetet som presenteras i denna uppsats använder en data-driven pipeline för definitionen av en återkommande auto-encoderarkitektur för att analysera, på ett oövervakat sätt, högdimensionella händelsetidsserier som genereras av flera och variabla processer som interagerar med ett system. Mot bakgrund av ovanstående problem undersöker arbetet om det är möjligt eller inte att använda en enda modell för att analysera mönster som producerats av olika källor. Analys av loggfiler som registrerar händelser av interaktion mellan användare och radionätverksinfrastruktur används som en fallstudie för det angivna problemet. Undersökningen syftar till att verifiera prestandan hos en enda maskininlärningsmodell som tillämpas för inlärning av flera mönster som utvecklats över tid från olika källor. Arbetet föreslår en pipeline för att hantera den komplexa representationen hos datakällorna och definitionen och avstämningen av anomalidetektionsmodellen, som inte är baserad på domänspecifik kunskap och därför kan anpassas till olika probleminställningar. Modellen har implementerats i fyra olika varianter som har utvärderats med avseende på både normala och avvikande data, som delvis har samlats in från verkliga nätverksceller och delvis från simulering av avvikande beteenden. De empiriska resultaten visar modellens tillämplighet för detektering av avvikande sekvenser och händelser i det föreslagna ramverket, med F1-score över 80%, varierande beroende på den specifika tröskelinställningen. Dessutom ger deras djupare tolkning insikter om skillnaden mellan olika varianter av modellen och därmed deras begränsningar och styrkor.

