Spelling suggestions: "subject:"ensemblemodeller"" "subject:"ensemble""
1 |
Pricing collateralized loan obligation tranches using machine learning : Machine learning applied to financial data / Prissättning av collateralized loan obligation tranches med hjälp av maskininlärning : Artificiella neurala nätverk applicerade på finansiell dataEnström, Marcus January 2022 (has links)
Machine learning and neural networks have recently become very popular in a large category of domains, partly thanks to their ability to solve complex problems by finding patterns in data, but also due to an increase in computing power and data availability. Successful applications of machine learning include for example image classification, natural language processing, and product recommendation. Despite the potential upside of machine learning applied to financial data there exists relatively few articles published while the ones that do exist exhibit that there exists a potential for the tools that it provides. This thesis utilizes neural networks to price collateralized loan obligations which is a type of bond that is backed by a large pool of corporate loans, rather than being issued by a single company or government like a regular bond. The large pool of corporate loans and structure of a collateralized loan obligation makes it a good candidate for this type of research as it involves regressing a large number of variables into a final single real-valued price of the bond where the relations are not necessarily linear. The thesis establishes a relatively simple model and builds upon this using a state-of-the-art ensemble method while also exploring a volatility scaled loss function. The findings of this thesis are that artificial neural networks can price collateralized loan obligations using only their structural and loan pool data with an accuracy close to that of a human. Ensemble methods outperform non-ensemble methods and boost performance by up to 28% when only considering mean squared error while scaling the loss function with the inverse of market volatility does not boost performance. The best performing model can price a collateralized loan obligation tranche rated AAA with an average absolute error of 0.88 and an equity tranche with an average mean absolute error of 4.67. / Under de senaste åren har maskininlärning samt artificiella neurala nätverk blivit väldigt populära i många olika domäner. Detta är delvis tack vare deras förmåga att lösa komplexa problem genom att hitta mönster i data, men även tack vare en ökning i beräkningskraft samt att tillgängligheten av data har blivit bättre. Några exempel på områden där maskininlärning har applicerats med framgång är klassificering av bilder, språkteknologi samt produktrekommendationer. Trots att maskininlärning skulle kunna erbjuda en stor potentiell uppsida vid lyckad tillämpning på finansiella data finns relativt lite studier publicerade kring ämnet. De studier som däremot är publicerade visar på stora möjligheter inom området. Den här studien använder artificiella neurala nätverk för att prissätta ”collateralized loan obligations” (CLOs), som tyvärr inte har någon bra svensk översättning. En CLO utfärdar obligationer vars underliggande värde härstammar från en portfölj av företagslån, och är därmed ett finansiellt instrument. Strukturen av en CLO och dess underliggande lånportfölj ger upphov till en stor mängd data, vilket gör instrumentet till en bra kandidat för maskininlärning. Studien etablerar ett relativt enkelt neuralt nätverk som sedan används för ett jämföra med en ensemblemetod samt en modifierad loss funktion som tar höjd för volatilitet. Slutsatserna av den här studien är att neurala nätverk lyckas prissätta instrumenten näst intill lika bra som vad en människa skulle kunna göra med befintliga metoder som bygger på Monte Carlo simulering. Däremot är studiens metod inte lika beroende av antaganden som gör den befintliga metoden väldigt känslig. Vidare så bidrar ensemblemetoden som används till att minska det genomsnittliga felet i kvadrat med upp till 28%. Att ta höjd för volatilitet vid inlärning bidar inte till att minska felet.
|
2 |
Hybrid Ensemble Methods: Interpretible Machine Learning for High Risk Aeras / Hybrida ensemblemetoder: Tolkningsbar maskininlärning för högriskområdenUlvklo, Maria January 2021 (has links)
Despite the access to enormous amounts of data, there is a holdback in the usage of machine learning in the Cyber Security field due to the lack of interpretability of ”Blackbox” models and due to heterogenerous data. This project presents a method that provide insights in the decision making process in Cyber Security classification. Hybrid Ensemble Methods (HEMs), use several weak learners trained on single data features and combines the output of these in a neural network. In this thesis HEM preforms phishing website classification with high accuracy, along with interpretability. The ensemble of predictions boosts the accuracy with 8%, giving a final prediction accuracy of 93 %, which indicates that HEM are able to reconstruct correlations between the features after the interpredability stage. HEM provides information about which weak learners trained on specific information that are valuable for the classification. No samples were disregarded despite missing features. Cross validation were made across 3 random seeds and the results showed to be steady with a variance of 0.22%. An important finding was that the methods performance did not significantly change when disregarding the worst of the weak learners, meaning that adding models trained on bad data won’t sabotage the prediction. The findings of these investigations indicates that Hybrid Ensamble methods are robust and flexible. This thesis represents an attempt to construct a smarter way of making predictions, where the usage of several forms of information can be combined, in an artificially intelligent way. / Trots tillgången till enorma mängder data finns det ett bakslag i användningen av maskininlärning inom cybersäkerhetsområdet på grund av bristen på tolkning av ”Blackbox”-modeller och på grund av heterogen data. Detta projekt presenterar en metod som ger insikt i beslutsprocessen i klassificering inom cyber säkerhet. Hybrid Ensemble Methods (HEMs), använder flera svaga maskininlärningsmodeller som är tränade på enstaka datafunktioner och kombinerar resultatet av dessa i ett neuralt nätverk. I denna rapport utför HEM klassificering av nätfiskewebbplatser med hög noggrannhet, men med vinsten av tolkningsbarhet. Sammansättandet av förutsägelser ökar noggrannheten med 8 %, vilket ger en slutgiltig prediktionsnoggrannhet på 93 %, vilket indikerar att HEM kan rekonstruera korrelationer mellan funktionerna efter tolkbarhetsstadiet. HEM ger information om vilka svaga maskininlärningsmodeller, som tränats på specifik information, som är värdefulla för klassificeringen. Inga datapunkter ignorerades trots saknade datapunkter. Korsvalidering gjordes över 3 slumpmässiga dragningar och resultaten visade sig vara stabila med en varians på 0.22 %. Ett viktigt resultat var att metodernas prestanda inte förändrades nämnvärt när man bortsåg från de sämsta av de svaga modellerna, vilket innebär att modeller tränade på dålig data inte kommer att sabotera förutsägelsen. Resultaten av dessa undersökningar indikerar att Hybrid Ensamble-metoder är robusta och flexibla. Detta projekt representerar ett försök att konstruera ett smartare sätt att göra klassifieringar, där användningen av flera former av information kan kombineras, på ett artificiellt intelligent sätt.
|
Page generated in 0.0704 seconds