• Refine Query
  • Source
  • Publication year
  • to
  • Language
  • 4
  • Tagged with
  • 4
  • 4
  • 4
  • 2
  • 2
  • 2
  • 2
  • 2
  • 2
  • 2
  • 2
  • 2
  • 1
  • 1
  • 1
  • About
  • The Global ETD Search service is a free service for researchers to find electronic theses and dissertations. This service is provided by the Networked Digital Library of Theses and Dissertations.
    Our metadata is collected from universities around the world. If you manage a university/consortium/country archive and want to be added, details can be found on the NDLTD website.

Supervised Machine Learning Modeling in Secondary Metallurgy : Predicting the Liquid Steel Temperature After the Vacuum Treatment Step of the Vacuum Tank Degasser

Vita, Roberto January 2022 (has links)
In recent years the steelmaking industry has been subjected to continuous attempts to improve its production route. The main goals has been to increase the competitiveness and to reduce the environmental impact. The development of predictive models has therefore been of crucial importance in order to achieve such optimization. Models are representations or idealizations of reality which can be used to investigate new process strategies without the need of intervention in the process itself. Together with the development of Industry 4.0, Machine Learning (ML) has turned out as a promising modeling approach for the steel industry. However, ML models are generally difficult to interpret, which makes it complicated to investigate if the model accurately represents reality. The present work explores the practical usefulness of applied ML models in the context of the secondary metallurgy processes in steelmaking. In particular, the application of interest is the prediction of the liquid steel temperature after the vacuum treatment step in the Vacuum Tank Degasser (VTD). The choice of the VTD process step is related to its emerging importance in the SSAB Oxelösund steel plant due to the planned future investment in an Electric Arc Furnace (EAF) based production line. The temperature is an important parameter of process control after the vacuum treatment since it directly influences the castability of the steel. Furthermore, there are not many available models which predict the temperature after the vacuum treatment step. The present thesis focuses first on giving a literature background of the statistical modeling approach, mainly addressing the ML approach, and the VTD process. Furthermore, it is reported the methodology behind the construction of the ML model for the application of interest and the results of the numerical experiments. All the statistical concepts used are explained in the literature section. By using the described methodologies, several findings originated from the resulting ML models predicting the temperature of the liquid steel after the vacuum treatment in the VTD.A high complexity of the model is not necessary in order to achieve a high predictive performance on the test data. On the other hand, the data quality is the most important factor to take into account when improving the predictive performance. Itis fundamental having an expertise in both metallurgy and machine learning in order to create a machine learning model that is both relevant and interpretable to domain experts. This knowledge is indeed fundamental for the selection of the input data and the machine learning model framework. Crucial information for the predictions result to be the heat status of the ladle as well as the stirring process time and the temperature benchmarks before and after the vacuum steps. However, to draw specific conclusions, a higher model predictive performance is needed. This can only be obtained upon a significant data quality improvement. / Stålindustrin har under de senaste åren ständigt förbättrat sin produktionsförmåga som i huvudsak har bidragit till ökad konkurrenskraft och minskad miljöpåverkan. Utvecklingen  av  prediktiva  modeller  har  under  denna  process  varit  av  avgörande betydelse för att uppnå dessa bedrifter. Modeller är representationer eller idealiseringar av verkligheten som kan användas för att utvärdera nya processtrategier utan att åberopa  ingrepp  i  själva  processen.    Detta  sparar  industrin  både  tid och pengar.   I takt  med  Industri  4.0  har  maskininlärning  blivit  uppmärksammad  som ett ytterligare modelleringsförfarande inom stålindustrin. Maskininlärningsmodeller är dock generellt svårtolkade, vilket gör det utmanande att undersöka om modellen representerar verkligheten. Detta arbete undersöker den praktiska användningen av maskininlärningsmodeller inom sekundärmetallurgin på  ett  svenskt  stålverk.    Tillämpningen  är  i  synnerhet av   intresse   för   att   kunna   förutspå   temperaturen   hos   det   flytande   stålet   efter vakuumbehandlingssteget  i  VTD-processen. Denna  process  valdes  eftersom den är av  stor  betydelse  för  framtida  ståltillverkning  hos  SSAB  i  Oxelösund. Detta är primärt  på  grund  utav  att  SSAB  kommer  att  investera  i  en ljusbågsugnsbaserad produktionslinje.   Temperaturen är en viktig processparameter eftersom den direkt påverkar   stålets   gjutbarhet. Utöver   detta   har   inga   omfattande   arbeten   gjorts gällande  att  förutspå  temperaturen  efter vakuumbehandlingssteget  med  hjälp av maskininlärningsmodeller. Arbetet presenterar först en litteraturbakgrund inom statistisk modellering med fokus på maskininlärning och VTD-processen.  Därefter redovisas metodiken som använts för att skapa  maskininlärningsmodellerna  som  ligger  till  grund  för  de  numeriska experimenten samt resultaten. Genom att använda de beskrivna metoderna härrörde flera fynd från de skapande maskininlärningsmodellerna. En hög grad av komplexitet är inte   nödvändig   för   att   uppnå   en   hög   prediktiv   förmåga   på   data   som   inte använts  för  att  anpassa  modellens  parametrar.   Å  andra  sidan  är  datakvalitén den viktigaste faktorn om man ämnar att förbättra den prediktiva förmågan hos modellen. Utöver  detta  är  det  av  yttersta  vikt  att  ha  kompetens  inom  både  metallurgi  och maskininlärning för att skapa en modell som är både relevant och tolkbar för experter inom  området  processmetallurgi. Ideligen  är  kunskap  inom  processmetallurgi grundläggande för val av indata och val av maskininlärningsalgoritm. Under analysen av maskininlärningsmodellerna upptäcktes det att skänkens värmestatus, omrörningstiden i processen, samt temperaturriktmärkena före och efter vakuumstegen var de mest avgörande variablerna för modellens prediktiva förmåga. För att kunna dra specifika slutsatser behöver modellen ha en högre prediktiv förmåga. Detta kan endast erhållas efter en betydande förbättring av datakvalitén.

Customer Lifetime Value Prediction Using Statistical Modeling: Predicting Online Payments in an Industry Setting / Kundens livstidsvärde förutsägelse med statistisk modellering: predikera online betalningar i en industriell miljö

SUSOYKINA, Alina January 2018 (has links)
Customer lifetime value (CLV) provides a measure of customer revenue contribution. It allows to justify marketing campaigns, overall budgeting, and strategy planning. CLV is an estimated cash flow attributed to the entire relationship with customers in the future. Ability to utilize information gained from CLV analysis at the most efficient way, provides a strong competitive advantage. The concept of CLV was studied and modeled with application to the online payments industry which is relatively new and at its growing phase. Ability to predict CLV accurately conveys a great value for guiding the industry (i.e. emerging companies) to maturity. CLV analysis in this case becomes complex due to the fact that usually the databases of such companies are huge and include transactions from different industries: e-commerce, financial services, travel, gaming etc. This paper aims to define an appropriate model for CLV prediction in the online payments setting. The proposed model segments customers first in order to improve performance of the predictive model. Then Pareto/NBD model was applied to predict CLV at the customer-level for each customer segment separately. Although the results show that it is possible to predict CLV at some extent, the model needs to be further improved and possible pitfalls need to be scrutinized. Discussion on these issues is provided in the following sections. / Kundens livstidsvärde (Customer lifetime value) är ett mått på hur en kund bidrar till företagets omsättning. Det tillåter att åskådliggöra försäljningskampanjer, företagets budget och företagets strategi. Kundens livstidsvärde är en estimering av betalningsflöde som ett företag kan tjäna av kunder i framtiden. Möjligheten att nyttiggöra informationen från kundens livstidsvärde analys ger företag en starkt konkurrenskraftig fördel. Kundens livstidsvärde var studerat och modellerat med anknytning till online betalningstjänster industri, vilken har utvecklats kraftigt inom senaste åren. Möjligheten att predikera kundens livstidsvärde med hög noggranhet medför ett starkt värde för företag som erbjuder tjänster inom online betalningar och kan driva dessa till mognad. Att predikera kundens livstidsvärde inom denna bransch anses vara en komplex process, då databaser hos såna föratag är stora och inkluderar information om transaktioner från olika industrier såsom: elektronisk handel, finansiella tjänster, rese- och spelbolag. I denna studie definieras en modell för att kunna predikera kundens livstidsvärde baserat på data från ett företag som tillhandahåller online betalningstjänster. För att uppnå bättre prestanda, segmenterar den föreslagna modellen kunder först. Därefter en Pareto/NBD modell används, för att predikera kundens livstidsvärde för varje kundsegment. Trots att resultat visar att kundens livtidsvärde kan modelleras till en viss nivå, modellen behöver förbättras och möjliga blindskär måste granskas.

Statistical Modelling of Price Difference Durations Between Limit Order Books: Applications in Smart Order Routing / Statistisk modellering av varaktigheten av prisskillnader mellan orderböcker: Tillämpningar inom smart order routing

Backe, Hannes, Rydberg, David January 2023 (has links)
The modern electronic financial market is composed of a large amount of actors. With the surge in algorithmic trading some of these actors collectively behave in increasingly complex ways. Historically, academic research related to financial markets has been focused on areas such as asset pricing, portfolio management and financial econometrics. However, the fragmentation of the financial market has given rise to a different set of problems, namely the order allocation problem, as well as smart order routers as a tool to comply with these. In this thesis we consider price discrepancies between order books, trading the same instruments, as a proxy for order routing opportunities. A survival analysis framework for these price differences is developed. Specifically, we consider the two widely used Kaplan-Meier and Cox Proportional Hazards models, as well as the somewhat less known Random Survival Forest model, in order to investigate whether such a framework is effective for predicting the survival times of price differences. The results show that the survival models outperform random models and fixed routing decisions significantly. Thus suggesting that such models could beneficially be incorporated into existing SOR environments. Furthermore, the implementation of order book parameters as covariates in the CPH and RSF models add additional performance. / Den moderna elektroniska marknaden består av ett stort antal aktörer som, till följd av ökningen av algoritmisk handel, beter sig alltmer komplext. Historiskt sett har akademisk forskning inom finans i huvudsak fokuserat på områden som prissättning av tillgångar, portföljförvaltning och finansiell ekonometri. Fragmentering av finansiella marknader har däremot gett upphov till nya sorters problem, däribland orderplaceringsproblemet. Följdaktligen har smart order routers utvecklats som ett verktyg för att tillmötesgå detta problem. I detta examensarbete studerar vi prisskillnader mellan orderböcker som tillhandhåller handel av samma instrument. Dessa prisskillnader representerar möjligheter för order routing. Vi utvecklar ett ramverk inom överlevnadsanalys för dessa prisskillnader. Specifikt används de välkända Kaplan-Meier- och Cox Proportional Hazards-modellerna samt den något mindre kända Random Survival Forest, för att utvärdera om ett sådant ramverk kan användas för att förutspå prisskillnadernas livstider. Våra resultat visar att dessa modeller överträffar slumpmässiga modeller samt deterministiska routingstrategier med stor marginal och antyder därmed att ett sådant ramverk kan integreras i SOR-system. Resultaten visar dessutom att användning av orderboksparametrar som variabler i CPH- och RSF-modellerna ökar prestandan.

Neural Ordinary Differential Equations for Anomaly Detection / : Neurala Ordinära Differentialekvationer för Anomalidetektion

Hlöðver Friðriksson, Jón, Ågren, Erik January 2021 (has links)
Today, a large amount of time series data is being produced from a variety of different devices such as smart speakers, cell phones and vehicles. This data can be used to make inferences and predictions. Neural network based methods are among one of the most popular ways to model time series data. The field of neural networks is constantly expanding and new methods and model variants are frequently introduced. In 2018, a new family of neural networks was introduced. Namely, Neural Ordinary Differential Equations (Neural ODEs). Neural ODEs have shown great potential in modelling the dynamics of temporal data. Here we present an investigation into using Neural Ordinary Differential Equations for anomaly detection. We tested two model variants, LSTM-ODE and latent-ODE. The former model utilises a neural ODE to model the continuous-time hidden state in between observations of an LSTM model, the latter is a variational autoencoder that uses the LSTM-ODE as encoding and a Neural ODE as decoding. Both models are suited for modelling sparsely and irregularly sampled time series data. Here, we test their ability to detect anomalies on various sparsity and irregularity ofthe data. The models are compared to a Gaussian mixture model, a vanilla LSTM model and an LSTM variational autoencoder. Experimental results using the Human Activity Recognition dataset showed that the Neural ODEbased models obtained a better ability to detect anomalies compared to their LSTM based counterparts. However, the computational training cost of the Neural ODE models were considerably higher than for the models that onlyutilise the LSTM architecture. The Neural ODE based methods were also more memory consuming than their LSTM counterparts. / Idag produceras en stor mängd tidsseriedata från en mängd olika enheter som smarta högtalare, mobiltelefoner och fordon. Denna datan kan användas för att dra slutsatser och förutsägelser. Neurala nätverksbaserade metoder är bland de mest populära sätten att modellera tidsseriedata. Mycket forskning inom området neurala nätverk pågår och nya metoder och modellvarianter introduceras ofta. Under 2018 introducerades en ny familj av neurala nätverk. Nämligen, Neurala Ordinära Differentialekvationer (NeuralaODE:er). Neurala ODE:er har visat en stor potential i att modellera dynamiken hos temporal data. Vi presenterar här en undersökning i att använda neuralaordinära differentialekvationer för anomalidetektion. Vi testade två olika modellvarianter, en som kallas LSTM-ODE och en annan som kallas latent-ODE.Den förstnämnda använder Neurala ODE:er för att modellera det kontinuerliga dolda tillståndet mellan observationer av en LSTM-modell, den andra är en variational autoencoder som använder LSTM-ODE som kodning och en Neural ODE som avkodning. Båda dessa modeller är lämpliga för att modellera glest och oregelbundet samplade tidsserier. Därför testas deras förmåga att upptäcka anomalier på olika gleshet och oregelbundenhet av datan. Modellerna jämförs med en gaussisk blandningsmodell, en vanlig LSTM modell och en LSTM variational autoencoder. Experimentella resultat vid användning av datasetet Human Activity Recognition (HAR) visade att de Neurala ODE-baserade modellerna erhöll en bättre förmåga att upptäcka avvikelser jämfört med deras LSTM-baserade motsvarighet. Träningstiden förde Neurala ODE-baserade modellerna var dock betydligt långsammare än träningstiden för deras LSTM-baserade motsvarighet. Neurala ODE-baserade metoder krävde också mer minnesanvändning än deras LSTM motsvarighet.

Page generated in 0.1399 seconds