131 |
Intelligent hydropower : Making hydropower more efficient by utilizing machine learning for inflow forecasting / Intelligent vattenkraft : Effektivisering av vattenkraft genom användning av maskininlärningClaesson, Jakob, Molavi, Sam January 2020 (has links)
Inflow forecasting is important when planning the use of water in a hydropower plant. The process of making forecasts is characterized by using knowledge from previous events and occurrences to make predictions about the future. Traditionally, inflow is predicted using hydrological models. The model developed by the Hydrologiska Byråns Vattenbalansavdelning (HBV model) is one of the most widely used hydrological models around the world. Machine learning is emerging as a potential alternative to the current HBV models but needs to be evaluated. This thesis investigates machine learning for inflow forecasting as a mixed qualitative and quantitative case study. Interviews with experts in various backgrounds within hydropower illustrated the key issues and opportunities for inflow forecasting accuracy and laid the foundation for the machine learning model created. The thesis found that the noise in the realised inflow data was one of the main factors which affected the quality of the machine learning inflow forecasts. Other notable factors were the precipitation data from the three closest weather stations. The interviews suggested that the noise in the realised inflow data could be due to faulty measurements. The interviews also provided examples of additional data such as snow quantity measurements and ground moisture levels which could be included in a machine learning model to improve inflow forecast performance. One proposed application for the machine learning model was as a complementary tool to the current HBV model to assist in making manual adjustments to the forecasts when considered necessary. The machine learning model achieved an average Mean Absolute Error (MAE) of 1.39 compared to 1.73 for a baseline forecast for inflow to the Lake Kymmen river system 1-7 days ahead over the period 2015-2019. For inflow to the Lake Kymmen river system 8-14 days ahead the machine learning model achieved an average MAE of 1.68 compared to 2.45 for a baseline forecast. The current HBV model in place had a lower average MAE than the machine learning model over the available comparison period of January 2018. / Tillrinningsprognostisering är viktig vid planeringen av vattenanvändningen i ett vattenkraftverk. Prognostiseringsprocessen går ut på att använda tidigare kunskap för att kunna göra prediktioner om framtiden. Traditionellt sett har tillrinningsprognostisering gjorts med hjälp av hydrologiska modeller. Hydrologiska Byråns Vattenbalansavdelning-modellen (HBV-modellen) är en av de mest använda hydrologiska modellerna och används världen över. Maskininlärning växer för tillfället fram som ett potentiellt alternativ till de nuvarande HBV-modellerna men behöver utvärderas. Det här examensarbetet använder en blandad kvalitativ och kvantitativ metod för att utforska maskininlärning för tillrinningsprognostisering i en fallstudie. Intervjuer med experter med olika bakgrund inom vattenkraft påtalade nyckelfrågor och möjligheter för precisering av tillrinningsprognostisering och lade grunden för den maskininlärningsmodell som skapades. Den här studien fann att brus i realiserade tillrinningsdata var en av huvudfaktorerna som påverkade kvaliteten i tillrinningsprognoserna av maskininlärningsmodellen. Andra nämnvärda faktorer var nederbördsdata från de tre närmaste väderstationerna. Intervjuerna antydde att bruset i realiserade tillrinningsdatana kan bero på felaktiga mätvärden. Intervjuerna bidrog också med exempel på ytterligare data som kan inkluderas i en maskininlärningsmodell för att förbättra tillrinningsprognoserna, såsom mätningar av snömängd och markvattennivåer. En föreslagen användning för maskininlärningsmodellen var som ett kompletterande verktyg till den nuvarande HBV-modellen för att underlätta manuella justeringar av prognoserna när det bedöms nödvändigt. Maskininlärningsmodellen åstadkom ett genomsnittligt Mean Absolute Error (MAE) på 1,39 jämfört med 1,73 för en referensprognos för tillrinningen till Kymmens sjösystem 1–7 dagar fram i tiden under perioden 2015–2019. För tillrinningen till Kymmens sjösystem 8–14 dagar fram i tiden åstadkom maskininlärningsmodellen ett genomsnittligt MAE på 1,68 jämfört med 2,45 för en referensprognos. Den nuvarande HBV-modellen hade ett lägre genomsnittligt MAE jämfört med maskininlärningsmodellen under den tillgängliga jämförelseperioden januari 2018.
|
132 |
Early Anomaly Detection in Electrical Bushings Manufacturing at Hitachi EnergyQuintero Suárez, Felipe January 2022 (has links)
The manufacturing of electrical bushings for high voltages is complicated and highly demanding technology-wise. This process has more than 10 steps where a single mistake in the chain could cause a complete failure of the final product. A faulty bushing represents high costs to the company both economically and in terms of public image. Nowadays, fault detection is corrective-oriented, which means that there is low traceability on where the problem happens, and it is only detected once the final product is tested. This thesis aims to test a machine learning tool from Imagimob® to determine if is possible to detect faults during the manufacturing process using the existing captured data. To perform the test, a sample from 2019 was taken where the production of the bushings reached a 60% scrap rate. A deep-learning neural network with a 2D convolutional layer was implemented. The outcome of the system showed an efficiency of 80%. However, due to the complexity of the bushing manufacturing process, the few data samples, and the addition of different factors that can result in a faulty bushing, a range of probability is set depending on the number of anomalies detected. With such validation, the tool can label 18% of the bushings as surely faulty, and 27% as most likely faulty. The limitation of the tool is that the information must be analyzed after each step is done, and not continuously. Hence further research should be carried out on implementing a real-time tool. / Tillverkningen av elektriska genomföringar för högspänning är komplicerad och mycket krävande teknikmässigt. Denna process har mer än 10 steg där ett enda misstag i kedjan kan orsaka ett fullständigt misslyckande i slutprodukten. En felaktig genomföring innebär höga kostnader för företaget både ekonomiskt och motverkar en god image. Nuförtiden är feldetekteringen korrigerande-orienterad, det betyder att det är låg spårbarhet på var problemet uppstår och upptäcks först när slutprodukten testas. Syftet med detta examensarbete är att testa ett maskininlärningsverktyg från Imagimob® för att avgöra om det är möjligt att upptäcka fel under tillverkningsprocessen med hjälp av befintliga insamlade data. För att utföra testet togs ett prov från 2019 där produktionen av genomföringar nådde 60 % skrotmängd. Ett djupt lärande-neuralt nätverk med 2D-konvolutionelt lager implementerades. Det slutliga resultatet av systemet visade en effektivitet på 80 %. På grund av komplexiteten i tillverkningsprocessen för genomföringarna, de få datapunkterna och tillägget av olika faktorer som kan resultera i en felaktig genomföring, ställs ett sannolikhetsområde in beroende på antalet upptäckta avvikelser. Med en sådan validering kan verktyget markera 18 % av genomföringarna som säkert felaktiga och 27 % som troligen felaktiga. Begränsningen med verktyget är att informationen måste analyseras efter att varje steg är gjort, och inte kontinuerligt, därför bör ytterligare forskning göras för att implementera ett realtidsverktyg.
|
133 |
Att använda ansiktsigenkänning inom bekämpning av narkotikahandel / Using facial recognition against drug traffickingPiehl, Tommaso, Sassani, Kevin January 2022 (has links)
Sweden has during the last couple of years seen an increase of drug-related crime compared to previous years. Although the amount of reported crimes has increased, the amount of solved crimes has decreased [4]. Other countries have, in the meantime, implemented artificial intelligence in law enforcement. It’s been used on digital platforms as well as surveillance in the real world [2]. One of the main forms in which artificial intelligence has been used is facial recognition. This technology has been proven to have great potential in the field of fighting and preventing crimes. However, questions have arised regarding the ethical aspects of high scale surveillance and the collection of personal data about citizens [1]. This study revolves around professional opinions regarding the use of facial recognition in order to fight drug-trafficking. More specifically taking place in public places around Sweden. Therefore, opinions from the users and developers of the technology have been compared in order to find out if they differ in any way. This study is based on data collected from interviews with police officers, police students and machine learning students from the masters program at KTH. The choice of participants for this study is made in order for the users of the technology to be represented by police and its developers being represented by the machine learning students. Furthermore, the data has been analyzed by comparing the answers from the police officers and students with the answers from the machine learning students. The results from this study shows that both groups regard facial recognition as something which would facilitate law enforcement. However, both groups were skeptical regarding the integrity aspect of the Tommaso Piehl EECS, Skolan för elektroteknik och datavetenskap Stockholm tommasop@kth.se implementation, especially among the machine learning students. More generally, the main difference between the groups was that the police-related participants were ultimately open to use the technology. On the contrary, the machine learning students saw this as too great of a threat to personal privacy. / I Sverige har under senare år kriminalitet kopplad till narkotikahandel haft en ökning jämfört med tidigare år. I takt med ökningen av anmälda brott har antalet lösta brott minskat [4]. Samtidigt har andra länder börjat använda sig av artificiell intelligens i syfte att bekämpa brott, både på digitala plattformar och fysiska platser [2]. Användningen av artificiell intelligens, mer specifikt i form av ansiktsigenkänning, har stor potential inom effektivisering av brottsbekämpning. Samtidigt uppstår många frågor kring den etiska aspekten av storskalig övervakning och insamling av personlig information [1]. Därmed är syftet med denna studie att undersöka om det finns några skillnader i hur användare och utvecklare av tekniken förhåller sig till dess användning. Mer specifikt är studien inriktad på ställningstaganden till användningen av ansiktsigenkänning för att bekämpa offentlig narkotikahandel i Sverige. Studien är baserad på data som har samlats in genom intervjuer av poliser, polisstudenter och studenter från KTH:s maskininlärningssprogram på masternivå. Tanken är att poliserna respektive maskininlärningsstudenterna representerar användare respektive utvecklare. Datan har analyserats genom att jämföra svaren från poliserna och polisstudenterna med svaren från maskininlärningsstudenterna. Resultatet från1.1 Bakgrund undersökningen visade att tekniken enligt båda grupper skulle underlätta polisens arbete. Däremot var båda grupper skeptiska till integritetsaspekten av implementationen, speciellt maskininlärningsstudenterna. Mer generellt var den största skillnaden att poliserna i slutändan var öppna för att använda tekniken. Maskininlärningsstudenterna såg det istället som ett alltför stort hot mot den personliga integriteten.
|
134 |
Application of TensorFlow lite on embedded devices : A hands-on practice of TensorFlow model conversion to TensorFlow Lite model and its deployment on Smartphone to compare model’s performanceRashidi, Mitra January 2022 (has links)
Rapporten beskriver processutvecklingen av integration inom smart-enheter och gör jämförelse med de traditionella datormodeller som exempelvis TensorFlow. Maskininlärning är ett område som för närvarande observeras av många människor på grund av dess anmärkningsvärda önskan inom olika intelligenta områden som datorseende, naturlig språkbehandling, föreslagna datorsystem, etcetera. Problem med utdata och tidsserier. Resursbegränsningen av smart-enheter gör det svårt att uppfatta olika aktiviteter som helt annorlunda än en stor process. En rekommenderad användarvänlig process för att utföra design, utveckling, utvärdering och leverans av maskininlärning-modeller för resurs begränsade inbäddade enheter. TensorFlow och TensorFlow Lite valdes ut för att utföra examensarbetet som tillhandahåller arbetsflödet för en maskininlärning-modell designad för en dator, bärbar dator eller en komprimerad och optimerad version av samma modell integrerad på en enda enhet har begränsade resurser. Modellerna jämförs och resultaten erhålls. Resultatet det visar sig att TensorFlow Lite-modellen är extremt starkt integrerad med maskininlärning i inbyggda enheter Lagringen av den utvecklade modell filen, tid det tog för att förutsäga värdet jämfördes. Resultaten visade att TensorFlow Lite-modellen var korrekt i jämförelse med basmodellen, då storleken på TensorFlow Lite var 60 % mindre än basstorleken och responstid för TensorFlow Lite-modellen var 70 % mindre än basmodellen. Detta visar att det finns en möjlighet att integrera maskininlärning i enheter med den process som föreslås i avhandlingen. Slutligen är modellen gjord på en Android-smartphone, dess praktiska funktionalitet och genomförbarhet har visat. Ramverket har ett unikt och pålitligt tillvägagångssätt, vilket ger flexibilitet samtidigt som det klarar utmaningen att integrera i Android-enheter. / The thesis describes development of Machine learning (ML) integration procedure in smartphone and provides a comparison with the traditional computer models like TensorFlow. Machine learning is a field that promotes a lot of observation in the current era due to its notable desire in various Intelligent applications such as computer vision, natural language processing, recommendation systems, and time series problems. The limitation of resources on a smartphone makes it challenging to apprehend varied completely different activities with high precision. A user-friendly procedure is proposed to perform the designing, development, evaluation and deployment of Machine learning models for embedded devices with limited resources. TensorFlow (TF) and TensorFlow lite (TF Lite) were selected to perform the task. The thesis provides the procedure of a base Machine learning model designed for a computer, laptop or a machine to a compressed and optimized version of the same model for integration on a device with limited resources. The models were compared, and results were obtained. It was found that the TensorFlow lite model is extremely favorable for Machine learning integration in embedded devices. The storage of the developed model file and the time taken for the prediction of the value was compared. The results showed that the TensorFlow lite model was as accurate as the basic model, the size of the TensorFlow lite model was 60% less than the size of the base model and the response time of the TensorFlow lite model was 70% less than the base model. This showed that the Machine learning integration to the embedded devices is promising with the procedure proposed in the thesis. Finally, the model was deployed in the android smart phone and its practicality and feasibility of use was showed. The framework adopts a unique and reliable approach that provides flexibility while passing the challenge of Machine learning integrated in the android device.
|
135 |
Data Analysis for Hearability and Synchronization in Telecom Systems / Dataanalys för hörbarhet och synkronisering i telekomsystemXin, Sun January 2022 (has links)
In a wireless communication system, synchronization is one of the most critical functions. Good timing and synchronization can prevent messages of the communication system from interfering with each other and enable a smooth message transfer. For 5G (the fifth generation of telecommunication network), the timing and synchronization requirements are even more strict. To synchronize the communication system, the first thing is to detect the connection quality and find the faults’ positions. This thesis aims to investigate a machine learning or deep learning approach to predict the connection quality called ”Hearability” between cells and to find the base stations whose cells have an absolute time error larger than a configurable threshold. The results show that the random forest classifier can obtain the highest accuracy while requiring less computing time than k-Nearest-Neighbors, Support Vector Machine, and Graph Neural Network. Additionally, we found the base stations with faults and offered suggestions for detecting the faults in complicated cases. / I ett trådlöst kommunikationssystem är synkronisering en av de mest kritiska funktionerna. Bra timing och synkronisering kan förhindra meddelanden från kommunikationssystemet från att störa varandra och möjliggöra en smidig meddelandeöverföring. För 5G (den femte generationens telekommunikationsnätverk) är kraven på timing och synkronisering ännu strängare. För att synkronisera kommunikationssystemet är det första att detektera anslutningskvaliteten och hitta felens positioner. Denna avhandling syftar till att undersöka en maskininlärning eller djupinlärning för att förutsäga anslutningskvaliteten som kallas ”Hörbarhet” mellan celler och att hitta de basstationer vars celler har ett absolut tidsfel som är större än en konfigurerbar tröskel. Resultaten visar att den slumpmässiga skogsklassificeraren kan få högsta noggrannhet samtidigt som den kräver mindre beräkningstid än k-Nearest-Neighbors, Support Vector Machine och Graph Neural Network. Dessutom hittade vi basstationerna med fel och gav förslag för att upptäcka felen i komplicerade fall.
|
136 |
Förbättrad väderklassificering genom instansval : Integrerad användning av maskininlärning och instansvalsmetoderna DRLSH och BPLSHIsmail, Aman Mohammed January 2024 (has links)
Maskininlärning är en lovande teknik för väderanalys med potential att förbättra och effektivisera väderförutsägelser. Som en datadriven teknik kräver maskininlärning ofta stora mängder data för att uppnå hög noggrannhet. Att hantera och bearbeta dessa stora datamängder innebär dock utmaningar, vilket gör träningstiderna för dessa modeller både långa och resurskrävande. Dessutom inkluderar stora data- mängd ofta en betydande mängd redundant data som inte bidrar mycket till klassifi- ceringen. Elimineringen av dessa redundanta data kan positivt påverka både beräk- ningstiden för modellträningen och noggrannheten. En effektiv metod för att han- tera detta problem är instansval. I denna studie undersöks effekterna av att använda instansvalsmetoderna Deep Ran- domized Locality Sensitive Hashing (DRLSH) och Binary Partitioning Locality Sensi- tive Hashing (BPLSH) i hybrid form för att optimera träningstiden och noggrann- heten hos maskininlärningsmodeller för väderklassificering. För att genomföra stu- dien har kvantitativa analyser använts där prestandan för maskininlärningsmodeller såsom RF, k-NN, SVM och LSTM utvärderades både före och efter implemente- ringen av instansvalsmetoderna. Dessa modeller testades på en omfattande data- mängd bestående av historiska väderdata, och jämförelser gjordes baserat på trä- ningshastighet och modellnoggrannhet. Studien visar att DRLSH och BPLSH kan minska den nödvändiga mängden tränings- data avsevärt, vilket i sin tur leder till snabbare träningstider för alla testade mo- deller. Resultaten visar också att noggrannheten förbättras marginellt i modeller som RF, k-NN och SVM när dessa metoder används, medan LSTM-modellen uppvi- sade en minskning i noggrannhet, vilket pekar på att metodernas effektivitet kan va- riera beroende på modelltyp. Det noterades dock att för modeller som k-NN och RF var träningstiden med instansvalsmetoderna inte optimal, eftersom tiden som togs av BPLSH för att göra instansval var betydligt längre. Baserat på resultaten rekommenderas användning av DRLSH och BPLSH särskilt för komplexa modeller som kräver omfattande beräkningsresurser och långa tränings- processer. För mindre komplexa modeller rekommenderas dock att använda DRLSH ensamt, eftersom den ökade tidsåtgången för instansval med BPLSH kan motverka de möjliga effektivitetsvinsterna. / Machine learning is a promising technique for weather analysis with the potential to improve and streamline weather forecasting. As a data-driven technique, machine learning often requires large amounts of data to achieve high accuracy. However, managing and processing these large datasets poses challenges, making the training times for these models both long and resource intensive. Additionally, large datasets often include a significant amount of redundant data that does not contribute much to classification. Eliminating this redundant data can positively impact both the com- putation time for model training and accuracy. An effective method for handling this issue is instance selection. This study examines the effects of using the instance selection methods Deep Ran- domized Locality Sensitive Hashing (DRLSH) and Binary Partitioning Locality Sensi- tive Hashing (BPLSH) in a hybrid form to optimize the training time and accuracy of machine learning models for weather classification. Quantitative analyses were used to evaluate the performance of machine learning models such as RF, k-NN, SVM, and LSTM before and after the implementation of the instance selection methods. These models were tested on a comprehensive dataset consisting of historical weather data, and comparisons were made based on training speed and model accu- racy. The study shows that DRLSH and BPLSH can significantly reduce the necessary amount of training data, which in turn leads to faster training times for all tested models. The results also indicate that accuracy improves marginally in models such as RF, k-NN, and SVM when these methods are used, whereas the LSTM model showed a decrease in accuracy, suggesting that the methods effectiveness may vary depending on the model type. However, it was noted that for models such as k-NN and RF, the training time with instance selection methods was not optimal, as the time taken by BPLSH for instance selection was considerably longer. Based on the results, the use of DRLSH and BPLSH is recommended particularly for complex models that require extensive computational resources and long training processes. For less complex models, however, it is recommended to use DRLSH alone, as the increased time taken by BPLSH for instance selection can negate poten- tial efficiency gains.
|
137 |
Effektivisering av fakturaklassificering enligt UNSPSC-standarden: en maskininlärningslösningSalam, Elaf, Norberg, Max January 2024 (has links)
Procurement requirements and procurement analysis are approaches used by the Swedish National Agency for Public Procurement to ensure and maintain a sustainable societal development. The aim is to safeguard tax funds and ensure that they are used for their intended reason. In addition, the objective is to promote healthy competition between actors. One way to impose this is through supply chain management and spend analysis, which can help companies improve spend efficiency by gaining more insight into their supply chain. This thesis aims to explore the necessary prerequisites for Business Vision Consulting AB to develop and train a machine learning model used for classifying invoices to improve and facilitate spend analysis. By applying several preprocessing methods, two natural language processing algorithms and training predictive models using four different machine learning algorithms, this thesis proposes solutions to classify invoice lines to their corresponding UNSPSC-codes. The four chosen machine learning algorithms are: logistic regression, boosted decision trees, decision forest, and neural network. Out of the four proposed algorithms, logistic regression with n-gram features method to transform words to numbers, proved to be the most effective with classifying invoice lines. In the three highest levels, segment, family, and class, in the hierarchical structure of UNSPSC, a logistic regression model with n-gram features managed to produce an overall accuracy of 96.3%, 95.5%, and 99.0% respectively. While these accuracies are adequate, the end of the thesis proposes areas to delve deeper into for further improvements.
|
138 |
Identifying the Higgs Boson with Machine Learning Methods / Identifiering av Higgsbosonen med maskininlärningsmetoderFrisk, Filip January 2024 (has links)
This report introduces a signal discrimination framework for particle physics processes, including a novel ensemble learning method using multiple machine learning models. The framework is tested with a signal region of the Higgs boson decay channel H → WW∗ → lνlν with two or more jets. The final state consists of leptons with the same flavor but opposite electrical charges, and the Higgs bosons are produced by Vector-boson fusion (VBF). The background region consists of the three largest processes with the same final state without originating from the signal process. Multiple models are trained and evaluated on Monte Carlo samples corresponding to a subset of the full Run 2 dataset of proton-proton collisions recorded by the ATLAS experiment at CERN’s Large Hadron Collider (LHC). The analysis in this report shows that ensemble methods improve background rejection leading to increased discrimination between the signal and background region compared with individual machine learning models. / Denna rapport introducerar ett ramverk för signalseparering för processer inom partikelfysik, inklusive en ny ensemblemetod. Ensemblemetoden använder sig av flera maskininlärningsmodeller. Ramverket testas med en signalregion bestående av en sönderfallskanal för Higgsbosonen H → WW∗ → lvlv med två eller flera jets. Leptonerna i sluttillståndet är av samma typ men motsatt laddning. Higgsbosonerna produceras genom så kallad "Vector-boson fusion (VBF)". Bakgrundsregionen innehåller de tre största processerna som har samma sluttillstånd utan att komma ifrån signalprocessen. Flertal modeller tränas och utvärderas på Monte Carlo-simuleringar som motsvarar en delmängd av hela Run 2-datasetet bestående av proton-proton kollisioner som samlats in av ATLAS-experimentet vid CERNs Large Hadron Collider (LHC). Rapporten visar att ensemblemetoden förbättrar bakgrundsidentifieringen vilket leder till förbättrad separation mellan signal- och bakgrundsregionen jämfört med individuella maskininlärningsmodeller.
|
139 |
Implementing Predictive Maintenance : For Small and Medium-Sized EnterprisesHolmkvist, Ingela January 2024 (has links)
Underhåll har alltid varit viktigt för industriella företag, med nya teknologier som prediktivt underhåll på väg fram. Insamlad sensordata och annan data används för att förbättra underhållet och för att minska kostnader och öka konkurrenskraften för företaget. Små och medelstora företag (SME) är viktiga för ekonomin, med 99 % av alla företag i Europa betraktade som SMEs idag. Det är viktigt att små och medelstora företag också inkluderas i implementeringen av prediktivt underhåll på grund av deras stora antal och betydelse för ekonomin. Syftet med denna avhandling har varit att undersöka utmaningar i implementering för SME som vill använda prediktivt underhåll. Problemet har varit att identifiera utmaningar och möjliga alternativ för mindre företag genom att utvärdera och jämföra flera maskininlärningsalgoritmer. Problemet som undersökts i avhandlingen har varit att identifiera en maskininlärningsalgoritm som optimerar både prestanda och resursanvändning. Genom att göra prediktivt underhåll mer tillgängligt för SME kan de också dra nytta av minskade driftskostnader, förlängd livslängd på sin utrustning och förbli konkurrenskraftiga i framtiden. Fem maskininlärningsmodeller tränades och testades. Algoritmen som presterade bäst var XGBoost, med Random Forest som en nära utmanare. Om resurserna är mycket begränsade presterar Decision Trees bäst av de enklare modellerna. / Maintenance has always been an important aspect for industrial companies, with new technologies allowing for predictive maintenance to be an option. Collected sensor data, and other data, can in this case be used to improve maintenance to reduce costs and increase competitiveness for the company. Small and medium-sized enterprises (SMEs) are important to the economy with 99% of all businesses in Europe being considered an SME. It’s important for small and mediumsized companies to also be included in the implementations of predictive maintenance due to their great number and importance to the economy. The aim of this thesis has been to investigate implementation challenges for SMEs that want to use predictive maintenance. The problem has been to identify challenges and possible options for smaller companies by evaluating and comparing several machine learning algorithms. The problem investigated in this thesis is identifying a machine learning algorithm that optimizes both performance and resource use. By making predictive maintenance more approachable for SMEs, they can also benefit from a reduction in operational costs, extended lifespan of their equipment and remain competitive in the future. Five machine learning models underwent training and testing. The algorithm that performed best was XGBoost, with Random Forest being a close contender. However, if resources are very limited, Decision Trees perform best out of the simpler models.
|
140 |
Predictive Modeling in Marketing Campaigns : Applying Machine Learning Techniques for Improved Campaign Evaluation / Prediktiv modellering i marknadsföringskampanjer : Tillämpning av maskininlärningstekniker för förbättrad kampanjutvärderingCarling, Albert January 2024 (has links)
By leveraging historical data together with machine learning algorithms, marketers can predict how new campaigns are likely to perform before launch. This approach can save time and resources and can help marketers optimize campaigns in current time through adjustments to increase return on investment (ROI) and reach the right target group. The objective of this thesis is to develop a predictive model through the application of feature selection techniques to assess the likability of a campaign. This study aims to identify the key features that significantly influence campaign likability and to quantify their impact. The task has been approached as a regression problem, with the objective of examine what predictors drives the liking of a campaign. The study implemented four methods for feature selection, recursive feature elimination with cross validation conjucted with random forest, lasso regression, ridge regression and decision trees. Further, to model, the following machine learning algorithms were employed: linear regression, ridge regression with cross validation, lasso regression with cross validation, elastic net with cross validation, kernel ridge regression and support vector regression. Based on the machine learning algorithm and the available data, the results indicate that the set of features generated by recursive feature elimination with cross validation combined with random forest was the most prominent and the algorithm support vector regression generated the best models. / Genom att använda historisk data tillsammans med maskininlärningsalgoritmer kan marknadsförare prediktera hur nya kampanjer sannolikt kommer att prestera innan de lanseras. Denna strategi kan spara tid och resurser och hjälpa marknadsförare att optimera kampanjer i realtid genom justeringar för att öka avkastningen på investeringen och nå rätt målgrupp. Målet med denna avhandling är att utveckla en prediktiv modell genom tillämpning av metodiker för variabelselektion för att bedöma sannolikheten för att en kampanj kommer att vara omtyckt. Denna studie syftar till att identifiera de nyckelvariabler som signifikant påverkar kampanjens popularitet och kvantifiera deras påverkan. Uppgiften behandlas som ett regressionsproblem för att identifiera vilka prediktorer som bidrar till ett positivt helhetsintryck av en kampanj. Studien implementerade fyra metoder för urval av variableselektion: rekursiv variabelselektion med korsvalidering kombinerad med random forest, lasso-regression, ridge-regression och beslutsträd. Dessutom användes följande maskininlärningsalgoritmer för modellering: linjär regression, ridge regression med korsvalidering, lasso regression med korsvalidering, elastiskt nät med korsvalidering, kernel ridge regression och stödvektorsregression. Baserat på maskininlärningsalgoritmerna och det tillgängliga datat indikerar resultaten att uppsättningen av funktioner genererad av rekursiv variabelselektion med korsvalidering kombinerad med random forest var mest framträdande och att algoritmen stödvektorregression genererade de bästa modellerna.
|
Page generated in 0.0991 seconds