A big challenge in managing large scale industry processes, like the ones in the paper and pulp industry, is to reduce the amount of downtime and reduce sources of product quality variability to a minimum, while staying cost effective. To accomplish this the key is to understand the complex nature of the processes variables, and to quantify the causal relationships between them and the product quality together with the amount of output. Paper and pulp industry processes consist mainly of chemical processes and the relatively low cost of sensors today enables collection of huge amounts of data, both variables and observations on frequent time intervals. These masses of data usually come with the intrinsic problem of multicollinearity which requires efficient multivari- ate statistical tools for the extraction of useful insights among the noise. One goal in this multivariate situation is to breakthrough the noise and find a relatively small subset of variables that are important, that is, variable selection. The purpose with this master thesis is to help SCA Obbola, a large paper manu- facturer that have had a variable production output, to come up with conclusions that can help them ensure a long term high production quantity and quality. We apply different variable selection approaches that have proven successful in the literature. The results that we get are of mixed success, but we manage to find both variables that SCA Obbola knows affect specific response variables, but also variables that they find interesting for further investigation. / En stor utmaning när det gäller att hantera storskaliga industriprocesser, som i pappers- och massaindustrin, är att minska tiden för driftstopp och reducera källor till varia- tioner i produktkvalitén till ett minimum, och samtidigt vara kostnadseffektiv. För att uppnå detta är det viktigt att förstå processvariablernas komplexa natur och att kvantifiera orsakssambanden mellan dem och produktkvaliteten tillsammans med pro- duktionsmängden. Pappers- och massasindustrin består huvudsakligen av kemiska pro- cesser och den relativt låga kostnaden för sensorer idag möjliggör insamling av stora mängder data, både variabler och observationer inom frekventa tidsintervall. Med des- sa datamängder får man ofta problem med multikollinearitet, vilket kräver effektiva multivariata statistiska verktyg för att extrahera användbara insikter bland bruset. Ett mål i denna multivariata situation är att bryta igenom bruset och hitta en relativt liten delmängd variabler som är viktiga, det vill säga variabel selektion. Syftet med denna masteruppsats är att hjälpa SCA Obbola, en stor pappersprodu- cent som har haft ett varierat produktionsutfall, att komma fram till slutsatser som kan hjälpa dem att säkerställa en långsiktig hög produktionskvantitet och kvalitet. Vi tillämpar olika metoder för variabel selektion, som har visat sig framgångsrika i lit- teraturen. Resultaten av arbetet är av blandad framgång, men vi lyckas hitta både variabler som SCA Obbola vet påverkar specifika responser, men även variabler som de tycker är intressanta för vidare utredning.
Identifer | oai:union.ndltd.org:UPSALLA1/oai:DiVA.org:umu-149283 |
Date | January 2018 |
Creators | Löfroth, Jaime, Wiklund, Samuel |
Publisher | Umeå universitet, Institutionen för matematik och matematisk statistik, Umeå universitet, Institutionen för matematik och matematisk statistik |
Source Sets | DiVA Archive at Upsalla University |
Language | English |
Detected Language | English |
Type | Student thesis, info:eu-repo/semantics/bachelorThesis, text |
Format | application/pdf |
Rights | info:eu-repo/semantics/openAccess |
Page generated in 0.0137 seconds