Klassificering av vinkvalitet / A classification of wine quality

Brouwers, Jack, Thellman, Björn January 2017 (has links)
The data used in this paper is an open source data, that was collected in Portugal over a three year period between 2004 and 2007. It consists of the physiochemical parameters, and the quality grade of the wines. This study focuses on assessing which variables that primarily affect the quality of a wine and how the effects of the variables interact with each other, and also compare which of the different classification methods work the best and have the highest degree of accuracy. The data is divided into red and white wine where the response variable is ordered and consists of the grades of quality for the different wines. Due to the distribution in the response variable having too few observations in some of the quality grades, a new response variable was created where several grades were pooled together so that each different grade category would have a good amount of observations. The statistical methods used are Bayesian ordered logistic regression as well as two data mining techniques which are neural networks and decision trees. The result obtained showed that for the two types of wine it is primarily the alcohol content and the amount of volatile acid that are recurring parameters which have a great influence on predicting the quality of the wines. The results also showed that among the three different methods, decision trees were the best at classifying the white wines and the neural network were the best for the red wines.

Prediktion av svenska riksdagsval : En kvantitativ studie med bayesianska regressionsmodeller

Olsson, Gustav, Ölfvingsson, Manne January 2021 (has links)
Syftet med uppsatsen är att studera olika residualfördelningar i samband med skapande av modeller föratt predicera valresultat till Sveriges riksdag. Modellerna inkluderar olika typer av t-fördelningar,gammafördelningen samt normalfördelningen som används som referensmodell från en tidigare studie.Strukturella regressionsmodeller och opinionsundersökningar är viktiga hörnstenar för att besvarastudiens frågeställningar. Metoder kopplade till bayesiansk statistik används kontinuerligt genomstudien där dragningar från aposteriorifördelningen liksom den prediktiva fördelningen genereras medhjälp av Markov chain Monte Carlo. För att utvärdera de framtagna modellerna används RMSE,prediktionsintervall, PIT-värden samt ELPD, där särskild vikt läggs vid värdet på ELPD. Resultatetdemonstrerar att den trunkerade t-fördelningen samt den icke-centrerade t-fördelningen generellt gerbäst resultat. För vissa partier, såsom Vänsterpartiet, visar sig dock andra fördelningar vara bättrelämpade vilket kan bero på dessa partiers storlek. Vidare väljs modellerna med icke-centrerad t-fördelning samt trunkerad t-fördelning ut för enjämförelse med de två referensmodellerna vid prediktion för valet 2018. Modell 5 väljs ut som den bästlämpade modellen för valprediktion i en svensk kontext och den prediktiva fördelningen för respektiveparti och valår 2018 illustreras. Slutligen skattas och tolkas parametrarna β och υ för modellen.Resultatet visar att lämpligheten för olika fördelningar varierar mellan partierna, men att en t-fördelninggenerellt ger ett bättre resultat, vad gäller valprediktionens träffsäkerhet, än normalfördelningen.Resultatet blir bättre när det skapas en trunkerad t-fördelning vid 0 vilket stoppar möjligheten förnegativa dragningar av valresultat, något som normalfördelningen och t-fördelningen ej åstadkommer.

Bayesiansk flernivåanalys för att undersöka variationen i elevers trygghet i skolan : En studie baserad på enkäten Om mig

Enoksson, Josefin, Olausson, Sofia January 2017 (has links)
According to chapter 5, section 3 of the Swedish School Law (2010: 800), it is written that "The education should be designed in such a way that all pupils are assured of a school environment characterized by safety and education". Today's school students are our future and it is therefore important to analyze puplis’ safety at school. This study investigates whether there is variation between schools, between municipalities and between schools within municipalities in Östergötland regarding pupils' safety at school. This study also investigates which variables that can affect school safety. The reason for this study is to provide a basis for further work to improve puplis’ school safety. The study is based on survey responses from the survey Om mig, which was sent to secondary grade in elementary school and grade 2 in upper secondary school. Data is divided into three parts, where respondents from primary school are in one, respondents from upper secondary school in one and finally one data for the whole of Östergötland, which contains both respondents for elementary school and upper secondary school. The response variable is the question How often do you feel safe at school?, Where students could answer, Always, Often, Sometimes, Rarely or Never. The explanatory variables are variables related to the school and to the student's health, such as trustworthy friend, bullying, stress, support and help developing. In Bilaga1, all of the variables examined are described. This study uses a multilevel logistic regression. Parameters are estimated using Bayesian inferences with noninformative prior distributions. The response variable is converted to a binary variable, where Always and Often was merged, and Sometimes, Rarely and Never was merged. The result showed that there is a small variation in puplis’ safety at school between schools, between municipalities and between schools within municipalities for primary school, upper secondary school and the whole of Östergötland. It was also investigated which variables affect school safety, it proved to be very similar between elementary school and upper secondary school, including bullying, how often students experience good mood at school, and if the students feel that they are treated equally by the teachers have an effect on the puplis’ safety at school. / Enligt 5 kapitlet 3 § i skollagen (2010:800) står det skrivet att ”Utbildningen ska utformas på ett sådant sätt att alla elever tillförsäkras en skolmiljö som präglas av trygghet och studiero”. Dagens skolelever är vår framtid och det är därför viktigt att analysera elevers trygghet i skolan. Denna studie undersöker om det finns variation mellan skolor, mellan kommuner samt mellan skolor inom kommuner i Östergötland vad gäller elevers trygghet i skolan. Studien undersöker även vilka variabler som kan ha effekt på tryggheten i skolan. Anledning till att denna studie genomförs är för att ha ett underlag i fortsatt arbete för att förbättra tryggheten i skolan. Studien bygger på enkätsvar från enkäten Om mig, som skickas ut till årskurs 8 i grundskolan samt årskurs 2 på gymnasiet. Datamaterialet är uppdelat i tre delar, där respondenter från grundskolan finns i ett, respondenter från gymnasiet i ett och till sist ett datamaterial för hela Östergötland som innehåller båderespondenter från grundskolan och gymnasieskolan. Responsvariabeln är frågan Hur ofta känner du dig trygg i skolan?, där eleverna kunde svara, Alltid, Ofta, Ibland, Sällan eller Aldrig. Förklaringsvariablerna är variabler som är relaterade till skolan och till elevens hälsa, till exempelpålitlig vän, mobbning, stress, stöd och hjälp att utvecklas. I bilaga 1 finns samtliga undersökta variabler beskrivna. Studien använder sig av en logistisk regression med flera nivåer. Parametrarna skattas med hjälp av Bayesiansk inferens med icke-informativa priorfördelningar. Responsvariabeln kodas om till en binärvariabel, där Alltid och Ofta slås ihop samt Ibland, Sällan och Aldrig slås ihop. Resultatet visade att det finns en liten variation i trygghet mellan skolor, mellan kommuner och mellan skolor inom kommuner, för grundskolan, gymnasiet och för hela Östergötland. Det undersökts även vilka variabler som har effekt på tryggheten i skolan, det visade sig vara väldigt lika mellan grundskolan och gymnasiet där bland annat mobbning, hur ofta eleverna upplever bra stämning i skolan samt om eleverna upplever att de blir rättvist behandlade av lärarna har en effekt på tryggheten i skolan.

Estimating the Early Evolution of Brachiopods Using an Integrated Approach Combining Genomics and Fossils / En uppskattning av armfotingarnas tidiga evolution med hjälp av genomik och fossil

Robert, Chloé January 2019 (has links)
The Brachiopoda, a major group of the Lophotrochozoa, experienced a rapid early evolutionary diversification during the well-known Cambrian explosion and subsequently dominated the Palaeozoic benthos with its diversity and abundance. Even though the phylogeny of the Lophotrochozoa is still hotly debated, it is now known that the Brachiopoda are a monophyletic grouping. However, the early evolutionary rates for the Brachiopoda have never been studied in the framework of a study combining molecular data and fossil time calibration points. In order to investigate the expected higher evolutionary rates of the Phylum at its origin, we conducted phylogenetic studies combining different methodologies and datasets. This work has at its foundation Maximum Likelihood and Bayesian analyses of 18S and 28S rRNA datasets followed by analyses of phylogenomic sequences. All material was obtained from previously available sequences and from sequencing of genetic material from specimens from a concerted worldwide collection effort.       While the analyses of the phylogenomic dataset produced a robust phylogeny of the Brachiopoda with good support, both the results of the novel rRNA and phylogenomic dating analyses provided limited insights into the early rates of evolution of the Brachiopoda from a newly assembled dataset, demonstrating some limitations in calibration dating using the software package BEAST2. Future studies implementing fossil calibration, possibly incorporating morphological data, should be attempted to elucidate the early rates of evolution of Brachiopoda and the effect of the Push of the Past in this clade. / Det är ofta antaget att evolution (förändringar i arvsmassan hos en grupp organismer) sker i en konstant hastighet men i slutändan ändå osäkert om så är fallet. Stora grupper av organismer har ofta associerats med en högre evolutionär hastighet, speciellt nära deras uppkomst, vilket ökar sannolikheten för överlevnad.  Armfotingar (Brachiopoda) är marina ryggradslösa djur med skal som tidigare var allmänt spridd, idag är istället musslor (Bivalvia) betydligt mer spridda. Armfotingar har funnits och utvecklats under flera miljoner år med ursprung under tidigt kambrium. Genom år av forskning och många fossil har vi fått mer information om utseendet hos utdöda organismer vilket har bidragit till att antalet fossila arter som vi känner till har ökat tusenfalt. Under den senaste tiden har det också skett innovationer inom molekylära tekniker som gjort det möjligt att applicera dessa kunskaper även på utdöda arter. Dessa molekylära tekniker har nyligen hjälpt till att bestämma några av släktskapsförhållandena inom armfotingar som tidigare ansetts vara väldigt svåra att lösa.  Det finns fortfarande vissa släktskapsförhållanden inom armfotingar som inte är kända och man vet ännu inte hur fort de utvecklades. Genom att undersöka just evolutionens hastighet kan man börja förstå gruppens tidiga framgång under Kambrium och Ordovicium samt minskningen som följde. Syftet med den här studien var att beräkna evolutionshastigheten hos armfotingar med särskild fokus på den tidiga diversifieringen av gruppen. För att undersöka detta använde vi oss av molekylära data för att analysera släktskapsförhållandena inom armfotingar. Dessutom använde vi fossil för att datera stora händelser i armfotingarnas evolutionära historia. Med hjälp av statistiska analyser kunde vi beräkna evolutionshastighet och släktskapsförhållandena inom gruppen. Vi kom fram till att armfotingar härstammar från en gemensam förfader. Dateringen kring när detta skedde blev inte fastställd då det beräknades ske miljoner år före det äldsta djurfossilet. Det kommer behövas mer forskning för att ta reda på om armfotingar hade en högre evolutionär hastighet i tidigt skede.

Imputation of Missing Data with Application to Commodity Futures / Imputation av saknad data med tillämpning på råvaruterminer

Östlund, Simon January 2016 (has links)
In recent years additional requirements have been imposed on financial institutions, including Central Counterparty clearing houses (CCPs), as an attempt to assess quantitative measures of their exposure to different types of risk. One of these requirements results in a need to perform stress tests to check the resilience in case of a stressed market/crisis. However, financial markets develop over time and this leads to a situation where some instruments traded today are not present at the chosen date because they were introduced after the considered historical event. Based on current routines, the main goal of this thesis is to provide a more sophisticated method to impute (fill in) historical missing data as a preparatory work in the context of stress testing. The models considered in this paper include two methods currently regarded as state-of-the-art techniques, based on maximum likelihood estimation (MLE) and multiple imputation (MI), together with a third alternative approach involving copulas. The different methods are applied on historical return data of commodity futures contracts from the Nordic energy market. By using conventional error metrics, and out-of-sample log-likelihood, the conclusion is that it is very hard (in general) to distinguish the performance of each method, or draw any conclusion about how good the models are in comparison to each other. Even if the Student’s t-distribution seems (in general) to be a more adequate assumption regarding the data compared to the normal distribution, all the models are showing quite poor performance. However, by analysing the conditional distributions more thoroughly, and evaluating how well each model performs by extracting certain quantile values, the performance of each method is increased significantly. By comparing the different models (when imputing more extreme quantile values) it can be concluded that all methods produce satisfying results, even if the g-copula and t-copula models seems to be more robust than the respective linear models. / På senare år har ytterligare krav införts för finansiella institut (t.ex. Clearinghus) i ett försök att fastställa kvantitativa mått på deras exponering mot olika typer av risker. Ett av dessa krav innebär att utföra stresstester för att uppskatta motståndskraften under stressade marknader/kriser. Dock förändras finansiella marknader över tiden vilket leder till att vissa instrument som handlas idag inte fanns under den dåvarande perioden, eftersom de introducerades vid ett senare tillfälle. Baserat på nuvarande rutiner så är målet med detta arbete att tillhandahålla en mer sofistikerad metod för imputation (ifyllnad) av historisk data som ett förberedande arbete i utförandet av stresstester. I denna rapport implementeras två modeller som betraktas som de bäst presterande metoderna idag, baserade på maximum likelihood estimering (MLE) och multiple imputation (MI), samt en tredje alternativ metod som involverar copulas. Modellerna tillämpas på historisk data förterminskontrakt från den nordiska energimarkanden. Genom att använda väl etablerade mätmetoder för att skatta noggrannheten förrespektive modell, är det väldigt svårt (generellt) att särskilja prestandan för varje metod, eller att dra några slutsatser om hur bra varje modell är i jämförelse med varandra. även om Students t-fördelningen verkar (generellt) vara ett mer adekvat antagande rörande datan i jämförelse med normalfördelningen, så visar alla modeller ganska svag prestanda vid en första anblick. Däremot, genom att undersöka de betingade fördelningarna mer noggrant, för att se hur väl varje modell presterar genom att extrahera specifika kvantilvärden, kan varje metod förbättras markant. Genom att jämföra de olika modellerna (vid imputering av mer extrema kvantilvärden) kan slutsatsen dras att alla metoder producerar tillfredställande resultat, även om g-copula och t-copula modellerna verkar vara mer robusta än de motsvarande linjära modellerna.

Analys av hörnsekvenser i svensk elitfotboll : Gruppering av hörnsekvenser och utvärdering av sannolikhet för skott med logistisk hierarkisk modellstruktur / Analysis of corner sequences in the top Swedish football leagues : Clustering of corner sequences and evaluation of the probability of shot with logistical hierarchical model structure

Rydström, Sidney, Lindén, Jakob January 2020 (has links)
Sportanalys definieras av Alamar (2013) som användning av historisk data för att applicera modeller som kan ge information till beslutstagare inom en viss organisation. Det ger dem möjlighet att assistera sin organisation för att få en sportslig fördel. I den här studien utförs sportanalys, mer specifikt analyseras hörnsekvenser inom svensk elitfotboll. En hörnsekvens är den sekvens av händelser som sker från att bollen sätts i spel från hörnans startposition tills det att något av följande villkor uppfylls: 8 händelser sker givet att hörnan slås kort 6 händelser sker givet att hörnan slås långt 15 sekunder passerar Försvarande lag tar över bollen Något lag utför ett regelbrott Skott utförs av attackerande lag Datamaterialet som används är framtaget av företaget Wyscout och tillhandahållet av Football Analytics Sweden AB. De ligor och säsonger som betraktas är de svenska herrligorna Allsvenskan och Superettan för säsongerna 2017, 2018 och 2019. I datamaterialet erhålls information om varje händelse som sker under matchen. Utifrån information om händelsen samt koordinater om var händelsen sker framställs variabler som ska kunna beskriva vad som sker inom en hörnsekvens. Syftet med studien är att först identifiera hörnsekvenser med liknande egenskaper och gruppera dem. Utifrån gruppindelningen undersöks sedan sannolikheten för att en hörnsekvens leder till skott samt vad som påverkar sannolikheten. Algoritmen Partitioning Around Medoids (PAM) används med avståndsmåttet Gower och utvärderingsmåttet silhouette för att identifiera följande fem hörnsekvenstyper: Utåtskruvade hörnor från vänsterhörn med tendens mot främre stolpen och relativt nära mållinjen. Inåtskruvade hörnor från vänsterhörn med tendens mot främre stolpen och längre förflyttning ut från mållinjen. Utåtskruvade hörnor från högerhörn med tendens mot främre stolpen och relativt nära mållinjen. Korta varianter som har längre varaktighet, innefattar fler händelser och involverar fler spelare. Inåtskruvade hörnor från högerhörn med tendens mot främre stolpen och längre förflyttning ut från mållinjen. Betraktas förekomsten av skott i datamaterialet givet klusterstrukturen konstateras att hörnsekvenstyp 4 i störst utsträckning lett till skott med förekomsten 19 procent inom klustret. Hörnsekvenstyperna 2 och 5 är något sämre med respektive 18 procent av hörnsekvenserna som lett till skott. Med dessa hörnsekvenstyper i fokus anpassas flera Bayesianska hierarkiska logitmodeller för att undersöka sannolikheten för att en hörnsekvens leder till skott givet de framtagna variablerna. Vid skapandet av modellerna undersöktes om en hierarkisk modellstruktur var behövlig för att undersöka sannolikheten för skott. Slutsatsen blev att det är väsentligt att tillämpa en hierarkisk modellstruktur. Av vald modell så dras slutsatsen att det som påverkar sannolikheten att komma till skott allra mest, med avseende de variabler som undersökts, är antalet händelser som sker i hörnsekvensen. Den hörnsekvenstyp som påverkas mest av antalet händelser är den korta varianten. Det diskuteras om hur det kan vara problematiskt att undersöka den linjära påverkan på log-oddset. Detta eftersom påverkan på sannolikheten för skott inte är densamma för en ökning mellan en och två händelser som mellan tre och fyra händelser. Det är även näst intill omöjligt att komma till skott på första händelsen i hörnsekvensen då händelsen utgörs av att hörnan slås. / Sports analysis is defined by Alamar (2013) as the management of structured historical data, the application of analytical models that utilize that data, and the use of information systems to inform decision makers and enable them to help their organization in gaining a competitive advantage on the field of play. This study focuses on sports analysis, more specifically corner sequences in Swedish elite football. A corner sequence is defined as the sequence of events that occur after the ball have been put into play from the corners start position up until that one of the following conditions are met: 8 events occur given a short corner is played 6 events occur given a long corner is played 15 seconds passes The defending team overtake the ball Some team performs a foul The attacking team performs a shot The data set used comes from Wyscout and is provided by Football Analytics Sweden AB. The data consist of games from the top Swedish football leagues for men: Allsvenskan and Superettan, and consists of games played in the seasons 2017, 2018 and 2019. In the data, information about every event that occur during the game is provided, where all events are classified to provide information about what happens at the specific event. The information about each event and its coordinates is then used produce variables to describe what occurs during a corner sequence. The purpose is to identify corner sequences with similar characteristics and group them together. Then use these groups to examine the probability that a corner sequence leads to a shot, and what influences this probability. The clustering algorithm Partitioning Around Medoids (PAM) is used with Gower as the dissimilarity measure and silhouette to evaluate the clusters, then the five following clusters are identified: Corners curled away from goal from the left corner with a tendency towards the front post and relatively close to the goal line. Corners curled towards goal from the left corner with a tendency towards the front post further away from the goal line. Corner curled away from goal from the right corner with a tendency towards the goal line. Short corner variant with longer duration, more events occurring and more players involved. Corners curled towards goal from the right corner with a tendency towards the front post and further away from the goal line. Given the clustering structure it is noted that the corner sequence of type 4 has led to the greatest extent of shots with the proportion of 19 percent within the cluster. The corner sequences of type 2 and 5 have a slightly lower shot occurrence with 18 percent per corner seqence type. With these corner sequence types in focus, several Hierarchical Bayesian Logistic Regression models are fitted to analyze the probability that a corner sequence leads to a shot given the produced explanatory variables. When fitting the models it is examined if it is necessary to apply a hierarchichal strutcture to the model. The conclusion is drawn that the hierarchical model structure is crucial to the model's performance. The conclusion is drawn from the final model that the explanatory variable which explains the probability to shoot best is the number of events that occur during the corner sequence. The corner sequence type that is most influenced by the number of events that occur during the corner sequence is the short corner variant. In the study it is discussed if there is an issue to suppose that this variable has a linear effect on the log-odds, since the impact on the probability to shoot is not the same for an increase between one and two as three and four events. Furthermore it is near impossible to shoot in the first event that occurs in the corner sequence.

Calibration of Breast Cancer Natural History Models Using Approximate Bayesian Computation / Kalibrering av natural history models för bröstcancer med approximate bayesian computation

Bergqvist, Oscar January 2020 (has links)
Natural history models for breast cancer describe the unobservable disease progression. These models can either be fitted using likelihood-based estimation to data on individual tumour characteristics, or calibrated to fit statistics at a population level. Likelihood-based inference using individual level data has the advantage of ensuring model parameter identifiability. However, the likelihood function can be computationally heavy to evaluate or even intractable. In this thesis likelihood-free estimation using Approximate Bayesian Computation (ABC) will be explored. The main objective is to investigate whether ABC can be used to fit models to data collected in the presence of mammography screening. As a background, a literature review of ABC is provided. As a first step an ABC-MCMC algorithm is constructed for two simple models both describing populations in absence of mammography screening, but assuming different functional forms of tumour growth. The algorithm is evaluated for these models in a simulation study using synthetic data, and compared with results obtained using likelihood-based inference. Later, it is investigated whether ABC can be used for the models in presence of screening. The findings of this thesis indicate that ABC is not directly applicable to these models. However, by including a sub-model for tumour onset and assuming that all individuals in the population have the same screening attendance it was possible to develop an ABC-MCMC algorithm that carefully takes individual level data into consideration in the estimation procedure. Finally, the algorithm was tested in a simple simulation study using synthetic data. Future research is still needed to evaluate the statistical properties of the algorithm (using extended simulation) and to test it on observational data where previous estimates are available for reference. / Natural history models för bröstcancer är statistiska modeller som beskriver det dolda sjukdomsförloppet. Dessa modeller brukar antingen anpassas till data på individnivå med likelihood-baserade metoder, eller kalibreras mot statistik för hela populationen. Fördelen med att använda data på individnivå är att identifierbarhet hos modellparametrarna kan garanteras. För dessa modeller händer det dock att det är beräkningsintensivt eller rent utav omöjligt att evaluera likelihood-funktionen. Huvudsyftet med denna uppsats är att utforska huruvida metoden Approximate Bayesian Computation (ABC), som används för skattning av statistiska modeller där likelihood-funktionen inte är tillgänglig, kan implementeras för en modell som beskriver bröstcancer hos individer som genomgår mammografiscreening. Som en del av bakgrunden presenteras en sammanfattning av modern ABC-forskning. Metoden består av två delar. I den första delen implementeras en ABC-MCMC algoritm för två enklare modeller. Båda dessa modeller beskriver tumörtillväxten hos individer som ej genomgår mammografiscreening, men modellerna antar olika typer av tumörtillväxt. Algoritmen testades i en simulationsstudie med syntetisk data genom att jämföra resultaten med motsvarande från likelihood-baserade metoder. I den andra delen av metoden undersöks huruvida ABC är kompatibelt med modeller för bröstcancer hos individer som genomgår screening. Genom att lägga till en modell för uppkomst av tumörer och göra det förenklande antagandet att alla individer i populationen genomgår screening vid samma ålder, kunde en ABC-MCMC algoritm utvecklas med hänsyn till data på individnivå. Algoritmen testades sedan i en simulationsstudie nyttjande syntetisk data. Framtida studier behövs för att undersöka algoritmens statistiska egenskaper (genom upprepad simulering av flera dataset) och för att testa den mot observationell data där tidigare parameterskattningar finns tillgängliga.

Osäkerhetsbedömning av skjuvhållfasthet i lera längs med Göta älv / Uncertainty assessment of shear strength in clay along the Göta älv river

Dyberg, Johanna January 2021 (has links)
Vid geotekniska arbeten är osäkerheter oundvikliga, men i stället för att hantera dessa som okända parametrar kan geotekniker med hjälp av bayesiansk statistik hantera geotekniska osäkerheter som slumpmässiga variabler med en sannolikhetsfördelning. I detta arbete har den bayesianska metoden utökad multivariabelanalys (EMA) tillämpats för bedömning av odränerad skjuvhållfasthet (𝑐u) i leror längs med Göta älv. Analysen har genomförts för områdena Smådala och Sörängen lokaliserade i lilla Edet längs med Göta älv, med mätdata från fem geotekniska mätmetoder i fält- och laboratorium: CPT-sondering (CPT), CRS-försök (CRS), direkta skjuvförsök (DSS), vingförsök (Vb) och fallkonförsök (Kon). Beräkningarna har genomförts i två steg: först har den totala osäkerheten för skattningen av 𝑐u bestämts separat för varje metod med hjälp av varianskoefficienten (𝐶𝑂𝑉tot) och sedan har samtliga 𝐶𝑂𝑉tot viktats med en EMA för en uppdaterad, mer tillförlitlig, total osäkerhet (𝐶𝑂𝑉tot,viktad). Resultaten visar 𝐶𝑂𝑉tot,viktat ≈ 2– 3,5 % för Smådala och 𝐶𝑂𝑉tot,viktat ≈ 1– 2 % för Sörängen. Slutsatsen är att bayesiansk statistik kan bidra till att kvantifiera geotekniska osäkerheter och därmed öka förståelsen dessa. Dock har osäkerheter vid bedömningen av vissa parametrar i 𝐶𝑂𝑉tot uppmärksammats, vilket kan innebära att osäkerheten från modellfelet (𝜗) kan öka osäkerheten vid skattningen av 𝑐u. Därför rekommenderas att storleken på 𝜗 vid bedömning av 𝐶𝑂𝑉tot bör undersökas och adderas till modellen för att möjliggöra användning av EMA i praktiken. / Uncertainties are inevitable in geotechnical investigations. However, instead of viewing these uncertainties as unknown parameters they could be managed with Bayesian statistics where the uncertainties are viewed as random variables with a statistical distribution. In this master thesis, the Bayesian method extended multivariate analysis (EMA) has been used for evaluation of the undrained shear strength (𝑐u) in clay along the Göta älv river. The analysis has been applied for the areas Smådala and Sörängen in the region Lilla Edet along the river, and with data from five geotechnical investigations methods from field- and laboratory testing: cone penetration test (CPT), constant rate of strain test (CRS), direct simple shear test (DSS), vane shear test (Vb) and fall cone test (Kon). The calculations were performed in two steps: first the calculation of the total uncertainty from the estimation of 𝑐u for each investigation method with the coefficient of variation (𝐶𝑂𝑉tot) and secondly the weighting of all the different 𝐶𝑂𝑉tot with an EMA to achieve an updated estimation of the uncertainties (𝐶𝑂𝑉tot,viktad). The results show that 𝐶𝑂𝑉tot,viktat ≈ 2– 3,5 % in Smådala and 𝐶𝑂𝑉tot,viktat ≈ 1– 2 % in Sörängen. The conclusion is that the usage of Bayesian statistics could increase the understanding of geotechnical uncertainties as well as give tools to quantify them. Although, there were uncertainties with the estimation of some parameters within 𝐶𝑂𝑉tot and thus the uncertainty from the so-called model error (𝜗) could increase the uncertainty in the estimation of 𝑐u. Therefore, it is suggested that the magnitude of 𝜗 when estimating 𝐶𝑂𝑉tot should be investigated and added to the model to enable the usage of EMA in practice.

