Spelling suggestions: "subject:"databearbetningen.""
1 |
Automatiska metoder för igenkänning, klassificering och extrahering av objekt från punktmoln insamlade med mobil laserskanning : En litteraturstudieLjunggren, Carl, Lundgren, Emil January 2019 (has links)
Digitalisering är för tillfället ett stort diskussionsämne och i de flesta delarnaav världen pågår det en övergång från analoga till digitala data. Digitala data ärmer flexibelt och kan innehålla mycket högre detaljnivå än vad som ärpraktiskt möjligt med analoga data. Digitala data är dock fortfarande i sinvagga och det krävs mycket mer arbete för att effektivisera och optimerainsamlingen och bearbetningen av den. Denna litteraturstudie undersökermobil laserskanning (MLS) och dess databearbetning för att hitta var teknikensframkant ligger gällande automation samt hur detta reflekterar sig motlaserskanningsbranschen. I litteraturstudien har ett stort antal artiklarhanterats och sållats, vilket i slutändan resulterade i 25 artiklar som redovisas iresultatet. Utöver litteraturstudien har det även utförts ett mindre antalintervjuer och utskickade enkäter, detta i syftet att dra paralleller mellanteorin i artiklarna och det praktiska utförandet i Sverige. Resultatet gårigenom de olika artiklarnas metoder, redovisar vad som är speciellt med dem,samt redovisar likheter mellan dem. I diskussionen jämförs artiklarna vi lästmot hur laserskanningsbranschen för närvarande ser ut i Sverige, och varför vitror att de inte alltid speglar varandra. Slutsatserna vi drar är att de nyametoderna vi läst om är lovande och att automation är på framfart. Tyvärrfinns det ett glapp mellan dessa metoder och de tillämpade metoderna pågrund av hur mycket testning och mjukvaruutveckling som krävs för att föra innya metoder på marknaden. Beställarna är heller inte alltid motiverade till attprova nya och obeprövade metoder då det kan innebära förhöjda kostnader ide fall då den använda metoden inte fungerar, eller annan att komplikationuppstår.
|
2 |
Implementering av HAZUS-MH i Sverige : Möjligheter och hinder / Implementation of HAZUS-MH in Sweden : Opportunities and obstaclesThorell, Marcus, Andersson, Mattias January 2019 (has links)
För modellering av risker vid naturkatastrofer är GIS ett grundläggande verktyg. HAZUS-MH är ett GIS-baserat riskanalysverktyg, utvecklat av den amerikanska myndigheten FEMA. HAZUS-MH har en välutvecklad metodologi för modellering av naturkatastrofer, vilket är något som efterfrågas på europeisk nivå inom ramen för översvämningsdirektivet. Därför föreligger ett intresse för implementering av HAZUS-MH för icke amerikanska förhållanden. Denna studies syfte är att fördjupa kunskaperna för implementering och användning av HAZUS-MH i Sverige. För att möjliggöra implementering behöver svenska data bearbetas för att matcha datastrukturen i HAZUS-MH. Metoden innefattar en litteraturgenomgång av tidigare studier och manualer samt databearbetning. Erfarenheter av databearbetningen samlades in för att bygga upp en manual för databearbetning samt för att utvärdera möjligheter och hinder för implementering i Sverige. Resultatet visar hur systemkrav och övriga inställningar för användning av HAZUS-MH ser ut. De övriga inställningarna berör koppling till HAZUS-MH databas med mera. För anpassning av svenska data beskrivs databehov (administrativ indelning, inventeringsdata och hydrologiska data), data-bearbetning (rekommenderad arbetsgång för att fylla shape-filer och tabeller med information) och dataimport. Vidare redogör resultatet för tillämpningen av HAZUS-MH med svenska data. Denna studie identifierar flera möjligheter hos HAZUS-MH. Möjligheterna att skapa risk- och sårbarhetskartor samt dataimport är de största. Tidsåtgången för att utföra anpassningen av svenska data var runt 15 arbetsdagar. Denna studie uppskattar att med hjälp av manualer för anpass-ningen kan denna tid kortas till 3 arbetsdagar. Om processen att anpassa svenska data automat-iseras kan tiden kortas ytterligare. Den största barriären enligt denna studie är insamling av data. För att kunna använda HAZUS-MH fulla potential behövs omfattande datainsamling. En annan barriär är begränsningar i hydro-logiska data, det är nödvändigt med externa hydrologiska data för en så korrekt analys som möjligt. Vidare forskning inom området bör enligt denna studie fokusera på metoder för att samla in data samt hur en automatisk process för att anpassa data skulle kunna se ut. / When modeling risks for natural disasters, GIS is a fundamental tool. HAZUS-MH is a GIS-based risk analysis tool, developed by the American authority FEMA. HAZUS-MH has a well-developed methodology for modeling natural disasters, which is something that is demanded at European level within the flood directive framework. Hence, there is an interest in implementing HAZUS-MH for non-US conditions. The aim of the study is to deepen the knowledge for the implementation and use of HAZUS-MH in Sweden. To enable implementation, Swedish data is required to be processed to match the data structure of HAZUS-MH. Methods for this study are a literature review of previous studies and manuals and data processing. Experiences of the data processing were collected to build a manual for data processing and to evaluate opportunities and obstacles for implementation in Sweden. The result shows how system requirements and other settings for using HAZUS-MH look like. The other settings include connection to the HAZUS-MH database et cetera. For adaption of Swedish data, requirements including data (administrative division, inventory data and hydrological data), data processing (recommended workflow to fill shape-files and attribute tables with information) and data import are described. The result also describes the application of HAZUS-MH with Swedish data. This study identifies several possibilities of HAZUS-MH. The opportunities for creating risk and vulnerability maps and data import are the largest. The time required to perform the adaptation of Swedish data was approximately 15 working days. This study estimates that with the help of manuals for the adaption, this time could be shortened to approximately 3 working days. If the process of adapting data is automated, this time could be shortened further. The largest obstacle under this study is the data collection process, to use the full potential of HAZUS-MH extensive data collection is needed. Another obstacle is the limitation of hydrological data, external hydrological data is necessary to get as accurate analysis as possible. Further research in the field should, according to this study, focus on methods of collecting data and development of an automatic process for managing data.
|
3 |
Databearbetning på RinghalsLindskog, Jakob, Gunnarsson, Robin January 2019 (has links)
Den nya generationens digitalisering har slagit rot i samhället. Algoritmer och datamodeller styr nyhetsflödet i social media, röststyr mobilen genom att tolka rösten och självstyr bilen, helt och hållet i autonoma fordon. Inom industrierna finns det också en pågående process där machine learning kan appliceras för att öka drifttillgänglighet och minska kostnader. Det nuvarande paradigmet för att underhålla icke-säkerhetsklassade maskiner i kärnkraftindustrin är en kombination av Avhjälpande Underhåll och Förebyggande Underhåll. Avhjälpande underhåll innebär att underhålla maskinen när fel inträffar, förebyggande underhåll innebär att underhålla med periodiska intervall. Båda sätten är kostsamma för att de riskerar att under- respektive över-underhålla maskinen och blir därmed resurskrävande. Ett paradigmskifte är på väg, det stavas Prediktivt Underhåll - att kunna förutspå fel innan de inträffar och planera underhåll därefter. Den här rapporten utforskar möjligheten att använda sig av de neurala nätverken LSTM och GRU för att kunna prognostisera eventuella skador på maskiner. Det här baseras på mätdata och historiska fel på maskinen. / The new generation of digitalization has been ingrained into society. Algorithms and data models are controlling the news feed of social media, controlling the phone by interpreting voices and controlling the car, altogether with automonous vehicles. In the industries there is also an ongoing process where machine learning is applied to increase availability and reduce costs. The current paradigm for maintaining non-critical machines in the nuclear power industry is a combination of corrective maintenance and preventive maintenance. Corrective maintenance means doing repairs on the machine upon faults, preventive maintenance means doing repairs periodically. Both ways are costly because they run the risk of under- and over-maintaining the machine and therefore becoming resource-intensive. A paradigm shift is on it's way, and it's spelled Predictive Maintenance - being able to predict faults before they happen and plan maintenance thence. This report explores the possibilities of using LSTM and GRU to forecast potential damage on machines. This is based on data from measurements and historical issues on the machine.
|
4 |
Evaluating Erlang database structures for building statistics in telecommunications : Comparing non-relational and relational databases in MnesiaPtitsin, Anton, Jönsson, Lou January 2021 (has links)
Mobile subscriptions are steadily increasing, making it more relevant to collect data and make useful statistics. To handle these large data sets, robust databases must be built. Two important factors for databases are storing the information persistently and having an adequate read and write speed to the database. This thesis project will study the implementation to fulfill these factors along with the comparison between a non-relational database structure and a relational database structure. The system will be written in the database management system Mnesia in the programming language Erlang. This study was conducted at Mobile Arts AB in Stockholm, Sweden. The company requested a system with different modules to build a query language used to extract relevant statistics. Large amounts of data should be processed through the file processor and stored in a database efficiently. A system based on two different database structures was built and compared to achieve the most efficient system among the two database structures. To measure the performance of the system and to compare the database structures, benchmarks were executed to determine the most efficient method. The results show that the non-relational database has a faster input processing speed compared to the relational one, while the relational database structure was faster in output processing. The conclusion is that the non-relational database works better for the system of this thesis project. / Antalet mobilabonnemang ökar stadigt, vilket gör det mer relevant att samla in data samt bygga värdefull statistik. För att hantera stora datamängder måste stabila och robusta databaser byggas. Två viktiga faktorer för databaser är att kunna lagra informationen och att kunna skriva till och läsa från databasen snabbt. Detta arbete kommer studera implementationen för att uppfylla dessa faktorer samt jämföra icke-relationsdatabasstrukturen med relationsdatabasstrukturen. Systemet kommer skrivas i databas-hanteraren Mnesia, i programmerings-språket Erlang. Studien utfördes på Mobile ArtsABi Stockholm. Företaget efterfrågade ett system med flera moduler tillsammans med ett egetdefinierat frågespråk för att kunna bygga relevant statistik. Stora mängder data skulle processeras genom filprocessorn och lagras i databasen på ett effektivt sätt. Ett system med två olika databasstrukturer implementerades och jämfördes för att hitta det mest effektiva systemet mellan de två databasstrukturerna. Prestandamätningar på systemet utfördes för att mäta vilken databasstruktur som gav mest effektiva resultat. Resultatet visar att icke-relationsdatabasen är snabbare vad gäller inmatningshastighet jämfört med systemet med relationsdatabas, medan relationsdatabasen hade en snabbare utmatningshastighet. Slutsatsen är att icke-relationsdatabasen fungerar bättre till systemet för detta arbete.
|
5 |
Microscopic traffic simulation of free-riding cyclists in downhills / Mikroskopisk trafiksimulering av fria cyklister i nedförsbackarChen, Jiaxi, Lennstring, Jonathan January 2022 (has links)
A key component of traffic models for simulating bicycle traffic focuses on capturing the interactions between cyclists and the cycling infrastructure. One of the most relevant features of the infrastructure that has a significant impact in bicycle traffic is the gradient of a bicycle path. Bicycle traffic simulations are a rather uninvestigated topic since historically, most focus on simulations has been on cars. However, bicycle simulations are an important tool to further investigate and understand cyclist’s behaviour. Therefore, the main objective of this thesis is to investigate and simulate free-riding behavior of cyclists in connection to the gradient, particularly on downhills. To do so, trajectory data of cyclists traveling on a downhill with a maximum gradient of 5.5\% are analysed to identify the impact of gradient on the speed and acceleration. The data received needed processing in order to be useful. This included filtering of the trajectories and excluding the data from cyclists which could not to be regarded as free-riding. As a result, a linear correlation is found between pedaling power and the gradient that can be used in microscopic bicycle traffic simulation. Based on this knowledge regarding this linearity, the approach used for modeling the gradient’s effect on the pedaling power is linear regression. The model can be developed in various ways, so instead of only choosing one model, several were developed and compared against each other. These models are then used for the simulation. The results indicate that the simulation captures well the impact of downhill gradients in a population of cyclists as it reproduces similar speed profiles to the ones observed. Therefore, it can be concluded that a power-based model is suitable for simulating free-riding behaviour of cyclists traveling in downhills. / En nyckelfaktor i trafikmodeller för cykelsimuleringar är att beskriva interaktionen mellan cykister och den omgivande infrastrukturen. En av de mest relevanta faktorerna hos infrastrukturen som har en signifikant påverkan på cykeltrafiken är lutningen på vägen. Simuleringar av cykeltrafik är ett tämligen outforskat område eftersom historiskt sett har mest fokus legat på simulering av bilar. Simuleringar är dock ett viktigt verktyg för att vidare undersöka cyklisters beteenden. Därmed är det huvudsakliga syftet med detta arbete att undersöka fria cyklisters beteenden med specifikt fokus på cyklister som cyklar i nedförsbackar. För att göra detta har data från cyklister som cyklar i nedförsbackar med en maximal lutning på 5.5\% analyserats för att analysera hur lutningen påverkar cyklisternas hastighet och acceleration. Den tillgängliga datan behövde bearbetning för att kunna användas. Detta innebar att filtrera datan samt att exkludera cyklister som ej kunde anses vara fria. Detta resulterade i att en linjär korrelation mellan effekten på pedalerna och lutningen på backen, denna korrelation kan användas för mikroskopisk cykelsimulering. Baserat på denna kunskap gällande linjäriteten kan linjär regressionsanalys användas för att modellera väglutningens inverkan på effekten från cyklisten. Modellen kan utvecklas på många olika sätt, och istället för att enbart välja en av dessa så utvecklades flera som kan jämföras med varandra. Dessa modeller används sedan för simuleringen. Resultaten indikerar att simuleringarna väl beskriver nedförsbackarnas påverkan på cyklister då simuleringarna genererar liknande hastighetskurvor som den uppmätta datan. Därmed kan slutsatsen dras att effektbaserade modeller är lämpliga för att simulera fria cyklisters beteenden när de cyklar i nedförsbackar.
|
6 |
Clustering Customers from Home Appliance DataPorcu, Simone January 2024 (has links)
In the realm of customer-centric strategies, the study focuses on the critical aspect of customer segmentation in the context of innovative home appliances of Electrolux, the company where this master thesis was performed. This thesis leverages Machine Learning models to analyze washing machine data from the Europe, Middle East, and Africa (EMEA) region, aiming to cluster customers and unveil patterns in appliance usage. The importance of tailored marketing strategies is underscored, prompting an investigation into existing solutions for customer segmentation in this specific engineering domain. The study addresses challenges such as developing a robust methodology for clustering and ensuring accurate information extraction. Results demonstrate the efficacy of Machine Learning in customer segmentation, enabling the company to enhance its understanding of customers, implement targeted campaigns, and offer personalized experiences. The successful resolution of this problem opens avenues for broader conclusions, such as gaining insights from worldwide data sets, transcending the previous limitation to the EMEA region. Furthermore, incorporating various timestamps, including periods before, during, and after the COVID-19 pandemic, enables a more comprehensive understanding of the issue. This approach enhances the applicability and robustness of our findings, offering a nuanced and holistic perspective on the challenges faced in different global contexts and over varying temporal dimensions. / När det gäller kundcentrerade strategier fokuserar studien på den kritiska aspekten av kundsegmentering i samband med innovativa hushållsapparater från Electrolux, företaget där denna masteruppsats utfördes. Den här avhandlingen utnyttjar maskininlärningsmodeller för att analysera tvättmaskinsdata från Europa, Mellanöstern och Afrika (EMEA)-regionen, i syfte att klustera kunder och avslöja mönster för användning av apparater. Vikten av skräddarsydda marknadsföringsstrategier understryks, vilket föranleder en undersökning av befintliga lösningar för kundsegmentering inom denna specifika tekniska domän. Studien tar upp utmaningar som att utveckla en robust metod för klustring och säkerställa korrekt informationsextraktion. Resultaten visar effektiviteten av Machine Learning i kundsegmentering, vilket gör det möjligt för företaget att öka sin förståelse för kunder, implementera riktade kampanjer och erbjuda personliga upplevelser. Den framgångsrika lösningen av detta problem öppnar vägar för bredare slutsatser, som att få insikter från världsomspännande datamängder, som överskrider den tidigare begränsningen till EMEA-regionen. Genom att införliva olika tidsstämplar, inklusive perioder före, under och efter covid-19-pandemin, möjliggörs en mer omfattande förståelse av problemet. Detta tillvägagångssätt förbättrar tillämpbarheten och robustheten av våra resultat, och erbjuder ett nyanserat och holistiskt perspektiv på de utmaningar som ställs inför i olika globala sammanhang och över varierande tidsdimensioner.
|
7 |
Pattern analysis of the user behaviour in a mobile application using unsupervised machine learning / Mönsteranalys av användarbeteenden i en mobilapp med hjälp av oövervakad maskininlärningHrstic, Dusan Viktor January 2019 (has links)
Continuously increasing amount of logged data increases the possibilities of finding new discoveries about the user interaction with the application for which the data is logged. Traces from the data may reveal some specific user behavioural patterns which can discover how to improve the development of the application by showing the ways in which the application is utilized. In this thesis, unsupervised machine learning techniques are used in order to group the users depending on their utilization of SEB Privat Android mobile application. The user interactions in the applications are first extracted, then various data preprocessing techniques are implemented to prepare the data for clustering and finally two clustering algorithms, namely, HDBSCAN and KMedoids are performed to cluster the data. Three types of user behaviour have been found from both K-medoids and HDBSCAN algorithm. There are users that tend to interact more with the application and navigate through its deeper layers, then the ones that consider only a quick check of their account balance or transaction, and finally regular users. Among the resulting features chosen with the help of feature selection methods, 73 % of them are related to user behaviour. The findings can be used by the developers to improve the user interface and overall functionalities of application. The user flow can thus be optimized according to the patterns in which the users tend to navigate through the application. / En ständigt växande datamängd ökar möjligheterna att hitta nya upptäckter om användningen av en mobil applikation för vilken data är loggad. Spår som visas i data kan avslöja vissa specifika användarbeteenden som kan förbättra applikationens utveckling genom att antyda hur applikationen används. I detta examensarbete används oövervakade maskininlärningstekniker för att gruppera användarna beroende på deras bruk av SEB Privat Android mobilapplikation. Användarinteraktionerna i applikationen extraheras ut först, sedan används olika databearbetningstekniker för att förbereda data för klustringen och slutligen utförs två klustringsalgoritmer, nämligen HDBSCAN och Kmedoids för att gruppera data. Tre distinkta typer av användarbeteende har hittats från både K-medoids och HDBSCAN-algoritmen. Det finns användare som har en tendens att interagera mer med applikationen och navigera genom sitt djupare lager, sedan finns det de som endast snabbt kollar på deras kontosaldo eller transaktioner och till slut finns det vanliga användare. Bland de resulterande attributen som hade valts med hjälp av teknikerna för val av attribut, är 73% av dem relaterade till användarbeteendet. Det som upptäcktes i denna avhandling kan användas för att utvecklarna ska kunna förbättra användargränssnittet och övergripande funktioner i applikationen. Användarflödet kan därmed optimeras med hänsyn till de sätt enligt vilka användarna har en speciell tendens att navigera genom applikationen.
|
8 |
Twittersentimentanalys : Jämförelse av klassificeringsmodeller tränade på olika datamängder. / Twitter Sentiment Analysis : Comparison of classification models trained on different data sets.Bandgren, Johannes, Selberg, Johan January 2018 (has links)
Twitter är en av de populäraste mikrobloggarna, som används för att uttryckatankar och åsikter om olika ämnen. Ett område som har dragit till sig mycketintresse under de senaste åren är twittersentimentanalys. Twittersentimentanalyshandlar om att bedöma vad för sentiment ett inlägg på Twitter uttrycker, om detuttrycker någonting positivt eller negativt. Olika metoder kan användas för attutföra twittersentimentanalys, där vissa lämpar sig bättre än andra. De vanligastemetoderna för twittersentimentanalys använder maskininlärning.Syftet med denna studie är att utvärdera tre stycken klassificeringsalgoritmerinom maskininlärning och hur märkningen av en datamängd påverkar en klassifi-ceringsmodells förmåga att märka ett twitterinlägg korrekt för twittersentimenta-nalys. Naive Bayes, Support Vector Machine och Convolutional Neural Network ärklassificeringsalgoritmerna som har utvärderats. För varje klassificeringsalgoritmhar två klassificeringsmodeller tagits fram, som har tränats och testats på två se-parata datamängder: Stanford Twitter Sentiment och SemEval. Det som skiljer detvå datamängderna åt, utöver innehållet i twitterinläggen, är märkningsmetodenoch mängden twitterinlägg. Utvärderingen har gjorts utefter vilken prestanda deframtagna klassificeringmodellerna uppnår på respektive datamängd, hur lång tidde tar att träna och hur invecklade de var att implementera.Resultaten av studien visar att samtliga modeller som tränades och testades påSemEval uppnådde en högre prestanda än de som tränades och testades på Stan-ford Twitter Sentiment. Klassificeringsmodellerna som var framtagna med Convo-lutional Neural Network uppnådde bäst resultat över båda datamängderna. Dockär ett Convolutional Neural Network mer invecklad att implementera och tränings-tiden är betydligt längre än Naive Bayes och Support Vector Machine. / Twitter is one of the most popular microblogs, which is used to express thoughtsand opinions on different topics. An area that has attracted much interest in recentyears is Twitter sentiment analysis. Twitter sentiment analysis is about assessingwhat sentiment a Twitter post expresses, whether it expresses something positiveor negative. Different methods can be used to perform Twitter sentiment analysis.The most common methods of Twitter sentiment analysis use machine learning.The purpose of this study is to evaluate three classification algorithms in ma-chine learning and how the labeling of a data set affects classification models abilityto classify a Twitter post correctly for Twitter sentiment analysis. Naive Bayes,Support Vector Machine and Convolutional Neural Network are the classificationalgorithms that have been evaluated. For each classification algorithm, two classi-fication models have been trained and tested on two separate data sets: StanfordTwitter Sentiment and SemEval. What separates the two data sets, in addition tothe content of the twitter posts, is the labeling method and the amount of twitterposts. The evaluation has been done according to the performance of the classifi-cation models on the respective data sets, training time and how complicated theywere to implement.The results show that all models trained and tested on SemEval achieved ahigher performance than those trained and tested on Stanford Twitter Sentiment.The Convolutional Neural Network models achieved the best results over both datasets. However, a Convolutional Neural Network is more complicated to implementand the training time is significantly longer than Naive Bayes and Support VectorMachine.
|
9 |
IoT as Fog Nodes: An Evaluation on Performance and ScalabilityEzaz, Ishaq January 2023 (has links)
I takt med den exponentiella tillväxten av Internet of Things (IoT) har utmaningen att hantera den enorma mängden genererade data blivit allt större. Denna studie undersöker paradigmen med distribuerade dimdatorer, där kostnadseffektiva IoT-enheter används som dimnoder, som en potentiell lösning på de utmaningarna som det centraliserade molnet står inför. Skalbarheten och prestandan hos ett dimdatorsystem utvärderades under en rad olika arbetsbelastningar genererade av beräkningsintensiva uppgifter. Resultaten visade att en ökning av antal dimnoder förbättrade systemets skalbarhet och minskade den totala latensen. Dock visade det sig att konfigurationer med färre dimnoder presterade bättre vid lägre arbetsbelastningar, vilket understryker vikten av balansen mellan beräkningsuppgifter och kommunikationskostnaden. Sammantaget framhäver denna studie dimdatorkonceptets genomförbarhet som en effektiv och skalbar lösning för beräkningsintensiva databearbetning inom IoT. Trots att studiens fokus låg på latens, kan de insikter som vunnits vägleda framtida design och implementering av dimdatorsystem och bidra till de pågående diskussionerna om strategier för datahantering inom IoT. / With the exponential growth of the Internet of Things (IoT), managing the enormous amount of data generated has become a significant challenge. This study investigates the distributed paradigm of fog computing, using cost-effective IoT devices as fog nodes, as a potential solution for the centralized cloud. The scalability and performance of a fog computing system were evaluated under a range of workloads, using computationally intensive tasks reflective of real-world scenarios. Results indicated that with an increase in the number of fog nodes, system scalability improved, and the overall latency decreased. However, at lower workloads, configurations with fewer fog nodes outperformed those with more, highlighting the importance of the balance between computation and communication overheads. Overall, this study emphasizes the viability of fog computing as an efficient and scalable solution for data processing in IoT systems. Although the study primarily focused on latency, the insights gained could guide future design and implementation of fog computing systems and contribute to the ongoing discussions on IoT data processing strategies.
|
Page generated in 0.11 seconds