Global ETD Search

1	Identifying New Fault Types Using Transformer Embeddings Karlsson, Mikael January 2021 (has links) Continuous integration/delivery and deployment consist of many automated tests, some of which may fail leading to faulty software. Similar faults may occur in different stages of the software production lifecycle and it is necessary to identify similar faults and cluster them into fault types in order to minimize troubleshooting time. Pretrained transformer based language models have been proven to achieve state of the art results in many natural language processing tasks like measuring semantic textual similarity. This thesis aims to investigate whether it is possible to cluster and identify new fault types by using a transformer based model to create context aware vector representations of fault records, which consists of numerical data and logs with domain specific technical terms. The clusters created were compared against the clusters created by an existing system, where log files are grouped by manual specified filters. Relying on already existing fault types with associated log data, this thesis shows that it is possible to finetune a transformer based model for a classification task in order to improve the quality of text embeddings. The embeddings are clustered by using density based and hierarchical clustering algorithms with cosine distance. The results show that it is possible to cluster log data and get comparable results to the existing manual system, where the cluster similarity was assessed with V-measure and Adjusted Rand Index. / Kontinuerlig integration består automatiserade tester där det finns risk för att några misslyckas vilket kan leda till felaktig programvara. Liknande fel kan uppstå under olika faser av en programvarans livscykel och det är viktigt att identifiera och gruppera olika feltyper för att optimera felsökningsprocessen. Det har bevisats att språkmodeller baserade på transformatorarkitekturen kan uppnå höga resultat i många uppgifter inom språkteknologi, inklusive att mäta semantisk likhet mellan två texter. Detta arbete undersöker om det är möjligt att gruppera och identifiera nya feltyper genom att använda en transformatorbaserad språkmodell för att skapa numeriska vektorer av loggtext, som består av domänspecifika tekniska termer och numerisk data. Klustren jämförs mot redan existerande grupperingar som skapats av ett befintligt system där feltyper identifieras med manuellt skrivna filter. Det här arbetet visar att det går att förbättra vektorrepresenationerna skapade av en språkmodell baserad på transformatorarkitekturen genom att tilläggsträna modellen för en klassificeringsuppgift. Vektorerna grupperas med hjälp av densitetsbaserade och hierarkiska klusteralgoritmer. Resultaten visar att det är möjligt att skapa vektorer av logg-texter med hjälp av en transformatorbaserad språkmodell och få jämförbara resultat som ett befintligt manuellt system, när klustren evaluerades med V-måttet och Adjusted Rand Index. Transformer Models Clustering Embeddings Deep Learning Fault Identification Transformatorbaserade modeller Klustering Djupinlärning Felidentifiering Computer Sciences Datavetenskap (datalogi)
2	Nätanalys : Identifiering av felställe i kabelnät Berg, Mikael January 2017 (has links) The report is a study of error management and localization in underground cable network with very little overhead line. Error management is treated with the theoretical troubleshooting model and theoretical model with practical feedback. The work relates to the fact that troubleshooting has been complicated when the supply safety in the electricity grid increases. Difficult troubleshooting is followed by a difficult reset work in case of malfunctioning in the network and it leads to longer interruptions.The grid is built with main feed and radial feeds. In the cable stretches, an interval of the short-circuit current occurs with a minimum and a maximum current below the distance. Depending on how the network is built, multiples of same error current is created, that create harder error-handling. The analysis examines which locations in the grid, which help increase the number of alternative malfunctions and if there is any alternative method to solve the problem. The report deals with the connection between currents in main feed and in radial feeds along the line. There appears to be a connection between the emergences of currents with similar current values in several places. A network consisting of a main feed and a plurality of radial feeds, the occurrence of streams in several places is a disadvantage in the troubleshooting task and the work is adversely affected and the troubleshooting work becomes more difficult. / Rapporten är en studie om felhantering och fellokalisering i ett markbelagt kabelnät med en väldigt liten del friledning. Felhanteringen be-handlas med både dataprogramvara och teoretiska beräkningar. Arbetet relaterar till att felsökningen försvåras när leveranssäkerheten i elnätet ökar. Svårare felsökning är följt av ett försvårat återställningsar-bete vid fel i nätet som leder till längre avbrottstider. Elnätsområdet är uppbyggt med huvudmatning samt radiella matning-ar. I kabelsträckorna uppkommer ett intervall på kortslutningsström-men med en minsta och en högsta ström under sträckan. Beroende på hur nätet är uppbyggt skapas multiplar av felställen som skapar svårare felhantering. Analysen undersöker vilka ställen i elnätet som bidrar till att antalet alternativa felställen ökar och om det finns någon alternativ metod att lösa problemet. Rapporten behandlar sammanbandet mellan strömmar i huvudmatning och i radiella matningar längs ledningens sträcka. Det visar sig vara ett samband mellan uppkomsten av strömmar med liknande strömvärden på ett flertal ställen. Ett nät som består av en huvudmatning och ett flertal radiella matningar är uppkomsten av samma kortslutningsströmmar på flera ställen. Det är en nackdel i felsökningsarbetet och arbetet påverkas negativt och fel-sökningsarbetet blir svårare. Short circuit detection troubleshooting cable network fault identification. Kortslutningsdetektering felsökning kabelnät felidentifiering. Annan elektroteknik och elektronik
3	Interaktiv identifiering av avvikelser i mätdata från testning av kretskort Berglund, Ebba, Kazemi, Baset January 2024 (has links) Visualisering är ett kraftfullt verktyg vid dataanalys, särskilt för att identifiera avvikelser. Att effektivt kunna identifiera felaktiga komponenter i elektronik kan förbättra och utveckla produktionsprocesserna avsevärd. Genom att tydligt visa korrelationen mellan felaktiga och fungerande komponenter kan analytiker identifiera nyckelkomponenter som orsakar defekta produkter. Multivariata data och multivariata tidsseriedata ställer höga krav på visualiseringar på grund av deras komplexitet. Den höga dimensionaliteten kan leda till problem som överlappning och dolda mönster beroende på vilken visualiseringsteknik som används. För att uppnå effektiv visualisering av multivariata data och multivariata tidsseriedata krävs det att både trender över tid och korrelationer mellan olika variabler visas. Studien genomfördes i samarbete med konsultföretaget Syntronic AB för att identifiera lämpliga visualiseringstekniker för data som samlats in vid testning av kretskort. Metoden som användes är design science, vilket omfattar en litteraturstudie, utveckling av prototyp och utvärdering av prototypen. Prototypen består av tre visualiseringstekniker som är: Kategorisk heatmap, Parallella koordinater och Scatterplot. Dessa tekniker jämfördes systematiskt för att bedöma deras effektivitet. Utvärderingen består av kvantitativa metoder såsom mätningar och enkäter, samt den kvalitativa metoden intervju. Resultatet av studien presenterar den utvecklade prototypen och analysen av utvärderingen. Resultatet av studien visar att kategoriska heatmaps är effektiv för att identifiera samband mellan avvikelser i multivariat data. Även om alla användare upplevde visualiseringen svårtolkad vid en första anblick uttryckte de att visualiseringen var effektiv på att visa korrelationer mellan avvikelser. Parallella koordinater upplevdes svårtolkad och ineffektiv på grund av den höga dimensionaliteten där alla dimensioner inte kan visas samtidigt. Förbättringsförslag för att öka användarvänlighet och användarupplevelse lyftes där tree view förslogs som ett alternativ för att välja de dimensioner som ska visas i stället för reglaget. Scatterplots visade sig vara användbar för att analysera enskilda testpunkter och visade generella trender på ett tydligt och begripligt sätt. Studien har även visat att interaktiviteten påverkar upplevelsen av visualisering, där begränsad interaktivitet medför att tekniken upplevds mindre användbar för att identifiera relationer mellan avvikelser. / Visualization is of great importance when analyzing data, especially when distinguishing anomalies. Identifying faulty components of electronics could evolve and improve the production processes tremendously. By effectively displaying the correlation between faulty and working components, analytics can identify key components causing faulty products.Multivariate data and multivariate time series data place high demands on visualizations due to their complexity. The high dimensionality can lead to issues such as overlapping and hidden patterns, depending on the visualization technique used. To achieve effective visualization of multivariate data and multivariate time series data, it is necessary to show both trends over time and correlations between different variables. This study was conducted in cooperation with Syntronic AB, a consulting company, to help identify suitable visualization techniques for data gathered by testing circuit boards. The methodology used is design research which includes research gathering, development of a prototype and evaluation of the prototype. The prototype consists of three visualization techniques: Categorical heatmap, Parallel Coordinates, and Scatterplot. These techniques were systematically compared to assess their effectiveness. The evaluation consists of quantitative methods such as time measurement and survey, and the qualitative method interview. The result of the study shows the developed prototype and the analysis of the evaluation. As a result, the study found categorical heatmaps effective in distinguishing correlation between anomalies in multivariate data. Although all users found the visualization difficult to grasp at first glance, expressed their beliefs regarding the effectiveness of displaying correlation. Parallel Coordinates were perceived as difficult to interpret and ineffective for high-dimensional datasets where all dimensions can´t be displayed simultaneously. Interactive options such as tree view to select test pointsto visualize were suggested to further improve the usefulness of Parallel Coordinates. Scatterplot proved useful for analyzing individual test points and showed general trends in a user-friendly way. Furthermore, the study also showed that interactivity affect the perception of visualizations. Limited interactivity resulted in users finding the visualizations less effective in distinguishing anomalies and were perceived as less user-friendly. Visualization Multivariate Time Series Data Anomaly Detection of Coherence Parallel Coordinates Scatterplot Datavisualisering Multivariat tidsseriedata Felidentifiering av samband Heatmap Parallella koordinater Scatterplot Computer and Information Sciences Data- och informationsvetenskap

1

Page generated in 0.1882 seconds