• Refine Query
  • Source
  • Publication year
  • to
  • Language
  • 61
  • 59
  • Tagged with
  • 120
  • 82
  • 59
  • 53
  • 52
  • 50
  • 50
  • 46
  • 41
  • 39
  • 34
  • 19
  • 18
  • 16
  • 15
  • About
  • The Global ETD Search service is a free service for researchers to find electronic theses and dissertations. This service is provided by the Networked Digital Library of Theses and Dissertations.
    Our metadata is collected from universities around the world. If you manage a university/consortium/country archive and want to be added, details can be found on the NDLTD website.
81

Dynamisk jämförelseanalys av FE-modell och fältmätning : Baserad på Folke Bernadottes bro / Dynamic comparison analysis of FE model and field measurement : Based on Folke Bernadotte's bridge

Wahlroos, Ajje, Khalil, Mohammed January 2021 (has links)
Dagens planering och projektering av konstruktioner präglas av ett resursutnyttjande, miljömässigt och ekonomiskt tänk, där resultatet kan medföra brister med avseende på dynamiken. Därmed är det ytterst viktigt att skapa goda förutsättningar för noggranna beräkningsmodeller som i ett projekteringsskede kan representera konstruktionernas dynamiska beteende. I denna rapport utfördes en jämförelseanalys mellan en FE-modell och en fältmätning, där Folke Bernadottes bro har använts som underlag. Syftet är att presentera skillnader och likheter i naturliga frekvenser och modformer baserat på jämförelseanalysen, samt belysa några av de viktigaste faktorerna bakom dessa. Resultatet visade för en kalibrerad FE-modell 11 % genomsnittlig skillnad för de naturliga frekvenserna och 99 % överensstämmelse med avseende på modformerna, där den mest väsentliga parametern i modellen var upplagsvillkoren. / Today's planning and design of constructions is characterized by a resource utilization, environmental and economic thinking, where the result can lead to shortcomings with regard to dynamic behaviour. Thus, it is extremely important to create good conditions for accurate calculation models that in a design phase can represent the dynamic behaviour of the structures. In this report, a comparison analysis was performed between an FE-model and a field measurement, where Folke Bernadotte's bridge has been used as basis. The purpose is to present differences and similarities in natural frequencies and mode shapes based on the comparative analysis, and to highlight some of the most important factors behind these. The result showed for a calibrated FE-model an average difference of 11 % for the natural frequencies and 99 % agreement with respect to the mode shapes, where the most important parameter in the model was the support conditions.
82

Re-ranking search results with KB-BERT / Omrankning av sökresultat med KB-BERT

Viðar Kristjánsson, Bjarki January 2022 (has links)
This master thesis aims to determine if a Swedish BERT model can improve a BM25 search by re-ranking the top search results. We compared a standard BM25 search algorithm with a more complex algorithm composed of a BM25 search followed by re-ranking the top 10 results by a BERT model. The BERT model used is KB-BERT, a publicly available neural network model built by the National Library of Sweden. We fine-tuned this model to solve the specific task of evaluating the relevancy of search results. A new Swedish search evaluation dataset was automatically generated from Wikipedia text to compare the algorithms. The search evaluation dataset is a standalone product and can be beneficial for evaluating other search algorithms on Swedish text in the future. The comparison of the two algorithms resulted in a slightly better ranking for the BERT re-ranking algorithm. These results align with similar studies using an English BERT and an English search evaluation dataset. / Denna masteruppsats syftar till att avgöra om en svensk BERT-modell kan förbättra en BM25-sökning genom att ranka om de bästa sökresultaten. Vi jämförde en standard BM25-sökalgoritm med en mer komplex algoritm som består av en BM25-sökning följt av omrankning av de 10 bästa resultaten med en BERT-modell. BERT-modellen som används är KB-BERT, en allmänt tillgänglig neural nätverksmodell byggd av Kungliga biblioteket. Vi finjusterade den här modellen för att lösa den specifika uppgiften att utvärdera sökresultatens relevans. En ny svensk datamängd för utvärdering av sökresultat genererades automatiskt från Wikipedia-text för att jämföra algoritmerna. Datamängden är en fristående produkt och kan vara till nytta för att utvärdera andra sökalgoritmer på svensk text i framtiden. Jämförelsen av de två algoritmerna resulterade i en något bättre rankning för BERT-omrankningsalgoritmen. Dessa resultat överensstämmer med liknande studier som använder en engelsk BERT och en engelsk datamängd för utvärdering av sökresultat.
83

Task-agnostic knowledge distillation of mBERT to Swedish / Uppgiftsagnostisk kunskapsdestillation av mBERT till svenska

Kina, Added January 2022 (has links)
Large transformer models have shown great performance in multiple natural language processing tasks. However, slow inference, strong dependency on powerful hardware, and large energy consumption limit their availability. Furthermore, the best-performing models use high-resource languages such as English, which increases the difficulty of using these models for low-resource languages. Research into compressing large transformer models has been successful, using methods such as knowledge distillation. In this thesis, an existing task-agnostic knowledge distillation method is employed by using Swedish data for distillation of mBERT models further pre-trained on different amounts of Swedish data, in order to obtain a smaller multilingual model with performance in Swedish competitive with a monolingual student model baseline. It is shown that none of the models distilled from a multilingual model outperform the distilled Swedish monolingual model on Swedish named entity recognition and Swedish translated natural language understanding benchmark tasks. It is also shown that further pre-training mBERT does not significantly affect the performance of the multilingual teacher or student models on downstream tasks. The results corroborate previously published results showing that no student model outperforms its teacher. / Stora transformator-modeller har uppvisat bra prestanda i flera olika uppgifter inom naturlig bearbetning av språk. Men långsam inferensförmåga, starkt beroende av kraftfull hårdvara och stor energiförbrukning begränsar deras tillgänglighet. Dessutom använder de bäst presterande modellerna högresursspråk som engelska, vilket ökar svårigheten att använda dessa modeller för lågresursspråk. Forskning om att komprimera dessa stora transformatormodeller har varit framgångsrik, med metoder som kunskapsdestillation. I denna avhandling används en existerande uppgiftsagnostisk kunskapsdestillationsmetod genom att använda svensk data för destillation av mBERT modeller vidare förtränade på olika mängder svensk data för att få fram en mindre flerspråkig modell med prestanda på svenska konkurrerande med en enspråkig elevmodell baslinje. Det visas att ingen av modellerna destillerade från en flerspråkig modell överträffar den destillerade svenska enspråkiga modellen på svensk namngiven enhetserkännande och svensk översatta naturlig språkförståelse benchmark uppgifter. Det visas också att ytterligare förträning av mBERTpåverkar inte väsentligt prestandan av de flerspråkiga lärar- eller elevmodeller för nedströmsuppgifter. Resultaten bekräftar tidigare publicerade resultat som visar att ingen elevmodell överträffar sin lärare.
84

Structural Composite Material with Novel Cellulose Fibre Reinforcement / Strukturellt sammansatt material med nyskapande förstärkning av cellulosafibrer

Murrone, Mauro Antonio January 2024 (has links)
In recent decades, the necessity to find a completely environmentally friendly substitute for synthetic fibres in composite applications has intensified, driven by the objective of reducing emissions in both the production and disposal of composite components. Natural fibres present a potential solution, yet they have some issues such as the inhomogeneous quality of their cross-section and mechanical properties, depending on different aspects, for example, growing conditions and the amount of intake water. Another potential solution is organic man-made fibres, such as fibre made from Cellulose NanoFibrils, which do not present the previously cited drawbacks.This thesis investigates and compares the potentials of organic fibres, either man-made or natural, in composite reinforcement applications. To accomplish this, organic fibres are integrated into composite plates using two distinct thermoset matrices, epoxy and vinyl ester, respectively via methods of hot pressing and vacuum infusion. Subsequently, the produced composite plates undergo tensile testing, with the results being compared with the theoretical values. Furthermore, microscopy is employed to examine the adhesion at the interface between reinforcement and matrix.The findings indicate that man-made fibres from Cellulose NanoFibrils bind more efficiently with thermoset matrices compared to flax fibres, making them more adept as reinforcement materials for thermoset composites. / Under de senaste decennierna har behovet av att hitta en helt miljövänlig ersättning för syntetiska fibrer i kompositapplikationer intensifierats, drivet av målet att minska utsläppen både vid produktion och avfallshantering av kompositkomponenter. Naturliga fibrer presenterar en potentiell lösning, men de har vissa problem som den ojämna kvaliteten på deras tvärsnitt och mekaniska egenskaper, beroende på olika aspekter, till exempel växtförhållanden och mängden intaget vatten. En annan potentiell lösning är organiska konstgjorda fibrer, som fibrer tillverkade av cellulosa nanofibriller, som inte har de tidigare nämnda nackdelarna.Denna avhandling undersöker och jämför potentialen hos organiska fibrer, antingen konstgjorda eller naturliga, i kompositförstärkningsapplikationer. För att uppnå detta integreras organiska fibrer i kompositplattor med hjälp av två olika termohärdande matriser, epoxi och vinyl-ester, via metoder för varmpressning och vakuuminfusion. Därefter genomgår de producerade kompositplattorna dragprovning, med resultaten jämförda med de teoretiska värdena. Dessutom används mikroskopi för att undersöka vidhäftningen vid gränssnittet mellan förstärkning och matris.Resultaten indikerar att konstgjorda fibrer från cellulosa nanofibriller binder effektivare med termohärdande matriser jämfört med linfibrer, vilket gör dem mer lämpliga som förstärkningsmaterial för termohärdande kompositer.
85

Optimering av beslutsstöd inom verksamhetsstyrning genom en undersökning av artificiell intelligens : En djupgående undersökning av effektiva AI-tekniker för bättre affärsbeslut / Optimizing decision support in business management through an artificial intelligence study : An in-depth survey of effective AI techniques for better business decisions

Sakhai, Aram January 2024 (has links)
Denna studie undersöker hur artificiell intelligens (AI) kan optimera beslutsstödet inom verksamhetsstyrning genom analys av ostrukturerad data. Genom att granska begrepp som verksamhetsstyrning, Business Intelligence (BI), AI och maskininlärning (ML), belyser studien hur dessa teknologier kan förbättra organisationers beslutsprocesser. Verksamhetsstyrning syftar till att samordna och optimera organisationens delar för att nå gemensamma mål. AI (NLP, ML) samt särskilt genom BI spelar en avgörande roll genom att förbättra effektivitet och kvalitet. BI samlar och analyserar affärsinformation, medan ML möjliggör automatisk lärande från data. Studiens problemområde identifierar utmaningen med att hantera stora mängder ostrukturerad data. Trots AI:s potential att förbättra beslutsfattandet har dess fulla potential ännu inte realiserats. Genom att undersöka effektiv användning av AI för ostrukturerad data, bidrar studien till en bättre förståelse av hur AI kan förbättra beslutsstödet.Den kvalitativa ansatsen använde semistrukturerade intervjuer med IT-experter för att samla insikter om AI:s användning i beslutsfattande. Respondenterna beskrev hur AI analyserar data, förutsäger trender, optimerar processer och personaliserar kundupplevelser. AI automatiserar också tidskrävande uppgifter, vilket ökar effektiviteten och frigör tid för strategiskt arbete. Det visar att AI kan förbättra datakvalitet, automatisera processer och ge djupare insikter i kundbeteenden och marknadstrender. AI:s förmåga att hantera ostrukturerad data möjliggör identifiering av trender och mönster som annars skulle vara svåra att upptäcka. Utmaningar med AI-implementering inkluderar systemintegrering och behovet av teknisk expertis. Sammanfattningsvis visar studien att AI har stor potential att optimera beslutsstödet inom verksamhetsstyrning genom analys av ostrukturerad data.
86

Artificiell Intelligens vid redovisning : En kvalitativ studie om hur företag använder Artificiell Intelligens i sin redovisning och de utmaningar som användningen medför / Artificial Intelligence in Accounting : A qualitative study on how companies use Artificial Intelligence in their accounting and the challenges it entails

Weman, Frida, Norder, Ebba January 2024 (has links)
Bakgrund: Redovisning har historiskt präglats av noggranna, manuella och tidskrävande metoder. AI-teknologier har revolutionerat redovisningsprocessen genom att automatisera uppgifter, lösa problem och fatta beslut. AI-teknologier inom redovisning inkluderar maskininlärning (ML), robotprocessautomatisering (RPA) och naturlig språkbehandling (NLP). Syfte: Syftet med studien är att identifiera AI’s användningsområden inom företags redovisning och de praktiska och teoretiska utmaningarna användningen medför. Dessutom syftar studien till att undersöka relationen mellan de teoretiska och praktiska utmaningarna för att bidra med kunskap om de utmaningar som användning av AI inom redovisning faktiskt medför i praktiken. Metod: Studien tillämpar en kvalitativ metod med en abduktiv ansats och samlar in empirisk data genom semistrukturerade intervjuer med 7 respondenter. Analysen av den empiriska datan görs med en tematisk analysmetod. Studiens teori utgörs av tidigare forskning från vetenskapliga artiklar och böcker. Slutsats: Studiens slutsats utgår ifrån att AI inom redovisning tillämpas hos företag för automatisering av repetitiva och tidskrävande uppgifter, där RPA till skillnad från ML och NLP har implementerats hos flest företag. De utmaningar som presenterats av teorin gällande användningen av AI inom redovisning, återfinns även i praktiken. Däremot har praktiken förmedlat nya utmaningar som inte tagits upp av tidigare forskning. Utmaningar som exempelvis den manuella tid som AI faktiskt kräver. / Background: Accounting has historically been characterized by meticulous, manual, and time-consuming methods. AI technologies have revolutionized the accounting process by automating tasks, solving problems, and making decisions. AI technologies in accounting include machine learning (ML), robotic process automation (RPA), and natural language processing (NLP). Purpose: The purpose of this study is to identify the areas of AI application in accounting and the practical and theoretical challenges it entails. Additionally, the study aims to investigate the relationship between theoretical and practical challenges to contribute knowledge about the actual challenges of using AI in accounting practice. Method: The study employs a qualitative approach with an abductive stance, gathering empirical data through semi-structured interviews with 7 respondents. The analysis of the empirical data is conducted using a thematic analysis method. The theoretical framework of the study is based on previous research from scientific articles and books. Conclusion: The study concludes that AI is applied in accounting primarily for automating repetitive and time-consuming tasks, with RPA being more widely implemented than ML and NLP. The theoretical challenges related to AI usage in accounting, as presented in previous research, are also evident in practice. However, practical applications have revealed new challenges not previously addressed in the theory, such as the manual time that AI actually requires.
87

Det perifera seendets betydelse bland gångtrafikanter i naturlig miljö / Peripheral vision and its importance amongst pedestrians in a natural setting

Björnqvist, Anton January 2019 (has links)
The importance, and the role, of peripheral vision amongst pedestrians, is an area which for a long time has remained unexplored. Previous studies regarding peripheral vision and pedestrians have mostly studied the characteristics of peripheral vision, the general visual behaviours amongst pedestrians and whether people affected by a natural loss of peripheral vision fixate on different objects compared to those with normal vision. To examine the role of peripheral vision amongst pedestrians, an experiment consisting of 20 participants was conducted. The experiment took place in a car park, where head movements (i.e. how many times each participant moved their head) and head directions (i.e. in which direction the participants’ moved their heads) of the participants were recorded using three action cameras. Two of the cameras were mounted on a helmet which the participants used during the experiment. The third camera was in the hands of the experimenter, recording the participants from behind. The experiment consisted of four different conditions. Two conditions where the participants’ peripheral vision was blocked to different extents, one with no manipulation of the visual field and one where the participants were told to watch a video on a cell phone during the walk. The results demonstrated a significant difference in the number of head movements between all four conditions. Furthermore, the results also demonstrated a significant difference in the relative frequency of downwards head directions between the first three conditions. After the experiment, the participants answered a short survey which included questions related to each condition. The answers from the survey showcased, amongst other things, that the participants thought that the condition where their peripheral vision was blocked to the largest extent was the most difficult one. A thematic analysis was conducted based on the recordings of a think-aloud-protocol which the participants were told to conduct during the experiment. The thematic analysis demonstrated, amongst other things, that the participants thought that the condition performed with no manipulation of the visual field was easy, that they felt insecure when their peripheral vision was blocked and therefore had to increase the number of head movements, and that they sometimes felt the need to redirect their gaze away from the cell phone during that condition. The conclusion which can be drawn based on the results is that the peripheral vision is widely used amongst pedestrians in natural settings, which in part is based on the fact that the participants increased their number of head movements when their peripheral vision was limited and by their own expressed thoughts regarding the different conditions. However, the results are not able to explain exactly how the peripheral vision is used amongst pedestrians. / Det perifera seendets betydelse och roll bland gångtrafikanter i naturlig miljö är ett område som till stora delar stått outforskat. Tidigare studier har främst fokuserat på uppmätning av periferins egenskaper, gångtrafikanters allmänna visuella beteenden samt studerandet av personer drabbade av naturligt synfältsbortfall. I syfte att undersöka det perifera seendets betydelse bland gångtrafikanter genomfördes ett experiment med 20 deltagare på en parkeringsplats, där huvudrörelser (d.v.s. hur många gånger varje deltagare rörde på huvudet) samt huvudriktningar (d.v.s. i vilken riktning deltagarna rörde huvudet) uppmättes med hjälp av två actionkameror fästa på en hjälm, samt en i handen på försöksledaren som filmade deltagarna bakifrån. Experimentet bestod av fyra olika betingelser, där två av dem blockerade det perifera synfältet olika mycket, en under normala synförhållanden samt en där deltagarna fäste blicken på en mobiltelefon under gången. Resultatet visade en signifikant skillnad i antalet huvudrörelser mellan samtliga betingelser. Utöver detta visades en signifikant skillnad i frekvensen av huvudrörelser nedåt vid en jämförelse mellan de tre förstnämnda betingelserna. Efter utfört experiment fick deltagarna dessutom svara på en enkät, vilken bland annat visade att deltagarna själva skattade att betingelsen där deras perifera seende blockerades som mest var svårast att genomföra. En tematisk analys genomfördes även baserat på data från ett tänka-högt-protokoll som deltagarna var uppmanade att föra under experimentets gång. Detta visade bland annat att deltagarna kände att det var enkelt att gå vid normala synförhållanden, att det fanns osäkerhetskänslor och behov av huvudrörelser vid betingelserna där periferin blockerades, samt att många kände ett behov av att lyfta på blicken vid mobiltelefonbetingelsen. Slutsatsen som kan dras baserat på resultaten är att det perifera seendet används mycket bland gångtrafikanter i naturlig miljö, vilket dels grundar sig i att deltagarna rörde som mest på huvudet när deras perifera seende blockerades, samt deras egna yttrade tankar. Det som inte kunnat besvaras är exakt hur det perifera seendet används bland gångtrafikanter.
88

Understanding and communicating forest stand structures : lifting barriers for nature-based forest management

Busse Nielsen, Anders. January 2006 (has links) (PDF)
Ph.d.-afhandling. Den Kongelige Veterinær- og Landbohøjskole, 2006. / Haves også i trykt udg. Thesis (Ph.D.). 22 ill., 14 tables; approx. 90 ref. Summaries (Da, En).
89

Categorization of Customer Reviews Using Natural Language Processing / Kategorisering av kundrecensioner med naturlig språkbehandling

Liliemark, Adam, Enghed, Viktor January 2021 (has links)
Databases of user generated data can quickly become unmanageable. Klarna faced this issue, with a database of around 700,000 customer reviews. Ideally, the database would be cleaned of uninteresting reviews and the remaining reviews categorized. Without knowing what categories might emerge, the idea was to use an unsupervised clustering algorithm to find categories. This thesis describes the work carried out to solve this problem, and proposes a solution for Klarna that involves artificial neural networks rather than unsupervised clustering. The implementation done by us is able to categorize reviews as either interesting or uninteresting. We propose a workflow that would create means to categorize reviews not only in these two categories, but in multiple. The method revolved around experimentation with clustering algorithms and neural networks. Previous research shows that texts can be clustered, however, the datasets used seem to be vastly different from the Klarna dataset. The Klarna dataset consists of short reviews and contain a large amount of uninteresting reviews. Using unsupervised clustering yielded unsatisfactory results, as no discernible categories could be found. In some cases, the technique created clusters of uninteresting reviews. These clusters were used as training data for an artificial neural network, together with manually labeled interesting reviews. The results from this artificial neural network was satisfactory; it can with an accuracy of around 86% say whether a review is interesting or not. This was achieved using the aforementioned clusters and five feedback loops, where the model’s wrongfully predicted reviews from an evaluation dataset was fed back to it as training data. We argue that the main reason behind why unsupervised clustering failed is that the length of the reviews are too short. In comparison, other researchers have successfully clustered text data with an average length in the hundreds. These items pack much more features than the short reviews in the Klarna dataset. We show that an artificial neural network is able to detect these features despite the short length, through its intrinsic design. Further research in feature extraction of short text strings could provide means to cluster this kind of data. If features can be extracted, the clustering can thus be done on the features rather than the actual words. Our artificial neural network shows that the arbitrary features interesting and uninteresting can be extracted, so we are hopeful that future researchers will find ways of extracting more features from short text strings. In theory, this should mean that text of all lengths can be clustered unsupervised. / Databaser med användargenererad data kan snabbt bli ohanterbara. Klarna stod inför detta problem, med en databas innehållande cirka 700 000 recensioner från kunder. De såg helst att databasen skulle rensas från ointressanta recensioner och att de kvarvarande kategoriseras. Eftersom att kategorierna var okända initialt, var tanken att använda en oövervakad grupperingsalgoritm. Denna rapport beskriver det arbete som utfördes för att lösa detta problem, och föreslår en lösning till Klarna som involverar artificiella neurala nätverk istället för oövervakad gruppering. Implementationen skapad av oss är kapabel till att kategorisera recensioner som intressanta eller ointressanta. Vi föreslår ett arbetsflöde som skulle skapa möjlighet att kategorisera recensioner inte bara i dessa två kategorier, utan i flera. Metoden kretsar kring experimentering med grupperingsalgoritmer och artificiella neurala nätverk. Tidigare forskning visar att texter kan grupperas oövervakat, dock med ingångsdata som väsentligt skiljer sig från Klarnas data. Recensionerna i Klarnas data är generellt sett korta och en stor andel av dem kan ses som ointressanta. Oövervakad grupperingen gav otillräckliga resultat, då inga skönjbara kategorier stod att finna. I vissa fall skapades grupperingar av ointressanta recensioner. Dessa användes som träningsdata för ett artificiellt neuralt nätverk. Till träningsdatan lades intressanta recensioner som tagits fram manuellt. Resultaten från detta var positivt; med en träffsäkerhet om cirka 86% avgörs om en recension är intressant eller inte. Detta uppnåddes genom den tidigare skapade träningsdatan samt fem återkopplingsprocesser, där modellens felaktiga prediktioner av evalueringsdata matades in som träningsdata. Vår uppfattning är att den korta längden på recensionerna gör att den oövervakade grupperingen inte fungerar. Andra forskare har lyckats gruppera textdata med snittlängder om hundratals ord per text. Dessa texter rymmer fler meningsfulla enheter än de korta recensionerna i Klarnas data. Det finns lösningar som innefattar artificiella neurala nätverk å andra sidan kan upptäcka dessa meningsfulla enheter, tack vare sin grundläggande utformning. Vårt arbete visar att ett artificiellt neuralt nätverk kan upptäcka dessa meningsfulla enheter, trots den korta längden per recension. Extrahering av meningsfulla enheter ur korta texter är ett ¨ämne som behöver mer forskning för att underlätta problem som detta. Om meningsfulla enheter kan extraheras ur texter, kan grupperingen göras på dessa enheter istället för orden i sig. Vårt artificiella neurala nätverk visar att de arbiträra enheterna intressant och ointressant kan extraheras, vilket gör oss hoppfulla om att framtida forskare kan finna sätt att extrahera fler enheter ur korta texter. I teorin innebär detta att texter av alla längder kan grupperas oövervakat.
90

Data Collection and Layout Analysis on Visually Rich Documents using Multi-Modular Deep Learning.

Stahre, Mattias January 2022 (has links)
The use of Deep Learning methods for Document Understanding has been embraced by the research community in recent years. A requirement for Deep Learning methods and especially Transformer Networks, is access to large datasets. The objective of this thesis was to evaluate a state-of-the-art model for Document Layout Analysis on a public and custom dataset. Additionally, the objective was to build a pipeline for building a dataset specifically for Visually Rich Documents. The research methodology consisted of a literature study to find the state-of-the-art model for Document Layout Analysis and a relevant dataset used to evaluate the chosen model. The literature study also included research on how existing datasets in the domain were collected and processed. Finally, an evaluation framework was created. The evaluation showed that the chosen multi-modal transformer network, LayoutLMv2, performed well on the Docbank dataset. The custom build dataset was limited by class imbalance, although good performance for the larger classes. The annotator tool and its auto-tagging feature performed well and the proposed pipelined showed great promise for creating datasets with Visually Rich Documents. In conclusion, this thesis project answers the research questions and suggests two main opportunities. The first is to encourage others to build datasets with Visually Rich Documents using a similar pipeline to the one presented in this paper. The second is to evaluate the possibility of creating the visual token information for LayoutLMv2 as part of the transformer network rather than using a separate CNN. / Användningen av Deep Learning-metoder för dokumentförståelse har anammats av forskarvärlden de senaste åren. Ett krav för Deep Learning-metoder och speciellt Transformer Networks är tillgång till stora datamängder. Syftet med denna avhandling var att utvärdera en state-of-the-art modell för analys av dokumentlayout på en offentligt tillgängligt dataset. Dessutom var målet att bygga en pipeline för att bygga en dataset specifikt för Visuallt Rika Dokument. Forskningsmetodiken bestod av en litteraturstudie för att hitta modellen för Document Layout Analys och ett relevant dataset som användes för att utvärdera den valda modellen. Litteraturstudien omfattade också forskning om hur befintliga dataset i domänen samlades in och bearbetades. Slutligen skapades en utvärderingsram. Utvärderingen visade att det valda multimodala transformatornätverket, LayoutLMv2, fungerade bra på Docbank-datasetet. Den skapade datasetet begränsades av klassobalans även om bra prestanda för de större klasserna erhölls. Annotatorverktyget och dess autotaggningsfunktion fungerade bra och den föreslagna pipelinen visade sig vara mycket lovande för att skapa dataset med VVisuallt Rika Dokument.svis besvarar detta examensarbete forskningsfrågorna och föreslår två huvudsakliga möjligheter. Den första är att uppmuntra andra att bygga datauppsättningar med Visuallt Rika Dokument med en liknande pipeline som den som presenteras i denna uppsats. Det andra är att utvärdera möjligheten att skapa den visuella tokeninformationen för LayoutLMv2 som en del av transformatornätverket snarare än att använda en separat CNN.

Page generated in 0.0506 seconds