• Refine Query
  • Source
  • Publication year
  • to
  • Language
  • 218
  • 30
  • Tagged with
  • 248
  • 232
  • 229
  • 176
  • 163
  • 126
  • 126
  • 111
  • 80
  • 78
  • 62
  • 52
  • 52
  • 45
  • 42
  • About
  • The Global ETD Search service is a free service for researchers to find electronic theses and dissertations. This service is provided by the Networked Digital Library of Theses and Dissertations.
    Our metadata is collected from universities around the world. If you manage a university/consortium/country archive and want to be added, details can be found on the NDLTD website.
71

Kan själv!? : -vad är verksamhetsnyttan för att själv skapaunderlaget för en Chatbot?

Olausson, Erika January 2018 (has links)
Denna uppsats är uppbyggd på Design Science Research (DSR), där det inom denna studiestuderas den verksamhetsnytta som kan bli av att skapa en egen inlärd Chatbot. DesignScience Research är inom denna studie bron mellan skapandet och teoristudierna. Inomstudien skapas det en artefakt i form av en konceptuell modell, för att ge en framtida lösningför en modell som kan implementeras inom verksamheten. Att lära Chatboten automatisktfrån verksamhetens egna hemsida, har framgått som önskvärt. Artefakten har utvärderatsgenom dels ett experimentet med Natural Language Processing (NLP) paket och algoritmer,samt maskininlärningspaket och metoder. Den myndighet som studeras i denna studie ärRiksantikvarieämbete (RAÄ), där deras data har insamlats och behandlats med NLP ochmaskininlärning. Informationen som är insamlad i denna studie är cirka 70 % av RAÄsmaterial från hemsidan. Det som framkom från utvärderingen är att det krävs ett merdomänspecifikt corpus för att kunna skapa bättre klustrering av datat. Artefakten fråndesignen visade sig uppskattad utifrån att nyttan med inlärningen inte enbart skulle resultera ien Chatbot som fungerar för externa användare, utan även kan vara en hjälp för internaanvändare, som ett internt hjälpmedel för att söka av sin egen hemsida. / This essay is based on Design Science Research (DSR), in which it studies the businessbenefits that may be of creating a customized Chatbot. Design Science Research is within thisstudy the bridge between the creation and the theory studies. Within the study, an artifact iscreated in the form of a conceptual model, to provide a future solution for a model that can beimplemented within the business. Learning the chat boat automatically from the company'sown website has been shown as desirable. The artefact has been evaluated through anexperiment with Natural Language Processing (NLP) packages and algorithms, as well asmachine learning packages and methods. The authority studied in this study is theRiksantikvarieämbetet (RAÄ), where their data has been collected and processed with NLPand machine learning. The information collected in this study is approximately 70% ofRAÄ's material from the website. What emerged from the evaluation is that a moredomain-specific corpus is needed to create better clustering of data. The design from thedesign was estimated based on the fact that the benefit of learning would not only result in aChatbot that works for external users, but could also be a help for internal users, as aninternal tool for searching their own website.
72

Hur påverkas kapitalförvaltning och finansiell rådgivning av Artificiell Intelligens? : En studie om de möjligheter dagens aktörer står inför / How does Artificial Intelligence affect asset management and financial advisory? : A study about the opportunities today’s players are facing

Hedman, Tobias, Pettersson, Gustav January 2018 (has links)
Bakgrund: Artificiell Intelligens (AI) och maskininlärning implementeras i allt större grad på de finansiella marknaderna världen över. Syftet med implementeringen av AI inom finanssektorn innefattar bland annat kostnadsminimering, effektivisering, reducering av mänsklig bias samt ökning av intäkter för företagens verksamheter. Inom finansiell rådgivning och kapitalförvaltning finns brister gällande oberoende, kostnader, bias samt effektivisering varför det är relevant att undersöka hur dessa områden kan effektiviseras och förbättras med hjälp av AI. Vidare är det av intresse att undersöka hur människans roll kan komma att påverkas. Syfte: Syftet med denna studie är att analysera hur kapitalförvaltning och finansiell rådgivning kan påverkas av implementeringen av AI och hur synen på AI är inom dessa två områden. Metod: Studien är utformad utifrån en kvalitativ flerfallstudiedesign. Studiens empiriska material har samlats in från respondenter i två olika urvalsgrupper: kapitalförvaltare och finansiella rådgivare. Data har insamlats genom sju semistrukturerade intervjuer. Slutsats: Studiens resultat visar att AI har stor potential att reducera inslag av bias inom rådgivning och kapitalförvaltning. Styrkan i AI-lösningar återfinns i kombinationen av mänsklig intelligens och Artificiell Intelligens. Vidare står det klart att implementering av AI kan bidra till effektivare datahantering, kostnadshantering samt stordriftsfördelar. Implementeringen skapar möjligheter till ökad kundnytta samt en utökad kundgrupp. Vidare visar studiens resultat att AI har potential att minska intressekonflikter i form av Agency Theory. Slutligen visar studiens resultat att den framtida rådgivningen och kapitalförvaltningen sannolikt kommer ha inslag av cyborg finance, en samverkan mellan Artificiell Intelligens och mänsklig intelligens i form av hybridtjänster där de bästa egenskaperna från bådadera förenas. Nyckelord: Artificiell Intelligens, kapitalförvaltning, finansiell rådgivning, maskininlärning, djupinlärning, automatisering, psykologisk bias. / Background: Artificial Intelligence (AI) and machine learning are increasingly being implemented within the financial markets. The purpose of Artificial Iintelligence is to reduce costs, increase profits as well as efficiency and also reduce human bias. Within finacial advisory and asset management there are problems with independence, costs, bias and efficiency. Our study aims to analyse how these areas can be improved and become more efficient with AI. In addition, it is interesting to study what role the human is likely to take on as AI is increasingly being implemented. Aim: The purpose of this study is to analyse how AI can affect asset management and financial advisory, and also to study the public opinion of this transformation. Methodology:  This study has been designed by a qualitative research strategy. The empirical data derives from two different respondent groups: asset management and financial advisory. The data has been collected through seven semi-structured interviews.                                                                                                                                                  Conclusion: The result of this study indicates that AI has the potential to reduce biases within financial advisory and asset management. The strength of AI-solutions lies in the combination between Artificial Intelligence and human intelligence. Furthermore, an implementation of AI contributes to a higher efficiency when it comes to data handling, cost efficiency as well as economies of scale. This creates opportunities to reach a higher customer benefit and a wider customer group. Moreover, the study indicates that AI has the potential of reducing conflicts of interest and agency problems. Lastly, this study indicates that the future of financial advisory and asset management is likely to consist of cyborg finance. In other words, cooperation between Artificial Intelligence and human intelligence is likely to become commonplace, in the shape of hybrid services where the best attributes of humans and AI work together. Keywords: Artificial Intelligence, asset management, financial advisory, machine learning, deep learning, automation, psychological bias
73

Bedömning av fakturor med hjälp av maskininlärning / Invoice Classification using Machine Learning

Hjalmarsson, Martin, Björkman, Mikael January 2017 (has links)
Factoring innebär försäljning av fakturor till tredjepart och därmed möjlighet att få in kapital snabbt och har blivit alltmer populärt bland företag idag. Ett fakturaköp innebär en viss kreditrisk för företaget i de fall som fakturan inte blir betald och som köpare av kapital önskar man att minimera den risken. Aros Kapital erbjuder sina kunder tjänsten factoring. Under detta projekt undersöks möjligheten att använda maskininlärningsmetoder för att bedöma om en faktura är en bra eller dålig investering. Om maskininlärningen visar sig vara bättre än manuell hantering kan även bättre resultat uppnås i form av minskade kreditförluster, köp av fler fakturor och därmed ökad vinst. Fyra maskininlärningsmetoder jämfördes: beslutsträd, slumpmässig skog, Adaboost och djupa neurala nätverk. Utöver jämförelse sinsemellan har metoderna jämförts med Aros befintliga beslut och nuvarande regelmotor. Av de jämförda maskininlärningsmetoderna presterade slumpmässig skog bäst och visade sig bättre än Aros befintliga beslut på de testade fakturorna, slumpmässig skog fick F1-poängen 0,35 och Aros 0,22 . / Today, companies can sell their invoices to a third party in order to to quickly capitalize them. This is called factoring. For the financial institute which serve as the third party, the purchase of an invoice infers a certain risk in case the invoice is not paid, a risk the financial institute would like to minimize. Aros Kapital is a financial institute that offers factoring as one of their services. This project at Aros Kapital evaluated the possibility of using machine learning to determine whether or not an invoice will be good investment for the financial institute. If the machine learning algorithm performs better than manual handling and by minimizing credit losses and buying more invoices this could lead to an increase in profit for Aros. Four machine learning algorithms have been compared: decision trees, random forest, Adaboost and deep neural network. Beyond the comparison between the four algorithms, the algorithms were also compared with Aros actual decision and Aros current rule engine solution. The  results show that random forest is the best performing algorithm and it also shows a slight improvement on performance compared to Aros actual decision, random forest got an F1- core of 0.35 and Aros 0.22.
74

Artificiell intelligens inom mammografiscreening : En litteraturstudie / Artificial intelligence in mammography screening

Carrass-Milling, Anders, Johansson, Camilla January 2020 (has links)
Den senaste utvecklingen av artificiell intelligens (AI) och djupinlärning (DL) har gjort bild- och funktionsmedicin till en högst trolig kandidat att tidigt anta tekniken. AI inom mammografiscreening syftar till hälsofrämjande effekter genom en förhoppning om säkrare bilddiagnostik. Röntgensjuksköterskans (RSS) arbete präglas av korrekt utförd bildtagning och ett aktivt aktualiserande av den egna yrkesrollen gällande såväl tekniska framsteg som förnyade arbetssätt. Litteraturstudien har upprättats i syfte att belysa potentiella effekter av AI på bilddiagnostik inom mammografiscreening. Genom manifest innehållsanalys av resultat erhållna ur ämnesrelevanta vetenskapliga studier publicerade i databaserna Cinahl och Medline under år 2019–2020 identifierades och beskrevs kategorier sammanställda av subkategorier med liknande innehåll. Effekter inom granskningsprocessen och diagnostisk säkerhet skildrar flera perspektiv gällande AI:s effekter på bilddiagnostik. Utöver en stundtals ökad förmåga till cancerdetektion vid AI-assistans har artificiell bildgranskning även visat sig kunna reducera arbetsbördan för radiologer i form av friskrivning av mammogram med låg sannolikhet för bröstcancer. Vid tillämpning av AI ses lovande effekter inom framförallt klassificering av bröstvävnad samt vid reducering av falska positiva svar. Forskningen förbehålls dock med kvarstående etiska dilemman och avsaknad av ett juridiskt ramverk, vilket lämnar utrymme för vidare studier. / Recent developments in artificial intelligence (AI) and deep learning (DL) have made diagnostic imaging a prime candidate to adopt the technology. AI in mammography screening aims at promoting health with hopes of higher diagnostic accuracy. The radiographers work is characterized by properly performed imaging and actively updating the profession regarding technical developments and renewed working methods. The aim of this systematic review was to illustrate feasible effects of AI on diagnostic imaging within mammography screening. Through manifest content analysis of results obtained from subject related scientific studies published 2019–2020 in the databases Cinahl and Medline the authors identified and described categories compiled by subcategories with similar contents. Effects within the image interpretation process and diagnostic accuracy describes several perspectives regarding the outputs of AI on diagnostic imaging. AI-systems have proven to be useful in both assisting with image interpretation and reducing the workload for radiologists by disclaiming mammograms with low probability of breast cancer. Most promising effects are seen in the classification of breast tissue and reduction of false positives, but research is challenged by ethical dilemmas and the need for a legal framework, which are areas suggested for future research.
75

Automated visual inspections for final assembly : A case study of cab assembly at Scania Oskarshamn / Automatiserade visuella inspektioner för slutmontering : En fallstudie på hyttmontering hos Scania i Oskarshamn

Johnson, Amos, Aronsson, Hannes January 2020 (has links)
Quality inspections have seen varying degrees of automation depending on the complexity of the task and the environment. Especially in later phases of multi-stage manufacturing processes, such as final assembly in automotive industries, quality inspections are largely manual to this day. Today, emerging technologies offer both pressures and tools to increase automation. However, the current state of the research field is lacking in studies that help guide companies toward implementation. Thus, quality managers at final assembly for Scania's truck coachwork factory in Oskarshamn (MC) stipulated a thesis assignment to explore how inspections in their final assembly workshop could be automated. This assignment constitutes the purpose of this thesis project - to provide an exploratory study into existing and emerging technologies that enable automation of quality inspections at MC. This was eventually delimited to exploring automated visual inspection technologies. In order to better understand Scania's inspection and manufacturing system, a series of interviews and shadowings were undertaken with appropriate respondents. From these, we were able to extract seven inspection system requirements, most important were the ability to (1) handle high variability, (2) add new inspections fast, (3) inspect in direct flow and (4) inspect inside and outside of the truck coach without disassembly. Then, a thorough and comprehensive review of 559 active inspections allowed us to categorize and map the nature of inspections at MC. In our literature review, a model for a general quality inspections was found, which was used to guide and ground our proposals and recommendations as well as provided intuitive illustration. Further, two paradigms emerged as most interesting for this project: machine vision and deep learning. A theoretical comparison of the two suggested that the more traditional, rule-based machine vision algorithms would struggle in accommodating the requirements previously found. However, we could infer that deep learning would be highly suitable with respect to MC's requirements and inspections. A prototype deep learning inspection system gave further validation toward our speculations that deep learning offered the greatest potential for automation in complex environments such as MC's. Although this thesis was created for Scania as a primary customer, important theoretical and practical contributions were developed for a more general audience. Firstly, the exploration into new avenues for automation that overcome their traditional limitations were provided; something that is of high current import given the trends toward more complex manufacturing settings. Practically, we provide some guidance to industries that find themselves in similar situations to Scania - employing complex manufacturing systems or having complex products - where our findings can give insights in regards to modern automation challenges and solutions. / Kvalitetsinspektioner har automatiserats i variarande grad beroende på uppgiftens och omgivningens komlexitet. I synnerhet i de senare stadierna av flerstegsproduktioner, exempelvis slutmontering i fordonstillverkningsindustrin, består manuella inspektioner i stor utsträckning. Den snabba tekniska utvecklingen som har skett nyligen avger både ett tryck och skapar verktyg för att utöka automatiseringen. Dessvärre erbjuder dagslägets forskning föga stöd till företag gällande storskalig implementering av automatiserade kvalitetsinspektionssystem. Därför skapade kvalitetschefer på Scanias lastbilshyttmonteringsfabrik i Oskarshamn (MC) ett uppdrag att utforska hur deras inspektioner skulle kunna automatiseras. Detta uppdrag utgjorde syftet i vårt examensarbete: att utföra en explorativ studie inom befintliga och nya tekniker som möjliggör automatisering av MCs kvalitetsinpspektioner, vilket senare avgränsades till undersökandet av visuella kvalitetsinspektioner. För att tillgodogöra oss en djupare förståelse för Scanias inspektions- och produktionssytem utfördes en serie intervjuer och skuggningar med kunniga respondenter. Datan som erhölls utgjorde grunden i en nulägesanalys, från vilken sju systemkrav för ett inspektionssystem på MC kunde extraheras. De viktigaste av dessa var förmågan att (1) klara av hög variation, (2) addera nya inspektionspunkter snabbt, (3) kontrollera i direktflödet och (4) kontrollera innan- och utanför lastbilshytten. Vidare gjordes en omfattande genomgång av 559 aktiva inspektionspunkter vilket resulterade i en kategorisering och kartläggning av inspektioner på MC. I vår genomgång av relevant vetenskaplig litteratur hittades en generell modell för kvalitetskontroll som användes för att illustrera och teroretiskt förankra rekommendationer för ett automatiskt inspektionssystem. Vidare urskiljdes två intressanta områden i forskningen, machine vision och deep learning. En teoretisk jämförelse av traditionella regelbaserade machine vision algoritmer med deep learning erhöll att den förstnämnda är mindre lämpad för Scania med hänsyn till de krav som tagits fram. Deep learning å andra sidan, erbjuder många fördelar i relation till dessa. Genom en relativt enkel process kunde en deep learning baserad prototyp utvecklas. Prototypen påvisade goda resultat och gav vidare validering av vår spekulation att deep learning är ett lämpligt verktyg för automatisering i komplexa miljöer.Trots att detta examensarbete hade Scania som huvudsaklig uppdragsgivare så gjordes viktiga teoretiska och praktiska bidrag. En utforskning av i nya möjligheter för automatisering som kan överkomma begränsningarna av traditionell automatisering framtogs, vilket anses som både aktuellt och av vikt för samtiden där trender går mot mer dynamiska produktionssystem. Vad gäller praktiska bidrag så utgör denna rapport en sammanställning av råd till företag som befinner sig i liknande sitser som Scania - som använder komplexa produktionssystem eller har komplexa produkter - där våra resultat kan ge insikt gällande svårigheter och lösningar för modern automatisering.
76

AI-vision som tillämpning i en stålindustri : Med inriktning på objektdetektering & bildklassificering

Wenger, Jakob January 2020 (has links)
I takt med att industri 4.0 sveper över dagens industrier så utvecklas tillämpningsområden inom artificiell intelligens (AI). En relativt nyfunnen tillämpning som vanligen benämns AI-vision eller Computer-vision, inom detta arbete har benämningen AI-vision valts. Tillämpningen handlar om att datorer och maskiner upprättas med förmågan att tolka visuellt innehåll.I och med detta tränas en intelligent modell som klarar av att fatta beslut utifrån visuell data, såsom bild och video. Inriktningen i arbetet belyser inom AI-Vision teknikerna objektdetektering och bildklassificering. Objektdetektering innebär att ett eller flera specifika objekt upptäcks från en bild av flera komplexa linjer och former. Tekniken används inom en rad olika tillämpningar såsom t.ex. robotnavigering och automatisk fordonsstyrning. Syftet med bildklassificering ibland kallat bildigenkänning, handlar om att klassificera och kategorisera bilden genom att identifiera och sortera väsentlig data. Detta i försök att konstatera vad bilden i sig föreställer. För att forma och rama in detta arbete på ett lämpligt sätt ämnas huvudsakliga målet med arbetet beskriva hur tekniker såsom objektdetektering och bildklassificerings-modeller konstrueras. Så även redogöra kring bakomliggande intelligens i modellerna, samt vilka verktyg och metoder som används för att skapa dessa modeller. Arbetet syftar även till att presentera presumtiva tillämpningar inom en stålindustri, därför kommer förslag till applikationer framföras. I resultatdelen av arbetet presenteras i huvudsak uppbyggnaden av en objekdetekteringsapplikation som hanterar personsäkerhet och i diskussionsdelen framhävs vidare förslag till applikationer. Detta avses lägga grund för eventuell implementation i verkliga produktionsutrustningar i framtiden. / As Industry 4.0 sweeps across today's industries, applications within artificial intelligence (AI) are developing. A relatively new application that is commonly called AI-vision or sometimes Computer-vision, in this study the term AI-vision is used. The application is about making computers and machines visually inclined. With this, an intelligent model is trained that can make decisions based on visual data, such as image and video. The orientation in this study within AI-Vision, is to highlight object detection and image classification. Object detection defines as follows, one or more specific objects are detected from an image of several complex lines and shapes. The technology is used in a variety of applications such as robot navigation and automatic vehicle control. The purpose of image classification, sometimes called image recognition, is to classify and categorize the image by identifying and sorting essential data. This in attempt to ascertain what the image itself represents. In order to frame this work in an appropriate way, the main quest of this thesis is to describe how techniques such as Object Detection and Image Classification models are constructed. Explain the underlying intelligence in the models as well as what tools and methods are used to create these models. As the thesis also alludes to present prospective applications in a steel industry, proposals of specific applications will be presented. The results section mainly presents an Object Detection application that handles personal safety and drafts to applications is presented in the discussion section. This work intends to contribute for possible implementation in production equipment in the future.
77

Transfer learning applied to a deep learning system for cardiac abnormality classification in electrocardiograms / Överföringsinlärning tillämpad på ett system för djupinlärning för klassificering av hjärtfel i elektrokardiogram.

Campoy Rodriguez, Adrian January 2022 (has links)
Cardiovascular diseases are a leading cause of death globally. Early diagnosis and treatment is of prime importance to prevent or mitigate health complications. Electrocardiogram (ECG) is a standard test modality used for early diagnosis of arrhythmias. The standard ECG uses 12 leads (i.e., 12 different views of the electrical activity of the heart). However, it is not always possible to perform a standard 12-lead ECG, for instance, in certain emergency situations. Such devices used in emergency situations are able to measure only a subset of leads. Although it is a simpler way of recording ECG, it comes at the cost of losing some information. The project presented in this thesis applies three different models based on canonical correlation analysis (CCA) to perform transfer learning from 12-lead ECGs to improve performance when only a subset of leads is available. The models used were linear canonical correlation analysis, deep canonical correlation analysis (DCCA) and deep canonically correlated bidirectional long short-term memory networks (DCC-BiLSTMs). These models are compared to each other using different configurations to study their performance on ECG data. Linear canonical correlation analysis performed better than its more complex variants, DCCA and DCC-BiLSTMs. With this method, it was possible to improve performance on ECG classification when using two, three, four and six leads in a computationally efficient way. / Hjärt- och kärlsjukdomar är den främsta dödsorsaken i världen. Tidig diagnos och behandling är av största vikt för att förhindra ytterligare och allvarliga hälsoproblem. Elektrokardiogram (EKG) är den standardmetod som används för tidig diagnos av arytmier. Standardförfarandet inom EKG använder sig av 12 avledningar (dvs. 12 olika vyer av hjärtats elektriska aktivitet). Det är dock inte alltid möjligt att utföra ett standard-EKG med 12 ledningar, vilket t.ex. förekommer i vissa nödsituationer. I dessa fall kan utrustning som gör det möjligt att ta fram ett 12-ledars EKG inte vara tillgänglig av flera olika skäl, och därför används andra apparater som kan mäta endast en delmängd av ledningarna för tidig diagnostik. Även om det är ett enklare sätt att utföra ett EKG, innebär det att man förlorar en del information. I det projekt som presenteras i detta dokument används tre olika modeller baserade på kanonisk korrelationsanalys (CCA) för att utföra överföringsinlärning från 12-ledars EKG för att förbättra prestanda när endast en delmängd av avledningar används. De modeller som användes var linjär kanonisk korrelationsanalys, djup kanonisk korrelationsanalys (DCCA) och djupa kanoniskt korrelerade bidirektionella långtidsminnesnätverk (DCCBiLSTMs). Dessa modeller jämförs med varandra med hjälp av olika konfigurationer för att studera deras prestanda på EKG-data. Linjär kanonisk korrelationsanalys presterade bättre än dess mer komplexa varianter, DCCA och DCC-BiLSTMs. Med denna metod var det möjligt att förbättra prestandan för klassificering av EKG när man använder två, tre, fyra och sex ledningar på ett beräkningseffektivt sätt.
78

Transfer learning techniques in time series analysis

Sablons de Gélis, Robinson January 2021 (has links)
Deep learning works best with vast andd well-distributed data collections. However, collecting and annotating large data sets can be very time-consuming and expensive. Moreover, deep learning is specific to domain knowledge, even with data and computation. E.g., models trained to classify animals would probably underperform when they classify vehicles. Although techniques such as domain adaptation and transfer learning have been popularised recently, tasks in cross-domain knowledge transfer have also taken off. However, most of these works are limited to computer vision. In the domain of time series, this is relatively underexplored. This thesis explores methods to use time series data from one domain to classify data generated from another domain via transfer learning. It focuses on using accelerometer data from running recordings to improve the classification performance on jumping data based on the apparent similarity of individual recordings. Thus, transfer learning and domain adaptation techniques were used to use the learning acquired through deep model training on running sequences. This thesis has performed four experiments to test this domain similarity. The first one consists of transforming time series with the continuous wavelet transform to get both time and frequency information. The model is then pre-trained within a contrastive learning framework. However, the continuous wavelet transformation (CWT) did not improve the classification results. The following two experiments consisted of pre-training the models with self-supervised learning. The first one with a contrastive pretext-task improved the classification results, and the resilience to data decrease. The second one with a forward forecasting pretext-task improved the results when all the data was available but was very sensitive to data decrease. Finally, the domain adaptation was tested and showed interesting performances on the classification task. Although some of the employed techniques did not show improvement, pre-training using contrastive learning on the running dataset has shown great improvement to classify the jumping dataset. / Djupinlärning fungerar bäst med stora och väl distribuerade datasamlingar. Det kan dock vara mycket tidskrävande och dyrt att samla in och kommentera stora datamängder. Även med alla data och beräkningar är djupinlärning specifik för domänkunskap. Exempelvis skulle modeller som tränats för att klassificera djur förmodligen underprestera när de klassificerar fordon. Även om tekniker som domänanpassning och överföringsinlärning har populariserats på senare tid, har även uppgifter inom kunskapsöverföring mellan olika domäner tagit fart. De flesta av dessa arbeten är dock begränsade till datorseende. Inom tidsseriernas område är detta relativt outforskat. I den här avhandlingen undersöks metoder för att använda tidsseriedata från en domän för att klassificera data från en annan domän med hjälp av djupinlärning. Fokus ligger på att använda accelerometerdata från löpning för att förbättra klassificeringen av hoppdata, baserat på den uppenbara likheten mellan löpning och hoppning. Således användes tekniker för överföringsinlärning och domänanpassning för att använda den inlärning som förvärvats genom träning av djupa modeller på löpsekvenser. I den här avhandlingen har fyra experiment utförts för att testa denna domänlikhet. Det första består av att omvandla tidsserier med den kontinuerliga wavelettransformen för att få fram både tids- och frekvensinformation. Modellen förtränas sedan inom en ram för kontrastiv inlärning. Användningen av CWT förbättrade dock inte klassificeringsresultaten. De följande två experimenten bestod av att förträna modellerna med självövervakad inlärning. Det första försöket med en kontrasterande förtextuppgift förbättrade klassificeringsresultaten och motståndskraften mot dataförlust. Det andra försöket med en prognostiserande förtextuppgift förbättrade resultaten när alla data var tillgängliga, men var mycket känslig för dataförlust. Slutligen testades domänanpassningen och visade intressanta resultat i klassificeringsuppgiften. Även om några av de använda teknikerna inte visade någon förbättring, har förträning med hjälp av kontrastinlärning på löpande dataset visat sig ge stora förbättringar när det gäller klassificering av hoppdata.
79

News article segmentation using multimodal input : Using Mask R-CNN and sentence transformers / Artikelsegmentering med multimodala artificiella neuronnätverk : Med hjälp av Mask R-CNN och sentence transformers

Henning, Gustav January 2022 (has links)
In this century and the last, serious efforts have been made to digitize the content housed by libraries across the world. In order to open up these volumes to content-based information retrieval, independent elements such as headlines, body text, bylines, images and captions ideally need to be connected semantically as article-level units. To query on facets such as author, section, content type or other metadata, further processing of these documents is required. Even though humans have shown exceptional ability to segment different types of elements into related components, even in languages foreign to them, this task has proven difficult for computers. The challenge of semantic segmentation in newspapers lies in the diversity of the medium: Newspapers have vastly different layouts, covering diverse content, from news articles to ads to weather reports. State-of-the-art object detection and segmentation models have been trained to detect and segment real-world objects. It is not clear whether these architectures can perform equally well when applied to scanned images of printed text. In the domain of newspapers, in addition to the images themselves, we have access to textual information through Optical Character Recognition. The recent progress made in the field of instance segmentation of real-world objects using deep learning techniques begs the question: Can the same methodology be applied in the domain of newspaper articles? In this thesis we investigate one possible approach to encode the textual signal into the image in an attempt to improve performance. Based on newspapers from the National Library of Sweden, we investigate the predictive power of visual and textual features and their capacity to generalize across different typographic designs. Results show impressive mean Average Precision scores (>0:9) for test sets sampled from the same newspaper designs as the training data when using only the image modality. / I detta och det förra århundradet har kraftiga åtaganden gjorts för att digitalisera traditionellt medieinnehåll som tidigare endast tryckts i pappersformat. För att kunna stödja sökningar och fasetter i detta innehåll krävs bearbetning påsemantisk nivå, det vill säga att innehållet styckas upp påartikelnivå, istället för per sida. Trots att människor har lätt att dela upp innehåll påsemantisk nivå, även påett främmande språk, fortsätter arbetet för automatisering av denna uppgift. Utmaningen i att segmentera nyhetsartiklar återfinns i mångfalden av utseende och format. Innehållet är även detta mångfaldigt, där man återfinner allt ifrån faktamässiga artiklar, till debatter, listor av fakta och upplysningar, reklam och väder bland annat. Stora framsteg har gjorts inom djupinlärning just för objektdetektering och semantisk segmentering bara de senaste årtiondet. Frågan vi ställer oss är: Kan samma metodik appliceras inom domänen nyhetsartiklar? Dessa modeller är skapta för att klassificera världsliga ting. I denna domän har vi tillgång till texten och dess koordinater via en potentiellt bristfällig optisk teckenigenkänning. Vi undersöker ett sätt att utnyttja denna textinformation i ett försök att förbättra resultatet i denna specifika domän. Baserat pådata från Kungliga Biblioteket undersöker vi hur väl denna metod lämpar sig för uppstyckandet av innehåll i tidningar längsmed tidsperioder där designen förändrar sig markant. Resultaten visar att Mask R-CNN lämpar sig väl för användning inom domänen nyhetsartikelsegmentering, även utan texten som input till modellen.
80

Human pose estimation in low-resolution images / Estimering av mänskliga poser i lågupplösta bilder

Nilsson, Hugo January 2022 (has links)
This project explores the understudied, yet important, case of human pose estimation in low-resolution images. This is done in the use-case of images with football players of known scale in the image. Human pose estimation can mainly be done in two different ways, the bottom-up method and the top-down method. This project explores the bottom-up method, which first finds body keypoints and then groups them to get the person, or persons, within the image. This method is generally faster and has been shown to have an advantage when there is occlusion or crowded scenes, but suffers from false positive errors. Low-resolution makes human pose estimation harder, due to the decreased information that can be extracted. Furthermore, the output heatmap risks becoming too small to correctly locate the keypoints. However, low-resolution human pose estimation is needed in many cases, if the camera has a low-resolution sensor or the person occupies a small portion of the image. Several neural networks are evaluated and, in conclusion, there are multiple ways to improve the current state of the art network HigherHRNet for lower resolution human pose estimation. Maintaining large feature maps through the network turns out to be crucial for low-resolution images and can be achieved by modifying the feature extractor in HigherHRNet. Furthermore, as the resolution decreases, the need for sub-pixel accuracy grows. To improve this, various heatmap encoding-decoding methods are investigated, and by using unbiased data processing, both heatmap encoding-decoding and coordinate system transformation can be improved. / Detta projekt utforskar det understuderade, men ändå viktiga, fallet med uppskattning av mänskliga poser i lågupplösta bilder. Detta görs i användningsområdet av bilder med fotbollsspelare av en förutbestämd storlek i bilden. Mänskliga poseuppskattningar kan huvudsakligen göras på två olika sätt, nedifrån-och-upp- metoden och uppifrån-och-ned-metoden. Detta projekt utforskar nedifrån-och- upp-metoden, som först hittar kroppsdelar och sedan grupperar dem för att få fram personen, eller personerna, i bilden. Denna metod är generellt sett snabbare och har visat sig vara fördelaktig i scenarion med ocklusion eller mycket folk, men lider av falska positiva felaktigheter. Låg upplösning gör uppskattning av mänskliga poser svårare, på grund av den minskade informationen som kan extraheras. Dessutom riskerar färgdiagramet att bli för liten för att korrekt lokalisera kroppsdelarna. Ändå behövs uppskattning av lågupplöst mänskliga poser i många fall, exempelvis om kameran har en lågupplöst sensor eller om personen upptar en liten del av bilden. Flera neurala nätverk utvärderas och sammanfattningsvis finns flera sätt att förbättra det nuvarande toppklassade nätverket HigherHRNet för uppskattning av mänskliga poser med lägre upplösning. Att bibehålla stora särdragskartor genom nätverket visar sig vara avgörande för lågupplösta bilder och kan uppnås genom att modifiera särdragsextraktorn i HigherHRNet. Dessutom, när upplösningen minskar, ökar behovet av subpixel-noggrannhet. För att förbättra detta undersöktes olika färgdiagram-kodning-avkodningsmetoder, och genom att använda opartisk databehandling kan både färgdiagram-kodning-avkodning och koordinatsystemtransformationen förbättras.

Page generated in 0.1767 seconds