• Refine Query
  • Source
  • Publication year
  • to
  • Language
  • 39
  • 15
  • Tagged with
  • 54
  • 32
  • 21
  • 11
  • 10
  • 8
  • 7
  • 6
  • 6
  • 6
  • 6
  • 5
  • 5
  • 5
  • 5
  • About
  • The Global ETD Search service is a free service for researchers to find electronic theses and dissertations. This service is provided by the Networked Digital Library of Theses and Dissertations.
    Our metadata is collected from universities around the world. If you manage a university/consortium/country archive and want to be added, details can be found on the NDLTD website.
31

Osäkerhet vid fotogrammetrisk kartering med UAS och naturliga stödpunkter

Skoog, Elin, Axelsson, Mathilda January 2013 (has links)
En karta är en färskvara som är i ständigt behov av ajourhållning. Ajourhållning görs normalt med traditionella metoder: fotogrammetriska och/eller geodetiska. Men i och med att utvecklingen går framåt har intresset för en ny metod, UAS (Unmanned Aerial Systems), ökat. UAS är en relativt ny fotogrammetrisk metod där obemannade flygfarkoster används. Detta examensarbete har utvärderat vilken osäkerhet vanligt förekommande detaljer i en karta kan få i framställda "produkter" som genererats med hjälp av UAS-bilder som georefererats med naturliga stödpunkter. Produkterna som framställdes var en digital ytmodell och ett ortofoto och togs fram i datorprogrammet Agisoft Photoscan. Bilderna som bearbetades i denna studie erhölls från Swecos UAS-flygning och var tagna över deponiområdet Fågelmyra i Ornäs, Dalarnas län. I den digitala ytmodellen och i ortofotot mättes detaljer in för att sedan kontrolleras mot kontrollpunkter inmätta med nätverks-RTK (Real-Time Kinematic). Studien visade att detaljer inmätta i den digitala ytmodellen och ortofotot resulterade i en osäkerhet på 0,28 m respektive 0,08 m i plan. Varför osäkerheterna skiljer sig mellan den digitala ytmodellen och ortofotot kan ha att göra med att det är svårt att identifiera objekt i den digitala ytmodellen. Utifrån denna studie kan det konstateras att UAS och georeferering med naturliga stödpunkter lämpar sig för kartering av mindre områden. Dessutom kan det konstateras att UAS är effektiv och relativt enkel teknik. / A map is in constant need of being updated. Map updating is normally performed with traditional methods such as photogrammetric and/or geodetic. But by technical development the interest in new methods has increased, like in UAS (Unmanned Aerial Systems). UAS is a relatively new photogrammetric method using unmanned aerial vehicles (UAV). The purpose of this study is to evaluate what uncertainty common details in a map can get in "products" generated from UAS images georeferenced with natural ground control points. The products that were generated was a digital surface model and an orthophoto and was produced in the software Agisoft Photoscan. The images that were processed in this study were obtained from Sweco’s UAS flight and taken over landfill area Fågelmyra in Ornäs, Dalarna county. In the digital surface model and the orthophoto details were measured and controlled against check points surveyed with Network RTK (Real-Time Kinematic). The study has shown that the surveyed details in the digital surface model and ortohophoto resulted in a planimetric uncertainty of 0.28 m and 0.08 m, respectively. The reason for why the uncertainties for the digital surface model and orthophoto are different may be that it is difficult to identify objects in the digital surface model. Based on this study it can be concluded that UAS and georeferencing with natural ground control points is suitable for mapping of smaller areas. In addition, it can be concluded that UAS is efficient and relatively easy technique.
32

Extracting information about arms deals from news articles / Extrahering av information om vapenaffärer från nyhetsartiklar

Hernqvist, Fredrik January 2022 (has links)
The Stockholm International Peace Research Institute (SIPRI) maintains the most comprehensive publicly available database on international arms deals. Updating this database requires humans to sift through large amounts of news articles, only some of which contain information relevant to the database. To save time, it would be useful to automate a part of this process. In this thesis project we apply ALBERT, a state of the art Pre-trained Language Model for Natural Language Processing (NLP), to the task of determining if a text contains information about arms transfers and extracting that information. In order to train and evaluate the model we also introduce a new dataset of 600 news articles, where information about arms deals is annotated with lables such as Weapon, Buyer, Seller, etc. We achieve an F1-score of 0.81 on the task of determining if an arms deal is present in a text, and an F1-score of 0.77 on determining if a given part of a text has a specific arms deal-related attribute. This is probably not enough to entirely automate SIPRI’s process, but it demonstrates that the approach is feasible. While this paper focuses specifically on arms deals, the methods used can be generalized to extracting other kinds of information. / Stockholm International Peace Research Institute (SIPRI) tillhandahåller den största allmänt tillgängliga databasen med internationella vapenaffärer. För att hålla databasen uppdaterad måste människor sålla igenom stora mängder nyhetsartiklar, varav endast några innehåller information som är relevant för databasen. För att spara tid vore det bra att kunna automatisera en del av den processen. I det här examensarbetet använder vi ALBERT, en maskininlärningsmodell för behandling av naturliga språk (NLP), för att avgöra om en text innehåller information om vapenaffärer och för att extrahera den informationen. För att träna modellen skapar vi också ett dataset med 600 nyhetsartiklar, där information om vapenaffärer finns annoterad med attribut som Vapen, Köpare, Säljare, etc. Vi fick en F1-score på 0.81 på problemet att avgöra om en vapenaffär finns i en text, och en F1-score på 0.77 på problemet att avgöra om en given del av en text har ett specifikt vapenaffärsrelaterat attribut. Resultaten är förmodligen inte bra nog för att helt kunna automatisera SIPRIs process, men de demonstrerar att metoden är lovande. Det här examensarbetet fokuserar specifikt på vapenaffärer, men metoderna kan förmodligen generaliseras för att extrahera andra sorters information.
33

Photoredox catalysis enabled C–O bond activation: Access to unnatural amino acids / Fotoredoxkatalyserad aktivering av C–O bindningar: Syntes av icke-naturliga aminosyror

Lantz, Josefin January 2021 (has links)
Fotoredoxkatalys tillhandahåller möjligheter att utveckla nya hållbara kemiska reaktionsvägar. När fotokatalysatorn bestrålas med synligt ljus möjliggörs elektronöverföring till eller från substratet som i sin tur medför alstring av reaktiva fria radikaler. Kolradikaler, genererade med fotoredox-katalys från alkyloxalataktiverade alkoholer, har framgångsrikt kopplats till sulfinyliminer och möjliggör därigenom syntes av onaturliga α-aminosyror. Reaktionen utförs vid rumstemperatur och kräver endast extern energi i form av synligt ljus för att aktivera den iridium-baserade fotokatalysatorn. Den höga tillgängligheten av alkoholer utgör ett rimligt skäl för att använda dem som startmaterial. I detta projekt har tertiära alkoholer resulterat i framgångsrika reaktioner. / Photoredox catalysis provides opportunities to develop new sustainable chemical reaction pathways through single-electron transfer events and generation of reactive free-radical species. In this thesis carbon radicals, generated with photoredox catalysis from alkyl oxalate-activated alcohols, have successfully been coupled to sulfinyl imines and thereby enabling synthesis of unnatural α-amino acids. The reaction is performed at room temperature and only requires external energy in the form of visible light to activate the iridium-based photocatalyst. The abundance and availability of alcohols presents good reasons to use them as radical precursors. Under the developed reaction conditions, tertiary alcohols proved to be successful radical precursors, giving the desired product in good yield.
34

Stereoselective synthesis of unnatural α-amino acids through photoredox catalyzed C–H activation / Stereoselektiv syntes av icke-naturliga α-aminosyror genom fotoredoxkatalyserad C–H-aktivering

Wåhlin, Ludwig January 2021 (has links)
Fotoredoxkatalys har nyligen genomgått en renässans inom organisk kemi då metoden har möjliggjort framtagandet utav nya reaktionsvägar med milda reaktionsbetingelser genom att använda sig av synligt ljus. I det här arbetet undersöktes metodens bredd genom att kombinera metoden med väteatomöverföringskatalys för att funktionalisera C–H bindningar i α-position till heteroatomer och på så sätt skapa icke-naturliga α-aminosyror. Resultaten från detta arbete gav upp till 60% utbyte genom att kombinera dessa två katalysmetoder för substrat med Boc som skyddsgrupp, medan tertiära aminer inte krävde en väteatomöverföringskatalysator för kunna funktionaliseras. Den syntetiska metoden utan väteatomöverföringskatalys verkar dock inte vara applicerbara för sekundära aminer, men ser ut att fungera för C–H aktivering i α-position till svavelatomer vilket tyder på denna simplare metod utan väteatomsöverföring bör vara applicerbar för flera typer av substrat än för bara aminer / Photoredox catalysis has recently undergone a renaissance in the field of organic chemistry due the enabling of new reaction pathways under mild reaction conditions using visible light. In this work, the scope of this technology was explored by combining it with hydrogen atom transfer (HAT) to perform C–H functionalization in α-position to heteroatoms for synthesis of unnatural α-amino acids. The results showed that this is a viable method, gaining up to 60% yield using a dual catalytic system for Boc protected amines, while the functionalization of tertiary amines does not require HAT in order to work. Secondary amines proved to be non-applicable using the developed synthetic route without HAT catalyst while C–H activation in α-position to sulfur atoms gave similar response as tertiary amines – indicating that C–H activation without HAT should be applicable to a wider substrate scope than only using amines.
35

Hållbarhetsrapportering inom detaljhandeln : Ett fungerande styrmedel eller en rökridå för konsumenter?

Björk, Emma-Lee January 2021 (has links)
En hållbar utveckling är kritiskt för att kommande generationer ska kunna leva på vår jord med liknande möjligheter som vi har idag. Att arbeta med hållbarhet är viktigt för såväl privatpersoner som företag. För att säkerställa en mer hållbar utveckling har Europeiska Unionen tagit fram direktiv som sätter krav på större företag att redovisa sitt hållbarhetsarbete. I Sverige ingår detta direktiv i Årsredovisningslagen som ställer krav på hållbarhetsrapportering från större företag.Syftet i denna uppsats är att utreda om Ur &amp; Penn, ett stort företag inom klock- och smyckesbranschen har en hållbarhetsrapport i sin årsredovisning som fyller de krav Årsredovisningslagen ställer. Datainsamlingen som används om företaget kommer från offentliga källor samt empiriskt kunskapsinsamlande från den inblick en får genom att arbeta inom företaget. Företagets hållbarhetsrapport för räkenskapsår 2017-2018 har utretts och i resultatet fastställs det att hållbarhetsrapporten inte lever upp till de krav som Årsredovisningslagen ställer. Global Reporting Initiative används som mall för att ge förslag på förbättrad hållbarhetsredovisning.En värdekedjeanalys görs av ett armbandsur i rostfritt stål för att se vilken miljöpåverkan en populär produkt från företaget har och utifrån detta görs en SWOT-analys för att ta fram strategier som företaget kan använda till sitt hållbarhetsarbete. Den miljöpåverkan som värdekedjeanalysen fastställer kopplas till Det naturliga steget som belyser att produktionen av rostfritt stål har stor påverkan på miljön och att det arbetssätt som finns inom företaget bidrar till en icke hållbar värld.Slutsatsen i denna uppsats är att företaget inte lever upp till de krav som Årsredovisningslagen ställer gällande hållbarhetsrapportering. Företagets produkt och arbetssätt är inte hållbara och om företaget vill säkra en framtid på en marknad som blir allt mer hållbarhetsfokuserad behöver företaget arbeta mer med hållbarhet. / Sustainable development is crucial for future generations ability to live on this planet with similar opportunities as we do today. To work with sustainability is important for the individual person as well as companies. The European Union has developed directives that require big companies to account for their work with sustainability, this is to ensure a more sustainable development in the union. This directive is a part of the Annual Accounts Act in Sweden, and it requires that bigger companies have a report on their sustainability work.The purpose of this essay is to investigate if a big company within the watch- and jewelry industry have a sustainability report that meet the requirements of the Annual Accounts Act. The information that is used about the company is from public sources as well as personal experiences from the author that has worked within the company. The company's sustainability report for the financial year 2017-2018 does not meet the requirements. Global Reporting Initiative is used as a guide to give suggestions on improving the report.A value chain analysis is made for a wristwatch made of stainless steel to see which environmental impact a popular product from the company has. A SWOT-analysis is made based of the value chain to illustrate strategies that the company can use with its sustainability work. The environmental impact that the value chain determine is linked to The natural step which proves that the production of stainless steel has a big impact on the environment and that the working model within the company is contributing to an unsustainable world.The conclusion of the essay is that this company does not live up to the requirements that the Annual Accounts Act have regarding sustainability reports. The product from the company and their working model is not sustainable and if the company wants to ensure a future on a market that is becoming more focused on sustainability; they need to work more with sustainability. / <p>2021-11-26</p>
36

The applicability of agricultural fibres in industrial cleaning cloths : in the aspects of processability and sustainability / Applicerbarhet av naturliga fibrer i industriella rengöringsdukar : i aspekterna av tillverkningsprocess och hållbarhet

Walker, Liv, Essén, Karin January 2020 (has links)
This study has its background in the EU directive, the ‘Single-Use Plastics Directive’. The directive was initiated due to the environmental impacts that the oceans suffer due to plastic waste. The directive presents the most common single-use products found as waste in the oceans, including wipes and cloths. In collaboration with Essity, a global hygiene and health company, this study aims to find a replacement fibre for the currently used polyester fibre in Essity’s industrial cleaning cloths. To this end, we have evaluated the applicability of an agricultural fibre in the aspects of processability and sustainability. A theoretical part including a literature study of agricultural fibres is combined with a practical experimental part to evaluate a manufactured prototype. The theoretical part includes a compilation of the relevant parameters per fibre and the experimental part consists of laboratory tests and a panel test. On this basis, it was concluded that the first agricultural fibre, hemp, did not function adequately in the process due to the variations in fibre length and coarseness. A solution to this problem may be pre-treatments of the fibres. The second fibre, flax, functioned well in the process and may then be considered applicable in the aspect of process. The applicability of an agricultural fibre is possible in industrial cleaning cloths, but the geographical location of cultivation, transport, the chemicals used and irrigation should also be taken into account in the aspects of sustainability. / Bakgrunden till denna studie är EU-direktivet, ‘Single-Use Plastics Directive’. Direktivet har sitt ursprung i de miljöproblem som våra hav lider av på grund av nedskräpningen medplastavfall. Direktivet redovisar de engångsartiklar som återfinns allra mest i haven idag, däribland rengöringsdukar. På förekommen anledningen ska därför denna studie i samarbete med Essity, ett globalt hygien- och hälsoföretag, undersöka möjligheten att ersätta den befintliga polyesterfibern i deras industriella rengöringsdukar. Studien har utvärderat möjligheten att använda en naturlig fiber med avseende på tillverkningsprocess och hållbarhet. För att möjliggöra en utvärdering av en tillverkad prototyp, så har en teoretisk del med en litteraturstudie i kombination med en praktisk experimentell del genomförts. Den teoretiska delen består av en sammanställning av relevanta parametrar för varje fiber och den experimentella delen består av laboratorietester och ett paneltest. Slutsatserna från ett förstaförsök var att hampafibrer inte fungerade i processen på grund av variationer i hampansfiberlängd och grovlek. Att göra en förbehandling skulle kunna vara lösningen. I det andraförsöket med linfibrer, visade det sig att linfibrer fungerar i processen och därför kan vara applicerbar med avseende på tillverkningsprocess. En naturlig fiber kan användas i industriella rengöringsdukar, ur ett hållbarhetsperspektiv är det viktigt att beakta den geografiska platsen för odling, transporter, användning av kemikalier och konstbevattning.
37

Cytokine capture with beads in cytotoxicity assays in microwells / Cytokinfångning med kulor i cytotoxicitetsanalyser i mikrobrunnar

Simon, Maxime January 2023 (has links)
Cytokines are small, secreted proteins that are important for cell signalling in theimmune system. Interferon gamma (IFN-γ) is one of the most potent cytokines thatnatural killer (NK) cells of the innate immune system secrete with both antiviral,antibacterial, and antitumoral activity. Analysis of NK cells, such as that of secretionof IFN-γ, is important for studying the immune response to cancer and for developingeffective immunotherapies. In this master thesis project, a method was developedfor determining the amount of IFN-γ secreted by NK cells when being confinedwith cancer cells in deep microwells. Antibody-coated microbeads was used tocapture secreted IFN-γ, which was fluorescently labeled and detected by imaging usingfluorescence microscopy. Microbead seeding into small microwells for single cellassays and into large microwells for embedding of beads into 3D tumor spheroidswas investigated. An analytical model based on experimental standard curves wasdeveloped for straightforward quantification of the amount of bound IFN-γ, with ademonstrated detection down to 2.10−18 moles per bead. The detection of IFN-γ wasevaluated for primary NK cells stimulated by PMA/ionomycin for different incubationtimes. The secretion rate of IFN-γ by IL-2 activated NK cells under PMA/ionomycinstimulation was estimated at 184 molecules per second. IFN-γ detection was alsoevaluated in cell cytotoxicity assays where NK cells were confined over time togetherwith cancer cells in microwells. Both assays showed a successful detection of IFN-γ secretion, demonstrating the potential of the developed method for immune cellanalysis. / Cytokiner är små proteiner som är viktiga för cellsignalering inom immunförsvaret.Interferon gamma (IFN-γ) är en av de mest potenta cytokinerna som naturligamördarceller (NK) i det medfödda immunsystemet utsöndrar med både antiviral,antibakteriell och antitumoral aktivitet. Analys av NK-celler, av till exempelutsöndring av IFN-γ, är viktigt för att studera immunsvaret vid cancer och för attutveckla effektiva immunterapier. I detta examensarbete har en metod utvecklatsför att bestämma mängden IFN-γ som utsöndras av NK-celler när de är tillsammansmed cancerceller i djupa mikrobrunnar. Antikroppsbelagda mikrokulor användesför att fånga utsöndrat IFN-γ, som sedan fluorescensinmärktes och detekteradesgenom fluorescensmikroskopi. Distributionen av dessa kulor studerades i småmikrobrunnar för encellsanalyser och i stora mikrobrunnar för inbäddning av kulornai 3D-tumörsfäroider. En analytisk modell baserad på experimentella standardkurvorutvecklades för enkel kvantifiering av mängden bunden IFN-γ, med en påvisaddetektion ner till 2.10−18 mol per kula. Detektionen av IFN-γ utvärderades för primäraNK-celler stimulerade med PMA/ionomycin för olika inkubationstider. Sekretionenav IFN-γ från IL-2-aktiverade NK-celler vid stimulering med PMA/ionomycinuppskattades till 184 molekyler per sekund. IFN-γ-detektion utvärderades ocksåför analyser av cell-cytotoxicitet där NK-celler var placerade tillsammans medcancerceller i mikrobrunnar över tid. Båda analyserna visade en framgångsrikdetektering av utsöndrad IFN-γ, vilket visar potentialen hos den utvecklade metodenför immuncellsanalys.
38

Risk, tillit och vaccinering -En kvalitativ studie om unga vuxnas resonemang kring vaccinationen av Covid-19 i en svensk kontext

Johansson, Tobias, Jonsson, Tobias January 2021 (has links)
The first case of Covid-19 in Sweden was confirmed at the end of January 2020. At the time of conducting this study the society has begun vaccination against the virus. Although a majority of the population seem positive towards vaccination, the question remains which factors are influencing this attitude. The aim of this study is to create an understanding of how young adults in Sweden reason about Covid-19 and the vaccination thereof. The aim of this study is answered with the following question statements, how do young adults in Sweden reason about the risk of Covid-19 and the vaccination thereof and how do young adults in Sweden reason about the vaccination formed by their natural attitude and trust towards expert systems. Previous research shows that risk and trust towards expert systems are influential factors on individuals' inclination towards vaccines, regarding child vaccines or previous influenza vaccines. Antecedent quantitative studies show differences in vaccination attitudes between age categories and that young adults were most likely to have a negative attitude towards vaccines. This qualitative interview study, focusing on individuals in the age category of young adults, shows how risk and trust towards expert systems can influence their reasoning regarding Covid-19 and the vaccine against the virus, furthermore it shows how their natural attitudes can be affected by the pandemic. The result of this study shows that the studied young adults tend to see more risks with Covid-19 towards other people than themselves, which can be a contributing factor to the attitude towards vaccination of that age category. This study also shows that a high trust in expert systems can enable a positive reasoning regarding the vaccine and that the subjects of this study’s natural attitudes are changed by the pandemic. / Det första fallet av Covid-19 bekräftades i Sverige i slutet på januari 2020. Vid studiens genomförande har samhället påbörjat vaccineringen mot viruset. Även om majoriteten av befolkningen verkar positivt inställda till vaccinet återstår frågan om vilka faktorer som påverkar detta. Syftet med denna studie är att skapa en förståelse för hur unga vuxna i Sverige resonerar kring Covid-19 viruset och vaccinationen mot det. Syftet besvaras med följande frågeställningar, hur resonerar unga vuxna i Sverige kring risker med Covid-19 viruset och vaccinationen mot det och hur formas unga vuxna i Sveriges resonemang kring vaccinering av den naturliga inställningen och deras förhållningssätt till expertsystem. Tidigare forskning visar att risk och tillit till expertsystem kan vara påverkande faktorer på individers vaccinationsbenägenhet, åtminstone när det gäller barnvaccin eller tidigare influensavaccinationer. Tidigare kvantitativ forskning har även visat på skillnader i vaccinationsbenägenhet mellan åldersgrupper, där unga vuxna var mest troliga att vara negativt inställda. Denna kvalitativa intervjustudie med individer i åldersgruppen unga vuxna visar hur risk och tillit till expertsystem kan influera deras resonemang kring Covid-19 viruset och vaccineringen mot det samt hur deras naturliga inställning kan påverkas av pandemin. Resultatet av studien visar att respondenterna tenderar att se allvarligare på risker med Covid-19 gentemot andra än sig själva, något som kan vara en bidragande faktor till den åldersgruppens inställning till vaccinering. Studien visar även att en hög tillit till expertsystem möjliggör ett positivt resonemang kring vaccineringen och att den naturliga inställningen i pandemins samhälle är förändrad hos respondenterna.
39

Character Recognition in Natural Images Utilising TensorFlow / Teckenigenkänning i naturliga bilder med TensorFlow

Viklund, Alexander, Nimstad, Emma January 2017 (has links)
Convolutional Neural Networks (CNNs) are commonly used for character recognition. They achieve the lowest error rates for popular datasets such as SVHN and MNIST. Usage of CNN is lacking in research about character classification in natural images regarding the whole English alphabet. This thesis conducts an experiment where TensorFlow is used to construct a CNN that is trained and tested on the Chars74K dataset, with 15 images per class for training and 15 images per class for testing. This is done with the aim of achieving a higher accuracy than the non-CNN approach by de Campos et al. [1], that achieved 55.26%. The thesis explores data augmentation techniques for expanding the small training set and evaluates the result of applying rotation, stretching, translation and noise-adding. The result of this is that all of these methods apart from adding noise gives a positive effect on the accuracy of the network. Furthermore, the experiment shows that with a three layered convolutional neural network it is possible to create a character classifier that is as good as de Campos et al.'s. It is believed that even better results can be achieved if more experiments would be conducted on the parameters of the network and the augmentation. / Det är vanligt att använda konvolutionära artificiella neuronnät (CNN) för bildigenkänning, då de ger de minsta felmarginalerna på kända datamängder som SVHN och MNIST. Dock saknas det forskning om användning av CNN för klassificering av bokstäver i naturliga bilder när det gäller hela det engelska alfabetet. Detta arbete beskriver ett experiment där TensorFlow används för att bygga ett CNN som tränas och testas med bilder från Chars74K. 15 bilder per klass används för träning och 15 per klass för testning. Målet med detta är att uppnå högre noggrannhet än 55.26%, vilket är vad de campos et al. [1] uppnådde med en metod utan artificiella neuronnät. I rapporten utforskas olika tekniker för att artificiellt utvidga den lilla datamängden, och resultatet av att applicera rotation, utdragning, translation och bruspåslag utvärderas. Resultatet av det är att alla dessa metoder utom bruspåslag ger en positiv effekt på nätverkets noggrannhet. Vidare visar experimentet att med ett CNN med tre lager går det att skapa en bokstavsklassificerare som är lika bra som de Campos et al.s klassificering. Om fler experiment skulle genomföras på nätverkets och utvidgningens parametrar är det troligt att ännu bättre resultat kan uppnås.
40

Evaluation of the performance of machine learning techniques for email classification / Utvärdering av prestationen av maskininlärningstekniker för e-post klassificering

Tapper, Isabella January 2022 (has links)
Manual categorization of a mail inbox can often become time-consuming. Therefore many attempts have been made to use machine learning for this task. One essential Natural Language Processing (NLP) task is text classification, which is a big challenge since an NLP engine is not a native speaker of any human language. An NLP engine often fails at understanding sarcasm and underlying intent. One of the NLP challenges is to represent text. Text embeddings can be learned, or they can be generated from a pre-trained model. Google’s pre-trained model Sentence Bidirectional Encoder Representations from Transformers (SBERT) is state-of-the-art for generating pre-trained vector representation of longer text. In this project, different methods of classifying and clustering emails were studied. The performances of three supervised classification models were compared to each other. A Support Vector Machine (SVM) and a Neural Network (NN) were trained with SBERT embeddings, and the third model, a Recurrent Neural Network (RNN) was trained on raw data. The motivation for this experiment was to see whether SBERT embedding is an excellent choice of text representation when combined with simpler classification models in an email classification task. The results show that the SVM and NN perform higher than RNN in the email classification task. Since most real data is unlabeled, this thesis also evaluated how well unsupervised methods could perform in email clustering taking advantage of the available labels and using SBERT embeddings as text representations. Three unsupervised clustering models are reviewed in this thesis: K-Means (KM), Spectral Clustering (SC), and Hierarchical Agglomerative Clustering (HAC). The results show that the unsupervised models all had a similar performance in terms of precision, recall and F1-score, and the performances were evaluated using the available labeled dataset. In conclusion, this thesis gives evidence that in an email classification task, it is better for supervised models to train with pre-trained SBERT embeddings than to train on raw data. This thesis also showed that the output of the clustering methods compared on par with the output of the selected supervised learning techniques. / Manuell kategorisering av en inkorg kan ofta bli tidskrävande. Därför har många försök gjorts att använda maskininlärning för denna uppgift. En viktig uppgift för Natural Language Processing (NLP) är textklassificering, vilket är en stor utmaning eftersom en språkmotor inte talar något mänskligt språk som modersmål. En språkmotor misslyckas ofta med att förstå sarkasm och underliggande avsikt. En av språkmotorns utmaningar är att representera text. Textinbäddningar kan bli inlärda, eller så kan de genereras av en förutbildad modell. Googles förutbildade modell Sentence Bidirectional Encoder Representations from Transformers (SBERT) är den senaste tekniken för att generera förtränade vektorrepresentation av längre text. I detta projekt studerades olika metoder för att klassificera e-postmeddelanden. Prestandan av tre övervakade klassificeringsmodeller jämfördes med varandra, och av dessa var två utbildade med SBERT-inbäddningar: Support Vector Machine (SVM), Neural Network (NN) och den tredje modellen tränades på rådata: Recurrent Neural Network (RNN). Motivationen till detta experiment var att se om SBERT-inbäddningar tillsammans med enklare klassificeringsmodeller är ett bra val av textrepresentation i en e-post klassificeringsuppgift. Resultaten visar att SVM och NN har högre prestanda än RNN i e-postklassificeringsuppgiften. Eftersom mycket verklig data är omärkt utvärderade denna avhandling också hur väl oövervakade metoder kan utföras i samma e-postklassificeringsuppgift med SBERT-inbäddningar som textrepresentationer. Tre oövervakade klustringsmodeller utvärderas i denna avhandling: K-Means (KM), Spectral Clustering (SC) och Hierarchical Agglomerative Clustering (HAC). Resultaten visar att de oövervakade modeller hade liknande prestanda i precision, recall och F1-score, och prestandan var baserad på de tillgängliga klassannoteringarna. Sammanfattningsvis ger denna avhandling bevis på att i en e-postklassificeringsuppgift är det bättre att övervakade modeller tränar med förtränade SBERT-inbäddningar än att träna på rådata. Denna avhandling visade också att resultatet av klustringsmodellerna hade en jämförbar prestanda med resultatet av de valda övervakade inlärningstekniker.

Page generated in 0.0608 seconds