Global ETD Search

91	Trygghetsfrämjande arbete i park-, gångstråk- och torgprojekt : En fallstudie av hur trygghetsaspekter integrerats i projekt inom Grönare Stockholm / Safety-enhancing work in park, walkway and square projects : A case study regarding the integration of safety aspects in projects within Grönare Stockholm Arvidsson, Carl January 2022 (has links) Syftet med denna studie är att beskriva och analysera hur trygghetsaspekter integrerats i implementeringen av det strategiska dokumentet Grönare Stockholm. Dokumentet innehåller riktlinjer för hur stadens parker och naturområden skall planeras och förvaltas, med fokus på gröna frågor. Metoderna som använts för datainsamling i denna kvalitativa studie är en kombination av litteraturstudie, dokumentstudie och intervjustudie där fyra projekt inom parker, gångstråk och torg undersökts i en fallstudie. Fem tjänstepersoner på Trafikkontoret i Stockholms stad har intervjuats i syfte att erhålla deras beskrivning av hur trygghetsaspekter integrerats i dessa fyra projekt inom Grönare Stockholm. Fyra av intervjupersonerna var projektledare och den femte var verksamhetsutvecklare för Grönare Stockholm som helhet. Materialet har analyserats genom ett deduktivt angreppssätt med hjälp av första och andra generationens trygghetsprinciper som presenteras i teorin Crime Prevention Through Environmental Design (Atlas et.al, 2013; Cleveland & Saville, 2013). Resultatet visar att trygghetsprinciperna integrerats i hög grad i de projekt som studerats i fallstudien, även om det tagit sig olika uttryck beroende på respektive projekts förutsättningar. Det visade sig att sociala frågor och trygghetsfrågor haft stort fokus i samtliga projekt, vilket innebär att den praktiska tillämpningen av Grönare Stockholm inte speglar vad som framkommer i det strategiska dokumentet. / The purpose of this study is to describe and analyze how safety aspects has been integrated in the implementation of the strategic document Grönare Stockholm. The document contains guidelines regarding how the city’s parks and green areas should be planned and managed, with focus on green aspects. The methods used for data collection in this qualitative study is a combination of literature study, document study and interview study where four projects within parks, walkways and squares have been examined in a case study. Five officials at The Traffic Administration Office in the municipality of Stockholm have been interviewed in order to acquire their description of how safety aspects has been integrated in these four projects within Grönare Stockholm. Four of the interviewees were project managers and the fifth was a business developer for Grönare Stockholm overall. The material has been analyzed through a deductive approach with the first and second generation of safety principles which are presented in the theory Crime Prevention Through Environmental Design (Atlas et.al, 2013; Cleveland & Saville, 2013). The results show that the safety principles have been integrated largely in the projects that were studied within the case study, even though it has taken different forms depending on each projects prerequisites. It turned out that social and safety aspects had a big focus in all projects, which means that the practical application of Grönare Stockholm doesn’t reflect what emerges in the strategic document. City Planning City Environment Subjective Safety Natural Survelliance CPTED Defensible Space Eyes on the Street Grönare Stockholm stadsplanering stadsmiljö trygghet naturlig övervakning CPTED försvarbart utrymme ögon på gatan Grönare Stockholm Other Social Sciences Annan samhällsvetenskap
92	Automatic Question Paraphrasing in Swedish with Deep Generative Models / Automatisk frågeparafrasering på svenska med djupa generativa modeller Lindqvist, Niklas January 2021 (has links) Paraphrase generation refers to the task of automatically generating a paraphrase given an input sentence or text. Paraphrase generation is a fundamental yet challenging natural language processing (NLP) task and is utilized in a variety of applications such as question answering, information retrieval, conversational systems etc. In this study, we address the problem of paraphrase generation of questions in Swedish by evaluating two different deep generative models that have shown promising results on paraphrase generation of questions in English. The first model is a Conditional Variational Autoencoder (C-VAE) and the other model is an extension of the first one where a discriminator network is introduced into the model to form a Generative Adversarial Network (GAN) architecture. In addition to these models, a method not based on machine-learning was implemented to act as a baseline. The models were evaluated using both quantitative and qualitative measures including grammatical correctness and equivalence to source question. The results show that the deep generative models outperformed the baseline across all quantitative metrics. Furthermore, from the qualitative evaluation it was shown that the deep generative models outperformed the baseline at generating grammatically correct sentences, but there was no noticeable difference in terms of equivalence to the source question between the models. / Parafrasgenerering syftar på uppgiften att, utifrån en given mening eller text, automatiskt generera en parafras, det vill säga en annan text med samma betydelse. Parafrasgenerering är en grundläggande men ändå utmanande uppgift inom naturlig språkbehandling och används i en rad olika applikationer som informationssökning, konversionssystem, att besvara frågor givet en text etc. I den här studien undersöker vi problemet med parafrasgenerering av frågor på svenska genom att utvärdera två olika djupa generativa modeller som visat lovande resultat på parafrasgenerering av frågor på engelska. Den första modellen är en villkorsbaserad variationsautokodare (C-VAE). Den andra modellen är också en C-VAE men introducerar även en diskriminator vilket gör modellen till ett generativt motståndarnätverk (GAN). Förutom modellerna presenterade ovan, implementerades även en icke maskininlärningsbaserad metod som en baslinje. Modellerna utvärderades med både kvantitativa och kvalitativa mått inklusive grammatisk korrekthet och likvärdighet mellan parafras och originalfråga. Resultaten visar att de djupa generativa modellerna presterar bättre än baslinjemodellen på alla kvantitativa mätvärden. Vidare, visade the kvalitativa utvärderingen att de djupa generativa modellerna kunde generera grammatiskt korrekta frågor i större utsträckning än baslinjemodellen. Det var däremot ingen större skillnad i semantisk ekvivalens mellan parafras och originalfråga för de olika modellerna. Paraphrase Generation Variational Autoencoder Generative Adversarial Networks Natural Language Generation Deep Learning Word Embeddings Parafrasgenerering Variational Autoencoder generativa adversariala nätverk naturlig språkgenerering djupinlärning ordinbäddning Computer and Information Sciences Data- och informationsvetenskap
93	Reliability Assessment of Passive ICS in an SMR as part of the PSA Analysis / Tillförlitligsanalys av passiv ICS i en SMR som en led i PSA analysen Trundle, Graeme January 2023 (has links) Passive safety systems are increasingly being utilized in prospective nuclear power plant designs. Indeed, the use of safety systems driven by natural phenomena might be seen as an unmitigated virtue. However, the low magnitude of the forces involved in such systems, combined with the uncertainty inherent in the factors which affect them, pose a problem in the assessment of their reliability when compared to their active counterparts. Hence, the purpose of this thesis is to investigate and apply a state-of-the-art technique in passive reliability assessment, known as the Reliability Methods of Passive Systems (RMPS) methodology, to the isolation condenser system (ICS) of the prospective BWRX-300 small modular reactor (SMR) design. The ICS is a safety system driven by natural circulation which provides emergency core cooling, residual heat removal, and pressure control for the BWRX-300. Using RMPS to analyze the effect that uncertainties in thermal characteristics of the fuel have on ICS operation, the reliability of natural circulation was quantified with a confidence of 99%. This yielded an immeasurably small failure probability. Considering residual uncertainty, an engineering judgment assigned a failure probability of 1.00E-07. This finding was integrated into a Level 1 probabilistic safety assessment, involving analysis of initiating events, event tree analysis, and failure mode and effect analysis (FMEA) of safety systems, including natural circulation. Analysis of sequences leading to core damage resulted in a core damage frequency of 1.23E-07 yr-1. / Passiva säkerhetssystem används i allt större utsträckning i innovativa kärnkraftverkskonstruktioner. Faktum är att användningen av säkerhetssystem som drivs av naturfenomen kan ses som en oförminskad dygd. Den låga storleken på de krafter som är involverade i sådana system, i kombination med den osäkerhet som är inneboende i de faktorer som påverkar dem, utgör ett problem vid bedömningen av deras tillförlitlighet jämfört med deras aktiva motsvarigheter. Därför är syftet med denna avhandling att undersöka och tillämpa en toppmodern teknik inom passiv tillförlitlighetsbedömning, känd som Reliability Methods of Passive Systems (RMPS) metodologi, på isolationskondensorsystemet (ICS) hos den potentiella BWRX-300 liten modulär reaktor (SMR) design. ICS är ett säkerhetssystem som drivs av naturlig cirkulation som ger nödkylning av kärnan, avlägsnande av restvärme och tryckkontroll för BWRX-300. Med hjälp av RMPS kvantifierades den naturliga cirkulationens tillförlitlighet med en konfidens på 99 %, vilket gav en omätligt liten sannolikhet för misslyckande. Med hänsyn till kvarvarande osäkerhet tilldelade en teknisk dom en felsannolikhet på 1.00E-07. Detta fynd integrerades i en nivå 1 probabilistisk säkerhetsbedömning, som involverade analys av initierande händelser, händelseträdsanalys och felläges- och effektanalys (FMEA) av säkerhetssystem, inklusive naturlig cirkulation. Analys av sekvenser som leder till härdskada resulterade i en härdskadafrekvens på 1,23E-07 år-1. Passive system reliability Probabilistic safety assessment Reliability Methods of Passive Systems Natural circulation TRACE RiskSpectrum Passiv systemtillförlitlighet Probabilistisk säkerhetsbedömning Reliability Methods of Passive Systems Naturlig cirkulation TRACE RiskSpectrum Physical Sciences Fysik
94	Perceived Liveliness Impact on Sense of Safety : A Study on Women’s Perceived Safety in Human-Lacking Urban Environments through Virtual Reality / Upplevd Livlighets Påverkan på Uppfattad Trygghet : En Studie om Kvinnors Uppfattning av Livlighet i Folktomma Miljöer genom Virtuell Verklighet Rovig, Ebba January 2023 (has links) Denna avhandling undersökte förhållandet mellan urbana attribut och upplevd livlighet och dess effekt på kvinnors upplevda säkerhet. Med utgångspunkt i teorier om naturlig övervakning [6] och vikten av att ha andra människor närvarande för att öka kvinnors säkerhet [17], utvärderades fysiska gatuattribut som förutspåddes öka miljöns livlighet. Totalt deltog 27 kvinnor i åldrarna 22-31 i utvärderingen av upplevd säkerhet vid 16 stads gatuhörn genom en två-alternativ tvångsvalsmetod i en virtuell miljö. Valen gjordes två gånger för varje hörn och gatorna visades i en manuellt randomiserad ordning. Resultaten visar en hierarki av attribut på gatunivå som påverkar den upplevda säkerheten mer än fasader med fönster på grund av deras större inverkan på livligheten, och fönster visar sig vara viktigare än grönska. Förutom att bekräfta tidigare forskning visar studien också att människor inte behöver vara närvarande för att en miljö ska uppfattas som levande, eftersom attribut som bilar, kaféer, busshållplatser och fönster fungerar som substitut för mänsklig aktivitet och närvaro. / This thesis explored urban street attributes relationship with perceived liveliness and its effect on women’s perceived safety. Drawing on theories of natural surveillance [6] and the importance of having other humans present for women’s increased safety [17], the study evaluated physical street attributes that predicted to increase the liveliness of an urban environment were evaluated. 27 females aged 22-31 participated in evaluating the perceived safety of 16 urban street corners using a two-alternative forced-choice method in a virtual reality environment. The choices were made twice for each corner, with the streets displayed in a manually randomized order. Findings reveal a hierarchy of street-level attributes affecting perceived safety more than windowed facades due to its greater impact on liveliness, and windows being more important than greenery. Along with confirming previous research, it is also found that people do not need to be present for an environment to be perceived as lively as attributes like cars, cafes, bus stops and windows serve as proxies for human activity and presence of others. Perceived liveliness women’s perceived safety natural surveillance street attributes presence of others virtual reality urban environments Upplevd livlighet kvinnors uppfattade trygghet naturlig övervakning gatuattribut närvaro av människor virtuell verklighet urbana miljöer Computer and Information Sciences Data- och informationsvetenskap
95	The Effect of Data Quantity on Dialog System Input Classification Models / Datamängdens effekt på modeller för avsiktsklassificering i chattkonversationer Lipecki, Johan, Lundén, Viggo January 2018 (has links) This paper researches how different amounts of data affect different word vector models for classification of dialog system user input. A hypothesis is tested that there is a data threshold for dense vector models to reach the state-of-the-art performance that have been shown with recent research, and that character-level n-gram word-vector classifiers are especially suited for Swedish classifiers–because of compounding and the character-level n-gram model ability to vectorize out-of-vocabulary words. Also, a second hypothesis is put forward that models trained with single statements are more suitable for chat user input classification than models trained with full conversations. The results are not able to support neither of our hypotheses but show that sparse vector models perform very well on the binary classification tasks used. Further, the results show that 799,544 words of data is insufficient for training dense vector models but that training the models with full conversations is sufficient for single statement classification as the single-statement- trained models do not show any improvement in classifying single statements. / Detta arbete undersöker hur olika datamängder påverkar olika slags ordvektormodeller för klassificering av indata till dialogsystem. Hypotesen att det finns ett tröskelvärde för träningsdatamängden där täta ordvektormodeller när den högsta moderna utvecklingsnivån samt att n-gram-ordvektor-klassificerare med bokstavs-noggrannhet lämpar sig särskilt väl för svenska klassificerare söks bevisas med stöd i att sammansättningar är särskilt produktiva i svenskan och att bokstavs-noggrannhet i modellerna gör att tidigare osedda ord kan klassificeras. Dessutom utvärderas hypotesen att klassificerare som tränas med enkla påståenden är bättre lämpade att klassificera indata i chattkonversationer än klassificerare som tränats med hela chattkonversationer. Resultaten stödjer ingendera hypotes utan visar istället att glesa vektormodeller presterar väldigt väl i de genomförda klassificeringstesterna. Utöver detta visar resultaten att datamängden 799 544 ord inte räcker till för att träna täta ordvektormodeller väl men att konversationer räcker gott och väl för att träna modeller för klassificering av frågor och påståenden i chattkonversationer, detta eftersom de modeller som tränats med användarindata, påstående för påstående, snarare än hela chattkonversationer, inte resulterar i bättre klassificerare för chattpåståenden. Chatbot Chatterbot Virtual Assistant Dialog System Natural Language Understanding Word Embedding Word Vector Models Text Classification Chattbot Virtuell Assistent Dialogsystem Naturlig språkbehandling Ordinbäddning Ordvektormodeller Textklassificering
96	Recommendation of Text Properties for Short Texts with the Use of Machine Learning : A Comparative Study of State-of-the-Art Techniques Including BERT and GPT-2 / Rekommendation av textegenskaper för korta texter med hjälp av maskininlärning : En jämförande studie av de senaste teknikerna inklusive BERT och GPT-2 Zapata, Luciano January 2023 (has links) Text mining has gained considerable attention due to the extensive usage ofelectronic documents. The significant increase in electronic document usagehas created a necessity to process and analyze them effectively. Rule-basedsystems have traditionally been used to evaluate short pieces of text, but theyhave limitations, including the need for significant manual effort to create andmaintain rules and a high risk of complex bugs. As a result, text classificationhas emerged as a promising solution for extracting meaning from short texts,which are defined as texts limited by a specific character count or word count.This study investigates the feasibility and effectiveness of text classification inclassifying short pieces of text according to their appropriate text properties,based on users’ intentions in the text. The study focuses on comparing twotransformer models, GPT-2 and BERT, in their ability to classify short texts.While other studies have compared these models in intention classificationof text, this study is unique in its examination of their performance onshort pieces of text in this specific context. This study uses user-labelleddata to fine-tune the models, which are then tested on a test dataset fromthe same source. The comparative analysis of the models indicates thatBERT generally outperforms GPT-2 in classifying users’ intentions basedon the appropriate text properties, with an F1-score of 0.68 compared toGPT-2’s F1-score of 0.51. However, GPT-2 performed better on certainclosely related classes, suggesting that both models capture interesting featuresof these classes. Furthermore, the results demonstrated that some classeswere accurately classified despite being context-dependent and positionedwithin longer sentences, indicating that the models likely capture features ofthese classes and facilitate their classification. Both models show promisingpotential as classification models for short texts based on users’ intentions andtheir associated text properties. However, further research may be necessary toimprove their accuracy. Suggestions for enhancing their performance includeutilizing more recent versions of GPT, such as GPT-3 or GPT-4, optimizinghyperparameters, adjusting preprocessing methods, and adopting alternativeapproaches to handle data imbalance. Additionally, testing the models ondatasets from diverse domains with more intricate contexts could providegreater insight into their limitations. / Textutvinning har fått stor uppmärksamhet på grund av den omfattande användningen av elektroniska dokument. Den betydande ökningen av användningen av elektroniska dokument har skapat ett behov av att bearbeta och analysera dem på ett effektivt sätt. Regelbaserade system har traditionellt använts för att utvärdera korta textstycken, men de har begränsningar, bland annat behovet av betydande manuellt arbete för att skapa och upprätthålla regler och en hög risk för komplexa fel. Som ett resultat av detta har textklassificering framstått som en lovande lösning för att utvinna mening ur korta texter, som definieras som texter som begränsas av ett visst antal tecken eller ord. I den här studien undersöks om textklassificering är genomförbar och effektiv när det gäller att klassificera korta textstycken enligt deras lämpliga textegenskaper, baserat på användarnas intentioner i texten. Studien fokuserar på att jämföra två transformatormodeller, GPT-2 och BERT, i deras förmåga att klassificera korta texter. Även om andra studier har jämfört dessa modeller vid avsiktsklassificering av text, är denna studie unik i sin undersökning av deras prestanda för korta textstycken i detta specifika sammanhang. I studien används användarmärkta data för att finjustera modellerna, som sedan testas på ett testdataset från samma källa. Den jämförande analysen av modellerna visar att BERT generellt sett presterar bättre än GPT-2 när det gäller att klassificera användarnas avsikter baserat på lämpliga textegenskaper, med ett F1-värde på 0,68 jämfört med GPT-2:s F1-värde på 0,51. GPT-2 presterade dock bättre på vissa närbesläktade klasser, vilket tyder på att båda modellerna fångar intressanta egenskaper hos dessa klasser. Dessutom visade resultaten att vissa klasser klassificerades korrekt trots att de var kontextberoende och placerade i längre meningar, vilket tyder på att modellerna sannolikt fångar upp egenskaper hos dessa klasser och underlättar deras klassificering. Båda modellerna visar lovande potential som klassificeringsmodeller för korta texter baserade på användarnas intentioner och deras tillhörande textegenskaper. Ytterligare forskning kan dock vara nödvändig för att förbättra deras noggrannhet. Förslag för att förbättra deras prestanda är bland annat att använda nyare versioner av GPT, till exempel GPT-3 eller GPT-4, optimera hyperparametrar, justera förbehandlingsmetoder och anta alternativa metoder för att hantera obalans i data. Om modellerna dessutom testas på dataset från olika områden med mer komplicerade sammanhang kan man få en bättre insikt i deras begränsningar. Text classification Short texts Deep Learning BERT GPT GPT-2 Transformers Natural Language Processing Textklassificering Korta Texter Djupinlärning BERT GPT GPT-2 Transformatorer Naturlig språkbehandling Computer and Information Sciences Data- och informationsvetenskap
97	Methods for data and user efficient annotation for multi-label topic classification / Effektiva annoteringsmetoder för klassificering med multipla klasser Miszkurka, Agnieszka January 2022 (has links) Machine Learning models trained using supervised learning can achieve great results when a sufficient amount of labeled data is used. However, the annotation process is a costly and time-consuming task. There are many methods devised to make the annotation pipeline more user and data efficient. This thesis explores techniques from Active Learning, Zero-shot Learning, Data Augmentation domains as well as pre-annotation with revision in the context of multi-label classification. Active ’Learnings goal is to choose the most informative samples for labeling. As an Active Learning state-of-the-art technique Contrastive Active Learning was adapted to a multi-label case. Once there is some labeled data, we can augment samples to make the dataset more diverse. English-German-English Backtranslation was used to perform Data Augmentation. Zero-shot learning is a setup in which a Machine Learning model can make predictions for classes it was not trained to predict. Zero-shot via Textual Entailment was leveraged in this study and its usefulness for pre-annotation with revision was reported. The results on the Reviews of Electric Vehicle Charging Stations dataset show that it may be beneficial to use Active Learning and Data Augmentation in the annotation pipeline. Active Learning methods such as Contrastive Active Learning can identify samples belonging to the rarest classes while Data Augmentation via Backtranslation can improve performance especially when little training data is available. The results for Zero-shot Learning via Textual Entailment experiments show that this technique is not suitable for the production environment. / Klassificeringsmodeller som tränas med övervakad inlärning kan uppnå goda resultat när en tillräcklig mängd annoterad data används. Annoteringsprocessen är dock en kostsam och tidskrävande uppgift. Det finns många metoder utarbetade för att göra annoteringspipelinen mer användar- och dataeffektiv. Detta examensarbete utforskar tekniker från områdena Active Learning, Zero-shot Learning, Data Augmentation, samt pre-annotering, där annoterarens roll är att verifiera eller revidera en klass föreslagen av systemet. Målet med Active Learning är att välja de mest informativa datapunkterna för annotering. Contrastive Active Learning utökades till fallet där en datapunkt kan tillhöra flera klasser. Om det redan finns några annoterade data kan vi utöka datamängden med artificiella datapunkter, med syfte att göra datasetet mer mångsidigt. Engelsk-Tysk-Engelsk översättning användes för att konstruera sådana artificiella datapunkter. Zero-shot-inlärning är en teknik i vilken en maskininlärningsmodell kan göra förutsägelser för klasser som den inte var tränad att förutsäga. Zero-shot via Textual Entailment utnyttjades i denna studie för att utöka datamängden med artificiella datapunkter. Resultat från datamängden “Reviews of Electric Vehicle Charging ”Stations visar att det kan vara fördelaktigt att använda Active Learning och Data Augmentation i annoteringspipelinen. Active Learning-metoder som Contrastive Active Learning kan identifiera datapunkter som tillhör de mest sällsynta klasserna, medan Data Augmentation via Backtranslation kan förbättra klassificerarens prestanda, särskilt när få träningsdata finns tillgänglig. Resultaten för Zero-shot Learning visar att denna teknik inte är lämplig för en produktionsmiljö. Natural Language Processing Multi-label text classification Active Learning Zero-shot learning Data Augmentation Data-centric AI Naturlig språkbehandling Textklassificering med multipla klasser Active Learning Zero-shot learning Data Augmentation Datacentrerad AI Computer and Information Sciences Data- och informationsvetenskap
98	Self-Supervised Fine-Tuning of sentence embedding models using a Smooth Inverse Frequency model : Automatic creation of labels with Smooth Inverse Frequency model / Självövervakad finjustering av modeller för inbäddning av meningar med hjälp av en Smooth Inverse Frequency-modell : Automatiskt skapande av etiketter med Smooth Inverse Frequency-modellen Pellegrini, Vittorio January 2023 (has links) Sentence embedding models play a key role in the field of Natural Language Processing. They can be exploited for the resolution of several tasks like sentence paraphrasing, sentence similarity, and sentence clustering. Fine-tuning pre-trained models for sentence embedding extraction is a common practice that allows it to reach state-of-the-art performance on downstream tasks. Nevertheless, this practice usually requires labeled data sets. This thesis project aims to overcome this issue by introducing a novel technique for the automatic creation of a target set for fine-tuning sentence embedding models for a specific downstream task. The technique is evaluated on three distinct tasks: sentence paraphrasing, sentence similarity, and sentence clustering. The results demonstrate a significant improvement in sentence embedding models when employing the Smooth Inverse Frequency technique for automatic extraction and labeling of sentence pairs. In the paraphrasing task, the proposed technique yields a noteworthy enhancement of 2.3% in terms of F1-score compared to the baseline results. Moreover, it showcases a 0.2% improvement in F1-score when compared to the ideal scenario where real labels are utilized. For the sentence similarity task, the proposed method achieves a Pearson score of 0.71, surpassing the baseline model’s score of 0.476. However, it falls short of the ideal model trained with human annotations, which attains a Pearson score of 0.845. Regarding the clustering task, from a quantitative standpoint, the best model achieves a harmonic mean (calculated using DBCV and cophenetic score) of 0.693, outperforming the baseline score of 0.671. Nevertheless, the qualitative assessment did not demonstrate a substantial improvement for the clustering task, highlighting the need for exploring alternative techniques to enhance performance in this area. / Modeller för inbäddning av meningar spelar en nyckelroll inom området Natural Language språkbehandling. De kan utnyttjas för att lösa flera uppgifter som meningsparafrasering, meningslikhet och meningsklustring. Fin- och finjustering av förtränade modeller för extraktion av meningsinbäddning är en vanlig praxis som gör det möjligt att nå toppmoderna prestanda på nedströmsuppgifter. Denna metod kräver dock vanligtvis märkta datauppsättningar. Detta avhandlingsprojekt syftar till att lösa detta problem genom att introducera en ny teknik för det automatiska skapandet av en måluppsättning för finjustering av meningsinbäddningsmodeller för en specifik nedströmsuppgift. Tekniken utvärderas på tre olika uppgifter uppgifter: meningsparafrasering, meningslikhet och meningsklustring. Resultaten visar en betydande förbättring av modellerna för inbäddning av meningar när Smooth Inverse Frequency-tekniken används för automatisk extraktion och märkning av meningspar. I parafraseringsuppgiften ger den föreslagna tekniken en anmärkningsvärd förbättring på 2,3% när det gäller F1-score jämfört med baslinjens resultat. Dessutom visar den en förbättring på 0,2% i F1-score jämfört med det ideala scenariot där riktiga etiketter används. För meningslikhetsuppgiften uppnår den föreslagna metoden en Pearson-poäng på 0,71, vilket överträffar baslinjemodellens poäng på 0,476. Det faller dock under den ideala modellen som tränats med mänskliga anteckningar, vilket uppnår en Pearson-poäng på 0.845. När det gäller klustringsuppgiften uppnår den bästa modellen ur kvantitativ synvinkel ett harmoniskt medelvärde (beräknat med DBCV och cophenetic score) på 0,693, vilket överträffar baslinjens poäng på 0,671. Den kvalitativa bedömningen visade dock inte på någon väsentlig förbättring för klustringsuppgiften, vilket understryker behovet av att utforska alternativa tekniker för att förbättra prestandan inom detta område. Translated with www.DeepL.com/Translator (free version) Natural Language Processing sentence embeddings Transformer-based architectures sentence paraphrasing sentence similarity sentence clustering Naturlig språkbehandling inbäddning av meningar transformatorbaserade arkitekturer parafrasering av meningar meningslikhet Dockerbehållare Prestandajustering Computer and Information Sciences Data- och informationsvetenskap
99	Advancing Keyword Clustering Techniques: A Comparative Exploration of Supervised and Unsupervised Methods : Investigating the Effectiveness and Performance of Supervised and Unsupervised Methods with Sentence Embeddings / Jämförande analys av klustringstekniker för klustring av nyckelord : Undersökning av effektiviteten och prestandan hos övervakade och oövervakade metoder med inbäddade ord Caliò, Filippo January 2023 (has links) Clustering keywords is an important Natural Language Processing task that can be adopted by several businesses since it helps to organize and group related keywords together. By clustering keywords, businesses can better understand the topics their customers are interested in. This thesis project provides a detailed comparison of two different approaches that might be used for performing this task and aims to investigate whether having the labels associated with the keywords improves the clusters obtained. The keywords are clustered using both supervised learning, training a neural network and applying community detection algorithms such as Louvain, and unsupervised learning algorithms, such as HDBSCAN and K-Means. The evaluation is mainly based on metrics like NMI and ARI. The results show that supervised learning can produce better clusters than unsupervised learning. By looking at the NMI score, the supervised learning approach composed by training a neural network with Margin Ranking Loss and applying Kruskal achieves a slightly better score of 0.771 against the 0.693 of the unsupervised learning approach proposed, but by looking at the ARI score, the difference is more relevant. HDBSCAN achieves a lower score of 0.112 compared to the supervised learning approach with the Margin Ranking Loss (0.296), meaning that the clusters formed by HDBSCAN may lack meaningful structure or exhibit randomness. Based on the evaluation metrics, the study demonstrates that supervised learning utilizing the Margin Ranking Loss outperforms unsupervised learning techniques in terms of cluster accuracy. However, when trained with a BCE loss function, it yields less accurate clusters (NMI: 0.473, ARI: 0.108), highlighting that the unsupervised algorithms surpass this particular supervised learning approach. / Klustring av nyckelord är en viktig uppgift inom Natural Language Processing som kan användas av flera företag eftersom den hjälper till att organisera och gruppera relaterade nyckelord tillsammans. Genom att klustra nyckelord kan företag bättre förstå vilka ämnen deras kunder är intresserade av. Detta examensarbete ger en detaljerad jämförelse av två olika metoder som kan användas för att utföra denna uppgift och syftar till att undersöka om de etiketter som är associerade med nyckelorden förbättrar de kluster som erhålls. Nyckelorden klustras med hjälp av både övervakad inlärning, träning av ett neuralt nätverk och tillämpning av algoritmer för community-detektering, t.ex. Louvain, och algoritmer för oövervakad inlärning, t.ex. HDBSCAN och KMeans. Utvärderingen baseras huvudsakligen på mått som NMI och ARI. Resultaten visar att övervakad inlärning kan ge bättre kluster än oövervakad inlärning. Om man tittar på NMI-poängen uppnår den övervakade inlärningsmetoden som består av att träna ett neuralt nätverk med Margin Ranking Loss och tillämpa Kruskal en något bättre poäng på 0,771 jämfört med 0,693 för den föreslagna oövervakade inlärningsmetoden, men om man tittar på ARI-poängen är skillnaden mer relevant. HDBSCAN uppnår en lägre poäng på 0,112 jämfört med den övervakade inlärningsmetoden med Margin Ranking Loss (0,296), vilket innebär att de kluster som bildas av HDBSCAN kan sakna meningsfull struktur eller uppvisa slumpmässighet. Baserat på utvärderingsmetrikerna visar studien att övervakad inlärning som använder Margin Ranking Loss överträffar tekniker för oövervakad inlärning när det gäller klusternoggrannhet. När den tränas med en BCEförlustfunktion ger den dock mindre exakta kluster (NMI: 0,473, ARI: 0,108), vilket belyser att de oövervakade algoritmerna överträffar denna speciella övervakade inlärningsmetod. Keyword Clustering Supervised Learning Unsupervised Learning Cluster Labels Natural Language Processing Sentence Embeddings Nyckelord Klustring övervakad inlärning oövervakad inlärning klustermärkning naturlig språkbehandling Inbäddning av meningar Computer and Information Sciences Data- och informationsvetenskap
100	Nested Noun Phrase Detection in English Text with BERT Misra, Shweta January 2023 (has links) In this project, we address the task of nested noun phrase identification in English sentences, where a phrase is defined as a group of words functioning as one unit in a sentence. Prior research has extensively explored the identification of various phrases for language understanding and text generation tasks. Our aim is to tackle the novel challenge of identifying nested noun phrases within sentences. To accomplish this, we first review existing work on related topics such as partial parsing and noun phrase identification. Subsequently, we propose a novel approach based on transformer models to recursively identify nested noun phrases in sentences. We fine-tune a pre-trained uncased BERT model to detect phrase structures in a sentence and determine whether they represent noun phrases. Our recursive approach involves merging relevant segments of a sentence and assigning labels to the noun phrases at each step, facilitating the identification of nested structures. The evaluation of our model demonstrates promising results, achieving a high accuracy of up to 93.6% when considering all noun phrases in isolation and 90.9% when accounting for the predicted phrase structure of the sentence. Additionally, our model exhibits a recall rate of 83.5% and 81.2% at both levels, respectively. Overall, our model proves to be effective in identifying nested noun phrases, showcasing the potential of transformer-based models in phrase structure identification. Future research should explore further applications and enhancements of such models in this domain. / I detta projekt tar vi upp uppgiften att identifiera nästlade substantivfraser i engelska meningar, där en fras definieras som en grupp ord som fungerar som en enhet i en mening. Tidigare forskning har utförligt utforskat identifieringen av olika fraser för språkförståelse och textgenereringsuppgifter. Vårt mål är att ta itu med den nya utmaningen att identifiera nästlade substantivfraser i meningar. För att åstadkomma detta granskar vi först befintligt arbete med relaterade ämnen som partiell analys och identifiering av substantivfraser. Därefter föreslår vi en ny metod baserad på transformers-modeller för att rekursivt identifiera nästlade substantivfraser i meningar. Vi finjusterar en förtränad BERT-modell utan kapsling för att upptäcka frasstrukturer i en mening och avgöra om de representerar substantivfraser. Vårt rekursiva tillvägagångssätt innebär att sammanfoga relevanta segment av en mening och att tilldela etiketter till substantivfraserna vid varje steg, vilket underlättar identifieringen av nästlade strukturer. Utvärderingen av vår modell visar lovande resultat och uppnår en hög precision på upp till 93,6% när man tar hänsyn till alla substantivfraser isolerat och 90,9% när man tar hänsyn till meningens förutsagda frasstruktur. Dessutom uppvisar vår modell en täckning (recall) på 83,5% respektive 81,2% på båda nivåerna. Sammantaget visar vår modell sig vara effektiv för att identifiera nästlade substantivfraser, vilket visar potentialen hos transformers-modeller för identifiering av frasstruktur. Framtida forskning bör utforska ytterligare tillämpningar och förbättringar av sådana modeller på detta område. Phrase detection nested noun phrase identification phrase structure identification sentence parsing transformer models machine learning natural language processing Frasdetektering kapslad substantivfrasidentifiering frasstrukturidentifiering meningsanalys transformers-modeller maskininlärning naturlig språkbehandling Computer and Information Sciences Data- och informationsvetenskap

Search results