151 |
Méthodologies de Conception de Transformateurs Moyenne Fréquence pour application aux réseaux haute tension et réseaux ferroviaires / Medium Frequency Transformers design methodologies for high voltage grids and railway gridsFouineau, Alexis 13 November 2019 (has links)
Les Transformateurs Moyenne Fréquence (TMF) sont une technologie innovante par rapport aux transformateurs basse fréquence, avec la promesse d’une réduction de volume et d’une augmentation du rendement. Cette thèse s’intéresse en particulier à leur conception pour des applications haute tension forte puissance, telles que les réseaux haute tension et moyenne tension à courant continu, ainsi que les réseaux ferroviaires. Dans ces applications, les TMF sont utilisés au sein de convertisseurs pouvant générer des contraintes spécifiques à prendre en compte durant leur conception : signaux non-sinusoïdaux, tension de polarisation, valeurs d’inductances cibles. De plus, les choix technologiques actuellement disponibles pour la réalisation des TMF sont nombreux, et aucun de ces choix ne fait actuellement consensus quelle que soit l’application visée. Des tendances ont pu être identifiées à l’aide d’un outil de classification des designs de TMF issus de la littérature. Ainsi, les technologies les plus prometteuses ont été sélectionnées et retenues pour la suite. A partir de ces technologies, une méthodologie de conception permettant de concevoir et comparer rapidement et ce de façon semi-automatique des TMF avec différents choix technologiques a été mise en place. Elle est constituée de trois étapes : pré-design, design analytique et validation. Le design analytique complet du TMF avec différents choix technologiques est réalisé à l’aide d’un outil de conception automatisée développé durant cette thèse, que nous avons nommé SUITED (SUpergrid Institute TransformEr Design). Cette méthodologie requiert des modèles et données pour chacun des composants et phénomènes du TMF. Concernant le noyau magnétique, une revue et une sélection de modèles issus de la littérature ont été effectuées pour l’évaluation de l’inductance magnétisante et des pertes magnétiques. De plus, des caractérisations magnétiques ont permis de mettre en évidence l’impact de certains procédés technologiques sur les niveaux de pertes de noyaux magnétiques en matériau nanocristallin, qui est un excellent candidat pour les TMF. Au niveau des bobinages, des modèles analytiques pour calculer le champ magnétique, l’inductance de fuite et les effets de peau et de proximité ont été développés et comparés avec ceux de la littérature ainsi que des simulations. Ces nouveaux modèles s'avèrent obtenir une meilleure précision sur les géométries de TMF considérées que ceux de la littérature. De plus, une nouvelle méthode d’évaluation des capacités parasites de bobinages à spires rectangulaires a été mise en place et validée avec succès. Des schémas thermiques équivalents ont été identifiés pour différentes géométries de TMF. Les résistances thermiques de conduction, convection et radiation sont calculées à partir de modèles détaillés. En particulier, l’anisotropie des matériaux est prise en compte pour la conduction thermique, et les coefficients de convection sont évalués via des corrélations différentes pour chaque face du TMF. Les schémas thermiques sont ensuite résolus de façon itérative et analytique pour prendre en compte les non-linéarités des résistances thermiques tout en optimisant le temps de calcul nécessaire. Enfin, l’ensemble de la méthodologie de conception mise en place a été appliqué sur trois cas d’études correspondant à des applications cibles : haute tension, moyenne tension et ferroviaire. Les résultats obtenus montrent effectivement la performance et la nécessité de cette approche / Medium Frequency Transformers (MFT) are an innovative technology compared to low frequency transformers, with the promise of reduced volume and increased efficiency. This PhD thesis focuses in particular on their design for high voltage, high power applications, such as high voltage and medium voltage DC networks, as well as railway networks. In these applications, MFTs are used in converters that can generate specific constraints to be taken into account during their design: non-sinusoidal signals, polarization voltage, target inductance values. Moreover, the technological choices currently available for the realization of MFTs are numerous, and there is currently no consensus on any technology for any given application. Trends could be identified using a tool to classify MFT designs from the literature. Thus, the most promising technologies were selected and retained for the future. Based on these technologies, a design methodology was developed to quickly and semi-automatically design and compare MFTs with different technological choices. It consists of three steps: pre-design, analytical design, and validation. The complete analytical design of the MFT with different technological choices is carried out using an automated design tool developed during this thesis, named SUITED (SUpergrid Institute TransformEr Design). This methodology requires models and data for each of the components and phenomena of the MFT. Concerning the magnetic core, a review and selection of models from the literature were carried out for the evaluation of the magnetizing inductance and magnetic losses. In addition, magnetic characterizations have made it possible to highlight the impact of certain technological processes on the levels of loss of magnetic cores made of nanocrystalline material, which is an excellent candidate for MFTs. Concerning the windings, analytical models to calculate the magnetic field, leakage inductance and skin and proximity effects were developed and compared with those in the literature and simulations. These models are proving to be more accurate on the MFT geometries considered. On top of that, a new method for evaluating the parasitic capacitances of windings with rectangular turns has been successfully implemented and validated. Thermal networks have been identified for the different MFT geometries. The thermal resistances of conduction, convection and radiation are calculated from detailed models. In particular, the anisotropy of materials is taken into account for thermal conduction, and the convection coefficients are evaluated via different correlations for each face of the MFT. The thermal networks are then solved iteratively and analytically to take into account the non-linearity of the thermal resistances while optimizing the required computation time. Finally, this entire design methodology was applied to three case studies corresponding to the target applications: high voltage, medium voltage and rail. The results obtained do show the performance and necessity of this approach.
|
152 |
Advanced Side-Channel Analysis of USIMs, Bluetooth SoCs and MCUsBrisfors, Martin January 2021 (has links)
The use of deep learning for side channel analysis has shown a lot of success in recent years. Impressive results have been presented by many researchers. However, critics of this approach have voiced concerns about the ad hoc methodologies and bespoke neural network designs used in many presented approaches. This thesis first analyzes a possibility of generalizing the selection of neural network architecture for side channel analysis. Then, it presents a simple model for a multilayer perceptron network that does not need to be altered for different targets. Experiments are conducted on three different data sets; power consumption measurements of USIMs, far-field electromagnetic measurements of a Bluetooth device, and power consumption measurements of dedicated XMega victim boards. For each of these sets a model is presented with equivalent or better than state-of-the art results for secret key recovery. Training and testing are done on separate devices in each case. One of the models achieves a classification accuracy of 94.5% from a single measurement. Furthermore, the target and the training device do not even share the same printed circuit board layout. Another model achieves a 47.4% classification accuracy from measurements captured in a manner that is possible in a real-world attack. The thesis also investigates if three different numerical ways of determining the leakage point in unprotected implementations of AES agree. The tests are applied to all three data sets. Finally the thesis evaluates whether the popular transformer architecture is beneficial for side channel analysis. / Användande av djupinlärning för sidokanalsanalys har haft stora framgångar de senaste åren. Imponerande resultat har presenterats av många forskare. Men kritiker av detta tillvägagångssätt har uttryckt oro över att metoderna är ad hoc, och att specialanpassade neuronnätverksdesigner används i många presenterade rapporter. Detta examensarbete undersöker först möjligheten att generalisera valet av neuronnätverksarkitekturer för sidokanalsanalys. Sedan presenterar jag en enkel modell för ett multilayer perceptron-nätverk som inte behöver anpassas för olika enheter. Experiment genomförs på tre olika dataset; strömförbrukningsmätningar av USIMs, elektromagnetiska mätningar i fjärrfält av en Bluetooth-enhet, och strömförbrukningsmätningar av dedikerade XMega sidokanalsanalys-enheter. För var och en av dessa enheter presenteras en modell med likvärdiga eller bättre resultat som tidigare publicerad forskning. Träning och testning görs på separata enheter i varje fall. En av modellerna uppnår en klassificeringsprecision på 94,5% från en enda mätning. Dessutom delar attackenheten och träningsenheten inte ens samma kretskortslayout. En annan modell uppnår en klassificeringsprecision på 47,4% från mätningar som gjorts på ett sätt som ar realistiskt i en verklig attack. Examensarbetet undersöker också om tre olika numeriska sätt att bestämma läckagepunkten i oskyddade implementeringar av AES överensstämmer. Testerna tillämpas på alla tre dataset. Slutligen utvärderar examensarbetet om den populära transformer-arkitekturen ar passande för sidokanalsanalys.
|
153 |
Comparative Analysis of Transformer and CNN Based Models for 2D Brain Tumor SegmentationTräff, Henrik January 2023 (has links)
A brain tumor is an abnormal growth of cells within the brain, which can be categorized into primary and secondary tumor types. The most common type of primary tumors in adults are gliomas, which can be further classified into high-grade gliomas (HGGs) and low-grade gliomas (LGGs). Approximately 50% of patients diagnosed with HGG pass away within 1-2 years. Therefore, the early detection and prompt treatment of brain tumors are essential for effective management and improved patient outcomes. Brain tumor segmentation is a task in medical image analysis that entails distinguishing brain tumors from normal brain tissue in magnetic resonance imaging (MRI) scans. Computer vision algorithms and deep learning models capable of analyzing medical images can be leveraged for brain tumor segmentation. These algorithms and models have the potential to provide automated, reliable, and non-invasive screening for brain tumors, thereby enabling earlier and more effective treatment. For a considerable time, Convolutional Neural Networks (CNNs), including the U-Net, have served as the standard backbone architectures employed to address challenges in computer vision. In recent years, the Transformer architecture, which already has firmly established itself as the new state-of-the-art in the field of natural language processing (NLP), has been adapted to computer vision tasks. The Vision Transformer (ViT) and the Swin Transformer are two architectures derived from the original Transformer architecture that have been successfully employed for image analysis. The emergence of Transformer based architectures in the field of computer vision calls for an investigation whether CNNs can be rivaled as the de facto architecture in this field. This thesis compares the performance of four model architectures, namely the Swin Transformer, the Vision Transformer, the 2D U-Net, and the 2D U-Net which is implemented with the nnU-Net framework. These model architectures are trained using increasing amounts of brain tumor images from the BraTS 2020 dataset and subsequently evaluated on the task of brain tumor segmentation for both HGG and LGG together, as well as HGG and LGG individually. The model architectures are compared on total training time, segmentation time, GPU memory usage, and on the evaluation metrics Dice Coefficient, Jaccard Index, precision, and recall. The 2D U-Net implemented using the nnU-Net framework performs the best in correctly segmenting HGG and LGG, followed by the Swin Transformer, 2D U-Net, and Vision Transformer. The Transformer based architectures improve the least when going from 50% to 100% of training data. Furthermore, when data augmentation is applied during training, the nnU-Net outperforms the other model architectures, followed by the Swin Transformer, 2D U-Net, and Vision Transformer. The nnU-net benefited the least from employing data augmentation during training, while the Transformer based architectures benefited the most. In this thesis we were able to perform a successful comparative analysis effectively showcasing the distinct advantages of the four model architectures under discussion. Future comparisons could incorporate training the model architectures on a larger set of brain tumor images, such as the BraTS 2021 dataset. Additionally, it would be interesting to explore how Vision Transformers and Swin Transformers, pre-trained on either ImageNet- 21K or RadImageNet, compare to the model architectures of this thesis on brain tumor segmentation.
|
154 |
Generating Terraform Configuration Files with Large Language Models / Att skapa Terraform-konfigurationsfiler med stora språkmodellerBonde, Oskar January 2022 (has links)
This thesis explores how large language models can be used to generate configuration files for Terraform from natural language descriptions. Few-shot and fine-tuning paradigms are evaluated on decoder-only models of varying size, including the state-of-the-art Codex model. The generated configuration files are evaluated with regard to functional correctness on a custom dataset using Terraform, to account for the large space of functionally equivalent configuration files. Results show that the largest model Codex is very capable at generating configuration files given an English description of network infrastructure even without fine-tuning. The result could be a useful tool for engineers who know Terraform fundamentals and have experience with the cloud platforms: AWS, GCP, or Azure. A future study could fine-tune Codex for Terraform using OpenAI's API or create an open source Codex-replication by fine-tuning the GPT-3 replication OPT, which in turn can be \hbox{fine-tuned}. / Denna avhandling undersöker hur stora språkmodeller kan användas till att generera konfigurationsfiler för Terraform med hjälp av språkbeskrivningar. Både few-shot och fine-tuning paradigm utvärderas på decoder-only modeller i olika storlekar, inklusive Codex. För att ta hänsyn till konfigurationsfiler som i utseende ser olika ut men som är funktionellt ekvivalenta utvärderas konfigurationsfilerna utifrån deras funktion. Resultaten visar att Codex, som är den största modellen, har förmågan att generera konfigurationsfiler givet en engelsk beskrivning av nätverksinfrastruktur, trots att Codex inte har undergått fine-tuning. Resultatet kan vara ett användbart verktyg för ingenjörer som har grundläggande kunskap om Terraform och erfarenhet av molnplattformarna: AWS, GCP eller Azure. En framtida studie skulle kunna träna Codex för Terraform med OpenAI:s API eller skapa en Codex-kopia genom att träna GPT-3 kopian OPT som i sin tur kan bli tränad för Terraform.
|
155 |
Exploring Cross-Lingual Transfer Learning for Swedish Named Entity Recognition : Fine-tuning of English and Multilingual Pre-trained Models / Utforskning av tvärspråklig överföringsinlärning för igenkänning av namngivna enheter på svenskaLai Wikström, Daniel, Sparr, Axel January 2023 (has links)
Named Entity Recognition (NER) is a critical task in Natural Language Processing (NLP), and recent advancements in language model pre-training have significantly improved its performance. However, this improvement is not universally applicable due to a lack of large pre-training datasets or computational budget for smaller languages. This study explores the viability of fine-tuning an English and a multilingual model on a Swedish NER task, compared to a model trained solely on Swedish. Our methods involved training these models and measuring their performance using the F1-score metric. Despite fine-tuning, the Swedish model outperformed both the English and multilingual models by 3.0 and 9.0 percentage points, respectively. The performance gap between the English and Swedish models during fine-tuning decreased from 19.8 to 9.0 percentage points. This suggests that while the Swedish model achieved the best performance, fine-tuning can substantially enhance the performance of English and multilingual models for Swedish NER tasks. / Inom området för Natural Language Processing (NLP) är identifiering av namngivna entiteter (NER) en viktig problemtyp. Tack vare senaste tidens framsteg inom förtränade språkmodeller har modellernas prestanda på problemtypen ökat kraftigt. Denna förbättring kan dock inte tillämpas överallt på grund av en brist på omfattande dataset för förträning eller tillräcklig datorkraft för mindre språk. I denna studie undersöks potentialen av fine-tuning på både en engelsk, en svensk och en flerspråkig modell för en svensk NER-uppgift. Dessa modeller tränades och deras effektivitet bedömdes genom att använda F1-score som mått på prestanda. Även med fine-tuning var den svenska modellen bättre än både den engelska och flerspråkiga modellen, med en skillnad på 3,0 respektive 9,0 procentenheter i F1-score. Skillnaden i prestandan mellan den engelska och svenska modellen minskade från 19,8 till 9,0 procentenheter efter fine-tuning. Detta indikerar att även om den svenska modellen var mest framgångsrik, kan fine-tuning av engelska och flerspråkiga modeller betydligt förbättra prestandan för svenska NER-uppgifter.
|
156 |
Evaluating Text Summarization Models on Resumes : Investigating the Quality of Generated Resume Summaries and their Suitability as Resume Introductions / Utvärdering av Textsammanfattningsmodeller för CV:n : Undersökning av Kvaliteten på Genererade CV-sammanfattningar och deras Lämplighet som CV-introduktionerKrohn, Amanda January 2023 (has links)
This thesis aims to evaluate different abstractive text summarization models and techniques for summarizing resumes. It has two main objectives: investigate the models’ performance on resume summarization and assess the suitability of the generated summaries as resume introductions. Although automatic abstractive text summarization has gained traction in various areas, its application in the resume domain has not yet been explored. Resumes present a unique challenge for abstractive summarization due to their diverse style, content, and length. To address these challenges, three state-of-the-art pre-trained text generation models: BART, T5, and ProphetNet, were selected. Additionally, two approaches that can handle longer resumes were investigated. The first approach, named LongBART, modified the BART architecture by incorporating the Longformer’s self-attention into the encoder. The second approach, named HybridBART, used an extractive-then-abstractive summarization strategy. The models were fine-tuned on a dataset of 653 resume-introduction pairs and were evaluated using automatic metrics as well as two types of human evaluations: a survey and expert interviews. None of the models demonstrated superiority across all criteria and evaluation metrics. However, the survey responses indicated that LongBART showed promising results, receiving the highest scores in three out of five criteria. On the other hand, ProphetNet consistently received the lowest scores across all criteria in the survey, and across all automatic metrics. Expert interviews emphasized that the generated summaries cannot be considered correct summaries due to the presence of hallucinated personal attributes. However, there is potential for using the generated texts as resume introductions, given that measures are taken to ensure the hallucinated personal attributes are sufficiently generic. / Denna avhandling utvärderar olika modeller och tekniker för automatisk textsammanfattning för sammanfattning av CV:n. Avhandlingen har två mål: att undersöka modellernas prestanda på sammanfattning av CV:n och bedöma lämpligheten att använda de genererade sammanfattningar som CV-introduktioner. Även om automatisk abstrakt textsummering har fått fotfäste inom olika sammanhang är dess tillämpning inom CV-domänen ännu outforskad. CV:n utgör en unik utmaning för abstrakt textsammanfattning på grund av deras varierande stil, innehåll och längd. För att hantera dessa utmaningar valdes tre av de främsta förtränade modellerna inom textgenerering: BART, T5 och ProphetNet. Dessutom undersöktes två extra metoder som kan hantera längre CV:n. Det första tillvägagångssättet, kallat LongBART, modifierade BART-arkitekturen genom att inkludera självuppmärksamhet från Longformer-arkitekturen i kodaren. Det andra tillvägagångssättet, kallat HybridBART, använde en extraktiv-sen-abstraktiv sammanfattningsstrategi. Modellerna finjusterades med ett dataset med 653 CV-introduktionspar och utvärderades med hjälp av automatiska mått, samt två typer av mänsklig utvärdering: en enkätundersökning och intervjuer med experter. Ingen av modellerna visade överlägsenhet på alla kriterier och utvärderingsmått. Dock indikerade enkätsvaren att LongBART visade lovande resultat, genom att få högst poäng i tre av fem utvärderingskategorier. Å andra sidan fick ProphetNet lägst poäng i samtliga utvärderingskategorier, samt lägst poäng i alla automatiska mätningar. Expertintervjuer framhävde att de genererade sammanfattningarna inte kan anses vara pålitliga som fristående sammanfattningar på grund av förekomsten av hallucinerade personliga egenskaper. Trots detta finns det potential att använda dessa sammanfattningar som introduktioner, under förutsättningen att åtgärder vidtas för att säkerställa att hallucinerade personliga attribut är tillräckligt generiska.
|
157 |
Dynamic Thermal Rating for Improved Utilization of Wind Farm Export Systems : A Methodology for Improving Load Profile Estimation of Wind Farm Export TransformersLi, Zhongtian January 2023 (has links)
The power system components connected to renewable energy sources, such as transformers, are often oversized and conservatively loaded. The design of transformers normally ignores the intermittent nature of the connected renewable energy sources (e.g. solar, wind). Due to the variations in weather conditions and operation states, the transformer load oscillates and the actual hot spot temperature is significantly lower than the designed thermal rating. For wind farms, the oversized transformer causes extra resourcematerial waste and a higher wind power price. Dynamic thermal rating can be applied to determine the rating of the transformers based on real-time environmental conditions (e.g. ambient temperature, wind speed). However, in order to optimize the operation of the transformers with dynamic thermal rating, the prediction of the load profile of transformers is an obstacle. The load of wind farm export transformers oscillates due to thechange of load conditions (e.g. turbine availability, power curtailment) and environmental conditions (e.g. wind speed, wind direction and ambient temperature). This thesis proposes a new methodology to improve the utilization of wind farm export transformers by estimating their load profile more accurately and assessing their aging rate. The estimation of the load profile takes the wake effect and turbine availability into account. Specifically, the variation in the wind turbine failure and repair rates, which is influenced by the wind, is considered in the evaluation of turbine availability. Additionally, a correction method is proposed to improve the accuracy of the wake loss computation. The results demonstrate that the estimation accuracy of the transformer load profile is improved after considering the influence of the wake effect and turbine availability. The wake effect and the turbine availability reduce the generated wind power and to some extent, reduce the load and the aging rate of transformers. However, the wake effect has limited influence when the wind farm reaches peak power production while turbine availability influences the load profile of transformers especially when the load is close to the installed capacity of the wind farm. After considering these two factors, the prediction accuracy of the hot spot temperature in the transformers can be enhanced and dynamic thermal rating can be applied to transformers with improved reliability. / Kraftsystemkomponenter som är anslutna till förnybara energikällor, såsom transformatorer, är ofta överdimensionerade och konservativt belastade. Konstruktionen av transformatorer ignorerar normalt sett den intermittenta naturen hos anslutna förnybara energikällor (t.ex. sol och vind). På grund av variationer i väderförhållanden och drifttillstånd, oscillerar transformatorbelastningen och den faktiska hotspottemperaturen är betydligt lägre än den designade termiska bedömningen. För vindkraftsparker orsakar den överdimensionerade transformatorn extra resursmaterialavfall och högre vindkraftspriser. Dynamisk termisk bedömning kan tillämpas för att bestämma transformatorernas betyg baserat på realtidsmiljöförhållanden (t.ex. omgivande temperatur, vindhastighet). Men för att optimera driften av transformatorer med dynamisk termisk bedömning är förutsägelsen av transformatorernas belastningsprofil ett hinder. Belastningen på transformatorer för export av vindkraftsparkeroscillerar på grund av ändringar i belastningsförhållanden (t.ex. tillgänglighet för turbiner, effektreglering) och miljöförhållanden (t.ex. vindhastighet, vindriktning och omgivande temperatur). Denna avhandling föreslår en ny metod för att förbättra användningen av transformatorer för export av vindkraftsparker genom att uppskatta deras belastningsprofil mer noggrant och bedöma deras åldrande takt. Uppskattningen av belastningsprofilen tar hänsyn till wake-effekten och turbinernas tillgänglighet. Specifikt beaktas variationen i felfrekvensen och reparationsfrekvensen för vindturbiner, som påverkas av vinden, vid utvärderingen av turbinernas tillgänglighet. Dessutom föreslås en korrektionsmetod för att förbättra noggrannheten i beräkningen av wake-förlusten. Resultaten visar att uppskattningen av transformatorns belastningsprofil förbättras efter att ha beaktat wake-effekten och turbinernas tillgänglighet. Wake-effekten och turbinernas tillgänglighet minskar den genererade vindkraften och minskar till viss del belastningen och åldringstakten hos transformatorer. Wake-effekten har emellertid begränsad påverkan när vindkraftsparken når maximal produktionsnivå medan turbinernas tillgänglighet påverkar belastningsprofilen hos transformatorer, särskilt när belastningen är nära installerad kapacitet för vindkraftsparken. Efter att ha beaktat dessa två faktorer kan förutsägelsens noggrannhet för hotspot-temperaturen i transformatorerna förbättras och dynamisk termisk bedömning kan tillämpas på transformatorer med förbättrad tillförlitlighet. / <p>QC 20230414</p>
|
158 |
Modeling Credit Default Swap Spreads with Transformers : A Thesis in collaboration with Handelsbanken / Modellera Kreditswapp spreadar med Transformers : Ett projekt I samarbete med HandelsbankenLuhr, Johan January 2023 (has links)
In the aftermath of the credit crisis in 2007, the importance of Credit Valuation Adjustment (CVA) rose in the Over The Counter (OTC) derivative pricing process. One important part of the pricing process is to determine Probability of Defaults (PDs) of the counterparty in question. The normal way of doing this is to use Credit Default Swap (CDS) spreads from the CDS market. In some cases, there is no associated liquid CDS market, and in those cases, it is market practice to use proxy CDS spreads. In this thesis, transformer models are used to generate proxy CDS spreads with a certain region, rating, and tenor from stand-alone CDS spread data. Two different models are created to do this. The first simpler model is an encoder-based model that uses stand-alone CDS data from a single company to generate one proxy spread per inference. The second, more advanced model is an encoder-decoder model that uses stand-alone CDS data from three companies to generate one proxy spread per inference. The performance of the models is compared, and it is shown that the more advanced model outperforms the simpler model. It should, be noted that the simpler model is faster to train. Both models could be used for data validation. To create the transformer models, it was necessary to implement custom embeddings that embedd specific corporate information and temporal information regarding the CDS spreads. The importance of the different embeddings was also investigated, and it is clear that certain embeddings are more important than others. / I efterdyningarna av kreditkrisen 2007 så ökade betydelsen av CVA vid prissättning av OTC derivat. En viktig del av prissättningen av OTC derivat är att avgöra PDs för den aktuella motparten. Om det finns en likvid CDS marknad för motparten så kan man använda sig av CDSs spreadar dirket från marknaden för att avgöra PDs. I många fall så saknas en sådan likvid CDS marknad. Då är det praksis att istället använda sig av proxy CDS spreadar. I den här uppsatsen så presenteras två transformer modeller för att generera proxy CDS spreadar för bestämda kombinationer av region, rating och löptid från enskilda företags CDS spreadar. Den först enklare modellen är en encoder baserad modell som använder sig av data från ett enskilt företag för att generera en proxy spread per inferens. Den andra modellen är en mer avancerad encoder-decoder modell. Den mer avancerade modellen använder sig av data från tre företag för att generera en proxy spread. I uppsatsen jämförs dessa modeller och man kan konstatera att den mer avancereade modellen genererar mer exakta CDS spreadar. Den enklare modellen är dock betydligt enklare att träna och båda modellerna kan användas i syfte att validera det riktiga proxy datat. För att kunna skapa modellerna så var det en nödvändighet att implementera specialbyggda embeddings som kodad in temporal information och företagsspecifik information om CDS spreadarna. Dessutom så testades vikten av enskilda embeddings och det var uppenbart att vissa embeddings var viktigare än andra.
|
159 |
Domain Knowledge and Representation Learning for Centroid Initialization in Text Clustering with k-Means : An exploratory study / Domänkunskap och Representationsinlärning för Centroidinitialisering vid Textklustering med k-Means : En utforskande studieYu, David January 2023 (has links)
Text clustering is a problem where texts are partitioned into homogeneous clusters, such as partitioning them based on their sentiment value. Two techniques to address the problem are representation learning, in particular language representation models, and clustering algorithms. The state-ofthe-art language models are based on neural networks, in particular the Transformer architecture, and the models are used to transform a text into a point in a high dimensional vector space. The texts are then clustered using a clustering algorithm, and a recognized partitional clustering algorithm is k-Means. Its goal is to find centroids that represent the clusters (partitions) by minimizing a distance measure. Two influential parameters of k-Means are the number of clusters and the initial centroids. Multiple heuristics exist to decide how the parameters are selected. The heuristic of using domain knowledge is commonly used when it is available, e.g., the number of clusters is set to the number of dataset labels. This project further explores this idea. The main contribution of the thesis is an investigation of domain knowledge and representation learning as a heuristic in centroid initialization applied to k-Means. Initial centroids were obtained by applying a representation learning technique on the dataset labels. The project analyzed a Swedish dataset with views towards different aspects of Swedish immigration and a Swedish translated movie review dataset using six Swedish compatible language models and two versions of k-Means. Clustering evaluation was measured using eight metrics related to cohesion, separation, external entropy and accuracy. The results show the proposed heuristic made a positive impact on the metrics. By employing the proposed heuristic, six out of eight metrics were improved compared to the baseline. The improvements were observed using six language models and k-Means on two datasets. Additionally, the evaluation metrics indicated that the proposed heuristic has opportunities for future improvements. / Textklustering är ett problem där texter partitioneras i homogena kluster, till exempel genom att gruppera dem baserat på dess sentimentala värde. Två tekniker för att undersöka problemet är representationsinlärning, i synnerhet språkrepresentationsmodeller, och klustringsalgoritmer. Moderna språkmodeller är baserade på neurala nätverk, framförallt på Transformer arkitekturen, och modellerna används för att omvandla texter till punkter i ett högdimensionellt vektorrum. Därefter klustras texterna med hjälp av en klusteringsalgoritm, och en erkänd partition klusteringalgorithm är kMeans. Målet med algoritmen är att finna centroider som representerar klustren (partitioner) genom att minimera ett avståndsmått. Två inflytelserika parametrar i k-Means är antalet kluster och initiala centroider. Många heuristiker existerar för att bestämma hur dessa parametrar skall väljas. En vanligt förekommande heuristik är att använda domänkunskap om det är tillgängligt, e.g., antalet kluster väljs som antalet datamängdsetiketter. Detta projekt genomför ytterligare utforskningar av idén. Avhandlingens huvudsakliga bidrag är en undersökning av att använda kunskaper om domänen för datamängden och representationsinlärning som heuristik för centroid initialisering applicerat på k-Means. Initiala centroider erhölls genom att applicera en representationsinlärningsteknik på datamängdsetiketter. Projektet analyserar en svensk datamängd med åsikter gentemot olika aspekter av svensk immigration och en svensk översatt datamängd om filmrecensioner med hjälp av sex svenskkompatibla språkmodeller och kMeans. Utvärdering av klustringen uppmättes med hjälp av åtta mätetal relaterade till sammanhållning, separation, entropi och ackuratess. Den föreslagna heuristiken hade en positiv effekt på mätetalen. Genom att använda den föreslagna heuristiken förbättrades sex av åtta mätetal jämfört med baslinjen. Förbättringarna observerades med användning av sex språkmodeller och k-Means på två datamängder. Evalueringsmätetalen indikerar också på att heuristiken har möjligheter till framtida förbättringar.
|
160 |
Hållbara mottagningsstationer : Kan de bli självförsörjande gällande värme, kyla och batteriladdning?Beijer, Erik January 2023 (has links)
Mälarenergi’s vision is a world where we live and operate together without climate impact. This degree project has examined which opportunities Mälarenergi Elnät has in order to work towards this vision by looking more closely at whether their bigger substations can become self-sufficient in terms of heating, cooling and battery charging. The purpose of this degree project was to investigate how heat recovery from the substations’ transformers and the installation of PV-systems could contribute to both more environmentally friendly and self-sufficient substations. In addition to that, the economics and how this would affect the Swedish power grid regulation were of interest. The thesis was based on current values and data for oil temperatures and installed power in three of Mälarenergi Elnät’s substations. In addition to this, the thesis also includes a literature study, where previous research in heat transfer from power transformers, up-to-date information about PV-installations and the power grid regulation in Sweden were studied. The results of the thesis showed that both PV-installations and heat exchange for heating the station buildings could be of great benefit for Mälarenergi Elnät. In all but one case, the energy saving measures resulted in lower life cycle costs than if no measures were taken. It shows that the measures investigated in the thesis are not only good from an environmental perspective, but also has economic profitability.
|
Page generated in 0.1267 seconds