Spelling suggestions: "subject:"kunskapsgraf"" "subject:"kunskapsgapet""
1 |
CONNECTING THE DOTS : Exploring gene contexts through knowledge-graph representations of gene-information derived from scientific literatureHellberg, Henrietta January 2023 (has links)
Analyzing the data produced by next-generation sequencing technologies relies on access to information synthesized based on previous research findings. The volume of data available in the literature is growing rapidly, and it is becoming increasingly necessary for researchers to use AI or other statistics-based approaches in the analysis of their datasets. In this project, knowledge graphs are explored as a tool for providing access to contextual gene-information available in scientific literature. The explorative method described in this thesis is based on the implementation and comparison of two approaches for knowledge graph construction, a rule-based statistical as well as a neural-network and co-occurrence based approach, -based on specific literature contexts. The results are presented both in the form of a quantitative comparison between approaches as well as in the form of a qualitative expert evaluation of the quantitative result. The quantitative comparison suggested that contrasting knowledge graphs constructed based on different approaches can provide valuable information for the interpretation and contextualization of key genes. It also demonstrated the limitations of some approaches e.g. in terms of scalability as well as the volume and type of information that can be extracted. The result further suggested that metrics based on the overlap of nodes and edges, as well as metrics that leverage the global topology of graphs are valuable for representing and comparing contextual information between knowledge graphs. The result based on the qualitative expert evaluation demonstrated that literature-derived knowledge graphs of gene-information can be valuable tools for identifying research biases related to genes and also shed light on the challenges related to biological entity normalization in the context of knowledge graph development. In light of these findings, automatic knowledge-graph construction presents as a promising approach for improving access to contextual information about genes in scientific literature. / För att analysera de stora mängder data som produceras med hjälp av next-generation sequencing krävs det att forskare har tillgång till och kan sammanställa information från tidigare forskning. I takt med att mängden data som finns tillgänglig i den vetenskapliga litteraturen ökar, så ökar även behovet av att använda AI och andra statistiska metoder för att få tillgång till denna data i analysen. I detta projekt utforskas kunskapsgrafer som verktyg för att tillgängliggöra kontextuell geninformation i vetenskapliga artiklar. Den explorativa metod som beskrivs i detta projekt är baserad på implementationen och jämförelsen av två olika tekniker för kunskapsgrafgenerering, en regelbaserad-statistisk metod samt en metod baserad på neurala-nätverk och co-occurrence, baserade på specifika kontexter inom litteraturen. Resultatet presenteras både i form av en kvantitativ jämförelse mellan metoder samt genom en kvalitativ expertutvärdering baserad på det kvantitativa resultatet. Den kvantitativa jämförelsen antydde att jämförelsen mellan kunskapsgrafer genererade med hjälp av olika metoder kan bidra med värdefull information för tolkningen och kontextualiseringen av viktiga gener. Resultatet visade även på begränsningar hos vissa metoder, till exempel gällande skalbarhet samt den mängd och typ av information som kan extraheras. Men även att metrics baserade på överlappning av hörn och kanter, samt metrics som tar hänsyn till den globala topologin i grafer kan vara användbara i jämförelsen av, samt för att representera skillnader mellan biologiska kunskapsgrafer. Resultatet från den kvalitativa expertutvärderingen visade att kunskapsgrafer baserade på geninformation extraherad från vetenskapliga artiklar kan vara värdefulla verktyg för att identifiera forskningsbias gällande gener, samt framhävde viktiga utmaningar gällande normalisering av biologiska entiteter inom området kunskapsgrafsutveckling. Baserat på dessa fynd framstår automatisk kunskapsgrafsgenerering som ett lovande tillvägagångssätt för att förbättra tillgängligheten av kontextuell geninformation i vetenskaplig litteratur.
|
2 |
On the use of knowledge graph embeddings for business expansion / Om användandet av kunskapsgrafinbäddningar för företagsexpansionRydberg, Niklas January 2022 (has links)
The area of Knowledge Graphs has grown significantly during recent time and has found many different applications both in industrial and academic settings. Despite this, many large Knowledge Graphs are in fact incomplete, which leads to the problem of finding the missing facts in the graphs using Link Prediction. There are several ways of performing Link prediction, the most common one that has emerged recently being using Machine learning techniques to learn low-dimensional representations of the Knowledge Graph called Knowledge Graph embeddings. This project attempts to explore whether or not this is a viable method to use in order to give suggestions for companies that want to expand their businesses. In order to test this hypothesis, a Knowledge Graph was built using real company data from open sources. Then different Knowledge Graph embedding models were trained on the data in order to predict missing elements in the Knowledge Graph. The models were then compared to see which one is most suitable for this task and data set. The geometric based models were found to perform the best for the specific data set used in this project. In this category there are models such as TransE, TransR and RotatE. The results point to the method being a valid option for giving expansion suggestions to companies using a Knowledge Graph of other companies and their products. However, to be certain of this, further research needs to be done where the method needs to be implemented on a larger scale using more diverse data. / Området kunskapsgrafer har växt mycket under de senaste åren och har många olika tillämpningar både inom akademiska och industriella områden. Trots denna tillväxt så är många kunskapsgrafer ofullständiga, vilket leder till problemet att hitta den faktan i kunskapsgraferna som saknas genom något som kallas länkförutsägelser. Det finns många olika metoder för att göra länkförutägelser, men den populäraste metoden som uppkommit de senaste åren är att använda maskininlärning för att lära in lågdimensionerade representationer av kunskapsgrafen i något som kallas kunskapsgrafsinbäddningar. I det här projektet försöker vi ta reda på om den här metoden går att använda för att ge förslag för företag som vill expandera och etablera sig på nya marknader. För att testa om detta är möjligt byggdes en kunskapsgraf med hjälp av data från öppna källor. Sedan fick olika kunskapsgrafsinbäddningsmodeller träna på data från kunskapsgrafen för att sedan kunna hitta fakta i grafen som saknades. De olika modellerna jämfördes sedan för att se vilken som var mest lämplig för att klara av uppgiften på vår kunskapsgraf. De modeller som är geometribaserade visade sig prestera bäst, bland dom fanns modeller som TransE, TransR och RotatE. Resultaten från projektet visar på att metoden är användbar för uppgiften att ge förslag om områden som ett företag kan expandera till. Dock skulle detta behöva undersökas mer med en större mer mångfaldig mängd data för att vara säker på att detta går att använda i fler marknadsområden än dem som ingick i projektet.
|
Page generated in 0.0417 seconds