Global ETD Search

1	Exploring declarative rule-based probabilistic frameworks for link prediction in Knowledge Graphs Gao, Xiaoxu January 2017 (has links) En kunskapsgraf lagrar information från webben i form av relationer mellan olika entiteter. En kunskapsgrafs kvalité bestäms av hur komplett den är och dess noggrannhet. Dessvärre har många nuvarande kunskapsgrafer brister i form av saknad fakta och inkorrekt information. Nuvarande lösningar av länkförutsägelser mellan entiteter har problem med skalbarhet och hög arbetskostnad. Denna uppsats föreslår ett deklarativt regelbaserat probabilistiskt ramverk för att utföra länkförutsägelse. Systemet involverar en regelutvinnande modell till ett “hinge-loss Markov random fields” för att föreslå länkar. Vidare utvecklades tre strategier för regeloptimering för att förbättra reglernas kvalité. Jämfört med tidigare lösningar så bidrar detta arbete till att drastiskt reducera arbetskostnader och en mer spårbar modell. Varje metod har utvärderas med precision och F-värde på NELL och Freebase15k. Det visar sig att strategin för regeloptimering presterade bäst. MAP-uppskattningen för den bästa modellen på NELL är 0.754, vilket är bättre än en nuvarande spjutspetsteknologi graphical model(0.306). F-värdet för den bästa modellen på Freebase15k är 0.709. / The knowledge graph stores factual information from the web in form of relationships between entities. The quality of a knowledge graph is determined by its completeness and accuracy. However, most current knowledge graphs often miss facts or have incorrect information. Current link prediction solutions have problems of scalability and high labor costs. This thesis proposed a declarative rule-based probabilistic framework to perform link prediction. The system incorporates a rule-mining model into a hingeloss Markov random fields to infer links. Moreover, three rule optimization strategies were developed to improve the quality of rules. Compared with previous solutions, this work dramatically reduces manual costs and provides a more tractable model. Each proposed method has been evaluated with Average Precision or F-score on NELL and Freebase15k. It turns out that the rule optimization strategy performs the best. The MAP of the best model on NELL is 0.754, better than a state-of-the-art graphical model (0.306). The F-score of the best model on Freebase15k is 0.709. Knowledge Graph Link Prediction Probabilistic Soft Logic Hinge-loss Markov Random Fields Kunskapsgraf Länkförutsägelser Probabilistic Soft Logic Hinge-loss Markov Random Fields Computer and Information Sciences Data- och informationsvetenskap
2	Exploring Construction of a Company Domain-Specific Knowledge Graph from Financial Texts Using Hybrid Information Extraction Jen, Chun-Heng January 2021 (has links) Companies do not exist in isolation. They are embedded in structural relationships with each other. Mapping a given company’s relationships with other companies in terms of competitors, subsidiaries, suppliers, and customers are key to understanding a company’s major risk factors and opportunities. Conventionally, obtaining and staying up to date with this key knowledge was achieved by reading financial news and reports by highly skilled manual labor like a financial analyst. However, with the development of Natural Language Processing (NLP) and graph databases, it is now possible to systematically extract and store structured information from unstructured data sources. The current go-to method to effectively extract information uses supervised machine learning models, which require a large amount of labeled training data. The data labeling process is usually time-consuming and hard to get in a domain-specific area. This project explores an approach to construct a company domain-specific Knowledge Graph (KG) that contains company-related entities and relationships from the U.S. Securities and Exchange Commission (SEC) 10-K filings by combining a pre-trained general NLP with rule-based patterns in Named Entity Recognition (NER) and Relation Extraction (RE). This approach eliminates the time-consuming data-labeling task in the statistical approach, and by evaluating ten 10-k filings, the model has the overall Recall of 53.6%, Precision of 75.7%, and the F1-score of 62.8%. The result shows it is possible to extract company information using the hybrid methods, which does not require a large amount of labeled training data. However, the project requires the time-consuming process of finding lexical patterns from sentences to extract company-related entities and relationships. / Företag existerar inte som isolerade organisationer. De är inbäddade i strukturella relationer med varandra. Att kartlägga ett visst företags relationer med andra företag när det gäller konkurrenter, dotterbolag, leverantörer och kunder är nyckeln till att förstå företagets huvudsakliga riskfaktorer och möjligheter. Det konventionella sättet att hålla sig uppdaterad med denna viktiga kunskap var genom att läsa ekonomiska nyheter och rapporter från högkvalificerad manuell arbetskraft som till exempel en finansanalytiker. Men med utvecklingen av ”Natural Language Processing” (NLP) och grafdatabaser är det nu möjligt att systematiskt extrahera och lagra strukturerad information från ostrukturerade datakällor. Den nuvarande metoden för att effektivt extrahera information använder övervakade maskininlärningsmodeller som kräver en stor mängd märkta träningsdata. Datamärkningsprocessen är vanligtvis tidskrävande och svår att få i ett domänspecifikt område. Detta projekt utforskar ett tillvägagångssätt för att konstruera en företagsdomänspecifikt ”Knowledge Graph” (KG) som innehåller företagsrelaterade enheter och relationer från SEC 10-K-arkivering genom att kombinera en i förväg tränad allmän NLP med regelbaserade mönster i ”Named Entity Recognition” (NER) och ”Relation Extraction” (RE). Detta tillvägagångssätt eliminerar den tidskrävande datamärkningsuppgiften i det statistiska tillvägagångssättet och genom att utvärdera tio SEC 10-K arkiv har modellen den totala återkallelsen på 53,6 %, precision på 75,7 % och F1-poängen på 62,8 %. Resultatet visar att det är möjligt att extrahera företagsinformation med hybridmetoderna, vilket inte kräver en stor mängd märkta träningsdata. Projektet kräver dock en tidskrävande process för att hitta lexikala mönster från meningar för att extrahera företagsrelaterade enheter och relationer. Natural Language Processing Information Extraction Named Entity Recognition Relation Extraction Knowledge Graph Naturlig språkbehandling Informationsextraktion Namngiven Entitetsigenkänning Relationsextraktion Kunskapsgraf Computer and Information Sciences Data- och informationsvetenskap
3	ElektroCHAT: A Knowledge Base-Driven Dialogue System for Electrical Engineering Students : A Proposal for Interactive Tutoring / ElektroCHAT: Ett Kunskapsbaserat Dialogsystem för Ingenjörsstudenter Inom Elektroteknik : Ett Förslag för Interaktiv Handledning Gölman, Fredrik January 2023 (has links) Universities worldwide face challenges both with students dropping out of educational programmes and repetitive questions directed toward teaching staff which both consume resources and result in delays. Recent progress in natural language processing (NLP) introduces the possibility of more sophisticated dialogue systems that could help alleviate the situation. Dialogue systems in education are complex to construct for multiple reasons. Two such reasons are that domain-specific data is often not readily available and extending an existing system often requires configuring the system again and re-training models. In this thesis, a graph-based knowledge base (KB) which is the foundation of a heavily rule-based dialogue system is proposed. The core of the natural language understanding (NLU) in the pipeline-based dialogue system includes the transformer-based DIET classifier for intent classification and entity extraction. The custom logic of the dialogue system relies on contextual and distributional embeddings. While the proposed solution is used in electrical engineering specifically, the KB and the architecture of the dialogue system are designed with generalization in mind. An emphasis is to maintain a low level of system maintenance after deployment allowing teaching staff without expertise in computer science and machine learning to operate the system. The utilization of transfer learning with pre-trained language models helps achieve this objective. The findings suggest that the system is sufficiently sophisticated to improve learning environments for students while potentially alleviating the workload of teaching staff. They further indicate that computer science and machine learning expertise are not required to operate the system over time. / Universitet världen runt möter utmaningar vad gäller både studenter som avbryter sina studier i förtid och repetitiva frågeställningar riktade till kursansvariga vilket konsumerar resurser och resulterar i onödig tidsåtgång. Den utveckling som på senare tid har skett inom naturlig språkhantering (NLP) introducerar möjligheter för mer sofistikerade dialogsystem som skulle kunna avhjälpa situationen. Dialogsystem inom utbildning är ofta komplexa att konstruera av flera anledningar. Två av dessa anledningar är att domän-specifik data sällan finns tillgänglig och att vidareutveckla existerande dialogsystem ofta kräver omkonfigurering och att man åter tränar de involverade modellerna. I denna uppsats föreslås en grafbaserad kunskapsbas (KB) som är grunden av ett till stora delar regelbaserat dialogsystem. Kärnan av den naturliga språkförståelsen (NLU) i det pipeline-baserade dialogsystemet inkluderar den transformer-baserade DIET-modellen för klassificering av intentioner och extrahering av entiteter. Den egenutvecklade logiken i dialogsystemet förlitar sig på förtränade kontextuella och distribuerade inbäddningar. Medan den föreslagna lösningen används specifikt inom elektroteknik så är både KB och dialogsystemets arkitektur utvecklade med generalisering i åtanke. Det finns även en betoning på att bibehålla en låg underhållningsnivå efter att systemet har sjösatts för att tillåta att systemet drivs av kursansvariga utan expertis inom datalogi eller maskininlärning. Användandet av förtränade språkmodeller hjälper till att uppnå detta mål. Upptäckterna tyder på att systemet är tillräckligt sofistikerat för att förbättra lärandemiljön för studenter medan det samtidigt möjligtvis kan hjälpa till att förminska arbetsbelastningen för kursansvariga. Vidare så indikerar upptäckterna att expertis inom datalogi och maskininlärning inte är nödvändigt för att driva systemet över tid. Knowledge base Knowledge graph Dialogue system Chatbot Electrical engineering Education Kunskapsbas Kunskapsgraf Dialogsystem Chatbot Elektroteknik Utbildning Computer Sciences Datavetenskap (datalogi) Computer Engineering Datorteknik Computer and Information Sciences Data- och informationsvetenskap
4	Digital Twin Knowledge Graphs for IoT Platforms : Towards a Virtual Model for Real-Time Knowledge Representation in IoT Platforms / Digital Twin Kunskapsgrafer för IoT-Plattformar : Mot en Virtuell Modell för Kunskapsrepresentation i Realtid i IoT-Plattformar Jarabo Peñas, Alejandro January 2023 (has links) This thesis presents the design and prototype implementation of a digital twin based on a knowledge graph for Internet of Things (IoT) platforms. The digital twin is a virtual representation of a physical object or system that must continually integrate and update knowledge in rapidly changing environments. The proposed knowledge graph is designed to store and efficiently query a large number of IoT devices in a complex logical structure, use rule-based reasoning to infer new facts, and integrate unanticipated devices into the existing logical structure in order to adapt to changing environments. The digital twin is implemented using the open-source TypeDB knowledge graph and tested in a simplified automobile production line environment. The main focus of the work is on the integration of unanticipated devices, for which a similarity metric is implemented to identify similar existing devices and determine the appropriate integration into the knowledge graph. The proposed digital twin knowledge graph is a promising solution for managing and integrating knowledge in rapidly changing IoT environments, providing valuable insights and support for decision-making. / I den här avhandlingen presenteras utformningen och prototypimplementeringen av en digital tvilling baserad på en kunskapsgraf för IoT-plattformar (Internet of Things). Den digitala tvillingen är en virtuell representation av ett fysiskt objekt eller system som måste integrera och uppdatera kunskap i snabbt föränderliga miljöer. Den föreslagna kunskapsgrafen är utformad för att lagra och effektivt söka efter en stor uppsättning IoT-enheter i en komplex logisk struktur, använda regelbaserade resonemang för att härleda nya fakta och integrera oväntade enheter i den befintliga logiska strukturen för att anpassa sig till föränderliga miljöer. Den digitala tvillingen genomförs med hjälp av kunskapsgrafen TypeDB med öppen källkod och testas i en förenklad miljö för bilproduktion. Huvudfokus ligger på integrationen av oväntade enheter, för vilka ett likhetsmått implementeras för att identifiera liknande befintliga enheter och bestämma lämplig integration i kunskapsgrafen. Den föreslagna kunskapsgrafen för digitala tvillingar är en lovande lösning för att hantera och integrera kunskap i snabbt föränderliga IoT-miljöer, vilket ger värdefulla insikter och stöd för beslutsfattande. / Esta tesis presenta el diseño e implementación de un prototipo de gemelo digital basado en un grafo de conocimiento para plataformas de Internet de las Cosas (IoT). El gemelo digital es una representación virtual de un objeto o sistema físico que debe integrar y actualizar continuamente el conocimiento en entornos que cambian rápidamente. El grafo de conocimiento propuesto está diseñado para almacenar y consultar eficientemente un gran número de dispositivos IoT en una estructura lógica compleja, utilizar el razonamiento basado en reglas para inferir nuevos hechos e integrar dispositivos imprevistos en la estructura lógica existente para adaptarse a los cambios del entorno. El gemelo digital se implementa utilizando el grafo de conocimiento de código abierto TypeDB y se prueba en un entorno simplificado basado en una línea de producción de automóviles. El objetivo principal del trabajo es la integración de dispositivos no previstos, para lo cual se implementa una métrica de similitud para identificar dispositivos existentes similares y determinar la integración adecuada en el grafo de conocimiento. El grafo de conocimiento propuesto es una solución prometedora para la gestión del conocimiento y la integración en entornos IoT que cambian rápidamente, proporcionando información valiosa y apoyo a la toma de decisiones. Internet of Things Digital Twin Knowledge Graph Similarity Metric Semantic Data Integration Internet of Things Digital Twin Kunskapsgraf Likhetmetrik Integrering av Semantiska Data Internet of Things Gemelo Digital Grafo de Conocimiento Métrica de Similitud Integración de Datos Semánticos. Elektroteknik och elektronik
5	HackerGraph : Creating a knowledge graph for security assessment of AWS systems Stournaras, Alexios January 2023 (has links) With the rapid adoption of cloud technologies, organizations have benefited from improved scalability, cost efficiency, and flexibility. However, this shift towards cloud computing has raised concerns about the safety and security of sensitive data and applications. Security engineers face significant challenges in protecting cloud environments due to their dynamic nature and complex infrastructures. Traditional security approaches, such as attack graphs that showcase attack vectors in given network topologies, often fall short of capturing the intricate relationships and dependencies of cloud environments. Knowledge graphs, essentially a knowledge base with a directed graph structure, are an alternative to attack graphs. They comprehensively represent contextual information such as network topology information and vulnerabilities, as well as the relationships between all of the entities. By leveraging knowledge graphs’ inherent flexibility and scalability, security engineers can gain deeper insights into the complex interconnections within cloud systems, enabling more effective threat analysis and mitigation strategies. This thesis involves the development of a new tool, HackerGraph, specifically designed to utilize knowledge graphs for cloud security. The tool integrates data from various other tools, gathering information about the cloud system’s architecture and its vulnerabilities and weaknesses. By analyzing and modeling the information using a knowledge graph, the tool provides a holistic view of the cloud ecosystem, identifying potential vulnerabilities, attack vectors, and areas of concern. The results are compared to modern stateof-the-art tools, both in the area of attack graphs and knowledge graphs, and we prove that more information and more attack paths in vulnerable by-design scenarios can be provided. We also discuss how this technology can evolve, to better handle the intricacies of cloud systems and help security engineers in fully protecting their complicated cloud systems. / Organisationers snabba anammande av molnteknologier har låtit dem dra nytta förbättrad skalbarhet, kostnadseffektivitet och flexibilitet. Däremot har detta skifte också lett till nya säkerhetsproblem, speciellt gällande applikationer och behandlingen av känslig information. Molnmiljöers dynamiska natur och komplexa problem skapar markanta problem för de säkerhetstekniker som ansvarar för att skydda miljön. Den typ av invecklade förhållanden som finns i molnet fångas däremot sällan av traditionella säkerhetsmetoder, såsom attackgrafer. Ett alternativ till attackgrafer är därför kunskapsgrafer som utförligt kan representera kontextuell information, förhållanden och domänspecifik kunskap. Genom kunskapsgrafernas naturliga flexibilitet och skalbarhet skulle säkerhetsteknikerna kunna få djupare insikter kring de komplexa förhållanden som råder i molnmiljöer för att på ett mer effektivt sätt analysera hot och hur de kan förebyggas. Det här arbetet involverar därför utvecklingen av ett nytt verktyg specifikt designat för att använda kunskapsgrafer, nämligen HackerGraph. Verktyget integrerar data från flera andra verktyg som samlar information om molnmiljöers arkitektur samt deras sårbarheter eller svagheter. Genom att analysera och modellera informationen som en kunskapsgraf skapar verktyget en holistisk bild av molnekosystemet som kan identifiera potentiella sårbarheter, attackvektorer eller andra problemområden. Resultaten jämförs sedan med moderna verktyg inom både attack- och kunskapsgrafer. Vi bevisar därmed både hur mer information och fler attackvägar kan tillhandahållas från scenarion som är sårbara per design. Vi diskuterar också hur den här teknologin kan utvecklas för att bättre hantera molnmiljöers komplexitet samt hur den kan hjälpa säkerhetstekniker att skydda sina komplicerade molnmiljöer. Cloud security Knowledge graph Attack graph Vulnerability ssessment Attack paths Vulnerable-by-design systems Cloudgoat Molnsäkerhet Kunskapsgraf Attackgraf Sårbarhetsanalysis Sårbara miljöer Cloudgoat Elektroteknik och elektronik

1

Page generated in 0.0482 seconds