Keyword analysis in scientific articles is a method used to identify and evaluate the importance and relevance of specific words or phrases (keywords) within scientific literature. The primary goal of keyword analysis is to uncover the core themes, research trends, and conceptual frameworks within a given field or across multiple disciplines. It helps researchers understand scientific discourse's focus and ideas' evolution over time. This thesis performs keyword analysis on a repository of scientific publications through a combination of methods. It starts with extracting the available keywords, and it deals with the missing keywords data through data augmentation. Then, it utilizes a variety of statistical methods to gain insight into the publications. The study employs an implementation of LDA topic modeling to accurately categorize keywords into thematic groups, a Vector autoregression to explore keyword relationships, and temporal dynamics of keywords. Next, the research further examines the interdisciplinary connectivity of keywords, clarifying the collective nature of modern science. In conclusion, the thesis presents a comprehensive framework for keyword analysis in scientific literature, through a blend of data augmentation, natural language processing, temporal dynamics, and interdisciplinary examination, the study provides a robust tool for understanding the development and structure of scientific literature. The findings of this research have important implications for scholars, it allows navigating the vast amount of scientific literature more effectively and to discern the most influential ideas and trends shaping target fields. The methodologies implemented here offer an opportunity for any studies to methodologically search, extract, and identify keywords to find relevant papers and interpret the complex landscape of scientific communication. / Nyckelordsanalys i vetenskapliga artiklar är en metod som används för att identifiera och utvärdera vikten och relevansen av specifika ord eller fraser (nyckelord) inom vetenskaplig litteratur. Det primära målet med nyckelordsanalys är att avslöja kärnteman, forskningstrender och konceptuella ramverk inom ett givet fält eller över flera lämnar. Det hjälper forskare att förstå den vetenskapliga diskursens fokus och idéernas utveckling över tid. Denna avhandling utför nyckelordsanalys på ett arkiv av vetenskapliga publikationer genom en kombination av metoder. Den börjar med att extrahera de tillgängliga nyckelorden och hanterar de saknade nyckelordsdata genom dataaugtation. Därefter använder den en mängd statistiska metoder för att få insikt i publikationerna. Studien använder en implementering av LDA-ämnesmodellering för att noggrant kategorisera nyckelord i tematiska grupper, en vektorautoregression för att utforska nyckelordsrelationer och tidsmässig dynamik av nyckelord. Nästa steg i forskningen är att ytterligare undersöka den tvärvetenskapliga kopplingen mellan nyckelord, vilket klargör den kollektiva naturen av modern vetenskap. Sammanfattningsvis presenterar avhandlingen ett omfattande ramverk för nyckelordsanalys i vetenskaplig litteratur. Genom en blandning av dataaugmentation, naturlig språkbehandling, tidsmässig dynamik och tvärvetenskaplig undersökning, erbjuder studien ett robust verktyg för att förstå utvecklingen och strukturen av vetenskaplig litteratur. Forskningens resultat har viktiga implikationer för forskare; det möjliggör effektivare navigering i den omfattande mängden vetenskaplig litteratur och att urskilja de mest inflytdrikelserika idéerna och trenderna som formar målfälten. De metoder som införas här erbjuder en möjlighet för vilken studie som helst att metodiskt söka, extrahera och identifiera nyckelord för att hitta relevanta artiklar och tolka det komplexa landskapet av vetenskaplig kommunikation.
Identifer | oai:union.ndltd.org:UPSALLA1/oai:DiVA.org:liu-205252 |
Date | January 2024 |
Creators | Gholamniaetakhsami, Hirbod |
Publisher | Linköpings universitet, Statistik och maskininlärning |
Source Sets | DiVA Archive at Upsalla University |
Language | English |
Detected Language | Swedish |
Type | Student thesis, info:eu-repo/semantics/bachelorThesis, text |
Format | application/pdf |
Rights | info:eu-repo/semantics/openAccess |
Page generated in 0.1171 seconds