Return to search

Recommending Hashtags for Tweets Using Textual Similarity and Geographic Data / Föreslå hashtags till tweets med textbaserad likhet och geografisk data

Twitter is one of today’s largest and most popular social networks. The users of the service generate huge amounts of data each day and rely heavily on the service helping them find interesting tweets in short time. The concept of hashtags aids in this practice but relies on the users choosing to include the correct and commonly used hashtags for the topic of their tweet. Hashtag recommendation has been a target of research before with varying results. This thesis proposes a method taking the location of the users into account when making recommen- dations. The method generated improved results over just using similar tweets as a basis for recommendation. Various factors like the handling of different variations of vocabulary in the tweets, how many tweets the suggestions can be picked from and how the combination of similarity and geographic ranking should function could affect the result. This leads to the conclusion that geographic data can be used to improve hashtag suggestions, but a different approach in handling similarity and alternative combinations of similarity and geographic ranking could cause another result. / Twitter är ett av nutidens största och populäraste sociala nätverk. Tjänstens användare producerar stora mängder data varje dag och förväntar sig att tjänsten ska kunna hjälpa dem att hitta intressanta tweets snabbt. Därmed finns konceptet med hashtags, men detta förutsätter att användare väljer att inkludera vanligt förekommande hashtags som på ett korrekt sätt avspeglar innehållet i tweeten. Automatisk rekommendation av hashtags har därmed varit ett populärt forskningsämne de senaste åren, med varierande resultat. Denna studie undersöker en rekommendationsmetod som väger in användarens geografiska position för att rekommendera så passande hashtags som möjligt. Resultaten visar att denna metod generellt rekommenderar mer passande hashtags än metoder som enbart rekommenderar hashtags genom att analysera likhet mellan tweets. Olika faktorer så som hanterandet av olika varianter av vokabulär, hur många tweets som metoden kan föreslå hashtags från samt hur kombinationen av rekommendation baserat på likhet och geografiskt position ska fungera, kan samtidigt påverka resultaten. Detta leder till slutsatsen att geografisk data kan användas för att förbättra hashtagrekommendation, men att ett annorlunda tillvägagångsätt i att hantera likhet och alternativa kombinationer av likhetsrangordning och geografisk rangordning kan leda till ett annorlunda resultat.

Identiferoai:union.ndltd.org:UPSALLA1/oai:DiVA.org:kth-208473
Date January 2017
CreatorsBerglind, Jonathan, Forsmark, Mikael
PublisherKTH, Skolan för datavetenskap och kommunikation (CSC)
Source SetsDiVA Archive at Upsalla University
LanguageEnglish
Detected LanguageEnglish
TypeStudent thesis, info:eu-repo/semantics/bachelorThesis, text
Formatapplication/pdf
Rightsinfo:eu-repo/semantics/openAccess

Page generated in 0.0018 seconds