Twitter is one of today’s largest and most popular social networks. The users of the service generate huge amounts of data each day and rely heavily on the service helping them find interesting tweets in short time. The concept of hashtags aids in this practice but relies on the users choosing to include the correct and commonly used hashtags for the topic of their tweet. Hashtag recommendation has been a target of research before with varying results. This thesis proposes a method taking the location of the users into account when making recommen- dations. The method generated improved results over just using similar tweets as a basis for recommendation. Various factors like the handling of different variations of vocabulary in the tweets, how many tweets the suggestions can be picked from and how the combination of similarity and geographic ranking should function could affect the result. This leads to the conclusion that geographic data can be used to improve hashtag suggestions, but a different approach in handling similarity and alternative combinations of similarity and geographic ranking could cause another result. / Twitter är ett av nutidens största och populäraste sociala nätverk. Tjänstens användare producerar stora mängder data varje dag och förväntar sig att tjänsten ska kunna hjälpa dem att hitta intressanta tweets snabbt. Därmed finns konceptet med hashtags, men detta förutsätter att användare väljer att inkludera vanligt förekommande hashtags som på ett korrekt sätt avspeglar innehållet i tweeten. Automatisk rekommendation av hashtags har därmed varit ett populärt forskningsämne de senaste åren, med varierande resultat. Denna studie undersöker en rekommendationsmetod som väger in användarens geografiska position för att rekommendera så passande hashtags som möjligt. Resultaten visar att denna metod generellt rekommenderar mer passande hashtags än metoder som enbart rekommenderar hashtags genom att analysera likhet mellan tweets. Olika faktorer så som hanterandet av olika varianter av vokabulär, hur många tweets som metoden kan föreslå hashtags från samt hur kombinationen av rekommendation baserat på likhet och geografiskt position ska fungera, kan samtidigt påverka resultaten. Detta leder till slutsatsen att geografisk data kan användas för att förbättra hashtagrekommendation, men att ett annorlunda tillvägagångsätt i att hantera likhet och alternativa kombinationer av likhetsrangordning och geografisk rangordning kan leda till ett annorlunda resultat.
Identifer | oai:union.ndltd.org:UPSALLA1/oai:DiVA.org:kth-208473 |
Date | January 2017 |
Creators | Berglind, Jonathan, Forsmark, Mikael |
Publisher | KTH, Skolan för datavetenskap och kommunikation (CSC) |
Source Sets | DiVA Archive at Upsalla University |
Language | English |
Detected Language | English |
Type | Student thesis, info:eu-repo/semantics/bachelorThesis, text |
Format | application/pdf |
Rights | info:eu-repo/semantics/openAccess |
Page generated in 0.0018 seconds