Return to search

Characterizing Feature Influence and Predicting Video Popularity on YouTube / En karakterisering av olika egenskapers inverkan och förutsägelse av videopopularitet på YouTube

YouTube is an online video sharing platform where users can distribute and consume video and other types of content. The rapid technological advancement along with the proliferation och technological gadgets has led to the phenomenon of viral videos where videos and content garner hundreds of thousands if not million of views in a short span of time. This thesis looked at the reason for these viral content, more specifically as it pertains to videos on YouTube. This was done by building a predictor model using two different approaches and extracting important features that causes video popularity. The thesis further observed how the subsequent features impact video popularity via partial dependency plots. The knn model outperformed logistic regression model. The thesis showed, among other things that YouTube channel and title were the most important features followed by comment count, age and video category. Much research have been done pertaining to popularity prediction, but less on deriving important features and evaluating their impact on popularity. Further research has to be conduced on feature influence, which is paramount to comprehend the causes for content going viral. / YouTube är en online-plattform där användare kan distribuera och konsumera video och andra typer av innehåll. Den snabba tekniska utvecklingen tillsammans med spridningen av mobila plattformar har lett till fenomenet virala videor där videor får hundratusentals, om inte miljontals, visningar på kort tid. I arbetet undersöktes orsaken till virala videor på YouTube. Det gjordes genom att bygga två modeller för att förutspå videopopularitet och därefter analysera viktiga egenskaper som orsakar denna. Resultaten visade att Knn- modellen ger bättre resultat än logistisk regression. Arbetet visade bland annat att YouTube-kanalen och titeln var de viktigaste egenskaperna som driver popularitet, följt av antal kommentarer på en video, videons ålder och videons kategori. Vidare forskning är dock nödvändig inom detta område. Mycket forskning har gjorts för att förutsäga populariteten hos videor, men mindre fokus har lagts på att analysera deras viktiga egenskaper och utvärdera deras inverkan på populariteten.

Identiferoai:union.ndltd.org:UPSALLA1/oai:DiVA.org:kth-303504
Date January 2021
CreatorsAbdihakim, Ali
PublisherKTH, Skolan för elektroteknik och datavetenskap (EECS)
Source SetsDiVA Archive at Upsalla University
LanguageEnglish
Detected LanguageSwedish
TypeStudent thesis, info:eu-repo/semantics/bachelorThesis, text
Formatapplication/pdf
Rightsinfo:eu-repo/semantics/openAccess
RelationTRITA-EECS-EX ; 2021:554

Page generated in 0.0023 seconds