Crowdfunding används för att samla in pengar för tänkta projekt via internet, där ett stort antal investerare bidrar med små summor. Kickstarter är en av de största crowdfundingplattformarna idag. Trots det stora intresset för crowdfunding misslyckas många kampanjer att nå sin målsumma och projekt av kategorin teknologi visar sig vara de projekt som misslyckas till högst grad. Därmed är det av intresse att kunna förutsäga vilka kampanjer som kommer att lyckas eller misslyckas. Denna forskningsansats syftar till att undersöka genomförbarheten i att uppnå en högre accuracy vid prediktion av framgången hos lanserade kickstarterprojekt med hjälp av maskininlärning genom att använda en mindre mängd kategorispecifik data. Data över 192 548 lanserade projekt på plattformen Kickstarter har samlats in via www.kaggle.com. Två modeller av typen RandomForest har sedan tränats där en modell tränades med data över samtliga projekt i uppsättningen och en tränades med data över teknologiprojekt med syftet att kunna jämföra modellernas prestation vid klassificering av teknologiprojekt. Resultatet visar att en högre accuracy uppmättes för teknologimodellen som nådde 68,37% träffsäkerhet vid klassificeringen gentemot referensmodellens uppvisade accuracy på 68,00%. / Crowdfunding is used to collect money via internet for potential projects through a large number of backers which contribute with small pledges. Kickstarter is one of the largest crowdfunding platforms today. Despite the big interest in crowdfunding a lot of launched campaigns fail to reach their goal and projects of the category technology shows the largest rate of failure on Kickstarter. Therefore, it is important to be able to predict which campaigns are likely to succeed or fail. This thesis aims to explore the possibility of reaching a higher accuracy when predicting the success of launched projects with machine learning with a smaller amount of category-specific data. The data consists om 192 548 launched projects on Kickstarter and has been collected through Kaggle.com. Two models of the type Random Forest has been developed where one model has been trained with general data over all projects and one model has been trained with category specific data over technology projects. The results show that the technology model show a higher accuracy rate with 68,37 % compared to the reference model with 68,00 %.
Identifer | oai:union.ndltd.org:UPSALLA1/oai:DiVA.org:uu-413736 |
Date | January 2020 |
Creators | Appelquist, Niklas, Karlsson, Emelia |
Publisher | Uppsala universitet, Institutionen för informatik och media, Uppsala universitet, Institutionen för informatik och media |
Source Sets | DiVA Archive at Upsalla University |
Language | Swedish |
Detected Language | English |
Type | Student thesis, info:eu-repo/semantics/bachelorThesis, text |
Format | application/pdf |
Rights | info:eu-repo/semantics/openAccess |
Page generated in 0.0019 seconds