Genom de senaste åren har en mängd olika försök till verktyg som bedömer trovärdigheten för länkar växt fram. Dessa verktyg har oftast ett gemensamt problem i bedömning vilket är människan. Att ha människans åsikter som en del av trovärdigheten gör att bedömningen blir lättmanipulerad och därför inte trovärdig. Ett nytt verktyg utvecklas i denna studie där själva bedömningen för trovärdigheten tillämpar bibliometrisk data genom Danish Bibliometric Research Indicator som är tillgänglig på Wikidata. Denna lösning skulle då alltså utesluta lättmanipulerade metoder så som individers åsikter. Problemet som studeras är kopplingen mellan länk och betyg som angrips på tre olika tillvägagångssätt. Dessa tillvägagångssätt eller metoder jämförs i Effektivitet och nytta. Effektiviteten mättes i tiden det tog att hämta samtliga betyg för en sida och nyttan mättes i antalet hämtade betyg per sida. Att koppla domännamn till Wikipediasidor visade sig generera högst antal betyg medans att koppla domännamn direkt mot Wikidata hade en knapp fördel i tid. Den tredje metoden, som använde sig av SPARQL, skulle på förhand vara det bästa men visade sig ha begränsningar i brukandet som gjorde det oanvändbart. Vidare så bekräftas att kopplingen mellan länk och betyg på Wikidata gick att utföra och därav togs ett verktyg fram som utesluter lättmanipulerade metoder i trovärdighetsbedömningen. / Over the past few years, a variety of attempts to create tools that assess the credibility of links have been made. These tools usually have a common problem in assessment which is the human. Having the human’s opinion as part of their credibility makes the assessment easily manipulated and therefore not credible. A new tool is being developed in this study where the credibility assessment itself uses bibliometric data provided by Danish Bibliometric Research Indicator Level available on Wikidata. This solution would therefore excludes easily manipulated methods such as individual’s opinion. The problem being studied is the link between URL and credibility rating which is attacked in three different approaches. These approaches or methods are compared in duration of action and benefit. Duration of action was measured in the time it took to retrieve all the ratings for one page and the benefit was measured in the number of downloaded ratings per page. Linking domain names to pages on Wikipedia was found to generate the greatest number of ratings while linking domain names directly to Wikidata had a scarce advantage in time. The third method, which used SPARQL, would be the most beneficial solution in advance but turned out to have limitations in its practice that made it unusable. Furthermore, it is confirmed that the link between URL and credibility ratings on Wikidata was carried out. Hence, a tool was developed that excludes easily manipulated methods in the credibility assessment.
Identifer | oai:union.ndltd.org:UPSALLA1/oai:DiVA.org:miun-39337 |
Date | January 2020 |
Creators | Henriksson, Andreas |
Publisher | Mittuniversitetet, Institutionen för informationssystem och –teknologi |
Source Sets | DiVA Archive at Upsalla University |
Language | Swedish |
Detected Language | Swedish |
Type | Student thesis, info:eu-repo/semantics/bachelorThesis, text |
Format | application/pdf |
Rights | info:eu-repo/semantics/openAccess |
Page generated in 0.0114 seconds