Return to search

Data accuracy in bibliometric data sources and its impact on citation matching

Ist die Zitationsanalyse ein geeignetes Instrument zur Forschungsevaluation? Diese Dissertation untersucht, ob die zugrunde liegenden Zitationsdaten ausreichend fehlerfrei sind, um aussagekräftige Ergebnisse der Analysen zu erzielen, beziehungsweise sollte dies nicht der Fall sein, ob der Prozess, der die zitierenden und zitierten Artikel einander zurordnet, ausreichend robust gegenüber Ungenauigkeiten in den Daten ist. Ungenauigkeiten wurden als Unterschiede in den Datenwerten der bibliographischen Angaben definiert. Die untersuchten Daten setzen sich aus gezielt ausgewählten Publikationen des Web of Science (WoS) zusammen, welche eine geschichtete Stichprobe ergeben. Die bibliographischen Daten von 3.929 Referenzen wurden in einer qualitativen Inhaltsanalyse bewertet und die bibliographischen Ungenauigkeiten in einer Taxonomie zusammengefasst. Um genau festzulegen, welche von diesen tatsächlich den Zuordnungsprozess von Zitationen beeinflussen, wurde eine spezifische Untergruppe von Zitationen, d.h. Zitationen die von WoS nicht erfolgreich dem jeweilig zitierten Artikel zugeordnet wurden, untersucht. Die Ergebnisse wurden mit den Daten zweier weiterer bibliographischen Datenbanken, Scopus und Google Scholar, sowie den Daten dreier angewandter bibliometrischer Forschungsgruppen, CWTS, iFQ und Science-Metrix, trianguliert. Die Zuordnungsalgorithmen von CWTS und iFQ konnten rund zwei Drittel dieser Zitierungen erfolgreich zuordnen. Scopus und Google Scholar konnten ebenso über 60% der fehlenden Zitierungen erfolgreich mit dem entsprechenden zitierten Artikel verbinden, während Science-Metrix nur eine geringe Anzahl an Referenzen (5%) schaffte. Vollkommen falsche erste Seitenzahlen sowie Zahlendreher in Publikationsjahren können in allen Datenquellen nicht richtig zugeordnete Zitierungen verursachen. Basierend auf den Ergebnissen wurden Lösungsvorschläge formuliert, die im Stande sind den Zuordnungsprozess von Zitationen in bibliometrischen Datenquellen zu verbessern. / Is citation analysis an adequate tool for research evaluation? This doctoral research investigates whether the underlying citation data is sufficiently accurate to provide meaningful results of the analyses and if not, whether the citation matching process can rectify inaccurate citation data. Inaccuracies are defined as discrepancies in the data values of bibliographic references, since they are the essential part in the citation matching process. A stratified, purposeful data sample was selected to examine typical cases of publications in Web of Science (WoS). The bibliographic data of 3,929 references was assessed in a qualitative content analysis to identify prevailing inaccuracies in bibliographic references that can interfere with the citation matching process. The inaccuracies were categorized into a taxonomy. Their frequency was studied to determine any strata-specific patterns. To pinpoint the types of inaccuracies that influence the citation matching process, a specific subset of citations, i.e. citations not successfully matched by WoS, was investigated. The results were triangulated with five other data sources: with data from two bibliographic databases in their role as citation indexes (Scopus and Google Scholar) and with data from three applied bibliometric research groups (CWTS, iFQ and Science-Metrix). The matching algorithms of CWTS and iFQ were able to match around two thirds of these citations correctly. Scopus and Google Scholar also handled more than 60% successfully in their matching. Science-Metrix only matched a small number of references (5%). Completely incorrect starting page numbers and transposed publication years can cause a citation to be missed in all data sources. However, more often it is a combination of more than one kind of inaccuracy in more than one field that leads to a non-match. Based on these results, proposals are formulated that could improve the citation matching processes of the different data sources.

Identiferoai:union.ndltd.org:HUMBOLT/oai:edoc.hu-berlin.de:18452/17774
Date12 January 2015
CreatorsOlensky, Marlies
ContributorsPetras, Vivien, Larsen, Birger
PublisherHumboldt-Universität zu Berlin, Philosophische Fakultät I
Source SetsHumboldt University of Berlin
LanguageEnglish
Detected LanguageEnglish
TypedoctoralThesis, doc-type:doctoralThesis
Formatapplication/pdf
RightsNamensnennung - Keine kommerzielle Nutzung - Keine Bearbeitung, http://creativecommons.org/licenses/by-nc-nd/3.0/de/

Page generated in 0.0032 seconds