Semantic-Representation-Provenance-Contextual-Information-Scientific-Research Die Computer- und Informationstechnologie ist eine der größten Errungenschaften des letzten Jahrhunderts -- eine Revolution, welche die Art und Weise beeinflusst, auf die wir im täglichen Leben auf technische und soziale Problemen reagieren. Obwohl diese Technologien bereits Forschungsaktivitäten an sich beeinflussen, so ist zu erwarten, dass sie auch einen Einfluss auf das Publizieren und Teilen von Forschungsergebnissen haben werden. Bisher wurden in wissenschaftlichen Publikationen nur in geringem Maße Daten beigefügt. Forschungförderungseinrichtungen drängen zu konkreten Lösungen zum Verbreiten, Teilen und Wiederverwenden von Forschungsergebnissen. Berichte wie “Riding the Wave - How Europe can gain from the rising tide of scientific data” der High Level Expert Group on Scientific Data der Europäischen Kommission zeichnen eine Vision, bei der die Herausforderungen einer Diversität an Datenformaten, Menschen und Gemeinschaften durch die Anwendung technischer, semantischer und sozialer Eigenschaften der Interoperabilität vermieden werden. Diese Forschung adressiert derartige Herausforderungen aus einer technischer Perspektive. Fokus dieser Arbeit ist die Exploration eines neuartigen Ansatzes zur Unterstützung der Kuration (Sichtung und Korrektur) von Forschungsdaten mittels der Entwicklung einer Methodologie und mittels der Definition eines automatischen Datenkurationsprozesses in welchem Daten auf einfache Weise annotiert werden können. Ein Beitrag besteht in einem formalen Modell (COSI), welches die Integration großer Mengen an Metadaten erlaubt, welche als logische Konzepte behandelt werden können anstatt nur als Literale. Diese Konzepte werden in einer Ontologie definiert, welche, unter anderem, Inferenzen und Schlussfolgerungen ermöglicht. Der zweite Beitrag dieser Arbeit besteht in einer pragmatischen Lösung die es erlaubt, Metadaten on-the-fly zu annotieren. / Computational and information technology is one of the biggest advancement of the last century, a revolution that is influencing the way we approach social and technical problems in our day to day life. While these technologies have already influenced the research activity per sé, it is to be expected that these innovations will significantly influence the publishing and sharing of scientific results as well. So far, scientific publications have relied on limited result data attached inline in research paper publications. Establishments supporting research are pushing for concrete solutions that allow dissemination, share and reuse of research results. Reports such as “Riding the Wave - How Europe can gain from the rising tide of scientific data” of the High Level Expert Group on Scientific Data, European Commission (High Level Expert Group on Scientific Data, October 2010) presents a vision where the challenges of diverse data formats, people and communities are avoided due to the application of technical, semantic and social features of interoperability. This research is an effort to address similar concerns from a technical perspective. Focus of this research is the exploration of a novel approach on supporting research data curation by developing a method and defining an automated data curation process where data can be easily annotated. As a contribution, this work offers a formal model (COSI) that allows integration of plentiful metadata that can be treated as logic concepts and not merely as literals. These concepts are defined in an ontology that allows among other actions, inference and reasoning operations. The second contribution of this work is associated to a pragmatic solution that facilitates annotation of metadata on the fly. This solution is referred as sheer curation and shows how data can be annotated (based on COSI) and published while investigations are executed.
Identifer | oai:union.ndltd.org:HUMBOLT/oai:edoc.hu-berlin.de:18452/18297 |
Date | 15 November 2016 |
Creators | Brahaj, Armand |
Contributors | Schirmbacher, Peter, Petras, Vivien, Doherr, Detlev |
Publisher | Humboldt-Universität zu Berlin, Philosophische Fakultät I |
Source Sets | Humboldt University of Berlin |
Language | English |
Detected Language | English |
Type | doctoralThesis, doc-type:doctoralThesis |
Format | application/pdf |
Rights | Namensnennung, http://creativecommons.org/licenses/by/3.0/de/ |
Page generated in 0.0021 seconds