Spelling suggestions: "subject:"dates.""
101 |
Innovative Anwendungen mit Mobilitätsdaten: Internationale Fallbeispiele: Eine Studie der mFUND-Begleitforschung des WIKDieke, Alex, Tenbrock, Sebastian, Thiele, Sonja, Wielgosch, Julia 01 February 2022 (has links)
Die Digitalisierung hat das Potenzial, den Markt für Mobilität zukünftig radikal zu beeinflussen. Bereits heute haben digitale datenbasierte Anwendungen den Verkehrssektor verändert. Navigationshelfer,
Planungshelfer für den ÖPNV und Wettermelder sind aus privatem Alltag und geschäftlichem Einsatz nicht mehr wegzudenken. Die zunehmende Digitalisierung und Vernetzung der Verkehrsinfrastruktur
und neue Technologien ermöglichen es, Daten verschiedener Quellen miteinander zu verknüpfen und somit große Datenmengen zu generieren und auszuwerten. Komplexe Analysemodelle ermöglichen dabei neue Erkenntnisse und Analyseergebnisse in „Echtzeit“. Innovative Anwendungen haben das Potenzial, den Verkehr verlässlicher, sicherer, kostengünstiger und umweltfreundlicher zu organisieren und Wachstumsimpulse für die Wirtschaft zu generieren. Diese Studie der mFUND-Begleitforschung des WIK stellt sechs Fallbeispiele für erfolgreiche, innovative Anwendungen im Ausland vor. Sie geben Einblick in mögliche Einsatzfelder und Umsetzungsstrategien datenbasierter Innovationen in den Bereichen Verkehrssicherheit, Hafenmanagement, Verkehrsplanung, intermodale Routenplanung und nachhaltige Mobilität und können mFUND-Projekten und anderen Vorhaben, die innovative Nutzungskonzepte erforschen und entwickeln, wertvolle Anregungen liefern. Die Schlussfolgerungen stellen besonders interessante Aspekte der einzelnen Anwendungen für Deutschland heraus. / Digitisation opens potentials to affect radical changes for mobility markets. Digital, data-based applications are changing the transport and mobility sector today and will continue to bring about innovation and efficiency improvements. Navigation tools for private and public transport and weather applications have become ubiquitous for many private and business users. Advances in digitisation, connected transport infrastructures and new technology offer ever-growing opportunities to combine and enrich data from different sources, and generate and process huge amounts of data. Complex models and analytical tools offer new potentials to organise transport more reliably, more securely, more cost-effectively, and more sustainably. At the same time, they promote economic growth and efficiency. This study was prepared by the accompanying research for mFUND, a financial assistance programme sponsored by the German Federal Ministry of Transport and Digital Infrastructure to promote digital innovations for mobility in Germany. This study presents six international case studies for successful, innovative applications. They illustrate the diverse use cases and strategies of data-based innovation in transport security, management of seaports, traffic planning, intermodal routing and sustainable mobility. The case studies offer insights and learnings for projects sponsored by mFUND that research and develop innovative technologies and applications in Germany.
|
102 |
Zugang zu Behördendaten für Digitalisierungsprojekte des mFUND: Informationen und Erfahrungen aus dem mFUND-Arbeitsforum Open Data und Behörden: Eine Veröffentlichung der mFUND-Begleitforschung des WIKBildesheim, Oliver, Göbel, Richard, Hillebrand, Annette, Land, Sebastian, Müllner, Patricia, Ribouni, Sindy, Schnorbus, Alexander 01 February 2022 (has links)
Innovative Projekte im Bereich Mobilität sind mit besonderen Herausforderungen konfrontiert, wenn sie öffentliche und private Datenquellen nutzen wollen. Dazu gehören insbesondere auch öffentlich finanzierte Forschungsprojekte. Der Aufwand an personellen und finanziellen Ressourcen zur Beschaffung der Daten und zur Datenweiterverwendung ist trotz der Fortschritte bei den rechtlichen Rahmenbedingungen und der Anstrengungen von Bund, Ländern und Kommunen, offene Datenquellen bereit zu stellen, noch groß. Die effiziente Beschaffung von Daten ist davon abhängig, dass der Zugang zu Datensätzen und deren Metainformationen offen und dauerhaft gewährleistet ist. Hier wurde mit der mCLOUD des BMVI ein erster Schritt getan. Viele Nutzer benötigen jedoch Daten auch aus anderen Quellen und machen die Erfahrung, dass die Daten nicht immer offen, kostenfrei und dauerhaft verfügbar sind. Suchmaschinen für Datensätze sind zwar vorhanden, aber das Auffinden der Daten aus unterschiedlichsten Quellen verschiedener Behörden und Unternehmen ist mühsam. Die Forderung lautet hier, Daten besser auffindbar zu machen. Die Anzahl der Open-Data-Portale oder -Kataloge wächst erfreulicherweise beständig, aber Plattformen, die Zugriffsmöglichkeiten auf Daten bieten, sind meist dezentral aufgebaut, so dass hier zusätzliche Aufwände bei der Suche entstehen. Eine zentrale Anlaufstelle für „alle“ offenen Daten ist mit GovData geplant, aber noch nicht vollumfänglich ausgebaut. Die Kosten für die Beschaffung von Daten sollten, vor allem für Forschungsprojekte, Civic-Technology-Initiativen und Start-ups, gering gehalten werden. Die Beschaffung bestimmter Daten kann hohe Kosten verursachen und damit die Nutzungsmöglichkeiten, die Erschließung neuer Märkte und Innovationen allgemein stark einschränken. Kostenfaktoren sind vor allem Suchaufwand, Lizenzgebühren und der Übermittlungsaufwand an den Nutzer, des Weiteren die Technik für die Datenverwaltung, die Plausibilisierung sowie für Konvertierung und Anpassung. Nutzungsbedingungen können ein weiteres Hemmnis für Analyse, Auswertung und Weiterverarbeitung sein sowie vor allem für die Entwicklung marktreifer Datenprodukte. Eine Erleichterung für die Datenweiterverwender ist ein einheitlicher Rechtsrahmen für die Daten aller Anbieter, wie er sich für die Daten im öffentlichen Bereich abzeichnet (Standardverträge bzw. offene Lizenzen). Bei kommerziellen Anbietern führt die freie Vertragsgestaltung zu einer Vielzahl von Möglichkeiten, die für Projekte zu hohen Aufwänden zur Abstimmung der Vertragsbedingungen sowie zu nicht mehr kompatiblen Nutzungsbedingungen von Daten aus verschiedenen Quellen führen können. Die Nutzungsbedingungen schließen aktuell in vielen Fällen die Bereitstellung von aufbereiteten Daten für Dritte aus. Derzeit ist eine einfache Lösung für die Bereitstellung solcher Daten, die im Rahmen der mFUND-Projekte entstanden sind, noch nicht in Sicht. Die mFUND-Projekte arbeiten jedoch daran, eine rechtssichere gemeinsame Nutzung der Daten im Sinne der Nachhaltigkeit ihrer Projekte mit Hilfe der gesammelten Erfahrungen zu ermöglichen. Weiterhin haben die Projekt-Verantwortlichen kritische Punkte identifiziert, die auf politischer Ebene angegangen werden sollten, und Vorschläge dazu formuliert. Die in dieser Veröffentlichung skizzierten Lösungsansätze können einen wichtigen Beitrag zum Fortschritt der Digitalisierung auf der Basis von Open Data in Deutschland leisten.
|
103 |
Buyer-Personas für mFUND-Projekte: Informationen und Erfahrungen aus dem mFUND-Arbeitsforum Datenbasierte Geschäftsmodelle für Start-ups: Eine Veröffentlichung der mFUND-Begleitforschung des WIKGries, Christin-Isabel, Richter, Alexander, Thiele, Sonja 01 February 2022 (has links)
Diese Veröffentlichung ist aus einem Treffen des Arbeitsforums „Datenbasierte Geschäftsmodelle für Start-Ups“ im Rahmen der Förderinitiative mFUND des Bundesministeriums für Verkehr und digitale Infrastruktur entstanden. In dem Arbeitsforum treffen sich regelmäßig geförderte Projekte, die ihre Forschungsergebnisse nach Abschluss der Förderung kommerziell verwerten wollen, um sich zu ihren Fortschritten bei der Entwicklung eines passenden Geschäftsmodells auszutauschen. Die vorliegende Veröffentlichung fasst die Ergebnisse zum Thema Persona-Methode zusammen, die bei einem Treffen des Arbeitsforums erarbeitet wurden. Die Veröffentlichung enthält neben einer Einführung in die wesentlichen Elemente der Persona-Methode auch beispielhaft Personas, die Projekte während des Treffens erstellt haben, sowie bereits in der Praxis der mFUND-Projekte angewandte Personas. Diese Veröffentlichung soll anderen mFUND-Projekten als Einführung in die Methode und als Hilfestellung für die Anwendung in der eigenen Arbeit dienen.
|
104 |
Open Data für mehr Mobilität: Kommunale Daten, Attraktive Anwendungen, Mobile Bürger: Eine Studie der mFUND-Begleitforschung des WIKBender, Christian, Dieke, Alex, Hillebrand, Annette, Strube Martins, Sonia 01 February 2022 (has links)
ÖPNV, Digitalisierung und Open Data sind wichtige Zukunftsthemen. In diesem Bereich werden besonders hohe Effizienzgewinne durch verbundübergreifende Kooperation, eine Erhöhung der Benutzerfreundlichkeit und Verbesserung des diskriminierungsfreien Zugangs zu Daten für innovative Entwicklungen erwartet. Daten von Kommunen und kommunalen Verkehrsunternehmen haben dabei
herausragende Bedeutung für Innovationen im Bereich der Mobilität. Die vorliegende Studie will die Chancen dieses Potenzials unter Berücksichtigung der existierenden Regelungen sowie der nationalen und europäischen Planungen erläutern, die existierenden Barrieren für die weitere Entwicklung aufzeigen und Handlungsoptionen für Behörden darlegen, um diese Barrieren zu überwinden. Der Schwerpunkt der Studie liegt im kommunalen Bereich. Auf kommunaler Ebene werden umfangreiche Daten in verschiedensten Bereichen generiert, darunter auch Daten mit hoher Relevanz für Mobilität und Verkehr. Diese Daten weisen ein hohes Potenzial für die Entwicklung innovativer Dienste auf, von denen nicht nur Endverbraucher, sondern auch Kommunen stark profitieren können. Open Data ist eine wichtige Voraussetzung dafür, dass sich das Potenzial der Daten von Kommunen im Bereich Mobilität voll entfalten kann.
|
105 |
Ergonomische Informationskonstruktion: Werkzeuge zur Beherrschung komplexer DatenMühlstedt, Jens, Bullinger, Angelika C. January 2014 (has links)
In Arbeitsprozessen des Informationszeitalters, z. B. in Forschungs- und Entwicklungsabteilungen, spielen die Erhebung und Darstellung von Daten eine zentrale Rolle. In dem Beitrag wird ein Ansatz zur ingenieurtechnisch basierten Konstruktion von Informationen vorgestellt. Als Information werden abgeschlossene, aus Daten bestehende Einheiten im Sinne von Items, Symbolen, Diagrammen oder sonstigen symbolisierten Datenaufbereitungen verstanden. In Anlehnung an die Mensch-Maschine-Interaktion wird eine Mensch-Daten-Interaktion vorgeschlagen.
|
106 |
Bedarfsgerechte und wirtschaftliche öffentliche Ladeinfrastruktur – Plädoyer für ein Dynamisches NPM - Modell: Arbeitsgruppe 5 : Verknüpfung der Verkehrs- und Energienetze, Sektorkopplung: Bericht April 2020Bundesministerium für Verkehr und digitale Infrastruktur 24 May 2023 (has links)
Sieben bis 10,5 Millionen Elektro-Pkw (electric vehicles, EV) beträgt der Zielkorridor der NPM für das Jahr 2030. Dies bedeutet nicht nur eine Verzehnfachung gegenüber den bisherigen Analysen der NPE (vgl. NPE 2018), sondern auch, dass sich damit bis 2030 ein reifer Elektromobilitätsmarkt herausbilden könnte, der von einer Vielzahl unterschiedlicher EV-Ausformungen beziehungsweise -Ladeleistungen in unterschiedlichen Use-Cases geprägt sein wird. Mit Blick auf den parallelen Hochlauf der öffentlichen Ladeinfrastruktur bedeutet dies, dass weiterentwickelnde Bedarfe der Fahrzeuge beziehungsweise Fahrzeugnutzerinnen und Fahrzeugnutzer von der öffentlichen Ladeinfrastruktur abgebildet werden können und diese sich in diesem Zeitraum auch als reifer Markt etablieren muss – also wirtschaftlich betrieben werden kann. Dabei gilt grundsätzlich, dass jede von den Nutzerinnen und Nutzern nachgefragte Kilowattstunde (kWh) nur einmal geladen werden kann – zum Beispiel zu Hause oder öffentlich, an einer Normalladesäule oder an einer Schnellladesäule. Die verschiedenen Lade- und Leistungsvarianten (@home, @work, @public à 11 kW bis 350 kW1) verhalten sich dabei als „kommunizierende Röhren“. Das heißt, eine steigende Auslastung einer Ladebeziehungsweise Leistungsvariante geht zulasten der anderen. Aufgrund dieser neuen Anforderungen ist es notwendig, den von der NPE verfolgten Ansatz zur Ermittlung des erforderlichen Ladeinfrastrukturbedarfs, der auf ein frühes Marktstadium für 1 Million EV ausgelegt war, weiter zu entwickeln. Ziel dieses Berichts ist es entsprechend,
1. einen NPM-Ansatz bereitzustellen, der in der Lage ist, den Hochlauf der Ladeinfrastruktur vom aktuellen Stadium bis zu einem reifen Marktstadium dynamisch abzubilden, und der dabei die Anforderungen einer energetischen und leistungsmäßigen Bedarfsorientierung, Wirtschaftlichkeit und die Wechsel wirkung der Lade- und Leistungsvarianten („kommunizierende Röhren“) miteinander verbindet; 2. auf Basis dieses NPM-Ansatzes eine Analyse möglicher Markthochläufe unter Berücksichtigung der aktuellen Rahmenparameter des Klimapakets und des Masterplans Ladeinfrastruktur der
Bundes regierung durchzuführen; 3. der Nationalen Leitstelle Ladeinfrastruktur Ansätze für ihre Ermittlung des Ladeinfrastrukturbedarfs durch verschiedene Szenarien der Marktentwicklung und -Bedarfe bereitzustellen. Die Entwicklung des Ansatzes und die Analyse erfolgten in Abstimmung zwischen der AG 2 und der AG 5. Wesentliche Ergebnisse der Analyse sind: 1. Sofern eine schrittweise höhere Auslastung der Ladeinfrastruktur berücksichtigt wird und die Ladeinfrastruktur auf den energetischen und den Leistungsbedarf der Fahrzeuge ausgelegt ist, ist je nach Standort und im Zusammenspiel mit der Entwicklung auf der Fahrzeugseite ein wirtschaftlicher Betrieb der Ladeinfrastruktur ab 2025 möglich. 2. Die Szenarien zeigen einen Korridor für den Ladeinfrastruktur(LIS)-bedarf Bedarf von rund 180 bis rund 950 Tausend Ladepunkten im Jahr 2030 auf, je nachdem, wie groß der Anteil des öffentlichen Ladens und der AC- beziehungsweise DC-Ladepunkte ausfällt. Dies verdeutlicht die Notwendigkeit, im Rahmen der öffentlichen Förderung die Marktentwicklung zu monitoren und die Förderung entsprechend auf dieses „moving target“ auszutarieren, mit dem Ziel, dass das Wechselspiel von Angebot und Nachfrage den Ausbau ab 2025 weiter vorantreibt. 3. Mit Blick auf die verschiedenen AC- und DC-Ladeleistungen bildet der Aufbau von circa 40 Tausend DC Ladepunkten und circ 130 Tausend AC-Ladepunkten untere minimale Bedarfe („bottom line“) für die anvisierten 10,5 Millionen EV. [aus Executive Summary]:1 Einleitung
2 Kurzanalyse des Status Quo
3 Methodisches Vorgehen
3.1 Das NOM-Modell – Energiemenge Als Zentrale Bezugsgröße
3.2 Verwendete Daten
3.3 Szenarienbildung
4 Ergebnisse – bedarfsgerechte und wirtschaftliche Ladeinfrastruktur
5 Fazit Und Empfehlungen
Anhang
Abkürzungsverzeichnis
Literaturverzeichnis
Abbildungsverzeichnis
Tabellenverzeichnis
Impressum
|
107 |
RadVerS - Mit Smartphones generierte Verhaltensdaten im Verkehr – Differenzierung des Nutzerverhaltens unterschiedlicher RadfahrerInnengruppen : Teil II: Feldstudie zum RadverkehrsverhaltenLißner, Sven, Lindemann, Paul, Becker, Udo 16 September 2021 (has links)
Der vorliegende Forschungsbericht fasst die Vorbereitung, Durchführung und Auswertung einer Feldstudie zum Thema Radverhaltensforschung mittels GPS Daten zusammen. Ziel des Teil-Projektes war es zu prüfen, welche Parameter auf Personenebene Einfluss auf das Radverkehrsverhalten haben.
|
108 |
Archa Krkonoš® - Metodika pro vytvoření a editaci webové aplikaceKlimeš, Pavel 13 December 2023 (has links)
No description available.
|
109 |
Welche Einflussfaktoren eignen sich für die Typisierung von Radfahrer*innen mittels GPS-Daten? Ein Ansatz zur Kalibrierung von Self-Selected-SamplesLißner, Sven 07 March 2022 (has links)
Für eine zielgerichtete Radverkehrsplanung sind Analysedaten notwendig, die aber in vielen Kommunen kaum verfügbar sind. GPS - Daten von Radfahrer*innen können diese Datenlücke schließen. Bestehende Datensätze und Forschungsansätze bleiben bis-her den Nachweis der Repräsentativität für die Grundgesamtheit der Radfahrer*innen im jeweiligen Untersuchungsgebiet schuldig. Oft wird dies zudem als Schwachpunkt bisheriger Arbeiten thematisiert.
Um die Frage der Repräsentativität von GPS – Datensätzen für den deutschen Raum zu untersuchen, wird in der vorliegenden Arbeit das Radverkehrsverhalten von Radfahrer*innen im Raum Dresden analysiert. Grundlage der Analyse ist ein im Rahmen des Forschungsprojektes „RadVerS“ erhobener GPS-Datensatz von 200 Proband*innen, der 5.300 Einzelwege im Untersuchungsgebiet der Stadt Dresden enthält und Einblicke in deren Radverkehrsverhalten erlaubt. Die erhobenen Daten wurden mit unterschiedlichen Verfahren aufbereitet, so wurden beispielsweise Fahrten mit anderen Verkehrsmodi entfernt und Fahrten in einzelne Wege aufgeteilt. Anschließend wurden die Wegedaten mit Daten aus dem Verkehrsnetz des Untersuchungsgebietes angereichert und statistisch ausgewertet. Der Einfluss einzelner Fahrverhaltensparameter wurde dabei sowohl deskriptiv als auch mittels eines generalisierten linearen Modells ausgewertet.
Das Ergebnis der Untersuchungen zeigt, dass folgende Attribute Einfluss auf das Rad-verkehrsverhalten aufweisen und somit maßgeblich die Diskussion über die Repräsentativität von GPS Daten für die Radverkehrsplanung bestimmen sollten. Dabei offenbaren sich Unterscheide zum Vorgehen bei Haushaltsbefragungen:
- Alter: Es ist sicherzustellen, dass in der Stichprobe insbesondere sehr junge (< 30 Jahre) und ältere (>65 Jahre) Nutzer*innen entsprechend enthalten sind. Die Altersklassen zwischen 30 und 65 können dagegen zusammengefasst werden und sind i. d. R. ausreichend repräsentiert.
- Geschlecht: Diejenigen weiblichen Teilnehmerinnen, welche in Smartphone-basierten Stichproben enthalten sind, bewegen sich auf dem Fahrrad mit langsameren Geschwindigkeiten als männliche Probanden. Zudem beschleunigen sie weniger stark und ihre zurückgelegten Entfernungen sind kürzer als die der männlichen Probanden.
- Wegezweck: Die in smartphone-basierten Stichproben enthaltenen Arbeitswege sind tendenziell länger als Einkaufs- und Freizeitwege
- Die auf Arbeitswegen gefahrenen Geschwindigkeiten sind zudem höher als bei den übrigen Wegezwecken
Oben aufgeführte Parameter haben nur einen geringen und nicht signifikanten Einfluss auf die Infrastrukturnutzung durch Radfahrer*innen. So konnten nur geringe Unterschiede bei der Wahl der Infrastruktur zwischen Geschlechtern, unterschiedlichen Altersklassen und Radfahrtypen festgestellt werden.
Darüber hinaus lässt sich feststellen, dass nach erfolgter Datenaufbereitung die Wege-weitenverteilung und der Tagesgang der Radfahrten im Wesentlichen kongruent zu den Ergebnissen von Haushaltsbefragungen wie beispielsweise Mobilität in Städten (SrV) sind.:1. Einleitung 1
1.1 Hintergrund 3
1.2 Aufgabenstellung 5
1.3 Vorgehen 6
1.4 Herausforderungen und Grenzen der gewählten Methodik 7
2. Grundlagen 10
2.1 Radverkehr in Deutschland 11
2.2 Kennwerte des Radverkehrs 13
2.3 Planungsdaten und Analysemethoden im Radverkehr 18
2.4 Crowdsourcing als neuer Ansatz in der Verkehrsplanung 23
2.5 Big Data 26
2.6 GPS als Erhebungswerkzeug 27
2.7 Zusammenfassung 31
3. Forschungsstand 33
3.1 Methodik der Literaturrecherche Definition von Schlagworten, Recherchedatenbanken
3.2 Crowdsourcing und GPS-Datennutzung in der Verkehrswissenschaft 35
3.3 Quantitative (GPS)-Studien zum Radverkehrsverhalten 40
3.4 Zusammenfassung 52
4. Methodik 55
4.1 Vorbereitung der Datenerhebung 57
4.2 Datenerhebung 58
4.3 Die Datenübertragung 67
4.4 Datenschutz 68
4.5 Parameterauswahl 69
4.6 Datenverarbeitung 70
4.7 Berechnung der Kennziffern für die Wegestatistik 99
4.8 Zusammenfassung 99
5. Ergebnisse 101
5.1 Allgemeine Kennzahlen 101
5.2 Deskriptive Statistik 109
5.3 Inferenzstatistik 128
5.4 Ergebnisse der Vergleichsstichprobe 144
5.5 Zusammenfassung der wesentlichen Ergebnisse 149
6. Diskussion 152
6.1 Zusammenfassung und Interpretation der zentralen Ergebnisse 152
6.2 Stärken und Schwächen der Arbeit 158
6.3 Grenzen der Methodik 162
6.4 Zusammenfassung 165
7. Fazit und Ausblick 168
|
110 |
Automating Geospatial RDF Dataset Integration and Enrichment / Automatische geografische RDF Datensatzintegration und AnreicherungSherif, Mohamed Ahmed Mohamed 12 December 2016 (has links) (PDF)
Over the last years, the Linked Open Data (LOD) has evolved from a mere 12 to more than 10,000 knowledge bases. These knowledge bases come from diverse domains including (but not limited to) publications, life sciences, social networking, government, media, linguistics. Moreover, the LOD cloud also contains a large number of crossdomain knowledge bases such as DBpedia and Yago2. These knowledge bases are commonly managed in a decentralized fashion and contain partly verlapping information. This architectural choice has led to knowledge pertaining to the same domain being published by independent entities in the LOD cloud. For example, information on drugs can be found in Diseasome as well as DBpedia and Drugbank. Furthermore, certain knowledge bases such as DBLP have been published by several bodies, which in turn has lead to duplicated content in the LOD . In addition, large amounts of geo-spatial information have been made available with the growth of heterogeneous Web of Data.
The concurrent publication of knowledge bases containing related information promises to become a phenomenon of increasing importance with the growth of the number of independent data providers. Enabling the joint use of the knowledge bases published by these providers for tasks such as federated queries, cross-ontology question answering and data integration is most commonly tackled by creating links between the resources described within these knowledge bases. Within this thesis, we spur the transition from isolated knowledge bases to enriched Linked Data sets where information can be easily integrated and processed. To achieve this goal, we provide concepts, approaches and use cases that facilitate the integration and enrichment of information with other data types that are already present on the Linked Data Web with a focus on geo-spatial data.
The first challenge that motivates our work is the lack of measures that use the geographic data for linking geo-spatial knowledge bases. This is partly due to the geo-spatial resources being described by the means of vector geometry. In particular, discrepancies in granularity and error measurements across knowledge bases render the selection of appropriate distance measures for geo-spatial resources difficult. We address this challenge by evaluating existing literature for point set measures that can be used to measure the similarity of vector geometries. Then, we present and evaluate the ten measures that we derived from the literature on samples of three real knowledge bases.
The second challenge we address in this thesis is the lack of automatic Link Discovery (LD) approaches capable of dealing with geospatial knowledge bases with missing and erroneous data. To this end, we present Colibri, an unsupervised approach that allows discovering links between knowledge bases while improving the quality of the instance data in these knowledge bases. A Colibri iteration begins by generating links between knowledge bases. Then, the approach makes use of these links to detect resources with probably erroneous or missing information. This erroneous or missing information detected by the approach is finally corrected or added.
The third challenge we address is the lack of scalable LD approaches for tackling big geo-spatial knowledge bases. Thus, we present Deterministic Particle-Swarm Optimization (DPSO), a novel load balancing technique for LD on parallel hardware based on particle-swarm optimization. We combine this approach with the Orchid algorithm for geo-spatial linking and evaluate it on real and artificial data sets. The lack of approaches for automatic updating of links of an evolving knowledge base is our fourth challenge. This challenge is addressed in this thesis by the Wombat algorithm. Wombat is a novel approach for the discovery of links between knowledge bases that relies exclusively on positive examples. Wombat is based on generalisation via an upward refinement operator to traverse the space of Link Specifications (LS). We study the theoretical characteristics of Wombat and evaluate it on different benchmark data sets.
The last challenge addressed herein is the lack of automatic approaches for geo-spatial knowledge base enrichment. Thus, we propose Deer, a supervised learning approach based on a refinement operator for enriching Resource Description Framework (RDF) data sets. We show how we can use exemplary descriptions of enriched resources to generate accurate enrichment pipelines. We evaluate our approach against manually defined enrichment pipelines and show that our approach can learn accurate pipelines even when provided with a small number of training examples.
Each of the proposed approaches is implemented and evaluated against state-of-the-art approaches on real and/or artificial data sets. Moreover, all approaches are peer-reviewed and published in a conference or a journal paper. Throughout this thesis, we detail the ideas, implementation and the evaluation of each of the approaches. Moreover, we discuss each approach and present lessons learned. Finally, we conclude this thesis by presenting a set of possible future extensions and use cases for each of the proposed approaches.
|
Page generated in 0.0645 seconds