• Refine Query
  • Source
  • Publication year
  • to
  • Language
  • 51
  • 25
  • 9
  • Tagged with
  • 84
  • 78
  • 54
  • 51
  • 51
  • 51
  • 46
  • 23
  • 15
  • 15
  • 10
  • 9
  • 8
  • 8
  • 8
  • About
  • The Global ETD Search service is a free service for researchers to find electronic theses and dissertations. This service is provided by the Networked Digital Library of Theses and Dissertations.
    Our metadata is collected from universities around the world. If you manage a university/consortium/country archive and want to be added, details can be found on the NDLTD website.
31

Local Learning Strategies for Data Management Components

Woltmann, Lucas 18 December 2023 (has links)
In a world with an ever-increasing amount of data processed, providing tools for highquality and fast data processing is imperative. Database Management Systems (DBMSs) are complex adaptive systems supplying reliable and fast data analysis and storage capabilities. To boost the usability of DBMSs even further, a core research area of databases is performance optimization, especially for query processing. With the successful application of Artificial Intelligence (AI) and Machine Learning (ML) in other research areas, the question arises in the database community if ML can also be beneficial for better data processing in DBMSs. This question has spawned various works successfully replacing DBMS components with ML models. However, these global models have four common drawbacks due to their large, complex, and inflexible one-size-fits-all structures. These drawbacks are the high complexity of model architectures, the lower prediction quality, the slow training, and the slow forward passes. All these drawbacks stem from the core expectation to solve a certain problem with one large model at once. The full potential of ML models as DBMS components cannot be reached with a global model because the model’s complexity is outmatched by the problem’s complexity. Therefore, we present a novel general strategy for using ML models to solve data management problems and to replace DBMS components. The novel strategy is based on four advantages derived from the four disadvantages of global learning strategies. In essence, our local learning strategy utilizes divide-and-conquer to place less complex but more expressive models specializing in sub-problems of a data management problem. It splits the problem space into less complex parts that can be solved with lightweight models. This circumvents the one-size-fits-all characteristics and drawbacks of global models. We will show that this approach and the lesser complexity of the specialized local models lead to better problem-solving qualities and DBMS performance. The local learning strategy is applied and evaluated in three crucial use cases to replace DBMS components with ML models. These are cardinality estimation, query optimizer hinting, and integer algorithm selection. In all three applications, the benefits of the local learning strategy are demonstrated and compared to related work. We also generalize the strategy’s usability for a broader application and formulate best practices with instructions for others.
32

SAP HANA distributed in-memory database system: Transaction, session, and metadata management

Lehner, Wolfgang, Kwon, Yong Sik, Lee, Juchang, Färber, Franz, Muehle, Michael, Lee, Chulwon, Bensberg, Christian, Lee, Joo Yeon, Lee, Arthur H. 12 January 2023 (has links)
One of the core principles of the SAP HANA database system is the comprehensive support of distributed query facility. Supporting scale-out scenarios was one of the major design principles of the system from the very beginning. Within this paper, we first give an overview of the overall functionality with respect to data allocation, metadata caching and query routing. We then dive into some level of detail for specific topics and explain features and methods not common in traditional disk-based database systems. In summary, the paper provides a comprehensive overview of distributed query processing in SAP HANA database to achieve scalability to handle large databases and heterogeneous types of workloads.
33

Ermittlung von Aspekten der Bahninfrastruktur: Ein SQL-basierter Ansatz zur Berechnung von Haltepunkten, Hauptsignalisierungen und Geschwindigkeitsbeschränkungen aus GPS-Positions- und Bewegungsdaten

Lorenz, Mark 09 January 2024 (has links)
In dieser Arbeit wird demonstriert, wie die Messreihen eines in einem Triebwagen eingesetzten GPS-Empfangsgerätes genutzt werden können, um Informationen zu Bahninfrastruktur und Bahnbetrieb im betrachteten Netz zu ermitteln. Dazu wird das relationale Datenbanksystem PostgreSQL mit dessen Erweiterung PostGIS eingesetzt. Im ersten Teil werden geografische Positionen von Bahnhöfen, Haltepunkten, Haupt-, Vor- und Langsamfahrsignalen, sowie deren signalisierte Geschwindigkeitsbeschränkungen berechnet. Es werden Algorithmen vorgestellt, die die Positionsberechnung von regelmäßig angefahrenen Bahnhöfen und Haltepunkten ebenso ermöglichen, wie die von Haupt- und Langsamfahrsignalen. Es wird gezeigt, dass mit den gewählten Ansätzen die Berechnung der Vorsignalpositionen nicht möglich ist. Darüber hinaus werden Algorithmen zur Berechnung von Halte- und Fahrzeiten an bzw. zwischen den vorher errechneten Betriebsstellen erläutert. Die gewonnenen Informationen werden im letzten Teil in einem Algorithmus genutzt, um Ankunftsprognosen einzelner Fahrten an beliebigen geografischen Stellen der Strecke erstellen zu können. GPS-Daten unterliegen verschiedenen Ungenauigkeiten, die betrachtet werden müssen, um aussagekräftige Ergebnisse liefern zu können. In der Arbeit wird deshalb ausführlich auf die Messungenauigkeiten und Messfehler der betrachteten Daten eingegangen. Ausnahmefall- und Sonderfallbetrachtungen und -behandlungen machen einen großen Teil der Lösungsentwicklungen aus.:1 Einleitung 1.1 Zielsetzung 1.1.1 Aufgabenstellung 1.1.2 Anwendungsfälle 1.2 Datenquelle 1.3 Methodik und Aufbau 1.4 Beschreibung der verwendeten Systemumgebung 2 Begriffsklärungen 3 Vergleichbare Arbeiten 3.1 GNSS zur verbesserten Echtzeitlokalisierung von Fahrzeugen 3.2 Einsatz von digitalen Karten und GIS zusätzlich zu GNSS 3.3 Vermessung von Gleisstrecken mittels GNSS 3.4 Einordnung der Arbeit 4 Beschreibung und Vorbereitung der Rohdaten 4.1 Aufbau der GPRMC-Rohdaten 4.2 Konvertierung der Rohdaten 4.2.1 Vorbereitung der Logdateien 4.2.2 Import der Logdatei 4.2.3 Anlegen von Indexes 4.2.4 Materialisierte Sichten 5 Clustering der Daten 23 5.1 Temporaler Schnitt der Daten 5.2 Ansatz 1: k-Means-Clustering 5.2.1 Definition 5.2.2 Berechnung der Cluster 5.2.3 Fazit 5.3 Ansatz 2: Dichtebasiertes Clustering 5.3.1 Definition 5.3.2 Fazit 5.4 Ansatz 3: Gruppieren nach Koordinatenwerten - Rasterbasiertes Clustering 5.4.1 Berechnung der Cluster 5.4.2 Vorteile des Verfahrens 5.4.3 Nachteile des Verfahrens 5.4.4 Fazit 5.5 Ansatz 4: Snap-To-Track 5.5.1 Vorbereitung der Daten 5.5.2 Clustering 5.5.3 Vorteile des Verfahrens 5.5.4 Nachteile des Verfahrens 5.5.5 Fazit 5.6 Vergleich: Rasterbasiertes Clustering und Snap-To-Track 5.6.1 Fazit 6 Auswertungen mit rasterbasierten Clustern 6.1 Informationen aus Durchschnittsgeschwindigkeiten 6.2 Informationen aus Maximalgeschwindigkeiten 6.3 Informationen aus Standardabweichung der Geschwindigkeiten 7 Kontextabhängige Optimierungen der Datenmenge 7.1 Reduzierung von Datensätzen mit 0 km/h-Messungen 7.2 Zusammenführung mehrerer Messreihen 7.2.1 Zusammenführung von zwei Messreihen 7.2.2 Zusammenführung von mehr als zwei Messreihen 7.2.3 Fazit 8 Berechnung von Infrastruktur 8.1 Kriterien für die zu ermittelnde Infrastruktur 8.2 Regelmäßig bediente Betriebsstellen 8.2.1 Abfrage von Referenzdaten 8.2.2 Grundlage: Rasterbasiertes Clustering 8.2.2.1 Ergebnisse 8.2.3 Grundlage: Snap-To-Track-Clustering 8.2.3.1 Ergebnisse und Nachbesserungen 8.2.4 Vergleich beider Verfahren 8.2.5 Fazit 8.3 Berechnung der Ausrichtung der Betriebsstellen 8.3.1 Vergleichsfunktion für Richtungsangaben 8.3.2 Fazit 8.4 Berechnung von Haupt- und Vorsignalen, sowie Geschwindkeitsbeschränkungen 8.4.1 Berechnung von Haupt- und Vorsignalen für eine einzelne Fahrt 8.4.1.1 Beschreibung des Algorithmus für Signale 8.4.1.2 Umsetzung des Algorithmus für Signale als Datenbankabfrage 8.4.1.3 Beschreibung des Algorithmus für Geschwindigkeitsbeschränkungen 8.4.1.4 Einordnung des Algorithmus und Fazit 8.4.2 Berechnung von Haupt- und Vorsignalen für alle Fahrten 8.4.2.1 Berechnung der Positionen der Hauptsignale 8.4.2.2 Fazit 8.4.3 Berechnung von Geschwindigkeitsbeschränkungen für alle Fahrten 8.4.3.1 Beschreibung des Algorithmus 8.4.3.2 Umsetzung des Algorithmus als Datenbankabfrage 8.4.3.3 Fazit 9 Berechnung von betrieblichen Aspekten 9.1 Haltezeiten an Betriebsstellen 9.1.1 Auswirkungen der verwendeten Clusteringverfahren und Daten auf die Haltezeitberechnungen 9.1.2 Fazit 9.2 Fahrzeit zwischen Betriebsstellen 9.2.1 Fazit 9.3 Berechnung der Entfernungen zwischen Betriebsstellen 9.3.1 Beschreibung des Algorithmus 9.3.2 Umsetzung des Algorithmus als Datenbankabfrage 9.3.3 Fazit 9.4 Einordnung einzelner Fahrten 9.4.1 Beschreibung des Algorithmus 9.4.2 Umsetzung des Algorithmus als Datenbankabfrage 9.4.3 Beschreibung eines genaueren Algorithmus 9.4.4 Umsetzung des genaueren Algorithmus als Datenbankabfrage 9.4.5 Fazit 9.5 Ankunftsprognosen 9.5.1 Umsetzung des Algorithmus als Datenbankabfrage 9.5.2 Fazit 10 Ausblick 10.1 Offene Fragen der Arbeit 10.1.1 Unregelmäßig oder nur in eine Richtung bediente Haltepunkte, Bedarfshaltepunkte 10.1.2 Nutzung der Standardabweichungen für Geschwindigkeitswerte 10.1.3 Verifikation der berechneten Signalstandorte 10.1.4 Anpassung der gespeicherten Werte 10.1.5 Gleisscharfe Abfragen 10.2 Verbesserungen der demonstrierten Abfragen 10.2.1 Optimierung der Abfrageparameter bzgl. der Genauigkeit 10.2.2 Verbesserung der Fehlertoleranz 10.3 Einbeziehung anderer Forschungsarbeiten 10.4 Big Data, Machine Learning 11 Zusammenfassung und Fazit 11.1 Zusammenfassung der Kapitel 11.2 Fazit der Arbeit Anhang / In this thesis, it is demonstrated how the measurement series of a GPS receiver of a railcar can be used to determine information on railway infrastructure and operations in the related network. For this purpose the relational database system PostgreSQL with its extension PostGIS is used. In the first part, geographic positions of stations, stops, main and approach signals as well as signalized speed limits are calculated. Algorithms are presented that allow the calculation of the positions of regularly served stations, stops and signals. It is shown that the calculation of positions of approach signals is not possible with the selected algorithms. Furthermore, algorithms for the calculation of stopping and running times at or between the previously calculated operating points are explained. The information obtained is used in the last part in an algorithm to be able to generate arrival forecasts of specific trips at arbitrary geographical on-track locations. GPS data are subject to various inaccuracies that must be considered in order to provide meaningful results. The thesis especially deals with the analysis of measurement data regarding their inaccuracies and measurement errors. Therefore, exception and edge case considerations and treatments are a large part of the process of developing appropriate solutions.:1 Einleitung 1.1 Zielsetzung 1.1.1 Aufgabenstellung 1.1.2 Anwendungsfälle 1.2 Datenquelle 1.3 Methodik und Aufbau 1.4 Beschreibung der verwendeten Systemumgebung 2 Begriffsklärungen 3 Vergleichbare Arbeiten 3.1 GNSS zur verbesserten Echtzeitlokalisierung von Fahrzeugen 3.2 Einsatz von digitalen Karten und GIS zusätzlich zu GNSS 3.3 Vermessung von Gleisstrecken mittels GNSS 3.4 Einordnung der Arbeit 4 Beschreibung und Vorbereitung der Rohdaten 4.1 Aufbau der GPRMC-Rohdaten 4.2 Konvertierung der Rohdaten 4.2.1 Vorbereitung der Logdateien 4.2.2 Import der Logdatei 4.2.3 Anlegen von Indexes 4.2.4 Materialisierte Sichten 5 Clustering der Daten 23 5.1 Temporaler Schnitt der Daten 5.2 Ansatz 1: k-Means-Clustering 5.2.1 Definition 5.2.2 Berechnung der Cluster 5.2.3 Fazit 5.3 Ansatz 2: Dichtebasiertes Clustering 5.3.1 Definition 5.3.2 Fazit 5.4 Ansatz 3: Gruppieren nach Koordinatenwerten - Rasterbasiertes Clustering 5.4.1 Berechnung der Cluster 5.4.2 Vorteile des Verfahrens 5.4.3 Nachteile des Verfahrens 5.4.4 Fazit 5.5 Ansatz 4: Snap-To-Track 5.5.1 Vorbereitung der Daten 5.5.2 Clustering 5.5.3 Vorteile des Verfahrens 5.5.4 Nachteile des Verfahrens 5.5.5 Fazit 5.6 Vergleich: Rasterbasiertes Clustering und Snap-To-Track 5.6.1 Fazit 6 Auswertungen mit rasterbasierten Clustern 6.1 Informationen aus Durchschnittsgeschwindigkeiten 6.2 Informationen aus Maximalgeschwindigkeiten 6.3 Informationen aus Standardabweichung der Geschwindigkeiten 7 Kontextabhängige Optimierungen der Datenmenge 7.1 Reduzierung von Datensätzen mit 0 km/h-Messungen 7.2 Zusammenführung mehrerer Messreihen 7.2.1 Zusammenführung von zwei Messreihen 7.2.2 Zusammenführung von mehr als zwei Messreihen 7.2.3 Fazit 8 Berechnung von Infrastruktur 8.1 Kriterien für die zu ermittelnde Infrastruktur 8.2 Regelmäßig bediente Betriebsstellen 8.2.1 Abfrage von Referenzdaten 8.2.2 Grundlage: Rasterbasiertes Clustering 8.2.2.1 Ergebnisse 8.2.3 Grundlage: Snap-To-Track-Clustering 8.2.3.1 Ergebnisse und Nachbesserungen 8.2.4 Vergleich beider Verfahren 8.2.5 Fazit 8.3 Berechnung der Ausrichtung der Betriebsstellen 8.3.1 Vergleichsfunktion für Richtungsangaben 8.3.2 Fazit 8.4 Berechnung von Haupt- und Vorsignalen, sowie Geschwindkeitsbeschränkungen 8.4.1 Berechnung von Haupt- und Vorsignalen für eine einzelne Fahrt 8.4.1.1 Beschreibung des Algorithmus für Signale 8.4.1.2 Umsetzung des Algorithmus für Signale als Datenbankabfrage 8.4.1.3 Beschreibung des Algorithmus für Geschwindigkeitsbeschränkungen 8.4.1.4 Einordnung des Algorithmus und Fazit 8.4.2 Berechnung von Haupt- und Vorsignalen für alle Fahrten 8.4.2.1 Berechnung der Positionen der Hauptsignale 8.4.2.2 Fazit 8.4.3 Berechnung von Geschwindigkeitsbeschränkungen für alle Fahrten 8.4.3.1 Beschreibung des Algorithmus 8.4.3.2 Umsetzung des Algorithmus als Datenbankabfrage 8.4.3.3 Fazit 9 Berechnung von betrieblichen Aspekten 9.1 Haltezeiten an Betriebsstellen 9.1.1 Auswirkungen der verwendeten Clusteringverfahren und Daten auf die Haltezeitberechnungen 9.1.2 Fazit 9.2 Fahrzeit zwischen Betriebsstellen 9.2.1 Fazit 9.3 Berechnung der Entfernungen zwischen Betriebsstellen 9.3.1 Beschreibung des Algorithmus 9.3.2 Umsetzung des Algorithmus als Datenbankabfrage 9.3.3 Fazit 9.4 Einordnung einzelner Fahrten 9.4.1 Beschreibung des Algorithmus 9.4.2 Umsetzung des Algorithmus als Datenbankabfrage 9.4.3 Beschreibung eines genaueren Algorithmus 9.4.4 Umsetzung des genaueren Algorithmus als Datenbankabfrage 9.4.5 Fazit 9.5 Ankunftsprognosen 9.5.1 Umsetzung des Algorithmus als Datenbankabfrage 9.5.2 Fazit 10 Ausblick 10.1 Offene Fragen der Arbeit 10.1.1 Unregelmäßig oder nur in eine Richtung bediente Haltepunkte, Bedarfshaltepunkte 10.1.2 Nutzung der Standardabweichungen für Geschwindigkeitswerte 10.1.3 Verifikation der berechneten Signalstandorte 10.1.4 Anpassung der gespeicherten Werte 10.1.5 Gleisscharfe Abfragen 10.2 Verbesserungen der demonstrierten Abfragen 10.2.1 Optimierung der Abfrageparameter bzgl. der Genauigkeit 10.2.2 Verbesserung der Fehlertoleranz 10.3 Einbeziehung anderer Forschungsarbeiten 10.4 Big Data, Machine Learning 11 Zusammenfassung und Fazit 11.1 Zusammenfassung der Kapitel 11.2 Fazit der Arbeit Anhang
34

Ontology-Mediated Query Answering over Log-Linear Probabilistic Data: Extended Version

Borgwardt, Stefan, Ceylan, Ismail Ilkan, Lukasiewicz, Thomas 28 December 2023 (has links)
Large-scale knowledge bases are at the heart of modern information systems. Their knowledge is inherently uncertain, and hence they are often materialized as probabilistic databases. However, probabilistic database management systems typically lack the capability to incorporate implicit background knowledge and, consequently, fail to capture some intuitive query answers. Ontology-mediated query answering is a popular paradigm for encoding commonsense knowledge, which can provide more complete answers to user queries. We propose a new data model that integrates the paradigm of ontology-mediated query answering with probabilistic databases, employing a log-linear probability model. We compare our approach to existing proposals, and provide supporting computational results.
35

Methoden zur Unterstützung der klinischen Entscheidungsfindung in der Nierentransplantation

Fritsche, Lutz 07 July 2004 (has links)
In dieser Arbeit sollen die Vermittelbarkeit der notwendigen methodischen Fähigkeiten zur Anwendung der EbM in der klinischen Entscheidungsfindung sowie die Qualität der dazu unverzichtbaren Publikationen klinischer Studien für das Gebiet der Nierentransplantation untersucht werden. Des Weiteren sollen angesichts der für viele Fragen nicht vorhandenen Studienergebnisse alternative Verfahren der Gewinnung von klinisch entscheidungsrelevanten Erkenntnissen in der Nierentransplantationsmedizin untersucht werden. Liegen in einer Entscheidungssituation relevante Ergebnisse qualitativ adäquater randomisierter Studien vor, sollte die Entscheidung auf diese Ergebnisse gestützt werden. Die klinische Entscheidungsfindung kann auf verschiedenen Wegen unterstützt werden. Der Königsweg ist die auf Erkenntnissen der Grundlagenforschung fußende randomisierte Studie. Deren Nutzung erfordert jedoch eine leitliniengemäße Publikation und auf Seiten des Lesers entsprechendes Methodenwissen zur Interpretation der Ergebnisse. Komplementäre Methoden, insbesondere Analysen klinischer Datenbanken können die aus randomisierten Studien stammenden Entscheidungsgrundlagen sinnvoll ergänzen und die Durchführung weiterer randomisierter Studien vorbereiten. Auf diesem Hintergrund erscheint es auch für den Bereich der Nierentransplantation sinnvoll, die bestehende Datenbasis konsequent weiter auszubauen. / This work aims to investigate the communicability of the necessary skills for the application of Evidence-based Medicine in everyday clinical decision making. In addition the publication quality and design of clinical trials in the field of kidney transplantation are observed. In this context and on the background of the lack of clinically relevant study data for many important aspects of transplantation medicine alternative methods of knowledge generation to support clinical decision making are assessed. Whenever results of adequate prospective randomized trials are available clinical decision making should take these into account. But clinical decision making can be supported in various ways. The best way is the conduction of randomized clinical trials based on the results of basic science investigations. Use of randomized trial results requires their guideline-conforming publication and on the reader’s side the corresponding methodological skills for the critical interpretation and assessment of the scientific medical literature. Complementary methods - especially analyses of clinical databases can achieve substantial enhancement of the foundation for clinical decision making. They can also help to prepare the conduct of further randomized studies. Thus, as in other fields it seems worthwile to expand the existing databases in the field of kidney transplantation.
36

Lexical resources in psycholinguistic research

January 2012 (has links)
Experimental and quantitative research in the field of human language processing and production strongly depends on the quality of the underlying language material: beside its size, representativeness, variety and balance have been discussed as important factors which influence design, analysis and interpretation of experiments and their results. This volume brings together creators and users of both general purpose and specialized lexical resources which are used in psychology, psycholinguistics, neurolinguistics and cognitive research. It aims to be a forum to report experiences and results, review problems and discuss perspectives of any linguistic data used in the field. / Experimentelle und quantitative Forschung im Bereich der menschlichen Sprachverarbeitung und -produktion hängt wesentlich von der Qualität des zugrundeliegenden Sprachmaterials ab: Neben dessen Umfang wurden auch Repräsentativität, Vielfalt und Ausgewogenheit als wichtige Einflüsse auf Design, Analyse und Interpretation entsprechender Experimente und deren Ergebnisse diskutiert. Der vorliegende Band enthält Arbeiten von Entwicklern und Anwendern sowohl allgemeiner als auch spezialisierter lexikalischer Ressourcen aus den Bereichen Psychologie, Psycho-, Neurolinguistik und Kongitionswissenschaften. Ziel ist es anhand der dargestellten Ergebnisse Probleme und Perspektiven bei der Arbeit mit linguistischen Daten aufzuzeigen.
37

Vergleich von Lösungsvarianten zur Automatisierung von Geschäftsvorgängen im URZ

Hüttmann, Jörg 14 June 1999 (has links)
Die Arbeit diskutiert Lösungsvarianten und beschreibt die Implementation eines Prototyps zur Re-Organisation der Nutzerverwaltung des URZ. Besondere Schwerpunkte liegen auf der Erstellung eines Web-Interfaces zur Datenverwaltung und auf der Untersuchung relationaler Datenbanksysteme hinsichtlich der Eignung zur Lösung der Aufgabe. Der Prototyp stellt lediglich eine beispielhafte Implementierung einiger Teilkomplexe des Gesamtsystems dar.
38

Distribution of plant functional traits in a range of grassland formations differing in water and nitrogen availability / A comparison using the SynBioSys and BiolFlor databases / Verteilung funktionaler Pflanzenmerkmale in ausgewählten Grünlandgesellschaften, die sich in ihrer Wasser- und Stickstoffverfügbarkeit unterscheiden / Ein Vergleich mit den Datenbanken SynBioSys und BiolFlor

Kuhl, Eva-Maria 04 September 2009 (has links)
No description available.
39

Mitteilungen des URZ 3/1999

Clauß,, Dippmann,, Heik,, Hübsch,, Kempe,, Müller,, Seeger,, Ziegler, 14 September 1999 (has links)
Inhalt: Neuregelungen zur Inanspruchnahme kostenpflichtiger URZ-Dienste; Administrationsdienst für Windows NT und RedHat Linux; Aufbau eines Linux-Clusters am Institut für Physik; Neue AFS-Version verfügbar; Neues von MONARCH; Recherchieren von Datenbanken im Uni-Netz; ¨Zertifikat Internet-Nutzung¨ der TU Chemnitz
40

Mitteilungen des URZ 4/2007

Clauß, Matthias, Müller, Thomas, Dr. Riedel, Wolfgang, Ziegler, Christoph, Schmidt, Ronald, Fischer, Günther, Dippmann, Dagmar 03 December 2007 (has links)
Informationen des Universitätsrechenzentrums

Page generated in 0.0658 seconds