91 |
Objektorientierte Sichten zur Integration statisch getypter ObjektbankenBusse, Ralph. Unknown Date (has links)
Techn. Universiẗat, Diss., 2004--Darmstadt.
|
92 |
Allocation Strategies for Data-Oriented ArchitecturesKiefer, Tim 12 January 2016 (has links) (PDF)
Data orientation is a common design principle in distributed data management systems. In contrast to process-oriented or transaction-oriented system designs, data-oriented architectures are based on data locality and function shipping. The tight coupling of data and processing thereon is implemented in different systems in a variety of application scenarios such as data analysis, database-as-a-service, and data management on multiprocessor systems. Data-oriented systems, i.e., systems that implement a data-oriented architecture, bundle data and operations together in tasks which are processed locally on the nodes of the distributed system. Allocation strategies, i.e., methods that decide the mapping from tasks to nodes, are core components in data-oriented systems. Good allocation strategies can lead to balanced systems while bad allocation strategies cause skew in the load and therefore suboptimal application performance and infrastructure utilization. Optimal allocation strategies are hard to find given the complexity of the systems, the complicated interactions of tasks, and the huge solution space. To ensure the scalability of data-oriented systems and to keep them manageable with hundreds of thousands of tasks, thousands of nodes, and dynamic workloads, fast and reliable allocation strategies are mandatory. In this thesis, we develop novel allocation strategies for data-oriented systems based on graph partitioning algorithms.
Therefore, we show that systems from different application scenarios with different abstraction levels can be generalized to generic infrastructure and workload descriptions. We use weighted graph representations to model infrastructures with bounded and unbounded, i.e., overcommited, resources and possibly non-linear performance characteristics. Based on our generalized infrastructure and workload model, we formalize the allocation problem, which seeks valid and balanced allocations that minimize communication. Our allocation strategies partition the workload graph using solution heuristics that work with single and multiple vertex weights. Novel extensions to these solution heuristics can be used to balance penalized and secondary graph partition weights. These extensions enable the allocation strategies to handle infrastructures with non-linear performance behavior. On top of the basic algorithms, we propose methods to incorporate heterogeneous infrastructures and to react to changing workloads and infrastructures by incrementally updating the partitioning. We evaluate all components of our allocation strategy algorithms and show their applicability and scalability with synthetic workload graphs. In end-to-end--performance experiments in two actual data-oriented systems, a database-as-a-service system and a database management system for multiprocessor systems, we prove that our allocation strategies outperform alternative state-of-the-art methods.
|
93 |
Multi-Schema-Version Data ManagementHerrmann, Kai 19 December 2017 (has links) (PDF)
Modern agile software development methods allow to continuously evolve software systems by easily adding new features, fixing bugs, and adapting the software to changing requirements and conditions while it is continuously used by the users. A major obstacle in the agile evolution is the underlying database that persists the software system’s data from day one on. Hence, evolving the database schema requires to evolve the existing data accordingly—at this point, the currently established solutions are very expensive and error-prone and far from agile.
In this thesis, we present InVerDa, a multi-schema-version database system to facilitate agile database development. Multi-schema-version database systems provide multiple schema versions within the same database, where each schema version itself behaves like a regular single-schema database. Creating new schema versions is very simple to provide the desired agility for database development. All created schema versions can co-exist and write operations are immediately propagated between schema versions with a best-effort strategy. Developers do not have to implement the propagation logic of data accesses between schema versions by hand, but InVerDa automatically generates it.
To facilitate multi-schema-version database systems, we equip developers with a relational complete and bidirectional database evolution language (BiDEL) that allows to easily evolve existing schema versions to new ones. BiDEL allows to express the evolution of both the schema and the data both forwards and backwards in intuitive and consistent operations; the BiDEL evolution scripts are orders of magnitude shorter than implementing the same behavior with standard SQL and are even less likely to be erroneous, since they describe a developer’s intention of the evolution exclusively on the level of tables without further technical details. Having the developers’ intentions explicitly given in the BiDEL scripts further allows to create a new schema version by merging already existing ones.
Having multiple co-existing schema versions in one database raises the need for a sophisticated physical materialization. Multi-schema-version database systems provide full data independence, hence the database administrator can choose a feasible materialization, whereby the multi-schema-version database system internally ensures that no data is lost. The search space of possible materializations can grow exponentially with the number of schema versions. Therefore, we present an adviser that releases the database administrator from diving into the complex performance characteristics of multi-schema-version database systems and merely proposes an optimized materialization for a given workload within seconds. Optimized materializations have shown to improve the performance for a given workload by orders of magnitude.
We formally guarantee data independence for multi-schema-version database systems. To this end, we show that every single schema version behaves like a regular single-schema database independent of the chosen physical materialization. This important guarantee allows to easily evolve and access the database in agile software development—all the important features of relational databases, such as transaction guarantees, are preserved. To the best of our knowledge, we are the first to realize such a multi-schema-version database system that allows agile evolution of production databases with full support of co-existing schema versions and formally guaranteed data independence.
|
94 |
Analyse der Evolution von Mappings anhand ausgewählter Matchprobleme in den LebenswissenschaftenChyhir, Anastasiya 23 January 2018 (has links)
Heute werden gleiche Themen durch verschiedene Nutzer bearbeitet, deshalb entstehen unterschiedliche Darstellungen desselben Sachverhalts. Um eine einheitliche Repräsentation von Daten zu ermöglichen, werden Ontologien verwendet. Ontologien stellen einen strukturierten gerichteten Graphen dar, dessen Knoten und Kanten jeweils die Konzepte und Beziehungen innerhalb einer Domäne repräsentieren.
In den Lebenswissenschaften existieren zahlreiche große Ontologien wie z.B. CHEBI, NCI Thesaurus (The National Cancer Institute Thesaurus), GO (Gene Ontology). Da die Ontologien weiterentwickelt und wiederverwendet werden sollen, ist es wichtig, eine einheitliche und verständliche Syntax zu verwenden.
|
95 |
Parallele Kürzung von Rang-k-MatrizenDrechsler, Florian 23 January 2018 (has links)
Die Kürzung einer Rang-k-Matrix ist ein wichtiger Bestandteil der Technik der Hierarchischen Matrizen. In dieser Arbeit untersuchen wir zwei verschiedene Kürzungsalgorithmen auf ihre Parallelisierbarkeit. Zuerst werden wir die sequentiellen Versionen der Algorithmen einführen, ihre Komplexitat untersuchen und diese Ergebnisse in numerischen Experimenten validieren. Danach parallelisieren wir beide Algorithmen und untersuchen ihr Laufzeitverhalten theoretisch und anhand von numerischen Experimenten auf Rechensystemen mit verteiltem und geteiltem Speicher. Es zeigt sich, dass beide Algorithmen gut parallelisierbar sind, wobei wir bei Rechensystemen mit verteiltem Speicher die Anzahl der verwendeten Prozessoren an die Groesse der zu kuerzenden Matrix anpassen sollten, damit wir einen linearen Speedup erreichen.
|
96 |
Aufbau einer Infrastruktur zur Analyse von Massenspektrometrie-Daten am UFZJakob, Kevin 26 February 2018 (has links)
Heutige naturwissenschaftliche Forschung, beispielsweise in Biologie oder Chemie, ist ohne die Unterstützung durch informationstechnische Systeme nicht realisierbar. Verbesserte Verfahren und Messegeräte ermöglichen detailliertere Erkenntnisse und erzeugen dabei signifikante Datenmengen, die ohne IT-Systeme nicht mehr effizient verarbeitet und verwaltet werden können. Die Datenmengen wachsen kontinuierlich und mit ihnen die Komplexität durchzuführender wissenschaftlicher Berechnungen. Diese Berechnungen und das damit verbundene Lösen komplexer wissenschaftlicher Probleme sind weitere Gründe für die Notwendigkeit dieser Systeme.
|
97 |
Untersuchung und Realisierung von Modulen zur Verwaltung der Netzwerkkomponenten im CampusrechnernetzBachmann, Heiko 05 September 2001 (has links)
In dieser Arbeit wird das Komponentenmanagementsystem CCM, der Aufbau der zugrunde liegenden Datenbank sowie seine Benutzerschnittstelle analysiert. Ansätze, ein neues flexibleres und kostengünstigeres System durch Verwendung von Open Source-Software wie PHP und MySQL zu schaffen, werden untersucht. Es wird gezeigt, daß ein solches System realisierbar ist. Seine anfänglichen Einschränkungen und zukünftige Lösungsmöglichkeiten werden dargestellt. Die Phase der Datenmigration wird erörtert und ein Plan zum schrittweisen Übergang von der bestehenden zu einer neuen Komponentenverwaltung erstellt.
Während der Entwurfsphase werden Richtlinien für die Benutzerschnittstellen- und Programmcodegestaltung gesetzt und eine grundlegende modulare Systemarchitektur mit Hilfe eines objektorientierten Ansatzes zur Umsetzung der geforderten Erweiterbarkeit erarbeitet. Die entwickelten Schnittstellen werden implementiert und aufbauend auf sie die Kernalgorithmen von CCM portiert und erweitert.
Mit dem Abschluß dieser Arbeit steht ein einsatzbereites modulares und insbesondere kostenfreies System zur Produkt-, Komponenten- und Inventarverwaltung der Netzwerkkomponenten der TU Chemnitz bereit
, welches die Arbeitsaufgaben dieser Bereiche mit den aus CCM übernommenen Daten teilweise schneller oder effizienter erfüllen kann. Seine Schnittstellen werden schnelle und einfache Anpassungen und Erweiterungen der Datensichten ermöglichen.
|
98 |
Indexierung semistrukturierter DatenFiedler, Gunar 10 October 2002 (has links)
Based on the increased usage of heterogeneous information systems semistructural data models became more important in database technology.
This thesis explains the basics of query processing in semistructural environments and discusses the possibilities of alternative access structures.
In conjunction with these results two kinds of indexes are specified for the semistructural DBMS WebBus: path indexes and property indexes. These indexes are providing an efficient way for accessing data stored in the DBMS. / Bedingt durch die zunehmende Nutzung heterogener Informationssysteme gewinnt die semistrukturierte Datenmodellierung stetig an Bedeutung.
Diese Arbeit setzt sich mit den Grundlagen der Anfrageverarbeitung in semistrukturierten Umgebungen auseinander und diskutiert die Möglichkeiten alternativer Zugriffspfade.
Darauf aufbauend werden für das semistrukturierte Datenbank-Management-System WebBus Pfad- und Eigenschaftsindexe spezifiziert, die einen effizienten Zugriff auf die Daten des DBMS erlauben.
|
99 |
Ein Netzwerk- User- und Systemmanagementwerkzeug zur Unterstützung der Administration in kleineren bis mittleren UnternehmensnetzenSchreiber, Alexander 16 September 2002 (has links)
Im Kontext eines kleinen bis mittleren heterogenen Netzes
(Software/Hardware) soll nach Analyse und Bewertung vorhandener
Lösungen und Hilfsmittel ein modulares System zur Unterstützung der
Administration von Hosts, Nutzern und Software entworfen und
implementiert werden. Da aufgrund des zeitlichen Rahmens einer
Diplomarbeit nur eine begrenzte Lösung möglich ist, soll das System
von vornherein modular und auf einfache Erweiterbarkeit ausgelegt
werden. Im Rahmen der Arbeit sollen existierende Lösungsansätze und
Hilfsmittel aus dem Bereich der Administrationshilfen untersucht und
gegebenenfalls auf ihre Weiterverwendbarkeit in diesem Projekt geprüft
werden. Die dabei gewonnenen Erkenntnisse (u.a. in Bezug auf
Flexibilität und Wiederverwendbarkeit) sollen in das zu erstellende
System einfließen.
|
100 |
PostGIS -Freie Geodaten in Freien DatenbankenPönisch, Jens 23 November 2010 (has links)
Der Vortrag erläutert die Verwaltung von Geometrie- und geographischen Daten nach der OpenGIS-Spezifikation in der Datenbank PostgreSQL/PostGIS.
Schwerpunkte sind Installation, geometrische Datentypen, Eingabe und einfache Abfragen, Abfrage von Objektbeziehungen, Indices und Aggregatfunktionen. Auf die Verwendung von geographischen Bezugssystemen, die Verwendung in OpenStreetMap und die Schnittstellen zu Programmiersprachen wird ebenfalls eingegangen.
|
Page generated in 0.0615 seconds