Global ETD Search

41	Optimierte Visualisierung auf segmentierten Anzeigen Lorenz, Mario 27 July 2005 (has links) (PDF) Diese Arbeit beschreibt den Entwurf und die Funktionsweise einer parallelen OpenGL-Renderingschnittstelle, die den effizienten Betrieb unmodifizierter graphischer Anwendungen auf segmentierten Anzeigen ermöglicht. Diese Schnittstelle integriert sich vollständig in eine verteilte graphische Benutzeroberfläche. Die herausragende Eigenschaft der entwickelten parallelen OpenGL-Schnittstelle ist ihre gleich bleibende Bildrate bei wachsender Anzahl von Segmenten. Als Erweiterung des frei verfügbaren Chromium-Systems stellt die Implementation eine virtuelle Graphikpipeline mit der Gesamtauflösung der segmentierten Anzeige bereit, die den eingehenden Datenstrom über ein Kommunikationsnetzwerk an die Knoten eines Visualisierungsclusters überträgt. Jeder Knoten des Clusters rendert einen Ausschnitt des Gesamtbildes und bringt diesen auf dem zugehörigen Segment synchronisiert zur Anzeige. Die interne Verarbeitung der von der Applikation generierten OpenGL-Datenströme unterscheidet sich jedoch grundlegend von der existierenden Lösung. Während die Tilesort-SPU von Chromium die Daten entsprechend der Segmentierung der Anzeige sortiert und sequenziell an die relevanten Knoten versendet, überträgt die in der Arbeit vorgestellte Schnittstelle die Graphikbefehle simultan. Die dadurch erreichte Vermeidung redundanter Übertragungen bewirkt bereits einen besseren Durchsatz der Kommunikationskanäle und zusätzlich eine signifikante Verringerung der Prozessorbelastung des Applikationsrechners. Die freie gewordene Kapazität schafft wiederum die Voraussetzung für die Anwendung verschiedener Optimierungsverfahren zur weiteren Steigerung der graphischen Gesamtleistung der parallelen Schnittstelle. Dazu zählt neben der Zwischenspeicherung von Datensequenzen in einem Stream Cache die Filterung der OpenGL-Kommandoströme mit graphischen Culling-Verfahren. Speziell zum aktiv-stereoskopischen Rendern auf dem an der Professur vorhandenen zylindrischen Projektionssystem enthält die Schnittstelle Anpassungen für die Synchronisationshardware und die bildbasierte Korrektur der Parallaxe. Culling Multicast OpenGL Sort-First Architektur Stream Caching Visualisierungscluster parallelisierte Renderingschnittstelle segmentierte Anzeige tiled display ddc:004 Parallelisierung Rendering Visualisierung
42	Parallele Genetische Algorithmen Riedel, Marion 08 May 2002 (has links) The paper "Parallel Genetic Algorithms" discusses the theoretical basics of Evolutionary Algorithms concentrating on Genetic Algorithms. Possibilities for a parallelization of these algorithms are examined and explained on the basis of concepts of parallel programming. A concrete suggestion for a practical realization of a parallel Genetic Algorithm at different levels of complexity is presented. / Die Studienarbeit zum Thema "Parallele Genetische Algorithmen" befasst sich mit den theoretischen Grundlagen Evolutionärer Algorithmen, wobei die Konzentration bei Genetischen Algorithmen liegt, und untersucht die Möglichkeiten einer parallelen Realisierung dieser Algorithmen. Des weiteren werden Konzepte der Parallelen Programmierung diskutiert sowie ein konkreter Vorschlag zur praktischen Realisierung eines parallelen Genetischen Algorithmus' auf verschiedenen Komplexitätsebenen vorgestellt. info:eu-repo/classification/ddc/004 ddc:004 Paralleler Algorithmus Genetischer Algorithmus Evolutionärer Algorithmus Parallelrechner Parallelisierung Genetic Algorithm Evolutionary Algorithm
43	Parallelisierung des Indexaufbaus im ICIx System Krumbiegel, Stefan 29 July 2001 (has links) Es werden die Möglichkeiten zur Parallelisierung des Algorithmus zum Indexaufbau im ICIx System untersucht. Ausgehend von der Vorstellung dieses Algorithmus erfolgt zuerst die Erläuterung des verwendeten Kostenmodells. Nach einer Zerlegung des gesamten Trainingsprozesses in Teilschritte werden diese hinsichtlich der zu erwartenden Beschleunigung des Trainings untersucht. info:eu-repo/classification/ddc/004 ddc:004 Parallelisierung Neuronales Netz Datenbanksystem Cluster <Rechnernetz> Automatische Indexierung
44	Parallele Genetische Algorithmen mit Anwendungen Riedel, Marion 25 October 2002 (has links) The diploma thesis with the subject ¨Parallel Genetic Algorithms with Applications¨ deals with the parallelization of Genetic Algorithms for the creation of efficient optimization methods especially for simulation based application problems. First, an introduction to Genetic Algorithms and an overview of possible parallelization approaches as well as already published results of research are given. This is followed by a detailed explanation of the conception and realization of own Parallel Genetic Algorithms. The paper is rounded off by an particularized description of the results of extensive test runs on the Chemnitzer Linux-Cluster (CLiC). / Die Diplomarbeit zum Thema ¨Parallele Genetische Algorithmen mit Anwendungen¨ befasst sich mit der Parallelisierung Genetischer Algorithmen zur Erzeugung effizienter Optimierungsverfahren für insbesondere simulationsbasierte Anwendungsprobleme. Zunächst werden eine Einführung in Genetische Algorithmen sowie ein Überblick über mögliche Parallelisierungsansätze und bereits veröffentlichte Forschungsergebnisse gegeben. Dem schließt sich eine detaillierte Erläuterung der Konzeption und Umsetzung eigener Paralleler Genetischer Algorithmen an. Abgerundet wird die Arbeit durch eine ausführliche Darstellung der Ergebnisse umfangreicher Testläufe auf dem Chemnitzer Linux-Cluster (CLiC). info:eu-repo/classification/ddc/004 ddc:004 Cluster Parallelisierung Parallelrechner Parallelverarbeitung / Programmierung Paralleler Algorithmus Evolutionärer Algorithmus Genetischer Algorithmus
45	Inline-Qualitätsüberwachung beschichteter, metallischer Bipolarplatten nach dem Umformprozess Wiener, Thomas, Pierer, Alexander, Gjakova, Leutrim, Hoffmann, Michael, Barthel, Sven 25 November 2019 (has links) Metallische Bipolarplatten (BPP) rücken immer mehr in den Fokus der Forschung. Daher stellt die Entwicklung geeigneter Methoden zur Inline-Qualitätsüberwachung eine wichtige Aufgabe dar. So sind unterschiedliche Beschichtungsverfahren und -strategien in der Entwicklung, die verschiedene funktionelle Eigenschaften des Produktes ermöglichen sollen. Sowohl nach dem Beschichtungsprozess, als auch dem nachgelagerten Umformprozess muss die Realisierung einer homogenen und fehlerfreien Schutzschicht gewährleistet sein. Die notwendige lückenlose Überprüfung der Oberflächen erzeugt dabei aufgrund der erforderlichen optischen Analyse in Verbindung mit angestrebten hohen Durchsatzraten in der Produktion große Datenmengen zur Auswertung. Um die Fehlererkennung im Produktionstakt zu ermöglichen, kommen massiv parallele Hardwarestrukturen (Multi-Core-CPUs, GPUs) zum Einsatz. Zusätzlich zu den Hardwarestrukturen werden auch dafür optimierte Auswertungsverfahren zur Erkennung BPP-spezifischer Oberflächen- und Beschichtungsfehler benötigt. Mit Hilfe optischer Sensorik können neben Mikrorissen in der Grundstruktur auch Schichtdefekte in der Oberfläche im Takt detektiert werden. Somit wird die Weitergabe defekter BPP an die Montage erfolgreich verhindert. Inline-Qualitätsüberwachung info:eu-repo/classification/ddc/000 ddc:000 info:eu-repo/classification/ddc/620 ddc:620 Bipolarplatte; Parallelisierung
46	Software concepts and algorithms for an efficient and scalable parallel finite element method Witkowski, Thomas 19 December 2013 (has links) Software packages for the numerical solution of partial differential equations (PDEs) using the finite element method are important in different fields of research. The basic data structures and algorithms change in time, as the user\'s requirements are growing and the software must efficiently use the newest highly parallel computing systems. This is the central point of this work. To make efficiently use of parallel computing systems with growing number of independent basic computing units, i.e.~CPUs, we have to combine data structures and algorithms from different areas of mathematics and computer science. Two crucial parts are a distributed mesh and parallel solver for linear systems of equations. For both there exists multiple independent approaches. In this work we argue that it is necessary to combine both of them to allow for an efficient and scalable implementation of the finite element method. First, we present concepts, data structures and algorithms for distributed meshes, which allow for local refinement. The central point of our presentation is to provide arbitrary geometrical information of the mesh and its distribution to the linear solver. A large part of the overall computing time of the finite element method is spend by the linear solver. Thus, its parallelization is of major importance. Based on the presented concept for distributed meshes, we preset several different linear solver methods. Hereby we concentrate on general purpose linear solver, which makes only little assumptions about the systems to be solver. For this, a new FETI-DP (Finite Element Tearing and Interconnect - Dual Primal) method is proposed. Those the standard FETI-DP method is quasi optimal from a mathematical point of view, its not possible to implement it efficiently for a large number of processors (> 10,000). The main reason is a relatively small but globally distributed coarse mesh problem. To circumvent this problem, we propose a new multilevel FETI-DP method which hierarchically decompose the coarse grid problem. This leads to a more local communication pattern for solver the coarse grid problem and makes it possible to scale for a large number of processors. Besides the parallelization of the finite element method, we discuss an approach to speed up serial computations of existing finite element packages. In many computations the PDE to be solved consists of more than one variable. This is especially the case in multi-physics modeling. Observation show that in many of these computation the solution structure of the variables is different. But in the standard finite element method, only one mesh is used for the discretization of all variables. We present a multi-mesh finite element method, which allows to discretize a system of PDEs with two independently refined meshes. / Softwarepakete zur numerischen Lösung partieller Differentialgleichungen mit Hilfe der Finiten-Element-Methode sind in vielen Forschungsbereichen ein wichtiges Werkzeug. Die dahinter stehenden Datenstrukturen und Algorithmen unterliegen einer ständigen Neuentwicklung um den immer weiter steigenden Anforderungen der Nutzergemeinde gerecht zu werden und um neue, hochgradig parallel Rechnerarchitekturen effizient nutzen zu können. Dies ist auch der Kernpunkt dieser Arbeit. Um parallel Rechnerarchitekturen mit einer immer höher werdenden Anzahl an von einander unabhängigen Recheneinheiten, z.B.~Prozessoren, effizient Nutzen zu können, müssen Datenstrukturen und Algorithmen aus verschiedenen Teilgebieten der Mathematik und Informatik entwickelt und miteinander kombiniert werden. Im Kern sind dies zwei Bereiche: verteilte Gitter und parallele Löser für lineare Gleichungssysteme. Für jedes der beiden Teilgebiete existieren unabhängig voneinander zahlreiche Ansätze. In dieser Arbeit wird argumentiert, dass für hochskalierbare Anwendungen der Finiten-Elemente-Methode nur eine Kombination beider Teilgebiete und die Verknüpfung der darunter liegenden Datenstrukturen eine effiziente und skalierbare Implementierung ermöglicht. Zuerst stellen wir Konzepte vor, die parallele verteile Gitter mit entsprechenden Adaptionstrategien ermöglichen. Zentraler Punkt ist hier die Informationsaufbereitung für beliebige Löser linearer Gleichungssysteme. Beim Lösen partieller Differentialgleichung mit der Finiten Elemente Methode wird ein großer Teil der Rechenzeit für das Lösen der dabei anfallenden linearen Gleichungssysteme aufgebracht. Daher ist deren Parallelisierung von zentraler Bedeutung. Basierend auf dem vorgestelltem Konzept für verteilten Gitter, welches beliebige geometrische Informationen für die linearen Löser aufbereiten kann, präsentieren wir mehrere unterschiedliche Lösermethoden. Besonders Gewicht wird dabei auf allgemeine Löser gelegt, die möglichst wenig Annahmen über das zu lösende System machen. Hierfür wird die FETI-DP (Finite Element Tearing and Interconnect - Dual Primal) Methode weiterentwickelt. Obwohl die FETI-DP Methode vom mathematischen Standpunkt her als quasi-optimal bezüglich der parallelen Skalierbarkeit gilt, kann sie für große Anzahl an Prozessoren (> 10.000) nicht mehr effizient implementiert werden. Dies liegt hauptsächlich an einem verhältnismäßig kleinem aber global verteilten Grobgitterproblem. Wir stellen eine Multilevel FETI-DP Methode vor, die dieses Problem durch eine hierarchische Komposition des Grobgitterproblems löst. Dadurch wird die Kommunikation entlang des Grobgitterproblems lokalisiert und die Skalierbarkeit der FETI-DP Methode auch für große Anzahl an Prozessoren sichergestellt. Neben der Parallelisierung der Finiten-Elemente-Methode beschäftigen wir uns in dieser Arbeit mit der Ausnutzung von bestimmten Voraussetzung um auch die sequentielle Effizienz bestehender Implementierung der Finiten-Elemente-Methode zu steigern. In vielen Fällen müssen partielle Differentialgleichungen mit mehreren Variablen gelöst werden. Sehr häufig ist dabei zu beobachten, insbesondere bei der Modellierung mehrere miteinander gekoppelter physikalischer Phänomene, dass die Lösungsstruktur der unterschiedlichen Variablen entweder schwach oder vollständig voneinander entkoppelt ist. In den meisten Implementierungen wird dabei nur ein Gitter zur Diskretisierung aller Variablen des Systems genutzt. Wir stellen eine Finite-Elemente-Methode vor, bei der zwei unabhängig voneinander verfeinerte Gitter genutzt werden können um ein System partieller Differentialgleichungen zu lösen. info:eu-repo/classification/ddc/510 ddc:510
47	Advanced Concepts for Automatic Differentiation based on Operator Overloading Kowarz, Andreas 28 March 2008 (has links) (PDF) Mit Hilfe der Technik des Automatischen Differenzierens (AD) lassen sich für Funktionen, die als Programmquellcode gegeben sind, Ableitungsinformationen rechentechnisch effizient und mit geringem Aufwand für den Nutzer bereitstellen. Eine Variante der Implementierung von AD basiert auf der Überladung von Operatoren und Funktionen, die von vielen modernen Programmiersprachen ermöglicht wird. Durch Ausnutzung des Konzepts der Überladung wird eine interne Funktions-Repräsentation (Tape) generiert, die anschließend für die Ableitungsberechnung herangezogen wird. In der Dissertation werden neue Techniken erarbeitet, die eine effizientere Tape-Erstellung und die parallele Tape-Auswertung ermöglichen. Anhand von Laufzeituntersuchungen für numerische Beispiele werden die Möglichkeiten der neuen Techniken verdeutlicht. / Using the technique of Automatic Differentiation (AD), derivative information can be computed efficiently for any function that is given as source code in a supported programming languages. One basic implementation strategy is based on the concept of operator overloading that is available for many programming languages. Due the overloading of operators, an internal representation of the function can be generated at runtime. This so-called tape can then be used for computing derivatives. In the thesis, new techniques are introduced that allow a more efficient tape creation and the parallel evaluation of tapes. Advantages of the new techniques are demonstrated by means of runtime analyses for numerical examples. Automatic Differentiation Operator Overloading Activity Analysis Parallelism Nested Taping Automatisches Differenzieren Operator-Überladung Aktivitätsanalyse Parallelisierung Verschachteltes Taping ddc:004 rvk:SK 910
48	Entwicklung paralleler Algorithmen zur numerischen Simulation von Gas-Partikel-Stroemungen unter Beruecksichtigung von Partikel-Partikel-Kollisionen Wassen, Erik 17 December 1998 (has links) (PDF) Gas-Partikel-Stroemungen finden sich in weiten Bereichen der Energie- und Verfahrenstechnik. Beispiele fuer haeu- fig anzutreffende Problemstellungen sind der Transport, die Separation oder die Injektion eines Gemisches aus festen Partikeln und einem Traegergas. Fuer die numerische Simulation solcher disperser Mehr- phasenstroemungen hat sich das Lagrange-Verfahren als besonders geeignet erwiesen. Andererseits stellt die An- wendung dieses Berechnungsverfahrens hoechste Anforderun- gen an die Ressourcen der verwendeten Rechner. Dies gilt im besonderen Masse fuer die Simulation von Stroemungen mit einer moderaten bis hohen Partikelbeladung, in denen die Partikel-Partikel-Kollisionen einen grossen Einfluss auf das Stroemungsverhalten haben. Um das grosse Leistungspotential, das heutige massiv par- allele Hochleistungsrechner bieten, effizient zu nutzen, wurden im Rahmen dieser Arbeit parallele Simulationsalgo- rithmen fuer die numerische Berechnung kollisionsbehafte- ter Gas-Partikel-Stroemungen entwickelt. Die Effizienz dieser Algorithmen wurde anhand verschiedener Testfaelle untersucht. Auf der Grundlage der dabei erzielten Ergeb- nisse wurden Vorschlaege fuer weitere Entwicklungsmoeg- lichkeiten erarbeitet. / Gas-particle-flows can be found widely in the field of energy production and process engineering. Examples for applications of such kind of flows are transport, se- paration or injection of a mixture of solid particles and a gaseous phase. The Lagrangian approach has proved to be a suitable means for the numerical simulation of disperse multiphase flows. On the other hand its application requires a large amount of computational power, especially when flows with a mo- derate or high particle loading are computed and particle- particle collisions have a significant influence on the flow. In order to use efficiently the large computational power that parallel computers provide nowadays, parallel algo- rithms for the numerical simulation of gas-particle flows including particle-particle collisions were developed in the cource of this work. The algorithms' efficiency was investigated considering different test cases. On the basis of the results suggestions for further developments were made. numerische Simulation CFD Mehrphasenstroemung multiphase flow Lagrange-Verfahren Gas-Partikel-Stroemung Partikel-Partikel-Kollision HPC ddc:600 ddc:004 Parallelisierung Parallelrechner
49	Diffusion on Fractals Prehl, geb. Balg, Janett 15 June 2007 (has links) (PDF) We study anomalous diffusion on fractals with a static external field applied. We utilise the master equation to calculate particle distributions and from that important quantities as for example the mean square displacement <r^2(t)>. Applying different bias amplitudes on several regular Sierpinski carpets we obtain maximal drift velocities for weak field strengths. According to <r^2(t)>~t^(2/d_w), we determine random walk dimensions of d_w<2 for applied external fields. These d_w corresponds to superdiffusion, although diffusion is hindered by the structure of the carpet, containing dangling ends. This seems to result from two competing effects arising within an external field. Though the particles prefer to move along the biased direction, some particles get trapped by dangling ends. To escape from there they have to move against the field direction. Due to the by the bias accelerated particles and the trapped ones the probability distribution gets wider and thus d_w<2. / In dieser Arbeit untersuchen wir anomale Diffusion auf Fraktalen unter Einwirkung eines statisches äußeres Feldes. Wir benutzen die Mastergleichung, um die Wahrscheinlichkeitsverteilung der Teilchen zu berechnen, um daraus wichtige Größen wie das mittlere Abstandsquadrat <r^2(t)> zu bestimmen. Wir wenden unterschiedliche Feldstärken bei verschiedenen regelmäßigen Sierpinski-Teppichen an und erhalten maximale Driftgeschwindigkeiten für schwache Feldstärken. Über <r^2(t)>~t^{2/d_w} bestimmen wir die Random-Walk-Dimension d_w als d_w<2. Dieser Wert für d_w entspricht der Superdiffusion, obwohl der Diffusionsprozess durch Strukturen des Teppichs, wie Sackgassen, behindert wird. Es schient, dass dies das Ergebnis zweier konkurrierender Effekte ist, die durch das Anlegen eines äußeren Feldes entstehen. Einerseits bewegen sich die Teilchen bevorzugt entlang der Feldrichtung. Andererseits gelangen einige Teilchen in Sackgassen. Um die Sackgassen, die in Feldrichtung liegen, zu verlassen, müssen sich die Teilchen entgegen der Feldrichtung bewegen. Somit sind die Teilchen eine gewisse Zeit in der Sackgasse gefangen. Infolge der durch das äußere Feld beschleunigten und der gefangenen Teilchen, verbreitert sich die Wahrscheinlichkeitsverteilung der Teilchen und somit ist d_w<2. Biased Diffusion Drift Master Gleichung Mean Square Displacement Random Walk Dimension Sierpinski Teppich Subdiffusion Superdiffusion äußeres Feld ddc:530 Anomale Diffusion Diffusion Fraktal Fraktale Dimension Parallelisierung Parallelverarbeitung
50	Optimierte Visualisierung auf segmentierten Anzeigen Lorenz, Mario 07 July 2005 (has links) Diese Arbeit beschreibt den Entwurf und die Funktionsweise einer parallelen OpenGL-Renderingschnittstelle, die den effizienten Betrieb unmodifizierter graphischer Anwendungen auf segmentierten Anzeigen ermöglicht. Diese Schnittstelle integriert sich vollständig in eine verteilte graphische Benutzeroberfläche. Die herausragende Eigenschaft der entwickelten parallelen OpenGL-Schnittstelle ist ihre gleich bleibende Bildrate bei wachsender Anzahl von Segmenten. Als Erweiterung des frei verfügbaren Chromium-Systems stellt die Implementation eine virtuelle Graphikpipeline mit der Gesamtauflösung der segmentierten Anzeige bereit, die den eingehenden Datenstrom über ein Kommunikationsnetzwerk an die Knoten eines Visualisierungsclusters überträgt. Jeder Knoten des Clusters rendert einen Ausschnitt des Gesamtbildes und bringt diesen auf dem zugehörigen Segment synchronisiert zur Anzeige. Die interne Verarbeitung der von der Applikation generierten OpenGL-Datenströme unterscheidet sich jedoch grundlegend von der existierenden Lösung. Während die Tilesort-SPU von Chromium die Daten entsprechend der Segmentierung der Anzeige sortiert und sequenziell an die relevanten Knoten versendet, überträgt die in der Arbeit vorgestellte Schnittstelle die Graphikbefehle simultan. Die dadurch erreichte Vermeidung redundanter Übertragungen bewirkt bereits einen besseren Durchsatz der Kommunikationskanäle und zusätzlich eine signifikante Verringerung der Prozessorbelastung des Applikationsrechners. Die freie gewordene Kapazität schafft wiederum die Voraussetzung für die Anwendung verschiedener Optimierungsverfahren zur weiteren Steigerung der graphischen Gesamtleistung der parallelen Schnittstelle. Dazu zählt neben der Zwischenspeicherung von Datensequenzen in einem Stream Cache die Filterung der OpenGL-Kommandoströme mit graphischen Culling-Verfahren. Speziell zum aktiv-stereoskopischen Rendern auf dem an der Professur vorhandenen zylindrischen Projektionssystem enthält die Schnittstelle Anpassungen für die Synchronisationshardware und die bildbasierte Korrektur der Parallaxe. info:eu-repo/classification/ddc/004 ddc:004 Parallelisierung Rendering Visualisierung Culling Multicast OpenGL Sort-First Architektur Stream Caching Visualisierungscluster parallelisierte Renderingschnittstelle segmentierte Anzeige tiled display

Search results