Global ETD Search

11	Wissensintegration von generischem und fallbasiertem Wissen, uniforme Repräsentation, Verwendung relationaler Datenbanksysteme sowie Problemlösen mit Concept Based und Case Based Reasoning sowie Bayesschen Netzen in medizinischen wissensbasierten Systemen Zimmer, Sandra 27 June 2023 (has links) Ein wissensbasiertes System soll den Mediziner im Rahmen der Diagnosestellung unterstützen, indem relevante Informationen bereitgestellt werden. Aus komplexen Symptomkonstellationen soll eine zuverlässige Diagnose und damit verbundene medizinische Maßnahmen abgeleitet werden. Grundlage dafür bildet das im System adäquat repräsentierte Wissen, das effizient verarbeitet wird. Dieses Wissen ist in der medizinischen Domäne sehr heterogen und häufig nicht gut strukturiert. In der Arbeit wird eine Methodik entwickelt, die die begriffliche Erfassung und Strukturierung der Anwendungsdomäne über Begriffe, Begriffshierarchien, multiaxiale Komposition von Begriffen sowie Konzeptdeklarationen ermöglicht. Komplexe Begriffe können so vollständig, eindeutig und praxisrelevant abgebildet werden. Darüber hinaus werden mit der zugrunde liegenden Repräsentation Dialogsysteme, fallbasierte und generische Problemlösungsmethoden sowie ihr Zusammenspiel mit relationalen Datenbanken in einem System vorgestellt. Dies ist vor allem im medizinischen Diskursbereich von Bedeutung, da zur Problemlösung generisches Wissen (Lehrbuchwissen) und Erfahrungswissen (behandelte Fälle) notwendig ist. Die Wissensbestände können auf relationalen Datenbanken uniform gespeichert werden. Um das vorliegende Wissen effizient verarbeiten zu können, wird eine Methode zur semantischen Indizierung vorgestellt und deren Anwendung im Bereich der Wissensrepräsentation beschrieben. Ausgangspunkt der semantischen Indizierung ist das durch Konzepthierarchien repräsentierte Wissen. Ziel ist es, den Knoten (Konzepten) Schlüssel zuzuordnen, die hierarchisch geordnet und syntaktisch sowie semantisch korrekt sind. Mit dem Indizierungsalgorithmus werden die Schlüssel so berechnet, dass die Konzepte mit den spezifischeren Konzepten unifizierbar sind und nur semantisch korrekte Konzepte zur Wissensbasis hinzugefügt werden dürfen. Die Korrektheit und Vollständigkeit des Indizierungsalgorithmus wird bewiesen. Zur Wissensverarbeitung wird ein integrativer Ansatz der Problemlösungsmethoden des Concept Based und Case Based Reasoning vorgestellt. Concept Based Reasoning kann für die Diagnose-, Therapie- und Medikationsempfehlung und -evaluierung über generisches Wissen verwendet werden. Mit Hilfe von Case Based Reasoning kann Erfahrungswissen von Patientenfällen verarbeitet werden. Weiterhin werden zwei neue Ähnlichkeitsmaße (Kompromissmengen für Ähnlichkeitsmaße und multiaxiale Ähnlichkeit) für das Retrieval ähnlicher Patientenfälle entwickelt, die den semantischen Kontext adäquat berücksichtigen. Einem ausschließlichen deterministischen konzeptbasiertem Schließen sind im medizinischen Diskursbereich Grenzen gesetzt. Für die diagnostische Inferenz unter Unsicherheit, Unschärfe und Unvollständigkeit werden Bayessche Netze untersucht. Es können so die gültigen allgemeinen Konzepte nach deren Wahrscheinlichkeit ausgegeben werden. Dazu werden verschiedene Inferenzmechanismen vorgestellt und anschließend im Rahmen der Entwicklung eines Prototypen evaluiert. Mit Hilfe von Tests wird die Klassifizierung von Diagnosen durch das Netz bewertet.:1 Einleitung 2 Medizinische wissensbasierte Systeme 3 Medizinischer Behandlungsablauf und erweiterter wissensbasierter Agent 4 Methoden zur Wissensrepräsentation 5 Uniforme Repräsentation mit Begriffshierachien, Konzepten, generischem und fallbasierten Schließen 6 Semantische Indizierung 7 Medizinisches System als Beispielanwendung 8 Ähnlichkeitsmaße, Kompromissmengen, multiaxiale Ähnlichkeit 9 Inferenzen mittels Bayesscher Netze 10 Zusammenfassung und Ausblick A Ausgewählte medizinische wissensbasierte Systeme zur Entscheidungsunterstützung aus der Literatur B Realisierung mit Softwarewerkzeugen C Causal statistic modeling and calculation of distribution functions of classification features / A knowledge-based system is designed to support the medical professionals in the diagnostic process by providing relevant information. A reliable diagnosis and associated medical measures are to be derived from complex symptom constellations. It is based on the knowledge adequately represented in the system, which is processed efficiently. This knowledge is very heterogeneous in the medical domain and often not well structured. In this work, a methodology is developed that enables the conceptual capture and structuring of the application domain via concepts, conecpt hierarchies, multiaxial composition of concepts as well as concept declarations. Complex concepts can thus be mapped completely, clearly and with practical relevance. Furthermore, the underlying representation introduces dialogue systems, \acrlong{abk:CBR} and generic problem solving methods as well as their interaction with relational databases in one system. This is particularly important in the field of medical discourse, since generic knowledge (textbook knowledge) and experiential knowledge (treated cases) are necessary for problem solving. The knowledge can be stored uniformly on relational databases. In order to be able to process the available knowledge efficiently, a method for semantic indexing is presented and its application in the field of knowledge representation is described. The starting point of semantic indexing is the knowledge represented by concept hierarchies. The goal is to assign keys to the nodes (concepts) that are hierarchically ordered and syntactically and semantically correct. With the indexing algorithm, the keys are calculated in such a way that the concepts are unifiable with the more specific concepts and only semantically correct concepts may be added to the knowledge base. The correctness and completeness of the indexing algorithm is proven. An integrative approach of the problem-solving methods of Concept Based and \acrlong{abk:CBR} is presented for knowledge processing. Concept Based Reasoning can be used for diagnosis, therapy and medication recommendation and evaluation via generic knowledge. Case Based Reasoning can be used to process experiential knowledge of patient cases. Furthermore, two new similarity measures (compromise sets for similarity measures and multiaxial similarity) are developed for the retrieval of similar patient cases that adequately consider the semantic context. There are limits to an exclusively deterministic Concept Based Reasoning in the medical domain. For diagnostic inference under uncertainty, vagueness and incompleteness Bayesian networks are investigated. The method is based on an adequate uniform representation of the necessary knowledge. Thus, the valid general concepts can be issued according to their probability. To this end, various inference mechanisms are introduced and subsequently evaluated within the context of a developed prototype. Tests are employed to assess the classification of diagnoses by the network.:1 Einleitung 2 Medizinische wissensbasierte Systeme 3 Medizinischer Behandlungsablauf und erweiterter wissensbasierter Agent 4 Methoden zur Wissensrepräsentation 5 Uniforme Repräsentation mit Begriffshierachien, Konzepten, generischem und fallbasierten Schließen 6 Semantische Indizierung 7 Medizinisches System als Beispielanwendung 8 Ähnlichkeitsmaße, Kompromissmengen, multiaxiale Ähnlichkeit 9 Inferenzen mittels Bayesscher Netze 10 Zusammenfassung und Ausblick A Ausgewählte medizinische wissensbasierte Systeme zur Entscheidungsunterstützung aus der Literatur B Realisierung mit Softwarewerkzeugen C Causal statistic modeling and calculation of distribution functions of classification features info:eu-repo/classification/ddc/006 ddc:006
12	The predictability problem Ong, James Kwan Yau January 2007 (has links) Wir versuchen herauszufinden, ob das subjektive Maß der Cloze-Vorhersagbarkeit mit der Kombination objektiver Maße (semantische und n-gram-Maße) geschätzt werden kann, die auf den statistischen Eigenschaften von Textkorpora beruhen. Die semantischen Maße werden entweder durch Abfragen von Internet-Suchmaschinen oder durch die Anwendung der Latent Semantic Analysis gebildet, während die n-gram-Wortmaße allein auf den Ergebnissen von Internet-Suchmaschinen basieren. Weiterhin untersuchen wir die Rolle der Cloze-Vorhersagbarkeit in SWIFT, einem Modell der Blickkontrolle, und wägen ab, ob andere Parameter den der Vorhersagbarkeit ersetzen können. Unsere Ergebnisse legen nahe, dass ein computationales Modell, welches Vorhersagbarkeitswerte berechnet, nicht nur Maße beachten muss, die die Relatiertheit eines Wortes zum Kontext darstellen; das Vorhandensein eines Maßes bezüglich der Nicht-Relatiertheit ist von ebenso großer Bedeutung. Obwohl hier jedoch nur Relatiertheits-Maße zur Verfügung stehen, sollte SWIFT ebensogute Ergebnisse liefern, wenn wir Cloze-Vorhersagbarkeit mit unseren Maßen ersetzen. / We try to determine whether it is possible to approximate the subjective Cloze predictability measure with two types of objective measures, semantic and word n-gram measures, based on the statistical properties of text corpora. The semantic measures are constructed either by querying Internet search engines or by applying Latent Semantic Analysis, while the word n-gram measures solely depend on the results of Internet search engines. We also analyse the role of Cloze predictability in the SWIFT eye movement model, and evaluate whether other parameters might be able to take the place of predictability. Our results suggest that a computational model that generates predictability values not only needs to use measures that can determine the relatedness of a word to its context; the presence of measures that assert unrelatedness is just as important. In spite of the fact, however, that we only have similarity measures, we predict that SWIFT should perform just as well when we replace Cloze predictability with our measures. Cloze-Vorhersagbarkeit Blickbewegungen Latente-Semantische-Analyse Wort-n-Gramme-Wahrscheinlichkeit Ähnlichkeit-Masse Cloze predictability eye movements Latent Semantic Analysis word n-gram probability similarity measures Mathematics
13	Komparativer Ähnlichkeitsalgorithmus Schwartz, Eva-Maria 15 January 2010 (has links) (PDF) Die Notwendigkeit zur Nutzung von nicht-individuell entwickelter Software entsteht im Geschäfts- und Arbeitsfeld auf Grund der Entwicklung in diesem Bereich. Unternehmen müssen sich ständig ändernden Anforderungen im Geschäftsumfeld stellen. Mit dem immer stärker werdenden Wettbewerb ist es erforderlich, sich auf eigene Kernkompetenzen zu konzentrieren und zeitliche Kooperation bzw. Beziehungen mit anderen Organisationen einzugehen. Um diesen Beziehungen und Anforderungen gerecht zu werden, müssen Software bzw. Softwarebausteine flexibel und temporär bezogen werden. Um den Nutzern dieser Software eine bestmögliche Unterstützung bei der Auswahl ihrer bedarfsgerechten Komponenten zu geben, sollen Ihnen, anhand von Entscheidungen bereits bestehender Kunden, Vorschläge für Objekte unterbreitet werden. Diese Objekte können je nach System zum Beispiel Konfigurationseigenschaften, Inhaltsmodule oder Layoutdarstellungen sein. Es wird davon ausgegangen, dass ähnliche Nutzer auch ähnliche Objekte benötigen. Aus diesem Grund sollen die Nutzer miteinander verglichen werden. Das Problem liegt an dieser Stelle in der Beschreibung eines Nutzers. Dieser kann durch eine Vielzahl von Merkmalen gekennzeichnet werden, welche je nach Objekt eine unterschiedliche Wichtigkeit bei der Entscheidung haben. Aus diesem Grund müssen die einzelnen Merkmale unabhängig von einander betrachtet werden. Bei der Bewertung eines Objektes sollen dann entsprechende Wichtungen für das jeweilige Merkmal integriert werden. Der Vergleich ist erst dadurch möglich, dass der Kontext und damit die Aufgabe des Nutzers bekannt sind. Nur mit diesen Informationen können gezielte Empfehlungen erstellt werden. Es wird ein Verfahren vorgestellt, welches die priorisierte Bewertung einzelner Merkmale einbezieht. Ausgehend von diesem Verfahren wird ein Algorithmus vorgestellt, welcher Nutzer anhand ihrer Merkmale vergleicht und daraus folgend Empfehlungen für Objekte ausgibt. Der Algorithmus soll in ein Recommender-System integriert werden. Ähnlichkeit Usability Gebrauchstauglichkeit Recommender Systeme Empfehlungssysteme Nutzervergleich Nutzermodelle komparatives Bewerten Ähnlichkeitsalgorithmus KSA Recommender Systems similarity comparative similarity priorization compartive evaluation personalization ddc:004 rvk:SS 5514
14	Komparativer Ähnlichkeitsalgorithmus: Algorithmus zur komparativen Bewertung der Ähnlichkeiten von Objekten anhand von kollaborativen Priorisierungen Schwartz, Eva-Maria 15 January 2010 (has links) Die Notwendigkeit zur Nutzung von nicht-individuell entwickelter Software entsteht im Geschäfts- und Arbeitsfeld auf Grund der Entwicklung in diesem Bereich. Unternehmen müssen sich ständig ändernden Anforderungen im Geschäftsumfeld stellen. Mit dem immer stärker werdenden Wettbewerb ist es erforderlich, sich auf eigene Kernkompetenzen zu konzentrieren und zeitliche Kooperation bzw. Beziehungen mit anderen Organisationen einzugehen. Um diesen Beziehungen und Anforderungen gerecht zu werden, müssen Software bzw. Softwarebausteine flexibel und temporär bezogen werden. Um den Nutzern dieser Software eine bestmögliche Unterstützung bei der Auswahl ihrer bedarfsgerechten Komponenten zu geben, sollen Ihnen, anhand von Entscheidungen bereits bestehender Kunden, Vorschläge für Objekte unterbreitet werden. Diese Objekte können je nach System zum Beispiel Konfigurationseigenschaften, Inhaltsmodule oder Layoutdarstellungen sein. Es wird davon ausgegangen, dass ähnliche Nutzer auch ähnliche Objekte benötigen. Aus diesem Grund sollen die Nutzer miteinander verglichen werden. Das Problem liegt an dieser Stelle in der Beschreibung eines Nutzers. Dieser kann durch eine Vielzahl von Merkmalen gekennzeichnet werden, welche je nach Objekt eine unterschiedliche Wichtigkeit bei der Entscheidung haben. Aus diesem Grund müssen die einzelnen Merkmale unabhängig von einander betrachtet werden. Bei der Bewertung eines Objektes sollen dann entsprechende Wichtungen für das jeweilige Merkmal integriert werden. Der Vergleich ist erst dadurch möglich, dass der Kontext und damit die Aufgabe des Nutzers bekannt sind. Nur mit diesen Informationen können gezielte Empfehlungen erstellt werden. Es wird ein Verfahren vorgestellt, welches die priorisierte Bewertung einzelner Merkmale einbezieht. Ausgehend von diesem Verfahren wird ein Algorithmus vorgestellt, welcher Nutzer anhand ihrer Merkmale vergleicht und daraus folgend Empfehlungen für Objekte ausgibt. Der Algorithmus soll in ein Recommender-System integriert werden. info:eu-repo/classification/ddc/004 ddc:004
15	Über die Aussagesicherheit der Substanzidentifizierung mittels HPLC-DAD in der systematischen toxikologischen Analyse unter Verwendung einer selbsterstellten UV-Spektrenbibliothek mit 2.682 Einträgen Herzler, Matthias 17 March 2003 (has links) In der vorliegenden Arbeit wurde die Leistungsfähigkeit der Hochleistungsflüssigchromatographie mit Photodiodenarraydetektion (HPLC-DAD) im Rahmen der Systematischen Toxikologischen Analyse (STA) umfassend untersucht, ein besonderer Schwerpunkt lag dabei auf der Aussagesicherheit bei der Substanzidentifizierung. Die Grundlage für diese Untersuchungen bildete die Messung der UV-Spektren und relativen Retentionszeiten (RRT) von 2.682 toxikologisch relevanten Substanzen mit Hilfe moderner Diodenarraydetektoren und unter einheitlichen experimentellen Bedingungen (Eluent: Acetonitril/ Phosphatpuffer pH 2,3; Trennsäule: Lichrospher RP8ec). Die erhaltenen Daten wurden zusammen mit weiteren Substanzinformationen in einer Spektrenbibliothek zusammengefasst, die als Buch und CD-ROM auch der Öffentlichkeit zugänglich gemacht wurde. Bei der Entwicklung eines Konzeptes zur Methodenvalidierung für die STA erwiesen sich insbesondere die Kenngrößen Selektivität und Spezifität als von zentraler Bedeutung. Unter Verwendung eines Fensteransatzes für die RRT und des Similarity Index (SI) für den Spektrenvergleich wurden sämtliche möglichen Substanzpaare aus der Spektrenbibliothek miteinander auf ihre Unterscheidbarkeit hin verglichen, wobei verschiedene RRT-Fensterbreiten und SI-Schwellenwerte zugrundegelegt wurden. Aus den Ergebnissen wurden Selektivitätsparameter wie die Relative Identification Power (RIP), die Discriminating Power (DP) und die Mean List Length (MLL) berechnet. Mit einer RIP von 84,2 %, einer MLL von 1,25 und einer DP von 0,9999 wurden für die Substanzidentifikation anhand von RRT + UV-Spektrum im Literaturvergleich sehr gute Ergebnisse erhalten. Die hohe Grad an Spezifität der UV-Spektren für den Einsatz in der STA wurde einerseits durch Auszählung sämtlicher in der Spektrenbibliothek gefundener Chromophore/Absorptionssysteme belegt: 1.650 verschiedene Absorptionssysteme wurden gefunden, über 60 % der Verbindungen trugen ein in diesem Substanzbestand einzigartiges Absorptionssystem. Andererseits wurde die computergestützte Unterscheidbarkeit zwischen verschiedenen Gruppen jeweils strukturell ähnlicher Wirkstoffe anhand des UV-Spektrums untersucht. Hierfür wurden 487 Substanzen in ein hierarchisches System von Haupt- und Untergruppen eingeteilt, zwischen denen anschließend mit Hilfe der Schrittweisen Diskriminanzanalyse (SDA) unterschieden werden sollte. Die sehr guten Klassifizierungsergebnisse und die Auflösung auch feiner struktureller Unterschiede, oftmals abseits des eigentlichen Absorptionssystems, lassen es grundsätzlich möglich erscheinen, auch Substanzen für die STA zu erschließen, die nicht in der Spektrenbibliothek enthalten sind. Insgesamt erwies sich die HPLC-DAD als hochselektives und -spezifisches Messverfahren, das zu Recht eine der wichtigsten STA-Methoden darstellt. / In this thesis the capability of high-performance liquid chromatography with photodiode array detection in the context of Systematical Toxicological Analysis (STA) was extensively investigated with a special focus on the certainty of substance identification. As the foundation for these investigations, UV spectra and relative retention times (RRT) of 2,682 toxicologically relevant compounds were recorded under uniform experimental conditions (mobile phase: acetonitrile/ phosphate buffer pH 2.3; column: Lichrospher RP8ec) using up-to-date photodiode array detectors. Together with additional substance information these data were built into a spectra library also made available to the public in the form of a book and a CD-ROM. During the development of a concept for the validation of a STA method, selectivity and specificity were found to be of central importance. Using a window approach for the RRT and the Similarity Index (SI) for spectral comparison, all possible substance pairs within the spectra library were examined in terms of their respective distinguishability, based on different RRT windows and SI threshold values. From the results selectivity parameters such as the Relative Identification Power (RIP), the Discriminating Power (DP), and the Mean List Length (MLL) were calculated. As compared to the literature, with a RIP of 84.2 %, a MLL of 1.25, and a DP of 0,9999 excellent results were obtained for the substance identification based on the combination of RRT and UV spectrum. The high degree of specificty of UV spectra for use in the STA was demonstrated on the one hand by counting all different chromophores/ absorption systems found in the spectra library: 1,650 systems were found, more than 60 % of the substances bore absorption systems unique in the dataset. On the other hand the computer-based distinction between different groups of structurally similar compounds on the basis of the UV spectrum was investigated by dividing 487 substances into a hierarchical system of main and subgroups and trying to distinguish between these groups using stepwise discriminant analysis (SDA). The highly satisfying classification results together with the resolution of fine structural differences, often remote from the actual absorption system, make it seem possible to also render substances not included in the spectra library accessible for the STA. In conclusion HPLC-DAD proved to be highly selective and specific, rightfully regarded as one of the most important STA methods. HPLC-DAD Systematische Toxikologische Analyse Spektrenbibliothek Substanzidentifizierung spektrale Ähnlichkeit Selektivität Spezifität Diskriminanzanalyse HPLC-DAD systematic toxicological analysis spectra library substance identification spectral similarity selectivity specificity discriminant analysis 540 Chemie 30 Chemie VG 7300 ddc:540
16	Jobzentrisches Monitoring in Verteilten Heterogenen Umgebungen mit Hilfe Innovativer Skalierbarer Methoden Hilbrich, Marcus 24 June 2015 (has links) (PDF) Im Bereich des wissenschaftlichen Rechnens nimmt die Anzahl von Programmläufen (Jobs), die von einem Benutzer ausgeführt werden, immer weiter zu. Dieser Trend resultiert sowohl aus einer steigenden Anzahl an CPU-Cores, auf die ein Nutzer zugreifen kann, als auch durch den immer einfacheren Zugriff auf diese mittels Portalen, Workflow-Systemen oder Services. Gleichzeitig schränken zusätzliche Abstraktionsschichten von Grid- und Cloud-Umgebungen die Möglichkeit zur Beobachtung von Jobs ein. Eine Lösung bietet das jobzentrische Monitoring, das die Ausführung von Jobs transparent darstellen kann. Die vorliegende Dissertation zeigt zum einen Methoden mit denen eine skalierbare Infrastruktur zur Verwaltung von Monitoring-Daten im Kontext von Grid, Cloud oder HPC (High Performance Computing) realisiert werden kann. Zu diesem Zweck wird sowohl eine Aufgabenteilung unter Berücksichtigung von Aspekten wie Netzwerkbandbreite und Speicherkapazität mittels einer Strukturierung der verwendeten Server in Schichten, als auch eine dezentrale Aufbereitung und Speicherung der Daten realisiert. Zum anderen wurden drei Analyseverfahren zur automatisierten und massenhaften Auswertung der Daten entwickelt. Hierzu wurde unter anderem ein auf der Kreuzkorrelation basierender Algorithmus mit einem baumbasierten Optimierungsverfahren zur Reduzierung der Laufzeit und des Speicherbedarfs entwickelt. Diese drei Verfahren können die Anzahl der manuell zu analysierenden Jobs von vielen Tausenden, auf die wenigen, interessanten, tatsächlichen Ausreißer bei der Jobausführung reduzieren. Die Methoden und Verfahren zur massenhaften Analyse, sowie zur skalierbaren Verwaltung der jobzentrischen Monitoring-Daten, wurden entworfen, prototypisch implementiert und mittels Messungen sowie durch theoretische Analysen untersucht. / An increasing number of program executions (jobs) is an ongoing trend in scientific computing. Increasing numbers of available compute cores and lower access barriers, based on portal-systems, workflow-systems, or services, drive this trend. At the same time, the abstraction layers that enable grid and cloud solutions pose challenges in observing job behaviour. Thus, observation and monitoring capabilities for large numbers of jobs are lacking. Job-centric monitoring offers a solution to present job executions in a transparent manner. This dissertation presents methods for scalable infrastructures that handle monitoring data of jobs in grid, cloud, and HPC (High Performance Computing) solutions. A layer-based organisation of servers with a distributed storage scheme enables a task sharing that respects network bandwidths and data capacities. Additionally, three proposed automatic analysis techniques enable an evaluation of huge data quantities. One of the developed algorithms is based on cross-correlation and uses a tree-based optimisation strategy to decrease both runtime and memory usage. These three methods are able to significantly reduce the number of jobs for manual analysis from many thousands to a few interesting jobs that exhibit outlier-behaviour during job execution. Contributions of this thesis include a design, a prototype implementation, and an evaluation for methods that analyse large amounts of job-data, as well for the scalable storage concept for such data. Jobzentrisches Monitoring Ähnlichkeit Grid Big Data Monitoring Skalierbarkeit automatische Analyse Cloud HPC Datenanalyse Datenverteilung Job-centric Monitoring Similarity Grid Big Data Monitoring Saleability automatic Analysis Cloud HPC Data Analysis Data Distribution ddc:004 rvk:ST 200
17	Algorithmen zur automatisierten Dokumentation und Klassifikation archäologischer Gefäße Hörr, Christian 30 September 2011 (has links) (PDF) Gegenstand der vorliegenden Dissertation ist die Entwicklung von Algorithmen und Methoden mit dem Ziel, Archäologen bei der täglichen wissenschaftlichen Arbeit zu unterstützen. Im Teil I werden Ideen präsentiert, mit denen sich die extrem zeitintensive und stellenweise stupide Funddokumentation beschleunigen lässt. Es wird argumentiert, dass das dreidimensionale Erfassen der Fundobjekte mittels Laser- oder Streifenlichtscannern trotz hoher Anschaffungskosten wirtschaftlich und vor allem qualitativ attraktiv ist. Mithilfe von nicht fotorealistischen Visualisierungstechniken können dann wieder aussagekräftige, aber dennoch objektive Bilder generiert werden. Außerdem ist speziell für Gefäße eine vollautomatische und umfassende Merkmalserhebung möglich. Im II. Teil gehen wir auf das Problem der automatisierten Gefäßklassifikation ein. Nach einer theoretischen Betrachtung des Typbegriffs in der Archäologie präsentieren wir eine Methodologie, in der Verfahren sowohl aus dem Bereich des unüberwachten als auch des überwachten Lernens zum Einsatz kommen. Besonders die letzteren haben sich dabei als überaus praktikabel erwiesen, um einerseits unbekanntes Material einer bestehenden Typologie zuzuordnen, andererseits aber auch die Struktur der Typologie selbst kritisch zu hinterfragen. Sämtliche Untersuchungen haben wir beispielhaft an den bronzezeitlichen Gräberfeldern von Kötitz, Altlommatzsch (beide Lkr. Meißen), Niederkaina (Lkr. Bautzen) und Tornow (Lkr. Oberspreewald-Lausitz) durchgeführt und waren schließlich sogar in der Lage, archäologisch relevante Zusammenhänge zwischen diesen Fundkomplexen herzustellen. / The topic of the dissertation at hand is the development of algorithms and methods aiming at supporting the daily scientific work of archaeologists. Part I covers ideas for accelerating the extremely time-consuming and often tedious documentation of finds. It is argued that digitizing the objects with 3D laser or structured light scanners is economically reasonable and above all of high quality, even though those systems are still quite expensive. Using advanced non-photorealistic visualization techniques, meaningful but at the same time objective pictures can be generated from the virtual models. Moreover, specifically for vessels a fully-automatic and comprehensive feature extraction is possible. In Part II, we deal with the problem of automated vessel classification. After a theoretical consideration of the type concept in archaeology we present a methodology, which employs approaches from the fields of both unsupervised and supervised machine learning. Particularly the latter have proven to be very valuable in order to assign unknown entities to an already existing typology, but also to challenge the typology structure itself. All the analyses have been exemplified by the Bronze Age cemeteries of Kötitz, Altlommatzsch (both district of Meißen), Niederkaina (district of Bautzen), and Tornow (district Oberspreewald-Lausitz). Finally, we were even able to discover archaeologically relevant relationships between these sites. Non-Photorealistic Rendering 3D-Scanning aktive Konturen Formanalyse Gefäße metrische Räume non-photorealistic rendering 3D scanning active contours shape analysis vessels data mining machine learning metric spaces similarity archaeology Bronze Age ddc:004 ddc:930 Data Mining Maschinelles Lernen Ähnlichkeit Archäologie Bronzezeit
18	Jobzentrisches Monitoring in Verteilten Heterogenen Umgebungen mit Hilfe Innovativer Skalierbarer Methoden Hilbrich, Marcus 24 March 2015 (has links) Im Bereich des wissenschaftlichen Rechnens nimmt die Anzahl von Programmläufen (Jobs), die von einem Benutzer ausgeführt werden, immer weiter zu. Dieser Trend resultiert sowohl aus einer steigenden Anzahl an CPU-Cores, auf die ein Nutzer zugreifen kann, als auch durch den immer einfacheren Zugriff auf diese mittels Portalen, Workflow-Systemen oder Services. Gleichzeitig schränken zusätzliche Abstraktionsschichten von Grid- und Cloud-Umgebungen die Möglichkeit zur Beobachtung von Jobs ein. Eine Lösung bietet das jobzentrische Monitoring, das die Ausführung von Jobs transparent darstellen kann. Die vorliegende Dissertation zeigt zum einen Methoden mit denen eine skalierbare Infrastruktur zur Verwaltung von Monitoring-Daten im Kontext von Grid, Cloud oder HPC (High Performance Computing) realisiert werden kann. Zu diesem Zweck wird sowohl eine Aufgabenteilung unter Berücksichtigung von Aspekten wie Netzwerkbandbreite und Speicherkapazität mittels einer Strukturierung der verwendeten Server in Schichten, als auch eine dezentrale Aufbereitung und Speicherung der Daten realisiert. Zum anderen wurden drei Analyseverfahren zur automatisierten und massenhaften Auswertung der Daten entwickelt. Hierzu wurde unter anderem ein auf der Kreuzkorrelation basierender Algorithmus mit einem baumbasierten Optimierungsverfahren zur Reduzierung der Laufzeit und des Speicherbedarfs entwickelt. Diese drei Verfahren können die Anzahl der manuell zu analysierenden Jobs von vielen Tausenden, auf die wenigen, interessanten, tatsächlichen Ausreißer bei der Jobausführung reduzieren. Die Methoden und Verfahren zur massenhaften Analyse, sowie zur skalierbaren Verwaltung der jobzentrischen Monitoring-Daten, wurden entworfen, prototypisch implementiert und mittels Messungen sowie durch theoretische Analysen untersucht. / An increasing number of program executions (jobs) is an ongoing trend in scientific computing. Increasing numbers of available compute cores and lower access barriers, based on portal-systems, workflow-systems, or services, drive this trend. At the same time, the abstraction layers that enable grid and cloud solutions pose challenges in observing job behaviour. Thus, observation and monitoring capabilities for large numbers of jobs are lacking. Job-centric monitoring offers a solution to present job executions in a transparent manner. This dissertation presents methods for scalable infrastructures that handle monitoring data of jobs in grid, cloud, and HPC (High Performance Computing) solutions. A layer-based organisation of servers with a distributed storage scheme enables a task sharing that respects network bandwidths and data capacities. Additionally, three proposed automatic analysis techniques enable an evaluation of huge data quantities. One of the developed algorithms is based on cross-correlation and uses a tree-based optimisation strategy to decrease both runtime and memory usage. These three methods are able to significantly reduce the number of jobs for manual analysis from many thousands to a few interesting jobs that exhibit outlier-behaviour during job execution. Contributions of this thesis include a design, a prototype implementation, and an evaluation for methods that analyse large amounts of job-data, as well for the scalable storage concept for such data. info:eu-repo/classification/ddc/004 ddc:004
19	Nature, correlates, and consequences of spousal interrelations in old age Schade, Hannah Maria 08 July 2020 (has links) Die Paarbeziehung ist ein sozialer Kontext, der individuelle Entwicklung und erfolgreiches Altern beeinflusst. Größere Ähnlichkeit zwischen Partnern wird häufig als adaptiv für das Wohlbefinden des Individuums und die Qualität der Beziehung angesehen; neuere Übersichtsarbeiten weisen allerdings auf die Notwendigkeit diverserer Forschungsdesigns, Analysen und Stichproben hin, die auch das höhere Lebensalter umfassen. Diese Dissertation baut auf sozio-kontextuellen Theorien der Lebensspannenpsychologie auf, und nutzt Längsschnittdaten des Sozio-Ökonomischen Panels (SOEP) mit bis zu 31 jährlichen Erhebungen, sowie Experience Sampling Daten einer einwöchigen Tagebuchstudie zum Alltag älterer Ehepaare. Konkret werden a) die Wohlbefindensähnlichkeit zwischen Lebenspartnern über die Lebensspanne, ihre Korrelate und ihre Entwicklung über die Zeit beschrieben, b) die adaptive Funktionalität größerer Ähnlichkeit im affektiven und evaluativen Wohlbefinden für die Beziehung analysiert sowie c) die Rolle der Kontrollüberzeugung des Partners für das Wohlbefinden des Individuums untersucht. Partner wurden sich nicht ähnlicher in ihrer Lebenszufriedenheit über Jahre und Jahrzehnte, wie Mehrebenenwachstumsmodelle zeigten, allerdings war größere, und steigende, Ähnlichkeit prädiktiv für größere Zufriedenheit mit dem Familienleben. Größere durchschnittliche, und Momente von überdurchschnittlicher Ähnlichkeit im negativen Affekt war assoziiert mit dem Gefühl, den Alltag mit dem Partner gemeinsam besser zu meistern. Größere Kontrollüberzeugung als üblich im einen Partner gingen einher mit höherem Wohlbefinden im anderen Partner, wie Actor-Partner-Interdependence-Modelle zeigen konnten. Die Ergebnisse werden im Rahmen des kollektiven Modells selektiver Optimierung mit Kompensation diskutiert und betonen ein weiteres Mal die Wichtigkeit von Partner- und Beziehungsdynamiken sowie individueller und dyadischer Kontrollüberzeugung für Wohlbefinden und erfolgreiches Altern. / The romantic relationship is a social context that influences individual development and successful aging. Greater similarity between partners, e.g. in emotional well-being, has often been argued to be beneficial for the faring of individual and relationship; however, recent reviews suggest the need for more diverse designs, analyses and samples, which cover not only earlier but also later points in the lifespan. The aim of this dissertation is to make a solid contribution to our understanding of well-being similarity and dynamics between romantic partners across the lifespan and in old age. To do so, it draws on notions of socio-contextual theories of lifespan development and utilizes data from a macrolongitudinal study spanning more than 31 annual waves (SOEP) and an extensive experience sampling study on older couples’ everyday life. Specifically, this dissertation a) describes the nature and development of well-being similarity over time and its correlates b) investigates the adaptive potential of well-being similarity for relationship functioning, and c) explores how the individual’s well-being is influenced by the partner’s control perceptions. Multilevel growth models showed that partners did not grow more similar over time in their life satisfaction, and that greater, and increasing, similarity in life satisfaction similarity predicted greater satisfaction with family life. Actor–partner interdependence models revealed that average, and momentary, similarity in negative affect was positively related to everyday perceptions of dyadic mastery, and that the partner's higher momentary control beliefs were associated with lower negative affect in the individual. Emotionale Ähnlichkeit SOEP Lebensspanne Partnerdynamiken Gefühlssynchronizität Tagebuchstudie multilevel modeling lifespan couple dynamics soep life satisfaction emotional similarity control beliefs dyadic mastery 150 Psychologie CQ 7400 CV 4500 ddc:150
20	Improving Retrieval Accuracy in Main Content Extraction from HTML Web Documents Mohammadzadeh, Hadi 17 December 2013 (has links) (PDF) The rapid growth of text based information on the World Wide Web and various applications making use of this data motivates the need for efficient and effective methods to identify and separate the “main content” from the additional content items, such as navigation menus, advertisements, design elements or legal disclaimers. Firstly, in this thesis, we study, develop, and evaluate R2L, DANA, DANAg, and AdDANAg, a family of novel algorithms for extracting the main content of web documents. The main concept behind R2L, which also provided the initial idea and motivation for the other three algorithms, is to use well particularities of Right-to-Left languages for obtaining the main content of web pages. As the English character set and the Right-to-Left character set are encoded in different intervals of the Unicode character set, we can efficiently distinguish the Right-to-Left characters from the English ones in an HTML file. This enables the R2L approach to recognize areas of the HTML file with a high density of Right-to-Left characters and a low density of characters from the English character set. Having recognized these areas, R2L can successfully separate only the Right-to-Left characters. The first extension of the R2L, DANA, improves effectiveness of the baseline algorithm by employing an HTML parser in a post processing phase of R2L for extracting the main content from areas with a high density of Right-to-Left characters. DANAg is the second extension of the R2L and generalizes the idea of R2L to render it language independent. AdDANAg, the third extension of R2L, integrates a new preprocessing step to normalize the hyperlink tags. The presented approaches are analyzed under the aspects of efficiency and effectiveness. We compare them to several established main content extraction algorithms and show that we extend the state-of-the-art in terms of both, efficiency and effectiveness. Secondly, automatically extracting the headline of web articles has many applications. We develop and evaluate a content-based and language-independent approach, TitleFinder, for unsupervised extraction of the headline of web articles. The proposed method achieves high performance in terms of effectiveness and efficiency and outperforms approaches operating on structural and visual features. / Das rasante Wachstum von textbasierten Informationen im World Wide Web und die Vielfalt der Anwendungen, die diese Daten nutzen, macht es notwendig, effiziente und effektive Methoden zu entwickeln, die den Hauptinhalt identifizieren und von den zusätzlichen Inhaltsobjekten wie z.B. Navigations-Menüs, Anzeigen, Design-Elementen oder Haftungsausschlüssen trennen. Zunächst untersuchen, entwickeln und evaluieren wir in dieser Arbeit R2L, DANA, DANAg und AdDANAg, eine Familie von neuartigen Algorithmen zum Extrahieren des Inhalts von Web-Dokumenten. Das grundlegende Konzept hinter R2L, das auch zur Entwicklung der drei weiteren Algorithmen führte, nutzt die Besonderheiten der Rechts-nach-links-Sprachen aus, um den Hauptinhalt von Webseiten zu extrahieren. Da der lateinische Zeichensatz und die Rechts-nach-links-Zeichensätze durch verschiedene Abschnitte des Unicode-Zeichensatzes kodiert werden, lassen sich die Rechts-nach-links-Zeichen leicht von den lateinischen Zeichen in einer HTML-Datei unterscheiden. Das erlaubt dem R2L-Ansatz, Bereiche mit einer hohen Dichte von Rechts-nach-links-Zeichen und wenigen lateinischen Zeichen aus einer HTML-Datei zu erkennen. Aus diesen Bereichen kann dann R2L die Rechts-nach-links-Zeichen extrahieren. Die erste Erweiterung, DANA, verbessert die Wirksamkeit des Baseline-Algorithmus durch die Verwendung eines HTML-Parsers in der Nachbearbeitungsphase des R2L-Algorithmus, um den Inhalt aus Bereichen mit einer hohen Dichte von Rechts-nach-links-Zeichen zu extrahieren. DANAg erweitert den Ansatz des R2L-Algorithmus, so dass eine Sprachunabhängigkeit erreicht wird. Die dritte Erweiterung, AdDANAg, integriert eine neue Vorverarbeitungsschritte, um u.a. die Weblinks zu normalisieren. Die vorgestellten Ansätze werden in Bezug auf Effizienz und Effektivität analysiert. Im Vergleich mit mehreren etablierten Hauptinhalt-Extraktions-Algorithmen zeigen wir, dass sie in diesen Punkten überlegen sind. Darüber hinaus findet die Extraktion der Überschriften aus Web-Artikeln vielfältige Anwendungen. Hierzu entwickeln wir mit TitleFinder einen sich nur auf den Textinhalt beziehenden und sprachabhängigen Ansatz. Das vorgestellte Verfahren ist in Bezug auf Effektivität und Effizienz besser als bekannte Ansätze, die auf strukturellen und visuellen Eigenschaften der HTML-Datei beruhen. Hauptinhalt Extraktion Information Retrieval UTF-8-Kodierung Form HTML-Dokumente rechts nach links Sprachen Web Mining Unicode-Zeichensatz Vektorraummodell Cosinus-Ähnlichkeit überlappen erzielte Ähnlichkeit Schlagzeile Extraktion Titel Extraktion Trend-Mining main content extraction information retrieval UTF-8 encoding form HTML documents right to left languages web mining Unicode character set vector space model cosine similarity overlap scoring similarity headline extraction title extraction trend mining ddc:500

Search results