Global ETD Search

71	Facets of verb meaning / A distributional investigation of German verbs Roberts, William 14 June 2023 (has links) Diese Dissertation bietet eine empirische Untersuchung deutscher Verben auf der Grundlage statistischer Beschreibungen, die aus einem großen deutschen Textkorpus gewonnen wurden. In einem kurzen Überblick über linguistische Theorien zur lexikalischen Semantik von Verben skizziere ich die Idee, dass die Verbbedeutung wesentlich von seiner Argumentstruktur (der Anzahl und Art der Argumente, die zusammen mit dem Verb auftreten) und seiner Aspektstruktur (Eigenschaften, die den zeitlichen Ablauf des vom Verb denotierten Ereignisses bestimmen) abhängt. Anschließend erstelle ich statistische Beschreibungen von Verben, die auf diesen beiden unterschiedlichen Bedeutungsfacetten basieren. Insbesondere untersuche ich verbale Subkategorisierung, Selektionspräferenzen und Aspekt. Alle diese Modellierungsstrategien werden anhand einer gemeinsamen Aufgabe, der Verbklassifikation, bewertet. Ich zeige, dass im Rahmen von maschinellem Lernen erworbene Merkmale, die verbale lexikalische Aspekte erfassen, für eine Anwendung von Vorteil sind, die Argumentstrukturen betrifft, nämlich semantische Rollenkennzeichnung. Darüber hinaus zeige ich, dass Merkmale, die die verbale Argumentstruktur erfassen, bei der Aufgabe, ein Verb nach seiner Aspektklasse zu klassifizieren, gut funktionieren. Diese Ergebnisse bestätigen, dass diese beiden Facetten der Verbbedeutung auf grundsätzliche Weise zusammenhängen. / This dissertation provides an empirical investigation of German verbs conducted on the basis of statistical descriptions acquired from a large corpus of German text. In a brief overview of the linguistic theory pertaining to the lexical semantics of verbs, I outline the idea that verb meaning is composed of argument structure (the number and types of arguments that co-occur with a verb) and aspectual structure (properties describing the temporal progression of an event referenced by the verb). I then produce statistical descriptions of verbs according to these two distinct facets of meaning: In particular, I examine verbal subcategorisation, selectional preferences, and aspectual type. All three of these modelling strategies are evaluated on a common task, automatic verb classification. I demonstrate that automatically acquired features capturing verbal lexical aspect are beneficial for an application that concerns argument structure, namely semantic role labelling. Furthermore, I demonstrate that features capturing verbal argument structure perform well on the task of classifying a verb for its aspectual type. These findings suggest that these two facets of verb meaning are related in an underlying way. Semantik Verb lexikalisch Verarbeitung natürlicher Sprache maschinelles Lernen semantics verb lexical natural language processing machine learning 410 Linguistik GC 7012 GC 9352 ddc:410
72	Robust Real-time Query Processing with QStream Schmidt, Sven, Legler, Thomas, Schär, Sebastian, Lehner, Wolfgang 08 August 2023 (has links) Processing data streams with Quality-of-Service (QoS) guarantees is an emerging area in existing streaming applications. Although it is possible to negotiate the result quality and to reserve the required processing resources in advance, it remains a challenge to adapt the DSMS to data stream characteristics which are not known in advance or are difficult to obtain. Within this paper we present the second generation of our QStream DSMS which addresses the above challenge by using a real-time capable operating system environment for resource reservation and by applying an adaptation mechanism if the data stream characteristics change spontaneously. info:eu-repo/classification/ddc/004 ddc:004
73	Analysis of the Scope of Dynamic Power Management in Emerging Server Architectures Hähnel, Markus, Dargie, Waltenegus, Schill, Alexander 16 May 2023 (has links) The architectures of large-scale Internet servers are becoming more complex each year in order to store and process a large amount of Internet data (Big Data) as efficiently as possible. One of the consequences of this continually growing complexity is that individual servers consume a significant amount of data even when they are idle. In this paper we experimentally investigate the scope and usefulness of existing and proposed dynamic power management strategies to manage power at core, socket, and server levels. Our experiment involves four dynamic voltage and frequency scaling policies, three different workloads having different resource consumption statistics, and the activation and deactivation of different sockets (packets) of a multicore, multi-socket server. Moreover, we establish a quantitative relationships between the workload (w) and the estimated power consumption (p) under different power management strategies to make a quantitative comparison of the different strategies and server configurations. info:eu-repo/classification/ddc/004 ddc:004
74	Congruence-based contextual plausibility modulates cortical activity during vibrotactile perception in virtual multisensory environments Kang, Kathleen, Rosenkranz, Robert, Karan, Kaan, Altinsoy, Ercan, Li, Shu-Chen 19 March 2024 (has links) How congruence cues and congruence-based expectations may together shape perception in virtual reality (VR) still need to be unravelled. We linked the concept of plausibility used in VR research with congruence-based modulation by assessing brain responses while participants experienced vehicle riding experiences in VR scenarios. Perceptual plausibility was manipulated by sensory congruence, with multisensory stimulations confirming with common expectations of road scenes being plausible. We hypothesized that plausible scenarios would elicit greater cortical responses. The results showed that: (i) vibrotactile stimulations at expected intensities, given embedded audio-visual information, engaged greater cortical activities in frontal and sensorimotor regions; (ii) weaker plausible stimulations resulted in greater responses in the sensorimotor cortex than stronger but implausible stimulations; (iii) frontal activities under plausible scenarios negatively correlated with plausibility violation costs in the sensorimotor cortex. These results potentially indicate frontal regulation of sensory processing and extend previous evidence of contextual modulation to the tactile sense. info:eu-repo/classification/ddc/570 ddc:570
75	Query optimization by using derivability in a data warehouse environment Albrecht, Jens, Hümmer, Wolfgang, Lehner, Wolfgang, Schlesinger, Lutz 10 January 2023 (has links) Materialized summary tables and cached query results are frequently used for the optimization of aggregate queries in a data warehouse. Query rewriting techniques are incorporated into database systems to use those materialized views and thus avoid the access of the possibly huge raw data. A rewriting is only possible if the query is derivable from these views. Several approaches can be found in the literature to check the derivability and find query rewritings. The specific application scenario of a data warehouse with its multidimensional perspective allows the consideration of much more semantic information, e.g. structural dependencies within the dimension hierarchies and different characteristics of measures. The motivation of this article is to use this information to present conditions for derivability in a large number of relevant cases which go beyond previous approaches. info:eu-repo/classification/ddc/004 ddc:004
76	Development and testing of fast curing, mineral-impregnated carbon fiber (MCF) reinforcements based on metakaolin-made geopolymers Zhao, Jitong, Liebscher, Marco, Michel, Albert, Junger, Dominik, Trindade, Ana Carolina Constâncio, Silva, Fláviode Andrade, Mechtcherine, Viktor 28 November 2022 (has links) Mineralisch getränkte Carbonfasern (MCF) stellen eine vielversprechende Alternative zu herkömmlichen Stahlbewehrung in Beton dar. Für eine effiziente industrielle Herstellung von MCF muss eine ausreichende Verarbeitungszeit für die Imprägniersuspension gewährleistet sein. In der vorliegenden Untersuchung wurde zu diesem Zweck ein aus Metakaolin hergestelltes Geopolymer (GP) entwickelt und getestet. Die Tränkung von Carbonfasergarnen wurde kontinuierlich und automatisiert durchgeführt. Anschließend wurden die MCF bei 75 °C wärmebehandelt, um die Reaktionsprozesse zu beschleunigen. Die mechanische Leistung von MCF nahm im Verlauf des Aushärtungsprozesses von 2 auf 8 Stunden allmählich zu, was auf das größere Ausmaß der Geopolymerisation zurückzuführen ist. Bei einer solchen verlängerten Aushärtung zeigten thermogravimetrische und mikroskopische Analysen zwar eine stärkere 'reagierte' Mikrostruktur, aber auch einen höheren Gehalt an Hohlräumen. Nach 8-stündigen Erhitzen erreichten die Zugfestigkeit und der Young-Modul von MCF 2960 MPa bzw. 259 GPa, bezogen auf die Garnquerschnittsfläche.:Abstract Schlagwörter 1. Einleitung 2. Experimentelles Programm 2.1. Materialien 2.2. Herstellung von MCF 2.3. Testen der Geopolymermatrix 2.4. Mechanische Prüfung von MCF 2.5. Morphologische Charakterisierung 3. Ergebnisse und Diskussion 3.1. Charakterisierung der Geopolymermatrix 3.2. Hergestellte MCF mit Geopolymer und Wärmebehandlung bei 75 °C. 3.3. Chemische und morphologische Analyse 4. Schlussfolgerung Erklärung des konkurrierenden Interesses Literaturen / Mineral-impregnated, carbon ﬁber composites (MCF) are a promising alternative to conventional concrete reinforcements. For the efficient industrial production of MCF, sufficient processing time for the impregnation suspension must be ensured. In the present investigation, a metakaolin-made geopolymer (GP) has been developed and tested for this purpose. The impregnation of carbon-fiber yarns was performed continuously and automated. Subsequently, the MCF were heat-treated at 75 °C to accelerate the reaction processes. The mechanical performance of MCF gradually increased in the advancement of the curing process from 2 to 8 h, which is attributed to the greater extent of geopolymerization. In such extended curing, thermogravimetric and microscopic analysis showed indeed a more “reacted” microstructure but also a higher content of voids. After heating for 8 h, the tensile strength and Young's modulus of MCF reached 2960 MPa and 259 GPa, respectively, when related to the yarn cross-sectional area.:Abstract Schlagwörter 1. Einleitung 2. Experimentelles Programm 2.1. Materialien 2.2. Herstellung von MCF 2.3. Testen der Geopolymermatrix 2.4. Mechanische Prüfung von MCF 2.5. Morphologische Charakterisierung 3. Ergebnisse und Diskussion 3.1. Charakterisierung der Geopolymermatrix 3.2. Hergestellte MCF mit Geopolymer und Wärmebehandlung bei 75 °C. 3.3. Chemische und morphologische Analyse 4. Schlussfolgerung Erklärung des konkurrierenden Interesses Literaturen info:eu-repo/classification/ddc/690 ddc:690
77	Differential effects of script system acquisition and social immersion experience on face perception / Evidence from event-related brain potentials Ma, Xiaoli 19 January 2023 (has links) Informelle Berichte zeigten größere Amplituden der durch Gesichter ausgelösten N170 Komponente im Ereigniskorrelierten Potenzial (EKP) bei asiatischen als bei kaukasischen Probanden. Als mögliche Ursache vermutete ich unterschiedliche Erfahrungen mit logographischen bzw. alphabetischen Schriftsystemen (Schriftsystem-Hypothese) oder die verstärkte Exposition mit unbekannten Gesichtern während der Immersion in eine neue soziale oder ethnische Umgebung (soziale Immersions-Hypothese). Zur Überprüfung dieser Hypothesen führte ich zwei kulturvergleichende Studien mit Erwachsenen bzw. Kindern durch. In Studie 1 untersuchte ich einheimische Chinesen und nicht-chinesische Auswärtige in Hongkong und deutsche Einheimische und chinesische Auswärtige in Berlin. Die Auswärtigen an beiden Orten zeigten größere N170 Amplituden auf Gesichter als die Einheimischen. Außerdem zeigten Deutsche, die erst kurze Zeit in Berlin lebten ähnliche Amplituden wie langjährige Einheimische. Insgesamt unterstützt Studie 1 die soziale Immersions-Hypothese, dass die Immersion in eine neue ethnische Umgebung zu einer Vergrößerung der N170 führt. Studie 2 untersuchte die Schriftsystem-Hypothese bei chinesischen und deutschen Erstlesern am Ende der ersten oder zu Beginn des zweiten Schuljahres an ihrem jeweiligen Heimatort. Die Ergebnisse unterstützen die Schriftsystem-Hypothese, dass chinesische Kinder eine größere N170 auf Gesichter zeigen als deutsche. Insgesamt konnte die vorliegende Dissertation zwei neue Einfluss-Faktoren auf das Gesichterverarbeitungs-System nachweisen, das erworbene Schriftsystem (logographische versus alphabetisch) und die Erfahrung sozialer Immersion in eine neue ethnische Umgebung. Diese Effekte zu ganz unterschiedlichen Zeitpunkten der Entwicklung (Kindheit vs. junges Erwachsenen-Alter) zeigen, dass das Gesichterverarbeitungs-System über lange Zeit seine Plastizität behält. / Informal reports have shown larger face-elicited N170 component of event-related potential (ERP) in Asians than Caucasians participants. I proposed that different experience with logographic versus alphabetic scripts (script system hypothesis) or by exposure to abundant novel faces during the immersion into a new social and/or ethnic environment (social immersion hypothesis) as a possible cause. To test these hypotheses, I conducted two cross-cultural ERP studies with adults and Children. In Study 1, I examined Chinese locals and non-Chinese foreigners in Hongkong, and German locals and Chinese foreigners in Berlin. It turned out that the foreigners in both locations showed larger N170 amplitudes to faces than the locals. In addition, Germans who had only lived in Berlin for a short time showed similar face N170 amplitudes as long-term Berlin residents. In sum, Study 1 supports the social immersion hypothesis that immersing into a new ethnic environment drives an increase of face N170. Study 2 investigated the scripts system hypothesis in Chinese and German early readers assessed at the end of the first-grade or at the beginning of the second grade in their respective home towns. The findings support the script system hypothesis that Chinese children showed larger face N170 amplitudes than German children. Overall, the present thesis demonstrated two new influencing factors on the face processing system, the acquired script system (logographic vs. alphabetic) and the social immersion experience in a new ethnic environment. More specifically, learning to read a visually complex logographic Chinese script or immersing into an other-ethnic social environment facilitates early perceptual processing of faces. These effects acquired at different stages of development (early childhood versus young adulthood) show that the face processing system retains its plasticity over a long period of time. Gesichtswahrnehmung Wahrnehmungsexpertise konfigurale Verarbeitung holistische Verarbeitung Beziehungen der zweiter-Ordnung N170 EKPs Lesen Schriftsystem Chinesisch Deutsch soziale Immersion face perception perceptual expertise configural processing holistic processing second-order relations N170 ERPs reading script system Chinese German social immersion 150 Psychologie CP 2000 CP 4000 EG 9060 CV 3000 ddc:150 ddc:155
78	Sprache und Denken Kao, Chung-Shan 16 December 2010 (has links) Die Studie hat zum Ziel, im Rahmen des Äußerungsproduktionsmodells die Annahme thinking for speaking (Slobin, 1996) experimentell zu überprüfen. Ansatzpunkt ist der Unterschied in der Stellung der Markierung einer Entscheidungsfrage zwischen drei Sprachen. Während der Fragemodus im Deutschen/Polnischen vor dem Frageinhalt markiert wird, geschieht die Modusmarkierung im Chinesischen nach dem Inhalt. Um die entsprechende Satzstruktur aufzubauen, sollte der Fragemodus beim syntaktischen Kodierungsprozess (speaking) im Deutschen/Polnischen vor, im Chinesischen nach dem Inhalt verarbeitet werden. Unter Zugrundelegung der inkrementellen Äußerungsproduktion gehen wir davon aus, dass die Verarbeitungsreihenfolge beim vorangehenden Konzeptualisierungsprozess (thinking) mit der syntaktischen Kodierungsabfolge übereinstimmt: Der Fragemodus wird im Deutschen/ Polnischen vor, im Chinesischen hingegen nach dem Inhalt konzeptualisiert. Um den zeitlichen Ablauf der zwei Konzeptualisierungsprozess zu ermitteln, bedienten wir uns des lateralisierten Bereitschaftspotenzials (lateralized readiness potential, LRP) im binären Wahlreaktions-Go/Nogo-Paradigma. Im Versuch reagierten deutsche, chinesische und polnische Muttersprachler auf dargebotene Bilder mit Tastendrücken und Sprechen. Zu beobachten war das Auftreten eines LRP bei Nogo, das signalisierte, in welcher Reihenfolge sich die Handwahl und die Nogo-Entscheidung realisierten Ein Nogo-LRP trat bei allen drei Sprechergruppen auf. Zudem wurde festgestellt, dass die Nogo-Entscheidung, die erwartungsgemäß mit der sprachlichen Verarbeitung des Fragemodus verbunden wurde, bei den drei Sprechergruppen ungefähr zeitgleich getroffen wurde. Die Befunde legen nahe, dass der Fragemodus in den drei Sprachen zeitlich nicht unterschiedlich, sondern einheitlich geplant wurde. Die Schlussfolgerung wird im Rahmen von thinking for speaking sowie dem Äußerungsproduktionsmodell diskutiert. / Languages differ in the marking of the sentence mood of a polar interrogative (yes/no question). For instance, the interrogative mood is marked at the beginning of the surface structure in Polish, whereas the marker appears at the end in Chinese. In order to generate the corresponding sentence frame, the syntactic specification of the interrogative mood is early in Polish and late in Chinese. In this respect, German belongs to an interesting intermediate class. The yes/no-question is expressed by a shift of the finite verb from its final position in the underlying structure into the utterance initial position, a move affecting, hence, both the sentence final and the sentence initial constituents. The present study aimed to investigate whether during generation of the semantic structure of a polar interrogative, i.e. the processing preceding the grammatical formulation, the interrogative mood is encoded according to its position in the syntactic structure at distinctive time points in Chinese, German, and Polish. In a two-choice go/nogo experimental design, native speakers of the three languages responded to pictures by pressing buttons and producing utterances in their native language while their brain potentials were recorded. The emergence and latency of lateralized readiness potentials (LRP) in nogo conditions, in which speakers asked a yes/no question, should indicate the time point of processing the interrogative mood. The results revealed that Chinese, German, and Polish native speakers did not differ from each other in the electrophysiological indicator. The findings suggest that the semantic encoding of the interrogative mood is temporally consistent across languages despite its disparate syntactic specification. The consistent encoding may be ascribed to economic processing of interrogative moods at various sentential positions of the syntactic structures in languages or, more generally, to the overarching status of sentence mood in the semantic structure. Äußerungsproduktion Satzmodus Entscheidungsfrage inkrementelle Verarbeitung lateralisiertes Bereitschaftspotential speech production sentence mood polar interrogative incremental processing lateralized readiness potential (LRP) 400 Sprachwissenschaft, Linguistik ER 955 ddc:400
79	Top-down Verarbeitung und neuronale Synchronisation Siegel, Markus 24 March 2005 (has links) Wahrnehmung ist kein vollständig durch sensorische Reize determinierter bottom-up Prozeß, sondern wird stark beeinflußt durch von diesen Reizen unabhängige top-down Prozesse wie etwa Aufmerksamkeit oder Erwartungen. Welche neuronalen Mechanismen liegen der Integration von bottom-up und top-down gerichteter Verarbeitung sensorischer Information zu Grunde? Im ersten Teil dieser Arbeit wurde diese Frage an Hand von Simulationen eines neuronales Netzwerks zweier vereinfachter kortikaler Areale untersucht. Dieses Netzwerk berücksichtigt hierbei jüngste zellphysiologische Befunde über die stark asymmetrischen funktionellen Eigenschaften kortikaler Neurone. Das simulierte Netzwerk repliziert zentrale neurophysiologische Befunde: 1) Top-down Signale erhöhen die Feuerraten der Neurone sowohl in einem hierarchisch hohen als auch tiefen kortikalen Areal. 2) Durch selektive top-down Signale wird die Verarbeitung simultaner Reize zu Gunsten eines faszilitierten Reizes moduliert. 3) Durch die reziproke Netzwerkarchitektur kommt es zu einem bidirektionalen Informationsfluß zwischen Arealen. Diese kooperative Verarbeitung bedingt gemeinsam mit einer nichtlinearen somato-dendritischen Interaktion neuronale Salvenentladungen, die ein hohes Signal-Rausch-Verhältnis aufweisen. Das simulierte Netzwerk demonstriert, welche zentrale Rolle die komplexen nichtlinearen Eigenschaften kortikaler Neurone bei der Integration bottom-up und top-down gerichteter Verarbeitung sensorischer Information spielen. Im Mittelpunkt der im zweiten Abschnitt vorgestellten experimentellen Studie steht die hochfrequente Synchronisation neuronaler Aktivität. Das große neurowissenschaftliche Interesse an der zeitlichen Struktur neuronaler Aktivität liegt insbesondere in der kontrovers diskutierten Hypothese eines „Synchronisationscodes“ begründet, gemäß welcher Information nicht nur durch die Feuerraten kortikaler Neurone, sondern auch durch die Synchronisation der Aktionspotentiale einer Neuronenpopulation codiert wird. Finden sich solche Synchronisationsphänomene in wachen, sich unter möglichst natürlichen Bedingungen verhaltenden Tieren wieder? Sind diese Synchronisationen selektiv für Eigenschaften des Reizes? Gelingt es, an Hand eines objektiven Kriteriums ein funktionelles Frequenzband neuronaler Synchronisation zu definieren? Diese Fragestellungen wurden mittels chronischer extrazellulärer Ableitungen im primären visuellen Kortex wacher, sich verhaltender Katzen untersucht: 1) Visuelle Stimulation induziert einen breitbandigen hochfrequenten Anstieg neuronaler Synchronisation. 2) Diese Synchronisation ist selektiv für die Orientierung visueller Reize. 3) Durch Analyse dieser Stimulusselektivität kann ein funktionelles Band neuronaler Synchronisation von etwa 45 Hz bis 120 Hz definiert werden. Diese Untersuchungen an wachen, sich unter vergleichsweise natürlichen Bedingungen verhaltenden Tieren demonstrieren eine überraschend breite Frequenzverteilung neuronaler Synchronisation, die im hochfrequenten Bereich weit über die üblicherweise untersuchten Frequenzbänder hinausreicht. Diese Befunde sprechen gegen die Hypothese hochfrequenter kortikaler Synchronisation als einem schmalbandigen statischen Phänomen. / Sensory perception is not purely a bottom-up process determined only by sensory stimuli, but is strongly dependent on top-down factors such as attention or expectations.Which neuronal mechanisms underlie the integration of bottom-up and top-down directed processing of sensory information? In the first part of this study this question was addressed by numerical simulations of a neural network model of two simplified cortical areas. The simulated network takes into account recent findings concerning the pronounced functional asymmetry of cortical neurons.The network replicates several important neurophysiological findings: 1) Top-down signals enhance firing rates in hierarchically high and low cortical areas. 2) The processing of two competing stimuli is biased towards one stimulus by selective top-down signals. 3) The reciprocal network architecture results in a bidirectional flow of information. Together with the implemented non-linear somato-dendritic interaction this leads to neuronal bursting behaviour with a high signal to noise ratio. The simulated network demonstrates the critical role of the complex non-linear properties of cortical neurons for the integration of bottom-up and top-down directed sensory processing. The central question of the second part of this study is the functional role of high-frequency synchronization of neuronal activity. The strong interest in the temporal dynamics of neuronal activity is particularly due to the hypothesis of a “synchronization-code” according to which information is not solely encoded by firing rates but also by the synchronization of neuronal ensembles. Is such synchronization observed in awake animals behaving under natural conditions? Are these synchronizations stimulus selective? Is it possible to define a functional frequency band of synchronization based on an objective criterion? These questions were addressed by chronic extracellular recordings of neuronal activity in primary visual cortex of awake behaving cats: 1) Visual stimulation induces neuronal synchronization in a broad and high frequency range. 2) This synchronization is selective for the orientation of a visual stimulus. 3) By analyzing the stimulus selectivity of synchronization a functional band of neuronal synchronization can be defined from about 45 to 120 Hz. These results from animals behaving under natural conditions show a surprisingly broad spectral distribution of synchronization that extends well beyond typically investigated frequency ranges. These results cast doubt on the hypothesis of cortical high-frequency synchronizations as a spectrally sharp and static phenomenon. Neuronale Synchronisation top-down Verarbeitung visueller Kortex neuronale Netze Gamma-Band neuronal synchronization top-down processing visual cortex neural networks gamma-band 610 Medizin 33 Medizin ST 301 WW 4120 ddc:610
80	Robust relationship extraction in the biomedical domain Thomas, Philippe 25 November 2015 (has links) Seit Jahrhunderten wird menschliches Wissen in Form von natürlicher Sprache ausgetauscht und in Dokumenten schriftlich aufgezeichnet. In den letzten Jahren konnte man auf dem Gebiet der Lebenswissenschaften eine exponentielle Zunahme wissenschaftlicher Publikationen beobachten. Diese Dissertation untersucht die automatische Extraktion von Beziehungen zwischen Eigennamen. Innerhalb dieses Gebietes beschäftigt sich die Arbeit mit der Steigerung der Robustheit für die Relationsextraktion. Zunächst wird der Einsatz von Ensemble-Methoden anhand von Daten aus der "Drug-drug-interaction challenge 2013" evaluiert. Ensemble-Methoden erhöhen die Robustheit durch Aggregation unterschiedlicher Klassifikationssysteme zu einem Modell. Weiterhin wird in dieser Arbeit das Problem der Relationsextraktion auf Dokumenten mit unbekannten Texteigenschaften beschrieben. Es wird gezeigt, dass die Verwendung des halb-überwachten Lernverfahrens self training in solchen Fällen eine höhere Robustheit erzielt als die Nutzung eines Klassifikators, der lediglich auf einem manuell annotierten Korpus trainiert wurde. Zur Ermittlung der Robustheit wird das Verfahren des cross-learnings verwendet. Zuletzt wird die Verwendung von distant-supervision untersucht. Korpora, welche mit der distant-supervision-Methode erzeugt wurden, weisen ein inhärentes Rauschen auf und profitieren daher von robusten Relationsextraktionsverfahren. Es werden zwei verschiedene Methoden untersucht, die auf solchen Korpora trainiert werden. Beide Ansätze zeigen eine vergleichbare Leistung wie vollständig überwachte Klassifikatoren, welche mit dem cross-learning-Verfahren evaluiert wurden. Um die Nutzung von Ergebnissen der Informationsextraktion zu erleichtern, wurde die semantische Suchmaschine GeneView entwickelt. Anforderungen an die Rechenkapazität beim Erstellen von GeneView werden diskutiert und Anwendungen auf den von verschiedenen Text-Mining-Komponenten extrahierten Daten präsentiert. / For several centuries, a great wealth of human knowledge has been communicated by natural language, often recorded in written documents. In the life sciences, an exponential increase of scientific articles has been observed, hindering the effective and fast reconciliation of previous finding into current research projects. This thesis studies the automatic extraction of relationships between named entities. Within this topic, it focuses on increasing robustness for relationship extraction. First, we evaluate the use of ensemble methods to improve performance using data provided by the drug-drug-interaction challenge 2013. Ensemble methods aggregate several classifiers into one model, increasing robustness by reducing the risk of choosing an inappropriate single classifier. Second, this work discusses the problem of applying relationship extraction to documents with unknown text characteristics. Robustness of a text mining component is assessed by cross-learning, where a model is evaluated on a corpus different from the training corpus. We apply self-training, a semi-supervised learning technique, in order to increase cross-learning performance and show that it is more robust in comparison to a classifier trained on manually annotated text only. Third, we investigate the use of distant supervision to overcome the need of manually annotated training instances. Corpora derived by distant supervision are inherently noisy, thus benefiting from robust relationship extraction methods. We compare two different methods and show that both approaches achieve similar performance as fully supervised classifiers, evaluated in the cross-learning scenario. To facilitate the usage of information extraction results, including those developed within this thesis, we develop the semantic search engine GeneView. We discuss computational requirements to build this resource and present some applications utilizing the data extracted by different text-mining components. Relationsextraktion Informationsextraktion Protein-Protein Interaktionen Maschinelles Lernen Verarbeitung natürlicher Sprache Text Mining Information Extraction Natural Language Processing Text Mining Relation Extraction Protein Protein Interactions Machine Learning 004 Informatik 28 Informatik, Datenverarbeitung WC 7700 ddc:004

Search results