Global ETD Search

21	Digitales Annotieren von (italienischen) Comics – Status quo Arestau, Elena 02 May 2023 (has links) Die Comicforschung hat mit der fortschreitenden Digitalisierung eine neue Dimension erfahren. Zahlreiche Initiativen und Projekte, in denen die bunten Hefte digitalisiert werden, sind ins Leben gerufen worden. Dabei wird dieses Populärmedium nicht nur digitalisiert, sondern auch je nach Zweck und Ziel eines Projektes oder einer Initiative digital annotiert. Bis zum gegenwärtigen Zeitpunkt wurden bereits bemerkenswerte Versuche unternommen, die Comics mit Hilfe von Annotationssprachen zu kodieren. Der folgende Beitrag stellt zum einen eine Bestandsaufnahme, was das digitale Annotieren der Comics betrifft, dar. Zum anderen versucht er auf den Status Quo der italienischen Comicforschung im Bereich des digitalen Annotierens einzugehen. / La ricerca sul fumetto ha assunto una nuova dimensione con l’avanzare della digitalizzazione. Sono state avviate numerose iniziative e progetti in cui vengono digitalizzati i fumetti. In questo modo, questo mezzo popolare non è stato solo digitalizzato, ma anche annotato digitalmente a secondo dello scopo e dell’obbiettivo di un progetto o di un’iniziativa. Fino ad ora, sono già stati fatti notevoli tentativi di codificare i fumetti utilizzando linguaggi di annotazione. Il seguente contributo rappresenta da un lato il bilancio dello stato attuale per quanto riguarda l’annotazione digitale dei fumetti. Inoltre, cerca di affrontare lo status quo della ricerca sui fumetti italiani nel campo dell’annotazione digitale. info:eu-repo/classification/ddc/410 ddc:410 info:eu-repo/classification/ddc/440 ddc:440 info:eu-repo/classification/ddc/450 ddc:450
22	Tracking domain knowledge based on segmented textual sources Kalledat, Tobias 11 May 2009 (has links) Die hier vorliegende Forschungsarbeit hat zum Ziel, Erkenntnisse über den Einfluss der Vorverarbeitung auf die Ergebnisse der Wissensgenerierung zu gewinnen und konkrete Handlungsempfehlungen für die geeignete Vorverarbeitung von Textkorpora in Text Data Mining (TDM) Vorhaben zu geben. Der Fokus liegt dabei auf der Extraktion und der Verfolgung von Konzepten innerhalb bestimmter Wissensdomänen mit Hilfe eines methodischen Ansatzes, der auf der waagerechten und senkrechten Segmentierung von Korpora basiert. Ergebnis sind zeitlich segmentierte Teilkorpora, welche die Persistenzeigenschaft der enthaltenen Terme widerspiegeln. Innerhalb jedes zeitlich segmentierten Teilkorpus können jeweils Cluster von Termen gebildet werden, wobei eines diejenigen Terme enthält, die bezogen auf das Gesamtkorpus nicht persistent sind und das andere Cluster diejenigen, die in allen zeitlichen Segmenten vorkommen. Auf Grundlage einfacher Häufigkeitsmaße kann gezeigt werden, dass allein die statistische Qualität eines einzelnen Korpus es erlaubt, die Vorverarbeitungsqualität zu messen. Vergleichskorpora sind nicht notwendig. Die Zeitreihen der Häufigkeitsmaße zeigen signifikante negative Korrelationen zwischen dem Cluster von Termen, die permanent auftreten, und demjenigen das die Terme enthält, die nicht persistent in allen zeitlichen Segmenten des Korpus vorkommen. Dies trifft ausschließlich auf das optimal vorverarbeitete Korpus zu und findet sich nicht in den anderen Test Sets, deren Vorverarbeitungsqualität gering war. Werden die häufigsten Terme unter Verwendung domänenspezifischer Taxonomien zu Konzepten gruppiert, zeigt sich eine signifikante negative Korrelation zwischen der Anzahl unterschiedlicher Terme pro Zeitsegment und den einer Taxonomie zugeordneten Termen. Dies trifft wiederum nur für das Korpus mit hoher Vorverarbeitungsqualität zu. Eine semantische Analyse auf einem mit Hilfe einer Schwellenwert basierenden TDM Methode aufbereiteten Datenbestand ergab signifikant unterschiedliche Resultate an generiertem Wissen, abhängig von der Qualität der Datenvorverarbeitung. Mit den in dieser Forschungsarbeit vorgestellten Methoden und Maßzahlen ist sowohl die Qualität der verwendeten Quellkorpora, als auch die Qualität der angewandten Taxonomien messbar. Basierend auf diesen Erkenntnissen werden Indikatoren für die Messung und Bewertung von Korpora und Taxonomien entwickelt sowie Empfehlungen für eine dem Ziel des nachfolgenden Analyseprozesses adäquate Vorverarbeitung gegeben. / The research work available here has the goal of analysing the influence of pre-processing on the results of the generation of knowledge and of giving concrete recommendations for action for suitable pre-processing of text corpora in TDM. The research introduced here focuses on the extraction and tracking of concepts within certain knowledge domains using an approach of horizontally (timeline) and vertically (persistence of terms) segmenting of corpora. The result is a set of segmented corpora according to the timeline. Within each timeline segment clusters of concepts can be built according to their persistence quality in relation to each single time-based corpus segment and to the whole corpus. Based on a simple frequency measure it can be shown that only the statistical quality of a single corpus allows measuring the pre-processing quality. It is not necessary to use comparison corpora. The time series of the frequency measure have significant negative correlations between the two clusters of concepts that occur permanently and others that vary within an optimal pre-processed corpus. This was found to be the opposite in every other test set that was pre-processed with lower quality. The most frequent terms were grouped into concepts by the use of domain-specific taxonomies. A significant negative correlation was found between the time series of different terms per yearly corpus segments and the terms assigned to taxonomy for corpora with high quality level of pre-processing. A semantic analysis based on a simple TDM method with significant frequency threshold measures resulted in significant different knowledge extracted from corpora with different qualities of pre-processing. With measures introduced in this research it is possible to measure the quality of applied taxonomy. Rules for the measuring of corpus as well as taxonomy quality were derived from these results and advice suggested for the appropriate level of pre-processing. Datenvorverarbeitung Text Data Mining Korpuskennzahlen Korpuslinguistik Computerlinguistik Vorverarbeitungsqualität Wissensextraktion Text Data Mining Corpus Measures Corpus Linguistics Computational Linguistics Data Pre-processing Pre-processing Quality Knowledge Extraction 330 Wirtschaft 17 Wirtschaft QP 345 ddc:330
23	MKM – ein Metamodell für Korpusmetadaten / Dokumentation und Wiederverwendung historischer Korpora Odebrecht, Carolin 11 September 2018 (has links) Korpusdokumentation wird in dieser Arbeit als eine Voraussetzung für die Wiederverwendung von Korpora und als ein Bestandteil des Forschungsdatenmanagements verstanden, welches unter anderem die Veröffentlichung und Archivierung von Korpora umfasst. Verschiedene Forschungsdaten stellen ganz unterschiedliche Anforderungen an die Dokumentation und können auch unterschiedlich wiederverwendet werden. Ein geeignetes Anwendungsbeispiel stellen historische Textkorpora dar, da sie in vielen Fächern als empirische Grundlage für die Forschung genutzt werden können. Sie zeichnen sich im Weiteren durch vielfältige Unterschiede in ihrer Aufbereitung und durch ein komplexes Verhältnis zu der historischen Vorlage aus. Die Ergebnisse von Transkription und Normalisierung müssen als eigenständige Repräsentationen und Interpretationen im Vergleich zur Vorlage verstanden werden. Was müssen Forscherinnen und Forscher über ihr Korpus mit Hilfe von Metadaten dokumentieren, um dessen Erschließung und Wiederverwendung für andere Forscherinnen und Forscher zu ermöglichen? Welche Funktionen übernehmen dabei die Metadaten? Wie können Metadaten modelliert werden, um auf alle Arten von historischen Korpora angewendet werden zu können? Die Arbeit und ihre Fragestellung sind fest in einem interdisziplinären Kontext verortet. Für die Beantwortung der Forschungsfragen wurden Erkenntnisse und Methoden aus den Fachbereichen der Korpuslinguistik, der historischen Linguistik, der Informationswissenschaft sowie der Informatik theoretisch und empirisch betrachtet und für die Entwicklung eines Metamodells für Korpusmetadaten fruchtbar gemacht. Das im Rahmen dieser Arbeit in UML entwickelte Metamodell für Korpusmetadaten modelliert Metadaten von historischen textbasierten Korpora aus einer technisch-abstrakten, produktorientierten und überfachlichen Perspektive und ist in einer TEI-Spezifikation mit Hilfe der TEI-eigenen Modellierungssprache ODD realisiert. / Corpus documentation is a requirement for enabling corpus reuse scenarios and is a part of research data management which covers, among others, data publication and archiving. Different types of research data make differing demands on corpus documentation, and may be reused in various ways. Historical corpora represent an interesting and challenging use case because they are the foundation for empirical studies in many disciplines and show a great variety of reuse possibilities, of data creation, and of data annotation. Furthermore, the relation between the historical corpus and the historical original is complex. The transcription and normalisation of historical texts must be understood as independent representations and interpretations in their own right. Which kind of metadata information, then, must be included in a corpus documentation in order to enable intellectual access and reuse scenarios? What kind of role do metadata play? How can metadata be designed to be applicable to all types of historical corpora? These research questions can only be addressed with help of an interdisciplinary approach, considering findings and methods of corpus linguistics, historical linguistics, information science and computer science. The metamodel developed in this thesis models metadata of historical text-based corpora from a technical, abstract, and interdisciplinary point of view with help of UML. It is realised as a TEI-specification using the modelling language ODD. Historische Korpora Metadaten Dokumentation Repositorium Wiederverwendung Metamodell TEI Korpuslinguistik historical corpora metadata documentation repository reuse metamodel TEI corpus linguistics 410 Linguistik ES 900 ddc:417 ddc:410 ddc:020
24	Agreement and transitivity in Middle Ukrainian resultative and passive -no/-to constructions / a corpus-based diachronic investigation Parkhomenko, Iryna 19 January 2017 (has links) Die ukrainische Sprache, die zu den Nominativ-Akkusativ-Sprachen gehört, weist sowohl historisch als auch synchron Abweichungen vom kanonischen Lizensierungsmuster dieser beiden Kasus auf. So kennt das Ukrainische resultative, inkongruente, in den Finitheitsmerkmalen neutralisierten Passiv-Partizipien auf -no, -to, die wie finite Aktiv-Verben ihrem internen Argument Akkusativ zuweisen, aber historisch auch Nominativ am Patiensargument lizensierten. Solche Kasus-Zuweisung am Patiens passivischer und impersonaler Verben bei fehlender oder Default-Kongruenz stellt einen wichtigen Prüfstein für die theoretische Erfassung von Kasus, Finitheitsmerkmale und Subjektmarkierung dar. Das Ziel der Untersuchung war, über die etymologische Fragestellung hinaus, ein korpus-basiertes und quantifizierbares Bild des diachronen grammatischen Wandels der -no, -to-Formen im Mittelukrainischen zu erstellen. Synchron sind -no, -to bereits gut erforscht: die Struktur erlaubt eine overte Agensangabe im Instrumental und eine optional eingesetzte overte Kopula. Diagnostische Subjekteigenschaften wie Kontrolle in die Infinitiv- und Partizipialkontexte, sowie die Bindung von Reflexiva greifen nicht. Historisch dagegen bestehen noch große empirische Lücken und Beschreibungsdesiderate. Es wurden einige der empirischen Lücken in der Diachronie der -no, -to auf der Grundlage eines elektronischen, diachronen (1500-1800) mittelgroßen Korpus literarischer und administrativer Texte geschlossen: die Arbeit beschäftigt sich mit der Kongruenz und Transitivität der -no, -to und untersucht sie parallel zu den morphologisch identischen passiven kongruierenden -no, -to. / The Ukrainian language belongs to the nominative-accusative languages and demonstrates both historically and synchronically the deviations from the canonical case licensing pattern. That is, Ukrainian has resultative, non-agreeing and non-finite passive participles ending in either -no or -to that assign accusative to their internal argument, just like finite active verbs do. Historically -no, -to forms licensed the nominative on the patience argument as well. Accusative case assignment on the patience in impersonal verbs that lack agreement represents an important touchstone for the theoretical understanding of case, finiteness and subject marking. Along with the etymological questions, the aim of this investigation was to obtain a corpus-based quantifiable picture of the diachronic grammatical change of -no, -to forms in Middle Ukrainian. The modern -no, -to structure has already been properly investigated: it is clear that the structure allows for an overt agent phrase in instrumental and for an optional copula. Diagnostic subject properties like control into the infinitival and participial contexts, as well as the binding of reflexives do not apply. Historically however, there are large empirical gaps and desiderata as to the development of -no, -to. The thesis closes several of the empirical gaps in the diachrony of -no, -to on the basis of a middle-sized electronic corpus of literary and administrative texts from 1500-1800. The thesis deals with the agreement and transitivity of non-agreeing -no, -to that have been investigated parallel to the morphologically identical to them agreeing passive -no, -to. Korpuslinguistik diachrone Syntax Mittelukrainisch periphrastisches Passiv -no -to Konstruktion corpus linguistics diachronic change Middle Ukrainian periphrastic passive -no -to construction KL 2184 ddc:890
25	Measuring coselectional constraint in learner corpora: A graph-based approach Shadrova, Anna Valer'evna 24 July 2020 (has links) Die korpuslinguistische Arbeit untersucht den Erwerb von Koselektionsbeschränkungen bei Lernerinnen des Deutschen als Fremdsprache in einem quasi-longitudinalen Forschungsdesign anhand des Kobalt-Korpus. Neben einigen statistischen Analysen wird vordergründig eine graphbasierte Analyse entwickelt, die auf der Graphmetrik Louvain-Modularität aufbaut. Diese wird für diverse Subkorpora nach verschiedenen Kriterien berechnet und mit Hilfe verschiedener Samplingtechniken umfassend intern validiert. Im Ergebnis zeigen sich eine Abhängigkeit der gemessenen Modularitätswerte vom Sprachstand der Teilnehmerinnen, eine höhere Modularität bei Muttersprachlerinnen, niedrigere Modularitätswerte bei weißrussischen vs. chinesischen Lernerinnen sowie ein U-Kurven-förmiger Erwerbsverlauf bei weißrussischen, nicht aber chinesischen Lerner*innen. Unterschiede zwischen den Gruppen werden aus typologischer, kognitiver, diskursiv-kultureller und Registerperspektive diskutiert. Abschließend werden Vorschläge für den Einsatz von graphbasierten Modellierungen in kernlinguistischen Fragestellungen entwickelt. Zusätzlich werden theoretische Lücken in der gebrauchsbasierten Beschreibung von Koselektionsphänomenen (Phraseologie, Idiomatizität, Kollokation) aufgezeigt und ein multidimensionales funktionales Modell als Alternative vorgeschlagen. / The thesis located in corpus linguistics analyzes the acquisition of coselectional constraint in learners of German as a second language in a quasi-longitudinal design based on the Kobalt corpus. Supplemented by a number of statistical analyses, the thesis primarily develops a graph-based analysis making use of Louvain modularity. The graph metric is computed for a range of subcorpora chosen by various criteria. Extensive internal validation is performed through a number of sampling techniques. Results robustly indicate a dependency of modularity on language acquisition progress, higher modularity in L1 vs. L2, lower modularity in Belarusian vs. Chinese learners, and a u-shaped learning development in Belarusian, but not in Chinese learners. Group differences are discussed from a typological, cognitive, cultural and cultural discourse, and register perspective. Finally, future applications of graph-based modeling in core-linguistic research are outlined. In addition, some gaps in the theoretical discussion of coselection phenomena (phraseology, idiomaticity, collocation) in usage-based linguistics are discussed and a multidimensional and functional model is proposed as an alternative. gebrauchsbasierte Linguistik Koselektion idiomatisches Prinzip Fremdsprachenerwerb quantitative Linguistik Korpuslinguistik Kollokation usage-based linguistics coselection second language acquisition idiom principle quantitative linguistics corpus linguistics collocation 410 Linguistik 430 Deutsch und verwandte Sprachen 006 Spezielle Computerverfahren GB 3026 ddc:410 ddc:430 ddc:006

Page generated in 0.0475 seconds