• Refine Query
  • Source
  • Publication year
  • to
  • Language
  • 12
  • 9
  • 4
  • Tagged with
  • 25
  • 22
  • 14
  • 14
  • 11
  • 11
  • 11
  • 9
  • 6
  • 6
  • 5
  • 5
  • 4
  • 4
  • 4
  • About
  • The Global ETD Search service is a free service for researchers to find electronic theses and dissertations. This service is provided by the Networked Digital Library of Theses and Dissertations.
    Our metadata is collected from universities around the world. If you manage a university/consortium/country archive and want to be added, details can be found on the NDLTD website.
11

ANNIS: A graph-based query system for deeply annotated text corpora

Krause, Thomas 11 January 2019 (has links)
Diese Dissertation beschreibt das Design und die Implementierung eines effizienten Suchsystems für linguistische Korpora. Das bestehende und auf einer relationalen Datenbank basierende System ANNIS ist spezialisiert darin, Korpora mit verschiedenen Arten von Annotationen zu unterstützen und nutzt Graphen als einheitliche Repräsentation der verschiedener Annotationen. Für diese Dissertation wurde eine Hauptspeicher-Datenbank, die rein auf Graphen basiert, als Nachfolger für ANNIS entwickelt. Die Korpora werden in Kantenkomponenten partitioniert und für verschiedene Typen von Subgraphen werden unterschiedliche Implementationen zur Darstellung und Suche in diesen Komponenten genutzt. Operationen der Anfragesprache AQL (ANNIS Query Language) werden als Kombination von Erreichbarkeitsanfragen auf diesen verschiedenen Komponenten implementiert und jede Implementierung hat optimierte Funktionen für diese Art von Anfragen. Dieser Ansatz nutzt die verschiedenen Strukturen der unterschiedlichen Annotationsarten aus, ohne die einheitliche Darstellung als Graph zu verlieren. Zusätzliche Optimierungen, wie die parallele Ausführung von Teilen der Anfragen, wurden ebenfalls implementiert und evaluiert. Da AQL eine bestehende Implementierung besitzt und diese für Forscher offen als webbasierter Service zu Verfügung steht, konnten echte AQL-Anfragen aufgenommen werden. Diese dienten als Grundlage für einen Benchmark der neuen Implementierung. Mehr als 4000 Anfragen über 18 Korpora wurden zu einem realistischen Workload zusammengetragen, der sehr unterschiedliche Arten von Korpora und Anfragen mit einem breitem Spektrum von Komplexität enthält. Die neue graphbasierte Implementierung wurde mit der existierenden, die eine relationale Datenbank nutzt, verglichen. Sie führt den Anfragen im Workload im Vergleich ~10 schneller aus und die Experimente zeigen auch, dass die verschiedenen Implementierungen für die Kantenkomponenten daran einen großen Anteil haben. / This dissertation describes the design and implementation of an efficient system for linguistic corpus queries. The existing system ANNIS is based on a relational database and is focused on providing support for corpora with very different kinds of annotations and uses graphs as unified representations of the different annotations. For this dissertation, a main memory and solely graph-based successor of ANNIS has been developed. Corpora are divided into edge components and different implementations for representation and search of these components are used for different types of subgraphs. AQL operations are interpreted as a set of reachability queries on the different components and each component implementation has optimized functions for this type of queries. This approach allows exploiting the different structures of the different kinds of annotations without losing the common representation as a graph. Additional optimizations, like parallel executions of parts of the query, are also implemented and evaluated. Since AQL has an existing implementation and is already provided as a web-based service for researchers, real-life AQL queries have been recorded and thus can be used as a base for benchmarking the new implementation. More than 4000 queries from 18 corpora (from which most are available under an open-access license) have been compiled into a realistic workload that includes very different types of corpora and queries with a wide range of complexity. The new graph-based implementation was compared against the existing one, which uses a relational database. It executes the workload ~10 faster than the baseline and experiments show that the different graph storage implementations had a major effect in this improvement.
12

Fachphraseologismen in der Medizin: Eine kontrastive Analyse fachphraseologischer Einheiten in spanischen und deutschen Fachtexten zur Therapie des Schlaganfalls

Pfab, Franziska 10 June 2013 (has links)
Beim Fachtextübersetzen und in der technischen Redaktion ist die Beherrschung der korrekten Terminologie einer Fachsprache allein oft nicht ausreichend, sondern es bedarf auch des Wissens um die typische, für eine Sprache idiomatische Einbettung der Termini in den Text, z. B. in Form von Fachphraseologismen. Derartige Informationen finden sich jedoch häufig nicht in Fachwörterbüchern. Die vorliegende Arbeit beschäftigt sich mit terminologischen Phraseologismen in der medizinischen Fachsprache. Im Rahmen einer korpusbasierten Analyse wurden exemplarisch deutsche und spanische Fachphraseologismen aus einem Teilbereich der medizinischen Fachkommunikation, der Schlaganfallakuttherapie, in ihrem tatsächlichen, variantenreichen Gebrauch herausgearbeitet und in einem Glossar zusammengestellt, das als Unterstützung bei der Gestaltung von Übersetzungen sowie der technischen Redaktion entsprechender Texte dienen kann. Damit zeigt die Arbeit die Bedeutung fachphraseologischer Untersuchungen auf.
13

The text encoding software of the Thesaurus Linguae Aegyptiae

Schweitzer, Simon January 2016 (has links)
The Thesaurus Linguae Aegyptiae (TLA; http://aaew.bbaw.de/tla) is the publication platform of the project „Structure and Transformation in the Vocabulary of the Egyptian Language: Texts and Knowledge in the Culture of Ancient Egypt“ (formerly known as “Altägyptisches Wörterbuch”) located in Berlin and Leipzig. It contains the largest corpus of Egyptian texts (ca. 1.4 million text words) and it is a very important tool for linguistic, philological, lexicographical, and cultural research. My paper introduces you to the software behind the TLA. I will show how easy it is to add a new text to the corpus with transcription, translation, Hieroglyphic codes, and metadata and how easy you can add any annotations of different types like rubra, citations from other texts, comments, direct speech. The software itself is freely available and platform independent. You are welcome to use our software to edit your texts and to cooperate with us!
14

Die Negation von bar-Adjektiven – eine korpuslinguistische Untersuchung mithilfe von Data-Mining-Methoden

Reiße, Christiane 06 March 2006 (has links)
Diese Arbeit liefert einen Beitrag zur Erforschung der Negation von <i>bar</i>-Adjektiven. <i>Bar</i>-Adjektive k&ouml;nnen auf zwei verschiedene Weisen negiert werden: durch Pr&auml;figierung mit <i>un</i> wie in <i>undenkbar</i> und durch vorangestelltes <i>nicht</i> wie in <i>nicht essbar</i>. Die Negation mit <i>nicht</i> ist immer m&ouml;glich. Die Negation mit <i>un</i> unterliegt hingegen bestimmten Restriktionen. Diese Restriktionen zu erforschen ist Gegenstand dieser Arbeit. Es wird daf&uuml;r ein integrierter Ansatz aus Korpusanalyse und Data Mining benutzt.
15

Vielfalt und Integration - diversitá ed integrazione - diversité et intégration: Sprache(n) in sozialen und digitalen Räumen: Eine Festschrift für Elisabeth Burr

Amnisius, Marie, Arestau, Elena, Burkhardt, Julia, Herold, Nastasia, Sierig, Rebecca 25 April 2023 (has links)
Diese Festschrift für Elisabeth Burr stellt Vielfalt und Integration in der Sprachwissenschaft und in den Digital Humanities in den Mittelpunkt. Die Beiträge berühren zentrale Fragen im Schaffen Burrs: Wie kann Sprache und ihre Variation in Abhängigkeit von sozialen und geographischen Faktoren adäquat beschrieben werden? Wie lassen sich informatische und digitale Zugänge dafür nutzen? Verknüpft werden diese Fragen mit ihr wichtigen und aktuellen Themen aus Sozio-, Gender- und Korpuslinguistik, Dialektologie und Sprachgeographie sowie den digitalen Geisteswissenschaften. Die Beitragenden sind u. a. Stefania Spina, Thomas Krefeld, Annette Gerstenberg, Lázslo Hunyadi, Carol Chiodo und Lauren Tilton, Manuel Burghardt, Øyvind Eide, Jürgen Hermes, Andreas Witt, Ray Siemens, Arianna Ciula, Alejandro Bia sowie Rob Evans.
16

Figurative Verben in der allgemeinen Wissenschaftssprache des Deutschen

Meißner, Cordula 28 November 2016 (has links) (PDF)
In der vorliegenden Arbeit wird der für die allgemeine Wissenschaftssprache des Deutschen charakteristische Bereich der figurativen Verben im Rahmen eines gebrauchsbasierten Ansatzes unter Verwendung korpuslinguistischer Methoden empirisch erfasst und beschrieben. Auf der Grundlage dieser Untersuchung wird ein integrativer Ansatz zur Erfassung und Beschreibung zentraler Wortschatzbereiche der allgemeinen Wissenschaftssprache entwickelt. Das so gewonnene integrative Beschreibungsmodell verbindet die Perspektiven bisheriger quantitativ-bestandsbezogener und bedeutungsorientiert-einheitenbezogener Ansätze und bezieht darüber hinaus sowohl formale als auch inhaltlich-funktionale Aspekte als Gliederungsprinzipien für die zu beschreibenden Wortschatzbereiche mit ein. Methodisch zeichnet es sich durch das Ineinandergreifen von korpusgesteuertem und korpusbasiertem Vorgehen aus. Die Ausarbeitung der Komponenten des Beschreibungsmodells wird auf mehreren Ebenen vorgelegt: Diese werden im ersten Kapitel zunächst ausgehend von einer Bestandsaufnahme vorliegender Arbeiten zur Beschreibung allgemein-wissenschaftlichen Wortschatzes formuliert. Im zweiten Kapitel werden sie im Rahmen eines gebrauchsbasierten Modells der Sprachbeschreibung, der Kognitiven Grammatik Langackers, sprachtheoretisch fundiert. Methodisch eingelöst findet sich diese theoretische Fundierung in den korpuslinguistischen Untersuchungen zu figurativen Verben, die Gegenstand der Kapitel drei und vier sind. Im fünften Kapitel werden die dabei gewonnenen Ergebnisse zu einer formbasiert-funktionalen Typologie figurativer Verben zusammengeführt. Kapitel sechs zeigt die mit dem vorgeschlagenen Ansatz verbundenen Transfermöglichkeiten zur Erfassung und Beschreibung anderer Bereiche des allgemein-wissenschaftlichen Wortschatzes auf. Kapitel sieben ordnet den Untersuchungsgegenstand der figurativen Verben und das entwickelte Beschreibungsmodell aus fremdsprachendidaktischer Perspektive ein und skizziert einen Vorschlag zur Vermittlung allgemein-wissenschaftlichen Wortschatzes. / Verbs like ‘ausgehen von’, ‘beziehen auf’ or ‘darstellen’ that contain semantically concrete basic verbs (gehen, ziehen, stellen) form an essential part of German general academic vocabulary, i.e. vocabulary that is used across disciplines. Adopting a corpus linguistic approach, the study develops a comprehensive description of these ‚figurative verbs‘. Based on a data-driven methodology it investigates the properties of this lexis and shows that figurative verbs containing typical recurring forms like -stellen, -führen, -gehen and others are highly relevant from a quantitative point of view. On the basis of the most prominently recurring formal parts, a core inventory of verbs is collected and described with respect to the areas of meaning expressed as well as regarding aspects of polysemy. Based on the empirical study, a model for the identification and description of vocabulary is developed, that integrates the hitherto separated quantitative - inventory based and meaning oriented - unit based perspectives. Moreover, it brings together aspects regarding form and function as means of structuring the vocabulary under description. Methodically, the model builds on a combination of the corpus-driven and the corpus-based approach. The model is elaborated as follows: In Chapter 1, important aspects of description that the model should meet are identified based on a survey of existing work on general academic language. Chapter 2 provides a linguistic foundation within the framework of usage-based language description. In particular, it draws on Langacker’s Cognitive Grammar, from which the concepts of linguistic unit and construal are adopted. Chapters 3 and 4 present the corpus linguistic investigations on figurative verbs. In Chapter 5, the empirical results are brought together in a form- as well as function-based typology of figurative verbs. Chapter 6 synthesizes the findings into a model and shows possibilities of application of the proposed approach to other areas of general academic vocabulary. Finally, Chapter 7 summarizes the results from the perspective of language pedagogy and outlines a proposal for the teaching of general academic vocabulary.
17

Figurative Verben in der allgemeinen Wissenschaftssprache des Deutschen: eine Korpusstudie

Meißner, Cordula 28 November 2016 (has links)
In der vorliegenden Arbeit wird der für die allgemeine Wissenschaftssprache des Deutschen charakteristische Bereich der figurativen Verben im Rahmen eines gebrauchsbasierten Ansatzes unter Verwendung korpuslinguistischer Methoden empirisch erfasst und beschrieben. Auf der Grundlage dieser Untersuchung wird ein integrativer Ansatz zur Erfassung und Beschreibung zentraler Wortschatzbereiche der allgemeinen Wissenschaftssprache entwickelt. Das so gewonnene integrative Beschreibungsmodell verbindet die Perspektiven bisheriger quantitativ-bestandsbezogener und bedeutungsorientiert-einheitenbezogener Ansätze und bezieht darüber hinaus sowohl formale als auch inhaltlich-funktionale Aspekte als Gliederungsprinzipien für die zu beschreibenden Wortschatzbereiche mit ein. Methodisch zeichnet es sich durch das Ineinandergreifen von korpusgesteuertem und korpusbasiertem Vorgehen aus. Die Ausarbeitung der Komponenten des Beschreibungsmodells wird auf mehreren Ebenen vorgelegt: Diese werden im ersten Kapitel zunächst ausgehend von einer Bestandsaufnahme vorliegender Arbeiten zur Beschreibung allgemein-wissenschaftlichen Wortschatzes formuliert. Im zweiten Kapitel werden sie im Rahmen eines gebrauchsbasierten Modells der Sprachbeschreibung, der Kognitiven Grammatik Langackers, sprachtheoretisch fundiert. Methodisch eingelöst findet sich diese theoretische Fundierung in den korpuslinguistischen Untersuchungen zu figurativen Verben, die Gegenstand der Kapitel drei und vier sind. Im fünften Kapitel werden die dabei gewonnenen Ergebnisse zu einer formbasiert-funktionalen Typologie figurativer Verben zusammengeführt. Kapitel sechs zeigt die mit dem vorgeschlagenen Ansatz verbundenen Transfermöglichkeiten zur Erfassung und Beschreibung anderer Bereiche des allgemein-wissenschaftlichen Wortschatzes auf. Kapitel sieben ordnet den Untersuchungsgegenstand der figurativen Verben und das entwickelte Beschreibungsmodell aus fremdsprachendidaktischer Perspektive ein und skizziert einen Vorschlag zur Vermittlung allgemein-wissenschaftlichen Wortschatzes. / Verbs like ‘ausgehen von’, ‘beziehen auf’ or ‘darstellen’ that contain semantically concrete basic verbs (gehen, ziehen, stellen) form an essential part of German general academic vocabulary, i.e. vocabulary that is used across disciplines. Adopting a corpus linguistic approach, the study develops a comprehensive description of these ‚figurative verbs‘. Based on a data-driven methodology it investigates the properties of this lexis and shows that figurative verbs containing typical recurring forms like -stellen, -führen, -gehen and others are highly relevant from a quantitative point of view. On the basis of the most prominently recurring formal parts, a core inventory of verbs is collected and described with respect to the areas of meaning expressed as well as regarding aspects of polysemy. Based on the empirical study, a model for the identification and description of vocabulary is developed, that integrates the hitherto separated quantitative - inventory based and meaning oriented - unit based perspectives. Moreover, it brings together aspects regarding form and function as means of structuring the vocabulary under description. Methodically, the model builds on a combination of the corpus-driven and the corpus-based approach. The model is elaborated as follows: In Chapter 1, important aspects of description that the model should meet are identified based on a survey of existing work on general academic language. Chapter 2 provides a linguistic foundation within the framework of usage-based language description. In particular, it draws on Langacker’s Cognitive Grammar, from which the concepts of linguistic unit and construal are adopted. Chapters 3 and 4 present the corpus linguistic investigations on figurative verbs. In Chapter 5, the empirical results are brought together in a form- as well as function-based typology of figurative verbs. Chapter 6 synthesizes the findings into a model and shows possibilities of application of the proposed approach to other areas of general academic vocabulary. Finally, Chapter 7 summarizes the results from the perspective of language pedagogy and outlines a proposal for the teaching of general academic vocabulary.
18

A Corpus-based Comparison of Albanian and Italian Student Writing in L1 and English as L2: Hedges and Boosters as Modalization by Degree

Dheskali, Vincenzo 28 February 2020 (has links)
Within the system of modality, modalization builds an area of uncertainty. It is an intermediate point between positive polarity (it is) and negative polarity (it is not), which has various degrees of indeterminacy (Halliday and Matthiessen 2014: 176). This indeterminacy includes probability and is expressed through items that Holmes (1990) and Hyland (1998) termed hedges and boosters. However, hedges and boosters can also function within intensity, where they convey a certain level of degree. Through them, writers achieve approval by finding the right balance between the reinforcement of statements with the assurance of reliable knowledge and the tentativeness to convey doubt and adequate social interrelations (Hyland 1998b: 349). The aim of this comparative study is to investigate the usage of hedges and boosters in Italian and Albanian student academic writings in their L1 and L2. Author-related and proposition-related hedges (e.g. suppose, approximately) and boosters (e.g. show, completely) as well as interrelated aspects such as their positioning, orientation, manifestation, and prosody of modalization will be analysed. My paper will interweave Prince et al.’s (1980) categorization of hedges, Quirk et al.’s (1985) model of boosters, Lafuente Millán’s (2008) categorization of approximative meanings and related concepts of the Systemic Functional Grammar (henceforth SFG) (Halliday and Matthiessen 2014) to create an innovative combination. I have compiled two corpora of Italian student writings (around 3 million words each) respectively in Italian and English and two corpora of writings by Albanian students in Albanian (around 2.2 million words) and in English (around 600.000 words). All corpora include a similar number of words and genres for each disciplinary domain as well as a balance of male and female writers. Disciplinary domains pertain to both soft and hard sciences (Social Sciences, Languages and Literature, Medicine, Chemistry, Physics, Mathematics and Informatics). As Toska (2015) stated, very little research has been conducted on academic writing in Albania. Thus, it is essential to initiate research in this field. Results of the quantitative analysis show that hedges were favored by Albanians and boosters were favored by Italians. The neutral position (in-between the clause complex, next to the verb, temporal or finite operator) of hedges and boosters was the most frequently encountered position in my corpora, followed by medial (in-between the clause complex, not next to verb, temporal or finite operator) and thematic position (at the beginning of the clause). Lastly, the same hedge (probably) and booster (significantly) appeared as author-related (shield) and proposition-related (approximator). This overlap between author-related and proposition-related categories demonstrates the importance of context in ranking these items and suggests relevant modifications to the original categorization by Prince et al. (1980). From my findings, I conclude that Italians show more commitment than Albanians, who appear more tentative in their writings. / Da Sprache (nach Halliday/Matthiesen 2014: 25) ein Mittel des persönlichen Ausdrucks und der fachlichen und gesellschaftlichen Verständigung ist, beinhalten unsere Texte unsere persönlichen und pädagogischen Erfahrungen, unseres alltäglichen Umfeldes und unserer Kultur. Die vorliegende Dissertationsschrift ist ein Beitrag aus der Perspektive der systemisch-funktionalen Grammatik und des wissenschaftlichen Schreibens. Sie befasst sich mit pragmatischen, semantischen und syntaktischen Aspekten von Hedges und Booster. Dafür wurden vier Korpora albanischer und italienischer wissenschaftlicher Arbeiten von Studenten in deren Muttersprache sowie ihrer Zweitsprache Englisch erstellt und untersucht. Die fünf Forschungsfragen beziehen sich größtenteils auf die qualitativen und quantitativen Unterschiede in der Verwendung von Hedges, Booster und deren semantischen und pragmatischen Unterkategorien in den albanischen und italienischen Korpora. Zudem wurde untersucht, welche Rolle Geschlecht und Genre bei der Verwendung von Hedges und Booster spielen.
19

Nicoline Hortzitz, Die Sprache der Judenfeindschaft in der frühen Neuzeit (1450–1700): Untersuchungen zu Wortschatz, Text und Argumentation

Lasch, Alexander 18 May 2021 (has links)
Die Sprache der Judenfeindschaft in der frühen Neuzeit (1450–1700) steht im „Grenzbereich zwischen sprach- und kulturwissenschaftlicher Antisemitismusforschung“, die die „zeittypischen Argumentationsstrategien, Begründungsmuster und sprachlichen Darstellungsmittel in antijüdischen Schriften“ der Frühen Neuzeit in den Blick nimmt, um die „Zusammenhänge von vormodernem (religiösem) ,Antijudaismus‘ und modernem (rassistisch-säkularem) ,Antisemitismus‘“ zu erhellen (Klappentext). Methodisch ruht die Studie auf einer Verschränkung zwischen struktureller Semantik und einer die Argumentationsstrukturen hervorhebenden Textlinguistik auf. Sie knüpft damit unmittelbar an die Vorarbeiten von Nicoline Hortzitz an, die in der Sprache der Judenfeindschaft die Ergebnisse ihrer Dissertation zum Früh-Antisemitismus (1988), der Monographie Judenarzt (1994) und diverser Aufsätze in einer „Gesamtbewertung der Befunde“ (S. V) vorlegt. In seiner Besprechung der Dissertation zum Früh-Antisemitismus merkte Matthias Richter kritisch an, daß „infolge des strukturalistischen Ansatzes die individuellen Differenzen zwischen den untersuchten Autoren zu sehr vernachlässigt werden.“¹ Die „minuziöse[] und aufwendige[] Systematisierung des sprachlichen Instrumentariums der Früh-Antisemiten“² setzt die vorliegende Monographie in der Ausweitung des Untersuchungszeitraums fort, ohne dabei jedoch eine „strukturelle Untersuchung“ liefern zu wollen, wie die Akzentverschiebung im Titel nahe zu legen scheint.
20

Language games and nature: a corpus-based analysis of ecological discourse

Frayne, Craig 07 July 2021 (has links)
This dissertation approaches environmental discourse from the perspective of intercultural communication research. As a discipline, intercultural communication has encompassed a range of analytical levels, from micro-analysis of everyday communicative interactions to the macro-level structural factors that were brought into light by the critical turn. In light of planetary environmental issues, some researchers have called for an “ecological turn” as a new research paradigm. However, the complexity of integrating communication, culture, and the natural world into a coherent research program poses significant conceptual and methodological challenges. This dissertation seeks to provide both a methodological and conceptual framework for discourse at the interface of human cultures and the natural world.

Page generated in 0.0481 seconds