Spelling suggestions: "subject:"korpuslinguistik"" "subject:"korpuslinguistiek""
1 |
Experimental studies in linguistics 1January 2003 (has links)
This is the first issue of a series in which affiliates of the Institute of Linguistics report the results of their experimental work. Generative linguistics usually rely on the method of native speaker judgements in order to test their hypotheses. If a hypothesis rules out a set of sentences, linguistics can ask native speakers whether they feel these sentences are indeed ungrammatical in their language. There are, however, circumstances where this method is unreliable. In such cases a more elaborate method to test a hypothesis is called. All papes in this series, and hence, all papers in this volume deal with issues that cannot be reliably tested with native speaker judgements.
<br><br>
This volume contains 7 papers, all using different methods and finding answers to very different questions. This heterogenity, by the way, reflects the various interests and research programs of the institute. The paper, by Trutkowski, Zugck, Blaszczak, Fanselow, Fischer and Vogel deals with superiority in 10 Indo-European languages. The paper by Schlesewsky, Fanselow and Frisch and by Schlesewsky and Frisch, deal with the role of case in processing German sentences. The paper by Vogel and Frisch deals with resolving case conflicts, as does the paper by Vogel and Zugck. The nature of partitive case is the topic of the paper by Fischer. The paper by K?gler deals with the realization of question intonation in two German dialects.
<br><br>
We hope that you enjoy reading the papers!
|
2 |
Substantivische Suffixableitungen im Deutschen der Goethezeit am Beispiel von Adolph Freiherr von Knigges \(Über\) \(den\) \(Umgang\) \(mit\) \(Menschen\) oder Über den Umgang mit abstrakten Suffixderivationen / Nominal Suffix derivations in German of the Goethe period, using the example of Adolph Freiherr von Knigges “Über den Umgang mit Menschen“, or on dealing with abstract suffix derivationsvon Collani, Sina January 2022 (has links) (PDF)
Der Hauptuntersuchungsgegenstand dieser Arbeit sind substantivische Suffixableitungen, die mindestens einmal im Korpus („Über den Umgang mit Menschen“ von Adolph Franz Friedrich Ludwig Freiherr (von) Knigge) ein Abstraktum bilden. In methodisch-theoretischer Hinsicht reiht sich die Arbeit u.a. in die Projekte der Innsbrucker Arbeitsstelle ein, bei der eine historisch-synchrone Wortbildungsanalyse im Mittelpunkt steht. Die Arbeit stellt einen Ausschnitt der Wortbildung unter graphematischen, morphologischen, funktionalen und lexikalischen Gesichtspunkten dar und vergleicht diesen Ausschnitt mit dem Wörterbuchbestand um 1800 und dem Bestand der neuhochdeutschen Sprache der Gegenwart. So soll gezeigt werden, inwieweit das Korpus einen sprachlichen Spiegel seiner Zeit abbildet bzw. inwieweit eine sprachliche Entwicklung (= Wortbildungswandel) stattgefunden hat. In einem Exkurs wird zusätzlich die abstrakte Wortbildung Umgang als Mittel zur Textbildung besprochen. / The main object of this thesis are nominal suffix derivations that form an abstract at least once in the corpus (“Über den Umgang mit Menschen” by Adolph Franz Friedrich Ludwig Freiherr (von) Knigge). From a methodological-theoretical point of view, the treatise is similar to the projects of the Innsbrucker Arbeitsstelle, which focuses on a historical-synchronous word formation analysis. The study presents a section of word formation from a graphematic, morphological, functional and lexical point of view and compares it with the dictionary inventory of around 1800 and the inventory of the New High German language of the present. In this way, the author demonstrates to what extent the corpus is a realistic representation of its time and to what extent a linguistic development (= change in how word formation is done) has taken place. In an excursus, the abstract word formation Umgang as a means of text formation is additionally discussed.
|
3 |
Die Negation von bar-Adjektiven – eine korpuslinguistische Untersuchung mithilfe von Data-Mining-MethodenReiße, Christiane 06 March 2006 (has links) (PDF)
Diese Arbeit liefert einen Beitrag zur Erforschung der Negation von <i>bar</i>-Adjektiven.
<i>Bar</i>-Adjektive können auf zwei verschiedene Weisen negiert werden: durch Präfigierung mit
<i>un</i> wie in <i>undenkbar</i> und durch vorangestelltes <i>nicht</i> wie in <i>nicht
essbar</i>. Die Negation mit <i>nicht</i> ist immer möglich.
Die Negation mit <i>un</i> unterliegt hingegen bestimmten Restriktionen.
Diese Restriktionen zu erforschen ist Gegenstand dieser Arbeit. Es wird dafür
ein integrierter Ansatz aus Korpusanalyse und Data Mining benutzt.
|
4 |
Zur Fremdwortbildung bei den Adjektiven am Beispiel von al, ell, iv, ant und entGräfe, Karen 15 October 2019 (has links)
Fremdwörter werden für das Deutsche nach wie vor viel diskutiert. Die Erkenntnis jedoch, dass aus und mit diesen Fremdwörtern im Deutschen neue Wörter entstehen und sogar (Fremd-)Wortbildung möglich ist, könnte den Blick auf die oft kritisch beäugten Fremdwörter verändern. Die mit diesem Band vorgelegte Arbeit untersucht Fremdwörter des Deutschen, die dem Eurolatein zugerechnet werden. Inwiefern können eurolateinische Adjektive zur Entwicklung des Wortschatzes beitragen? Wie häufig sind sie im Deutschen? Das hohe Po-tenzial zur Weiterentwicklung und zur produktiven Fremdwortbildung wird exemplarisch an den Adjektiven auf al, ell, iv, ant und ent in einer umfangreichen Korpusanalyse untersucht. Die zunehmende Verbreitung dieser bildungssprachlichen Adjektive wird vor allem durch die Fachsprachen vorangetrieben, aus denen neue Wörter und Kombinationen übernommen wer-den. Ein empirisch fundiertes Sichtbarmachen des Aufbaus und der Häufigkeit dieser Wörter soll weitere Forschung zu Eurolatinismen auch für den Fremdsprachenunterricht anregen.
|
5 |
Česká přísloví a jejich německé ekvivalenty. Lexikografická analýza SČFL / Czech proverbs and their German equivalents. A lexicographic analysis of the SČFLKodadová, Ludmila January 2020 (has links)
This diploma thesis is focused on the analysis of German language equivalents of Czech proverbs in the dictionary of František Čermák Dictionary of Czech Phraseology and Idiomatics 4 (DCPI 4). The introductory part of the thesis characterizes proverbs as a phraseological unit and reflects the current state of Czech and German paremiography on the basis of selected dictionaries. Another theoretical starting point is the issue of equivalence, which in contrastive phraseology or, more precisely, paremiology plays an important role. The analytical part contains of multi-level analysis of German language equivalents of the Czech paremiological minimum in DPCI 4. Equivalents were verified using Hugo Siebenschein's Great Czech-German Dictionary, Duden 11, Hans Schemann's German Idiomatics, the corpuses InterCorp and DeReKo and the Google full-text search engine. The aim of this thesis is to evaluate the current state of German-language equivalents in DCPI 4 and offer possible suggestions for improvement. The chosen approach is therefore not only contemplative, but also constructive. Keywords lexikology, phraseology, paremiology, lexicography, phraseography, Corpus Linguistics, equivalence
|
6 |
Exploiting Linguistic and Statistical Knowledge in a Text Alignment SystemSchrader, Bettina 20 February 2009 (has links)
In machine translation, the alignment of corpora has evolved into a mature research area, aimed at providing training data for statistical or example-based machine translation systems. Moreover, the alignment information can be used for a variety of other purposes, including lexicography and the induction of tools for natural language processing. The alignment techniques used for these purposes fall roughly in two separate classes: sentence alignment approaches that often combine statistical and linguistic information, and word alignment models that are dominated by the statistical machine translation paradigm. Alignment approaches that use linguistic knowledge provided by corpus annotation are rare, as are as non-statistical word alignment strategies. Furthermore, parallel corpora are typically not aligned at all text levels simultaneously. Rather, a corpus is first sentence aligned, and in a subsequent step, the alignment information is refined to go below the sentence level. In this thesis, the distinction between the two alignment classes is withdrawn. Rather, a system is introduced that can simultaneously align at the paragraph, sentence, word, and phrase level. Furthermore, linguistic as well as statistical information can be combined. This combination of alignment cues from different knowledge sources, as well as the combination of the sentence and word alignment tasks, is made possible by the development of a modular alignment platform. Its main features are that it supports different kinds of linguistic corpus annotation, and furthermore aligns a corpus hierarchically, such that sentence and word alignments are cohesive. Alignment cues are not used within a global alignment model. Rather, different sub-models can be implemented and allowed to interact. Most of the alignment modules of the system have been implemented using empirical corpus studies, aimed at showing how the most common types of corpus annotation can be exploited for the alignment task.
|
7 |
Beschreibungstexte zu Crowdfunding-Kampagnen: Der Einfluss sprachlicher Merkmale auf die Erfolgsaussichten im CrowdfundingSchuppe, Robert Cornelis 07 December 2022 (has links)
Crowdfunding ist ein communitybasiertes Finanzierungsmodell, das in den letzten Jahren zunehmend an Bedeutung gewonnen hat. Indem eine Vielzahl an Unterstützer:innen gewonnen werden, können so Kreative und Kulturschaffende Produkte veröffentlichen, ohne einen klassischen Publikationsweg über Verlage oder ähnliche Institutionen zu wählen. Zentral für den Erfolg von Projekten ist dabei, eine Projektseite zu gestalten, die möglichst viele Menschen davon überzeugt, Geld in die Kampagne zu investieren. Ein Teil dieser Werbung geschieht mittels der Beschreibungstexte der Projekte. Diese stehen im Zentrum der vorliegenden Arbeit. Mittels einer korpuslinguistischen Analyse wird zunächst untersucht, welche sprachlichen Mittel in Beschreibungstexten die Erfolgschancen von Crowdfunding-Kampagnen erhöhen und welche diese verringern. Darauf folgt eine qualitative Auswertung der Ergebnisse auf Basis von Theorien aus der Linguistischen Vertrauensforschung, der kognitiven Linguistik und der Soziologie – wie etwa dem von Reckwitz eingeführten Kreativitätsdispositiv.:1. Einleitung
2. Crowdfunding
3. Theoretische Grundlagen
3.1. Linguistische Vertrauensforschung
3.2. Diskursanalyse
3.3. Aufmerksamkeitslenkung und Metaphern
3.4. Das Kreativitätsdispositiv
4. Methodik
5. Korpuszusammenstellung
6. Analyse
6.1. Lemmata
6.1.1. Unigramme
6.1.1.1. Eure und deine
6.1.1.2. Absprache
6.1.1.3. handsigniert
6.1.1.4. Echt, limitiert, aufwendig und atmosphärisch
6.1.1.5. Zwischenfazit - Reziprozität
6.1.1.6. Kompetenz
6.1.1.7. Meine
6.1.1.8. Enwickeln und Idee
6.1.1.9. Zwischenfazit - Adressat:innenbezug und Kompetenz
6.1.1.10. Zielperspektivierung
6.1.1.11. Gendern
6.1.1.12. Spaß
6.1.2. Trigramme
6.1.2.1. Zusätzlich erhalten sie und außerdem erhalten sie
6.1.2.2. In die letzt
6.2. Wortartem
6.2.1. Unigramme
6.2.1.1. Bestimmte und unbestimmte Artikel
6.2.1.2. Personalpronomen
6.2.1.3. Modalverben
6.2.1.4. Infinitive und Infinitivpartikel
6.2.2. Trigramme
6.2.2.1. Substantiv Artikel Substantiv und Artikel Substantiv Artikel
6.2.2.2. Artikel attributives Adjektiv Substantiv
7. Fazit
8. Anhänge
8.1. Zitierte Primärliteratur
8.2. Sekundärliteratur
|
8 |
The text encoding software of the Thesaurus Linguae AegyptiaeSchweitzer, Simon 20 April 2016 (has links) (PDF)
The Thesaurus Linguae Aegyptiae (TLA; http://aaew.bbaw.de/tla) is the publication platform of the project „Structure and Transformation in the Vocabulary of the Egyptian Language: Texts and Knowledge in the Culture of Ancient Egypt“ (formerly known as “Altägyptisches Wörterbuch”) located in Berlin and Leipzig. It contains the largest corpus of Egyptian texts (ca. 1.4 million text words) and it is a very important tool for linguistic, philological, lexicographical, and cultural research. My paper introduces you to the software behind the TLA. I will show how easy it is to add a new text to the corpus with transcription, translation, Hieroglyphic codes, and metadata and how easy you can add any annotations of different types like rubra, citations from other texts, comments, direct speech. The software itself is freely available and platform independent. You are welcome to use our software to edit your texts and to cooperate with us!
|
9 |
ANNIS: A graph-based query system for deeply annotated text corporaKrause, Thomas 11 January 2019 (has links)
Diese Dissertation beschreibt das Design und die Implementierung eines effizienten Suchsystems für linguistische Korpora. Das bestehende und auf einer relationalen Datenbank basierende System ANNIS ist spezialisiert darin, Korpora mit verschiedenen Arten von Annotationen zu unterstützen und nutzt Graphen als einheitliche Repräsentation der verschiedener Annotationen. Für diese Dissertation wurde eine Hauptspeicher-Datenbank, die rein auf Graphen basiert, als Nachfolger für ANNIS entwickelt. Die Korpora werden in Kantenkomponenten partitioniert und für verschiedene Typen von Subgraphen werden unterschiedliche Implementationen zur Darstellung und Suche in diesen Komponenten genutzt. Operationen der Anfragesprache AQL (ANNIS Query Language) werden als Kombination von Erreichbarkeitsanfragen auf diesen verschiedenen Komponenten implementiert und jede Implementierung hat optimierte Funktionen für diese Art von Anfragen. Dieser Ansatz nutzt die verschiedenen Strukturen der unterschiedlichen Annotationsarten aus, ohne die einheitliche Darstellung als Graph zu verlieren. Zusätzliche Optimierungen, wie die parallele Ausführung von Teilen der Anfragen, wurden ebenfalls implementiert und evaluiert. Da AQL eine bestehende Implementierung besitzt und diese für Forscher offen als webbasierter Service zu Verfügung steht, konnten echte AQL-Anfragen aufgenommen werden. Diese dienten als Grundlage für einen Benchmark der neuen Implementierung. Mehr als 4000 Anfragen über 18 Korpora wurden zu einem realistischen Workload zusammengetragen, der sehr unterschiedliche Arten von Korpora und Anfragen mit einem breitem Spektrum von Komplexität enthält. Die neue graphbasierte Implementierung wurde mit der existierenden, die eine relationale Datenbank nutzt, verglichen. Sie führt den Anfragen im Workload im Vergleich ~10 schneller aus und die Experimente zeigen auch, dass die verschiedenen Implementierungen für die Kantenkomponenten daran einen großen Anteil haben. / This dissertation describes the design and implementation of an efficient system for linguistic corpus queries. The existing system ANNIS is based on a relational database and is focused on providing support for corpora with very different kinds of annotations and uses graphs as unified representations of the different annotations. For this dissertation, a main memory and solely graph-based successor of ANNIS has been developed. Corpora are divided into edge components and different implementations for representation and search of these components are used for different types of subgraphs. AQL operations are interpreted as a set of reachability queries on the different components and each component implementation has optimized functions for this type of queries. This approach allows exploiting the different structures of the different kinds of annotations without losing the common representation as a graph. Additional optimizations, like parallel executions of parts of the query, are also implemented and evaluated. Since AQL has an existing implementation and is already provided as a web-based service for researchers, real-life AQL queries have been recorded and thus can be used as a base for benchmarking the new implementation. More than 4000 queries from 18 corpora (from which most are available under an open-access license) have been compiled into a realistic workload that includes very different types of corpora and queries with a wide range of complexity. The new graph-based implementation was compared against the existing one, which uses a relational database. It executes the workload ~10 faster than the baseline and experiments show that the different graph storage implementations had a major effect in this improvement.
|
10 |
Fachphraseologismen in der MedizinPfab, Franziska 10 June 2013 (has links) (PDF)
Beim Fachtextübersetzen und in der technischen Redaktion ist die Beherrschung der korrekten Terminologie einer Fachsprache allein oft nicht ausreichend, sondern es bedarf auch des Wissens um die typische, für eine Sprache idiomatische Einbettung der Termini in den Text, z. B. in Form von Fachphraseologismen. Derartige Informationen finden sich jedoch häufig nicht in Fachwörterbüchern.
Die vorliegende Arbeit beschäftigt sich mit terminologischen Phraseologismen in der medizinischen Fachsprache. Im Rahmen einer korpusbasierten Analyse wurden exemplarisch deutsche und spanische Fachphraseologismen aus einem Teilbereich der medizinischen Fachkommunikation, der Schlaganfallakuttherapie, in ihrem tatsächlichen, variantenreichen Gebrauch herausgearbeitet und in einem Glossar zusammengestellt, das als Unterstützung bei der Gestaltung von Übersetzungen sowie der technischen Redaktion entsprechender Texte dienen kann. Damit zeigt die Arbeit die Bedeutung fachphraseologischer Untersuchungen auf.
|
Page generated in 0.074 seconds