• Refine Query
  • Source
  • Publication year
  • to
  • Language
  • 102
  • 88
  • 12
  • 10
  • 6
  • 3
  • 3
  • 2
  • Tagged with
  • 224
  • 120
  • 62
  • 50
  • 48
  • 46
  • 46
  • 46
  • 46
  • 37
  • 29
  • 26
  • 23
  • 22
  • 19
  • About
  • The Global ETD Search service is a free service for researchers to find electronic theses and dissertations. This service is provided by the Networked Digital Library of Theses and Dissertations.
    Our metadata is collected from universities around the world. If you manage a university/consortium/country archive and want to be added, details can be found on the NDLTD website.
211

Akzentuierung des Litauischen bei litauisch - deutsch aufwachsenden Kindern in Deutschland

Gusinde, Jurgita 31 July 2008 (has links)
In dieser empirischen Untersuchung geht es um Kinder mit Migrationshintergrund aus der Osnabrücker Umgebung, die regelmäßig im privaten Bereich Litauisch hören und sprechen. Die Matrixsprache bei allen Kindern ist Deutsch. Es handelt sich um gemischte Familien, bei denen die Muttersprache des Vaters Deutsch und die Muttersprache der Mütter Litauisch ist. Bei den sieben litauisch-deutsch sprechenden Kindern sind die litauischen Sprachstrukturen so ausgebaut, dass die prosodischen Elemente gut zu analysieren sind. Die Arbeit behandelt einen engen prosodischen Bereich: sie beschränkt sich auf die Tonverläufe im Litauischen im Kindesalter. Die Sprachaufnahmen wurden im Zeitraum von ca. zwei Jahren erhoben und anhand von Praat, dem linguistischen Programm, das die Sonagramme der Wörter mit den prominenten Silben mit schweren Reimen erstellt. Der theoretische Teil der Arbeit bestätigt die Komplexität des Begriffs Akzent, auch wird die litauische Phonologie im Vergleich zum Deutschen reflektiert. Die Auswertung der empirischen Daten der Kontrollgruppe in Litauen und der untersuchten Gruppe in Deutschland stellt eine Transparenz der Akzente, bzw. der Tonverläufe des Litauischen dar. Die Akzente werden "sichtbar" anhand von erstellten graphischen Baumstrukturen. Die Arbeit bestätigt, dass die Tonverläufe nur eine nachrangige Funktionalität im Litauischen haben. Die Kinder in der Diaspora, unter eingeschränkten Bedingungen, lernen die litauische Sprache auch mit ihren flüchtigen Strukturen wie der Wortprosodie. Die bilingualen Kinder sind in der Lage, die wortprosodisch kontrastierenden Wortformen im Litauischen zu differenzieren, obwohl ihre dominante Sprache Deutsch dies nicht kennt. Die Sprachuntersuchungen zeigen, dass die Kinder im Spracherwerb nicht strategisch vorgehen: sie können gewissermaßen nicht anderes, als eine Sprache ggf. vollständig zu erlernen.
212

„… ein Gemisch von Gehörtem und selbst Zugeseztem“ / Nachschriften der ‚Kosmos-Vorträge‘ Alexander von Humboldts: Dokumentation, Kontextualisierung und exemplarische Analysen

Thomas, Christian 10 November 2023 (has links)
Diese Dissertationsschrift ist angesiedelt im Bereich Digitaler Edition archivalischer Quellen, deren Erschließung und (computergestützter) Analyse. Im Zentrum stehen die sog. Kosmos-Vorträge, die Alexander von Humboldts 1827/28 in zwei Vortragszyklen in Berlin gehalten hat. Diese werden als gleichwertige, zweifache Publikationen in Humboldts Werkbiographie eingeordnet. In einem zentralen Kapitel (Kap. 7) geht es mir um eine editionstheoretische Fundierung der Edition von Vorlesungsnachschriften, zunächst allgemein und dann bezogen auf die Nachschriften der Kosmos-Vorträge. Zuvor wird das Forschungsfeld beleuchtet, da über die Rahmenbedingungen und Inhalte der beiden Vortragsreihen bislang nur wenig bekannt war. Humboldts Motivation zu diesen Vorträgen, deren Zusammenhang mit dem Kosmos (1845–62) und weiteren seiner Publikationen, sowie die jeweiligen organisatorischen Rahmenbedingungen werden untersucht. Inhaltlich sind die Kosmos-Vorträge bislang wenig erforscht worden, unter anderem weil die wichtigsten Quellen nicht rezipiert wurden. Dank der Digitalisierung des Humboldt-Nachlasses und vor allem durch die Digitale Edition der Nachschriften aus dem Hörerkreis sind die Voraussetzungen dafür mittlerweile sehr viel besser. Um die künftige Arbeit mit diesen Dokumenten zu unterstützen, dokumentiere und reflektiere ich in Kapitel 8 die praktische Umsetzung des Editionsmodells gemäß den Richtlinien der Text Encoding Initiative (TEI). Anschließend stelle ich die edierten Nachschriften aus beiden Vortragszyklen vor und zeige, wie sich mit den digitalen Volltexten arbeiten lässt. Dabei kommen quantitative Untersuchungen und Verfahren wie automatische Kollation bzw. Plagiatssuche, aber auch ‚traditionell hermeneutische‘ Methoden zum Einsatz. Schließlich geht es mir in meiner Arbeit darum, die Grundlage für die weitere Erforschung der beiden Vortragsreihen wesentlich zu verbessern und anhand einiger exemplarischer Analysen erste Schritte in diese Richtung zu unternehmen. / This dissertation is located in the field of digital editions of archival sources, their exploration and (computer-assisted) analysis. In terms of content, it deals with the so-called Kosmos-Lectures, which Alexander von Humboldt held in two distinct courses in Berlin in the winter of 1827/28. The two series are recognised as two distinct publications of equal value in Humboldt’s oeuvre. In a central chapter (chapter 7), I am concerned with an edition-theoretical foundation for the edition of attendee’s notebooks, first in general and then in relation to the transcripts of the Kosmos-Lectures. Before this, the research field of the long-neglected Kosmos-Lectures is illuminated, as little has been known about the framework conditions of the lecture series. Humboldt’s motivation for these lectures, their connection with the Kosmos (1845–62) and other of his publications, and the respective organisational framework of the courses are being examined. In terms of content, the Kosmos-Lectures have so far been little researched, partly because the most important sources have not been taken into consideration. The conditions for this are now much better thanks to the digitisation of the Humboldt legacy collection and, above all, the digital edition of the transcripts from the audience. To facilitate future work with these documents, I document and reflect the practical implementation of the edition model according to the Text Encoding Initiative (TEI) in chapter 8. In the following two chapters, I present the attendee’s notebooks from both courses, and show how to work with these digital full texts. Quantitative investigations and methods such as automatic collation or text re-use detection, but also ‘traditional hermeneutic’ approaches are used. Ultimately, my work aims to significantly improve the basis for research into the two lecture series, which has so far been lacking, and to take the first steps in this direction by means of some exemplary analyses.
213

Measuring coselectional constraint in learner corpora: A graph-based approach

Shadrova, Anna Valer'evna 24 July 2020 (has links)
Die korpuslinguistische Arbeit untersucht den Erwerb von Koselektionsbeschränkungen bei Lerner*innen des Deutschen als Fremdsprache in einem quasi-longitudinalen Forschungsdesign anhand des Kobalt-Korpus. Neben einigen statistischen Analysen wird vordergründig eine graphbasierte Analyse entwickelt, die auf der Graphmetrik Louvain-Modularität aufbaut. Diese wird für diverse Subkorpora nach verschiedenen Kriterien berechnet und mit Hilfe verschiedener Samplingtechniken umfassend intern validiert. Im Ergebnis zeigen sich eine Abhängigkeit der gemessenen Modularitätswerte vom Sprachstand der Teilnehmer*innen, eine höhere Modularität bei Muttersprachler*innen, niedrigere Modularitätswerte bei weißrussischen vs. chinesischen Lerner*innen sowie ein U-Kurven-förmiger Erwerbsverlauf bei weißrussischen, nicht aber chinesischen Lerner*innen. Unterschiede zwischen den Gruppen werden aus typologischer, kognitiver, diskursiv-kultureller und Registerperspektive diskutiert. Abschließend werden Vorschläge für den Einsatz von graphbasierten Modellierungen in kernlinguistischen Fragestellungen entwickelt. Zusätzlich werden theoretische Lücken in der gebrauchsbasierten Beschreibung von Koselektionsphänomenen (Phraseologie, Idiomatizität, Kollokation) aufgezeigt und ein multidimensionales funktionales Modell als Alternative vorgeschlagen. / The thesis located in corpus linguistics analyzes the acquisition of coselectional constraint in learners of German as a second language in a quasi-longitudinal design based on the Kobalt corpus. Supplemented by a number of statistical analyses, the thesis primarily develops a graph-based analysis making use of Louvain modularity. The graph metric is computed for a range of subcorpora chosen by various criteria. Extensive internal validation is performed through a number of sampling techniques. Results robustly indicate a dependency of modularity on language acquisition progress, higher modularity in L1 vs. L2, lower modularity in Belarusian vs. Chinese learners, and a u-shaped learning development in Belarusian, but not in Chinese learners. Group differences are discussed from a typological, cognitive, cultural and cultural discourse, and register perspective. Finally, future applications of graph-based modeling in core-linguistic research are outlined. In addition, some gaps in the theoretical discussion of coselection phenomena (phraseology, idiomaticity, collocation) in usage-based linguistics are discussed and a multidimensional and functional model is proposed as an alternative.
214

Uneigentliche Differenz

Carovani, Anne M. 27 February 2019 (has links)
Die Arbeit untersucht Differenzdiskurse zu zwei historischen sozialen Identitäten im Manden (Westafrika) anhand mündlich und schriftlich tradierter Texte unterschiedlicher Sprachen (Bambara, Französisch, Deutsch, Englisch) und Genres (Reisebericht, Preislied (fasa), Epos (maana), Roman, Märchen (nsiirin), Lied (donkili)), die zwischen dem 14. bis 21. Jahrhundert erschienen sind. Die Differenz von horon, dem Edlen, Freien und jeli, dem 'Handhaber des Wortes' wird dabei höchst unterschiedlich als komplexer Beziehungsmodus diskursiv und performativ hervorgebracht und gestaltet. Als uneigentliche Differenz bildet sie sich unter der Prämisse des Schamprinzips vor allem entlang der jeweils vorgenommenen Zuschreibungen von freigiebigem Renommee-Suchenden und erbittendem Panegyriker. Die analysierten Texte, die den Zeitraum von Beginn des mittelalterlichen Mali-Reiches bis Mitte des 20. Jahrhunderts als intradiegetisches Setting haben, verhandeln die Differenz entsprechend spezifischer Wirkungsintentionen von einer Außenseiter-Perspektive, z.T. zur Legitimation kolonialer Absichten oder von einer Insider-Perspektive aus, um, teils politisch motiviert, das eigene kulturelle Erbe zu valorisieren oder auch um (historische) Mißstände anzuprangern. Dabei wird die Differenz von jeli und hↄrↄn unterschiedlich ausgestaltet, mit dem horon als Helden (ŋana, cεfarin), König (mansa, faama), Gastgeber (jatigi) und dem jeli als Meisterredner/sänger (ŋaara), Reputations-Verantwortlichen, Klienten des jatigi. Literatur wie Differenz wird als rhetorischer Ort kreativer Verhandlungen, strategischer (Neu)schöpfungen betrachtet, durch welche die jeweiligen Akteure spezifische Interessen verfolgen und damit variabel an Diskursen und damit an Wirklichkeiten mitgestalten. Jeli und horon verändern sich als literarische Konstruktion in Abhängigkeit von ästhetischen und ideologischen Strategien. / The present work examines discourses of difference about two historical social identities in Manden (West Africa) using oral and written literary texts of different languages (Bambara, French, German, English) and genres (travelogue, praise song (fasa), epic (maana), novel, fairy tale, song (dↄnkili)), published between the 14th to the 21st century. The difference between horon, the noble, the free, and jeli, the 'handler of the word', is produced and shaped in a highly differentiated way as a complex mode of relation(ship) in a discursive and performative manner. As an improper difference it is formed under the premise of the principle of shame, especially along the attributions made between the generous rewards seeker and the panegyrical requester. The analysed texts, which have the period from the beginning of the medieval Mali empire to the middle of the 20th century as an intradiegetic setting, negotiate the difference according to specific intended effects from an outsider perspective, eg. for purposes of legitimacy of colonial intentions or from an insider perspective, partly politically motivated, in order to valorise one's own cultural heritage or to denounce (historical) grievances. The difference between jeli and hↄrↄn appears in varying ways, with the horon as hero (ŋana, cεfarin), king (mansa, faama), host (jatigi) and the jeli as master-singer/-orator (ŋaara), reputational entrepreneur, client of a jatigi. Literature and Difference are considered both as a rhetorical place of creative negotiation, of strategic (re)creation, through which the respective actors pursue specific interests and thereby participate in shaping discourses and thus realities. The jeli, who is at the same time performer, narrator and protagonist of many narratives, and the horon, determined by his status and his ethos, change as a literary construction depending on aesthetic and ideological strategies.
215

Perspectivas de desenvolvimento do galego / Perspectives on the development of the Galician language

Bruce, Daniel January 2009 (has links)
<p>O presente trabalho trata da língua galega. É principalmente um estudo sobre a história da língua galega, desde o nascimento do galego até o tempo contemporâneo. O estudo explica o surgimento do problema da falta de um consenso lingüístico quanto ao galego. Dependendo de quem é a pessoa a quem se pergunta, as respostas sobre o que é a língua galega, são sempre diferentes. Consultando diferentes dicionários e opiniões de lingüistas a língua que se fala na Galiza, pode classificar-se como: uma língua independente ibero-românica, um dialeto do português, uma língua ibero-românica fortemente “castelhanizada” etc. Isto deve-se às complexas relações políticas, que a Galiza teve com Portugal e com a Espanha. Relatando sobre os principais problemas em relação à questão da evolução lingüística da língua galega, apresento dois movimentos lingüísticos, o movimento reintegracionista e o isolacionismo. Eles mostram de maneira clara, que há diferentes alternativas possíveis de um desenvolvimento para a língua galega. A dificuldade de chegar a um consenso lingüístico quanto à língua galega, mostra o fato de existirem paralelamente diferentes normas ortográficas.</p>
216

Improving Retrieval Accuracy in Main Content Extraction from HTML Web Documents

Mohammadzadeh, Hadi 17 December 2013 (has links) (PDF)
The rapid growth of text based information on the World Wide Web and various applications making use of this data motivates the need for efficient and effective methods to identify and separate the “main content” from the additional content items, such as navigation menus, advertisements, design elements or legal disclaimers. Firstly, in this thesis, we study, develop, and evaluate R2L, DANA, DANAg, and AdDANAg, a family of novel algorithms for extracting the main content of web documents. The main concept behind R2L, which also provided the initial idea and motivation for the other three algorithms, is to use well particularities of Right-to-Left languages for obtaining the main content of web pages. As the English character set and the Right-to-Left character set are encoded in different intervals of the Unicode character set, we can efficiently distinguish the Right-to-Left characters from the English ones in an HTML file. This enables the R2L approach to recognize areas of the HTML file with a high density of Right-to-Left characters and a low density of characters from the English character set. Having recognized these areas, R2L can successfully separate only the Right-to-Left characters. The first extension of the R2L, DANA, improves effectiveness of the baseline algorithm by employing an HTML parser in a post processing phase of R2L for extracting the main content from areas with a high density of Right-to-Left characters. DANAg is the second extension of the R2L and generalizes the idea of R2L to render it language independent. AdDANAg, the third extension of R2L, integrates a new preprocessing step to normalize the hyperlink tags. The presented approaches are analyzed under the aspects of efficiency and effectiveness. We compare them to several established main content extraction algorithms and show that we extend the state-of-the-art in terms of both, efficiency and effectiveness. Secondly, automatically extracting the headline of web articles has many applications. We develop and evaluate a content-based and language-independent approach, TitleFinder, for unsupervised extraction of the headline of web articles. The proposed method achieves high performance in terms of effectiveness and efficiency and outperforms approaches operating on structural and visual features. / Das rasante Wachstum von textbasierten Informationen im World Wide Web und die Vielfalt der Anwendungen, die diese Daten nutzen, macht es notwendig, effiziente und effektive Methoden zu entwickeln, die den Hauptinhalt identifizieren und von den zusätzlichen Inhaltsobjekten wie z.B. Navigations-Menüs, Anzeigen, Design-Elementen oder Haftungsausschlüssen trennen. Zunächst untersuchen, entwickeln und evaluieren wir in dieser Arbeit R2L, DANA, DANAg und AdDANAg, eine Familie von neuartigen Algorithmen zum Extrahieren des Inhalts von Web-Dokumenten. Das grundlegende Konzept hinter R2L, das auch zur Entwicklung der drei weiteren Algorithmen führte, nutzt die Besonderheiten der Rechts-nach-links-Sprachen aus, um den Hauptinhalt von Webseiten zu extrahieren. Da der lateinische Zeichensatz und die Rechts-nach-links-Zeichensätze durch verschiedene Abschnitte des Unicode-Zeichensatzes kodiert werden, lassen sich die Rechts-nach-links-Zeichen leicht von den lateinischen Zeichen in einer HTML-Datei unterscheiden. Das erlaubt dem R2L-Ansatz, Bereiche mit einer hohen Dichte von Rechts-nach-links-Zeichen und wenigen lateinischen Zeichen aus einer HTML-Datei zu erkennen. Aus diesen Bereichen kann dann R2L die Rechts-nach-links-Zeichen extrahieren. Die erste Erweiterung, DANA, verbessert die Wirksamkeit des Baseline-Algorithmus durch die Verwendung eines HTML-Parsers in der Nachbearbeitungsphase des R2L-Algorithmus, um den Inhalt aus Bereichen mit einer hohen Dichte von Rechts-nach-links-Zeichen zu extrahieren. DANAg erweitert den Ansatz des R2L-Algorithmus, so dass eine Sprachunabhängigkeit erreicht wird. Die dritte Erweiterung, AdDANAg, integriert eine neue Vorverarbeitungsschritte, um u.a. die Weblinks zu normalisieren. Die vorgestellten Ansätze werden in Bezug auf Effizienz und Effektivität analysiert. Im Vergleich mit mehreren etablierten Hauptinhalt-Extraktions-Algorithmen zeigen wir, dass sie in diesen Punkten überlegen sind. Darüber hinaus findet die Extraktion der Überschriften aus Web-Artikeln vielfältige Anwendungen. Hierzu entwickeln wir mit TitleFinder einen sich nur auf den Textinhalt beziehenden und sprachabhängigen Ansatz. Das vorgestellte Verfahren ist in Bezug auf Effektivität und Effizienz besser als bekannte Ansätze, die auf strukturellen und visuellen Eigenschaften der HTML-Datei beruhen.
217

Perspectivas de desenvolvimento do galego / Perspectives on the development of the Galician language

Bruce, Daniel January 2009 (has links)
O presente trabalho trata da língua galega. É principalmente um estudo sobre a história da língua galega, desde o nascimento do galego até o tempo contemporâneo. O estudo explica o surgimento do problema da falta de um consenso lingüístico quanto ao galego. Dependendo de quem é a pessoa a quem se pergunta, as respostas sobre o que é a língua galega, são sempre diferentes. Consultando diferentes dicionários e opiniões de lingüistas a língua que se fala na Galiza, pode classificar-se como: uma língua independente ibero-românica, um dialeto do português, uma língua ibero-românica fortemente “castelhanizada” etc. Isto deve-se às complexas relações políticas, que a Galiza teve com Portugal e com a Espanha. Relatando sobre os principais problemas em relação à questão da evolução lingüística da língua galega, apresento dois movimentos lingüísticos, o movimento reintegracionista e o isolacionismo. Eles mostram de maneira clara, que há diferentes alternativas possíveis de um desenvolvimento para a língua galega. A dificuldade de chegar a um consenso lingüístico quanto à língua galega, mostra o fato de existirem paralelamente diferentes normas ortográficas.
218

Exclusion in Sophocles

Spiegel, Francesca 30 November 2020 (has links)
"Exclusion in Sophocles" dass Exklusion als Motiv sich durch alle erhaltenen Sophoklesstücke zieht nebst einiger der längeren Fragmente. Auffällig ist die Vielfalt des Motivs, welches sich auf einen Ausschluss aus der Familie (Elektra), der Stadt (Ödipus-Dramen), der Armee (Philoktet), der Gemeinschaft der Menschen (Tereus) und noch vieles Weitere bezieht. Diese Arbeit sammelt, ordnet und analysiert sophokleische Exklusionsszenarien. Insbesondere wird der Gebrauch von Tropologien des Un/Menschlichen in der extrinsischen Charakterisierung der tragischen Protagonisten herausgestellt sowie damit verbundene Metaphern des Pathologischen, Monströsen, Bestialen und sog. Primitiven als Marker und Auslöser von strukturellen Exklusionen. Dabei wird das Exklusionsmotiv nicht als vollendete Tatsache erfasst, sondern als dynamischer und sich teilweise über ganze Plots hinweg erstreckender Prozess, als Narrativ eines ehemals gut Eingegliederten und von der Gemeinschaft nach und nach Exkludierten. Gleichwohl diese Entwicklung vom tragischen Protagonisten in eloquenten und selbstdarstellerischen Reden vehement kritisiert wird, erwächst im Bereich der Metaphern und rhetorischen Bildsprache der Gemeinschaft eine regelrechte Ausradierung und Neuzuweisung seiner Identität. Durch eine vergleichende Gegenüberstellung beider Standpunkte stellt sich heraus, wie tiefgreifend die als Exkludierend handelnde Gemeinschaft in das Vorantschreiten des tragischen Geschehens involviert ist und die Dramen eben nicht nur—wie in zahlreichen Forschungsstandpunkten festgehalten—die Manci des Exkludierten Protagonisten als moralische Fabel vorführen. / Social exclusion as a literary theme is common to all of Sophocles' fully extant plays as well as some of the longer fragments. The variety of settings is wide, between exclusion from the family like for example in Electra, exclusion from the city as in the case of Oedipus, from a regiment of the armed forces like in Ajax or Philoctetes, or even humankind, like with Tereus. This inquiry sets out to present, taxonomize and unpack Sophoclean discourses of exclusion and their attaining literary tropes of the pathological, the bestial, the brutish, the monstrous, and the so-called uncivilized. The aim is to demonstrate how deeply implicated the whole cast of characters and their language are in the process of a tragedy unfolding, rather than the causes of tragedy being lodged in the doings of one protagonist alone. One key point argued here is that, instead of taking 'the isolation of the tragic hero' as fait accompli, exclusion is a dynamic process that often takes up the entire plot arc of a tragedy. In the space of extrinsic characterization, it is argued that a process of rhetorical erasure and overwriting of identity takes place, where peer groups gradually dismantle a formerly well-established identity and re-assign a new and undesirable one. It is shown how the protagonists seek to resist, lament or somehow negotiate this process through long and expansive speeches of futile self-reinstatement. In the synthesis of both, it is argued that Sophocles' deployment of the theme puts a critical spotlight on the rhetorics of exclusion and its discourses of the bestial, the brutal, and especially the pathological, which embed and frame the work's overall literary, cultural and dramatic effects.
219

Improving Retrieval Accuracy in Main Content Extraction from HTML Web Documents

Mohammadzadeh, Hadi 27 November 2013 (has links)
The rapid growth of text based information on the World Wide Web and various applications making use of this data motivates the need for efficient and effective methods to identify and separate the “main content” from the additional content items, such as navigation menus, advertisements, design elements or legal disclaimers. Firstly, in this thesis, we study, develop, and evaluate R2L, DANA, DANAg, and AdDANAg, a family of novel algorithms for extracting the main content of web documents. The main concept behind R2L, which also provided the initial idea and motivation for the other three algorithms, is to use well particularities of Right-to-Left languages for obtaining the main content of web pages. As the English character set and the Right-to-Left character set are encoded in different intervals of the Unicode character set, we can efficiently distinguish the Right-to-Left characters from the English ones in an HTML file. This enables the R2L approach to recognize areas of the HTML file with a high density of Right-to-Left characters and a low density of characters from the English character set. Having recognized these areas, R2L can successfully separate only the Right-to-Left characters. The first extension of the R2L, DANA, improves effectiveness of the baseline algorithm by employing an HTML parser in a post processing phase of R2L for extracting the main content from areas with a high density of Right-to-Left characters. DANAg is the second extension of the R2L and generalizes the idea of R2L to render it language independent. AdDANAg, the third extension of R2L, integrates a new preprocessing step to normalize the hyperlink tags. The presented approaches are analyzed under the aspects of efficiency and effectiveness. We compare them to several established main content extraction algorithms and show that we extend the state-of-the-art in terms of both, efficiency and effectiveness. Secondly, automatically extracting the headline of web articles has many applications. We develop and evaluate a content-based and language-independent approach, TitleFinder, for unsupervised extraction of the headline of web articles. The proposed method achieves high performance in terms of effectiveness and efficiency and outperforms approaches operating on structural and visual features. / Das rasante Wachstum von textbasierten Informationen im World Wide Web und die Vielfalt der Anwendungen, die diese Daten nutzen, macht es notwendig, effiziente und effektive Methoden zu entwickeln, die den Hauptinhalt identifizieren und von den zusätzlichen Inhaltsobjekten wie z.B. Navigations-Menüs, Anzeigen, Design-Elementen oder Haftungsausschlüssen trennen. Zunächst untersuchen, entwickeln und evaluieren wir in dieser Arbeit R2L, DANA, DANAg und AdDANAg, eine Familie von neuartigen Algorithmen zum Extrahieren des Inhalts von Web-Dokumenten. Das grundlegende Konzept hinter R2L, das auch zur Entwicklung der drei weiteren Algorithmen führte, nutzt die Besonderheiten der Rechts-nach-links-Sprachen aus, um den Hauptinhalt von Webseiten zu extrahieren. Da der lateinische Zeichensatz und die Rechts-nach-links-Zeichensätze durch verschiedene Abschnitte des Unicode-Zeichensatzes kodiert werden, lassen sich die Rechts-nach-links-Zeichen leicht von den lateinischen Zeichen in einer HTML-Datei unterscheiden. Das erlaubt dem R2L-Ansatz, Bereiche mit einer hohen Dichte von Rechts-nach-links-Zeichen und wenigen lateinischen Zeichen aus einer HTML-Datei zu erkennen. Aus diesen Bereichen kann dann R2L die Rechts-nach-links-Zeichen extrahieren. Die erste Erweiterung, DANA, verbessert die Wirksamkeit des Baseline-Algorithmus durch die Verwendung eines HTML-Parsers in der Nachbearbeitungsphase des R2L-Algorithmus, um den Inhalt aus Bereichen mit einer hohen Dichte von Rechts-nach-links-Zeichen zu extrahieren. DANAg erweitert den Ansatz des R2L-Algorithmus, so dass eine Sprachunabhängigkeit erreicht wird. Die dritte Erweiterung, AdDANAg, integriert eine neue Vorverarbeitungsschritte, um u.a. die Weblinks zu normalisieren. Die vorgestellten Ansätze werden in Bezug auf Effizienz und Effektivität analysiert. Im Vergleich mit mehreren etablierten Hauptinhalt-Extraktions-Algorithmen zeigen wir, dass sie in diesen Punkten überlegen sind. Darüber hinaus findet die Extraktion der Überschriften aus Web-Artikeln vielfältige Anwendungen. Hierzu entwickeln wir mit TitleFinder einen sich nur auf den Textinhalt beziehenden und sprachabhängigen Ansatz. Das vorgestellte Verfahren ist in Bezug auf Effektivität und Effizienz besser als bekannte Ansätze, die auf strukturellen und visuellen Eigenschaften der HTML-Datei beruhen.
220

Präsenz des Gedichts um 1900

Märtin, Björn Ludger 10 January 2023 (has links)
Die Dissertationsschrift setzt sich mit der Karriere der Materialität in der Lyrik der Moderne auseinander. Im Übergang zur Moderne bildet die Lyrik Konzeptionen aus, die den Lyrikbegriff des 19. Jahrhunderts überwinden, indem sie materielle Eigenschaften von Literatur in die Produktion lyrischer Werke einbeziehen und im ästhetischen Erleben des Gedichts wirksam werden lassen. Die Untersuchung erforscht in ihrem Fortgang die produktive Wirksamkeit materieller Substrate der Lyrik in ihren technischen und poetologischen Ausprägungen. Im Zuge dessen werden Möglichkeitsbedingungen für die Rezeption lyrischer Werke herausgestellt, die durch einen veränderten Mediengebrauch entstehen. Dabei wird aufgezeigt, dass der Umgang mit den Substraten der Lyrik einer historischen Genese unterliegt, die zumindest in den bisher von der literaturwissenschaftlichen Forschung herausgestellten Gesichtspunkten zum Themenkomplex kaum beachtet wurde, die jedoch zu einem dezidierten Verständnis moderner Lyrik führt. In einer durch die Fragestellung gesteuerten Auswahl sind Gegenstände der Untersuchung sowohl Gedichte als auch Essays und Manifeste. / The dissertation is about the career of materiality in poems of the early modern period. In the shift from the 19th century to the beginning of the 20th century, lyricism develops conceptions comprising the material qualities of literature into the production of lyric works and make them operant in the aesthetical experience of poems. In this project I do research on the productive efficacy of material substrates of poems and describe them in their technical and poetical characteristics. In the course of this the basic preconditions for the reception of lyrical works as they effect from the changed use of media are elucidated. Based on this I assume, that the use of the substrates of lyrical production is subject to a historical genesis, that was neglected by studies in literature until now, although it would help to develop a deicide understanding of lyrical works of the modern period. Due to a problem based selection of texts the subjects of the research are poems as well as essays and manifestos.

Page generated in 0.0474 seconds