• Refine Query
  • Source
  • Publication year
  • to
  • Language
  • 9
  • 2
  • Tagged with
  • 11
  • 5
  • 3
  • 3
  • 3
  • 3
  • 2
  • 2
  • 2
  • 2
  • 2
  • 2
  • 2
  • 2
  • 2
  • About
  • The Global ETD Search service is a free service for researchers to find electronic theses and dissertations. This service is provided by the Networked Digital Library of Theses and Dissertations.
    Our metadata is collected from universities around the world. If you manage a university/consortium/country archive and want to be added, details can be found on the NDLTD website.
1

An HPSG-based Formal Grammar of a Core Fragment of Georgian Implemented in TRALE / An HPSG-based Formal Grammar of a Core Fragment of Georgian Implemented in TRALE

Abzianidze, Lasha January 2011 (has links)
Georgian is remarkably different from Indo-European languages. The language has several linguistic phenomena that are challenging both from theoretical and computational points of view. In addition, it is low- resourced and insufficiently studied from the computational point of view. In the thesis, we model morphology and syntax of a core fragment of the language in a formal grammar. Namely, the formal grammar is written in the HPSG framework - one of the most powerful grammar frameworks nowadays. We also implement the grammar in TRALE - a grammar implementation platform, which is faithful to "hand-written" HPSG-based grammars. Note that this is the first application of HPSG to Georgian.
2

Unknown word sequences in HPSG

Mielens, Jason David 06 October 2014 (has links)
This work consists of an investigation into the properties of unknown words in HPSG, and in particular into the phenomenon of multi-word unknown expressions consisting of multiple unknown words in a sequence. The work presented consists first of a study determining the relative frequency of multi-word unknown expressions, and then a survey of the efficacy of a variety of techniques for handling these expressions. The techniques presented consist of modified versions of techniques from the existing unknown-word prediction literature as well as novel techniques, and they are evaluated with a specific concern for how they fare in the context of sentences with many unknown words and long unknown sequences. / text
3

Grammar of Mauritian adverbs / Grammaire des adverbes en mauricien

Hassamal, Shrita 07 July 2017 (has links)
Le mauricien est un créole à base française avec un lexique d’origine française pour au moins 90%, sans statut officiel et de graphie récente (Hookoomsing 2004, Police-Michel et al 2011). À part l’étude générale de Baker (1972), les principales études syntaxiques portent sur le domaine nominal (Guillemin 2011, Alleesaib 2012) ou verbal (Henri 2010) ou sur les deux (Syea 2012). Cette thèse est consacrée aux adverbes qu’il convient de distinguer des autres catégories, dans une langue avec peu de morphologie flexionnelle et dont les autres catégories sont aussi invariables, à part les verbes qui peuvent avoir deux formes (forme longue (FL) et forme courte (FC))(Corne 1982, Henri & Abeillé 2008, Henri 2010) et certains noms qui peuvent agglutiner l’article (Bonami & Henri 2010). Nous montrons que les adverbes ont une syntaxe particulière qui se distingue de celle des adverbes du français: la plupart sont post verbales et certains se comportent syntaxiquement comme des compléments et non comme des ajouts, en déclenchant la FC du verbe. Du point de vue méthodologique, nous nous basons d’abord, sur le seul dictionnaire unilingue en mauricien, le DiksionerMorisien (Carpooran 2011) pour avoir une première base de données, puis sur les œuvres littéraires de Virahsawmy, sur le journal Lalit et sur les intuitions d’informateurs mauriciens pour tester nos hypothèses. Ensuite nous avons recours à des expériences de type psycholinguistique pour étudier les adverbes comparatifs en mauricien et en français. Dans un premier temps nous avons établi une liste de propriétés pour définir la catégorie Adverbe et pour la distinguer des autres catégories ; des prépositions (anba ‘sous’), des marqueurs TMA (ti [passé]), des pronoms (zordi ‘aujourd’hui’) et des adjectifs (agogo ‘en abondance’). Nous avons alors créé une autre base de données en ôtant de la première liste les mots que nous n’analysons pas comme adverbe et en ajoutant d’autres qui n’y figuraient pas. Ensuite, nous décrivons la formation lexicale des adverbes du mauricien qui sont majoritairement des hérités du français (vit ‘vite’). Il y a aussi des innovations du mauricien, créées par recatégorisation (mari qui vient du nom français ‘époux’ et qui est devenu l’adverbe ‘très’ en mauricien) ou par réduplication (anba-anba ‘sournoisement’). Le deuxième chapitre est consacré à une classification sémantique des adverbes; nous distinguons douze principales classes distinguables par des critères syntaxiques et sémantiques; les adverbes d’énonciations, modaux, connecteurs, évaluatifs, les adverbes d’habitude, aspectuels, temporels, les adverbes de domaine, locatifs, les adverbes de manière, les adverbes de degré et les adverbes sensibles au focus. Ensuite, nous faisons une étude syntaxique de ces classes. Nous montrons que les adverbes du mauricien peuvent avoir plusieurs fonctions: tête de phrase attributive, extrait, ajout à un verbe ou une autre catégorie et complément de verbe. En plus de la position des adverbes dans la phrase et de leur possibilité d’extraction dans les constructions clivées, l’alternance verbale en mauricien offre un critère supplémentaire pour déterminer la fonction des adverbes. Puis, nous consacrons les deux prochains chapitres à une étude approfondie de la classe des adverbes de degré (Kennedy & McNally 2005). Les adverbes de degré incluent aussi les adverbes comparatifs et nous avons réalisé une expérience avec des locuteurs natifs pour tester la distribution de pli et plis ‘plus’ en mauricien. Comme ces comparatifs de supériorité viennent du français plus prononcé /ply/ et /plys/ (sans compter la forme de liaison /plyz/), nous faisons aussi une étude expérimentale pour tester leur distribution en français. Nous concluons que la distribution de pli et plis en mauricien est en partie un héritage du français. Finalement, nous présentons la syntaxe des adverbes en mauricien dans le cadre HPSG qui est une théorie linguistique basée sur des contraintes (Sag et al. 2003). / Mauritian is a French-based creole with at least 90% of its lexicon inherited from French. It has no official status and a recent standardised written form (Hookoomsing 2004, Police-Michel, Carpooran & Florigny 2011). Apart form the general study of Baker (1972), most syntactic studies concern the nominal domain (Guillemin 2011, Allesaib 2012) or the verbal domain (Henri 2010) or both (Syea 2012).This dissertation is devoted to the study of adverbs, which is important to distinguish from other categories, especially in such a language with little morphology, and where the other categories are also invariable, apart from verbs that may have two forms (a long form and a short form) (Corne 1982, Henri & Abeillé 2008, Henri 2010) and nouns that may agglutinate the article (Bonami & Henri 2010). We also show that Mauritian adverbs have a particular syntax that differentiates them from French adverbs: most of the adverbs occur post-verbally and some are syntactic complements and not adjuncts, triggering the verb short form. On the methodological level, initially, we rely on the unique unilingual dictionary available in Mauritian, the Diksioner Morisien (Carpooran 2011) to obtain a first database of adverbs, and then on the literary works of the contemporary author Dev Virahsawmy, on articles from the online journal of the political party Lalit (www.lalitmauritius.org) and on the intuitions of Mauritian informants, to test our hypotheses. We also made use of more formal experimental methods to study and compare comparative adverbs in Mauritian and French.At first, we established a list of properties to define the category Adverb and to differentiate them from the other categories in Mauritian, namely prepositions (anba ‘under’), TMA markers (ti [past], pronouns (zordi ‘today’) and adjectives (agogo ‘in abundance’). Thereby, we created a new database of 428 adverbs after removing words that we do not analyse as adverbs, and adding others that were not in the list. Then, we described the lexical formation of Mauritian adverbs that are mostly French inheritances (vit ‘fast’). There are, however, some Mauritian innovations, created by recategorisation (for e.g. mari comes from the French noun mari ‘husband’ and has become a degree adverb ‘very’ in Mauritian) or by reduplication (anba-anba ‘sneakily’).The second chapter of the dissertation is devoted to a semantic classification of the adverbs; we distinguish twelve main semantic classes distinguishable by syntactic and semantic criteria; speech-act adverbs, modal adverbs, connectives, evaluatives, habitual adverbs, aspectual adverbs, domain adverbs, locatives, manner adverbs, degree adverbs and focus sensitive adverbs. Then, we studied these semantic classes of adverbs from a syntactic perspective. We show that Mauritian adverbs may function in several ways. They may be heads of copular sentences, fillers in sentence initial position, adjuncts to a verb or to another category or complements to a verb. In addition to the position of adverbs in a sentence and their possibility to be extracted in clefted constructions, the verbal alternation between a long form and a short form offers an additional criterion to determine the function of adverbs in Mauritian. The last two chapters are devoted to a detailed study of the class of degree adverbs (Kennedy & McNally 2005), including comparative adverbs (as…as, more, less). We developed experimental methods to test the distribution of pli and plis in Mauritian with native speakers. Then, since these superiority comparatives come from French plus pronounced /ply/ and /plys/ (apart from the liaison form /plyz/), we experimentally tested the distribution in French. We conclude that the distribution of Mauritian pli and plis is partly an inheritance of French. Finally, we sketch representations of the syntactic functions of Mauritian adverbs in HPSG, a formal constraint-based framework (Sag et al. 2003).
4

Generalized ID/LP grammar: a formalism for parsing linearization-based HPSG grammars

Daniels, Michael W. 13 July 2005 (has links)
No description available.
5

Arguments and Adjuncts at the Syntax-Semantics Interface / Argumente und Adjunkte an der Syntax-Semantik-Schnittstelle

Schäfer, Roland 11 August 2008 (has links)
No description available.
6

Grammaire des constructions coordonnées. Coordinations simples et coordinations à redoublement en français contemporain.

Mouret, François 17 February 2007 (has links) (PDF)
DANS CETTE THESE, NOUS EXAMINONS LES PROPRIETES SYNTAXIQUES ET INTERPRETATIVES DES COORDINATIONS SIMPLES (PAUL IRA À LONDRES ET À VENISE) ET DES COORDINATIONS À REDOUBLEMENT (PAUL IRA ET À LONDRES ET À VENISE) EN FRANÇAIS ET LEUR INCIDENCE SUR UNE THÉORIE GÉNÉRALE DE LA COORDINATION. LA PROPOSITION CENTRALE QUI EST DÉVELOPPÉE, SUR LA BASE DE LA COMPARAISON SYSTÉMATIQUE DES DEUX TOURS, EST QUE LA COORDINATION DOIT ÊTRE ANALYSÉE COMME UNE HIÉRARCHIE DE CONSTRUCTIONS DISTINCTE DE CELLE QUI CARACTÉRISE LES STRUCTURES DE DÉPENDANCE ORGANISÉES AUTOUR D'UNE TÊTE. CETTE HIÉRARCHIE PERMET DE DÉCRIRE SIMULTANÉMENT LES PROPRIÉTÉS GÉNÉRALES DES CONSTRUCTIONS COORDONNÉES, QUI JUSTIFIENT QU'ON DISTINGUE CELLES-CI DES STRUCTURES ENDOCENTRIQUES, ET LES PROPRIÉTÉS FINES DE NATURE SYNTAXIQUE, SÉMANTIQUE, DISCURSIVE ET CONTEXTUELLE QUI SÉPARENT LES COORDINATIONS SIMPLES DES COORDINATIONS À REDOUBLEMENT DANS LA GRAMMAIRE DU FRANÇAIS. L'ÉTUDE COMPARÉE DES DEUX TYPES DE COORDINATIONS FOURNIT PAR AILLEURS UN SUPPORT EMPIRIQUE EN FAVEUR D'UNE ANALYSE SANS ELLIPSE DES COORDINATIONS DE SÉQUENCES DE CONSTITUANTS (PAUL OFFRIRA (ET) UN DISQUE À MARIE ET UN LIVRE À JEAN) ET PLUS GÉNÉRALEMENT EN FAVEUR D'UNE ANALYSE SANS ELLIPSE DES DIVERSES COORDINATIONS DE CATÉGORIES DISSEMBLABLES (MARIE ADORE (ET) LE CINEMA ET FAIRE LES BOUTIQUES). NOS RÉSULTATS SONT EN PRINCIPE COMPATIBLES AVEC TOUS LES CADRES THÉORIQUES QUI PLACENT AU COEUR DU DISPOSITIF GRAMMATICAL LA NOTION DE CONSTRUCTION. NOUS PRÉSENTONS UNE MODÉLISATION DANS LE CADRE HPSG, QUI PERMET D'EXPLICITER LES ANALYSES SYNTAXIQUES DÉVELOPPÉES ET D'EN ASSURER LA COHÉRENCE D'ENSEMBLE.
7

On-line platforma pro spolupráci na vývoji empirických gramatik / An online collaborative platform for the development of empirical grammars

Garcia Sevilla, Antonio Fernando January 2016 (has links)
Modern science has seen the rise in prominence of group research projects and other many-person endeavours, in what has been called "Big Science". Computational linguistics is no exception to that, and especially the devel- opment of large linguistic resources is a task best suited for collaborative approaches. In this document, the design and implementation of an environment for doing computational linguistics online is described. The environment is a software tool, with which development of formal grammars and other types of computational linguistic resources can be performed in a collaborative way. The application supports HPSG as an example paradigm of this kind of work. 1
8

The Representation and Selection of Prepositions

Tseng, Jesse January 2001 (has links) (PDF)
In the literature on prepositions, a simple binary distinction between ``lexical\'\' and ``functional\'\' uses is commonly assumed. In this thesis I investigate the nature of the lexical vs. functional distinction for prepositions, and I argue that these two uses correspond to cardinal points of a spectrum of prepositional uses. This spectrum can be modelled descriptively as the interaction of two properties: form-fixedness and perceived meaningfulness. At the functional corner of the spectrum, prepositions are characterized by low meaningfulness and high fixedness, while at the lexical corner, prepositions have high meaningfulness and low fixedness. There are also, however, prepositions that are perceived to be both meaningful and fixed, and these present a problem for the notion of a simple binary lexical vs. functional dichotomy. <br />A number of empirical tests have been proposed for inducing a binary classification of prepositional uses---for example, formation of the pseudopassive and wh-questions, and specifier attachment. While these are all interesting phenomena individually, they do not converge on a single classification collectively, and I conclude that there are no broad generalizations to be captured by postulating a primitive lexical vs. functional distinction theoretically.<br />My own analysis, formalized in the framework of Head-Driven Phrase Structure Grammar, includes two binary distinctions between contentful vs. empty prepositions, and between prepositions with syntactically selected form vs. those without. The interaction of these distinctions results in an idealized representation of the three-cornered descriptive spectrum of meaningfulness and fixedness. I discuss various ways in which my more or less discrete formal representations can give rise to gradient behavior on a descriptive level.
9

Discordances dans l'ellipse périphérique en français / Mismatches in French peripheral ellipsis

Shiraishi, Aoi 15 June 2018 (has links)
Cette thèse se centre sur les discordances dans l’ellipse périphérique (RNR) et propose une analyse basée sur l’identité de lexème entre le matériel manquant et le matériel périphérique. Les analyses précédentes accordent de l’importance au syncrétisme, ou identité phonologique (Pullum & Zwicky (1986)). Dans cette thèse, nous contestons cette hypothèse. Nous avons analysé 5 types de discordance dans l’ellipse périphérique: discordances de polarité, de possessifs, de prépositions, de voix et de formes verbales. Nos études de corpus sur Internet, sur Frtenten 2012 (1.6 milliard de mots) (Baroni et al. (2009)) et sur le English Web 2013 (19 milliard mots) montrent l’existence des discordances dans l’ellipse périphérique en français et en anglais. Les discordances sont assez nombreuses même dans des écrits soignés. Dans tous les cas, les discordances sont résolues par la forme qui correspond au second conjoint. Les résultats des expériences de jugements d’acceptabilité et de mouvements oculaires permettent d’intégrer les discordances dans la grammaire. Les résultats sont compatibles avec les analyses qui postulent l’identité sémantique entre le matériel manquant et l’antécédent pour l’ellipse. Nous proposons une analyse formelle en HPSG.Nous comparons les résultats obtenus avec les cas de coordination lexicale. Nous montrons que l’accord de proximité s’applique (Villavicencio et al. (2005)) et nous proposons une analyse HPSG pour la coordination de verbes et de prépositions. / This thesis focuses on mismatches in peripheral ellipsis (RNR) and proposes an analysis based on lexeme identity between the missing material and the peripheral material. Previous analyses put emphasis on syncretism, or phonological identity (Pullum & Zwicky (1986)). In this thesis, we challenge this hypothesis. We analyzed 5 types of mismatches in peripheral ellipsis: polarity mismatch, possessive mismatch, voice mismatch and verbal form mismatch. Our corpus studies on the Internet, on Frtenten 2012 (1.6 billion words) (Baroni et al. (2009)) and on English Web 2013 (19 billion words) shows the existence of mismatches in peripheral ellipsis in French and English. Mismatches are quite numerous even in careful writings. In all cases, the mismatches are resolved by the form that corresponds to the second conjunct. The results of acceptability judgment tests and eye tracking experiments allow the integration of these mismatches into the grammar. The results are compatible with analyses postulating semantic identity between the missing material and the antecedent for ellipsis. We formalize peripheral ellipsis with mismatch within HPSG.We finally compare our results with lexical coordination. We show that it obeys closest conjunct agreement (Villavicencio et al (2005)) and propose a HPSG analysis for coordination of verbs and prepositions.
10

Computational support for learners of Arabic

Al-Liabi, Majda Majeed January 2012 (has links)
This thesis documents the use of Natural Language Processing (NLP) in Computer Assisted Language Learning (CALL) and its contribution to the learning experience of students studying Arabic as a foreign language. The goal of this project is to build an Intelligent Computer Assisted Language Learning (ICALL) system that provides computational assistance to learners of Arabic by teaching grammar, producing homework and issuing students with immediate feedback. To produce this system we use the Parasite system, which produces morphological, syntactic and semantic analysis of textual input, and extend it to provide error detection and diagnosis. The methodology we adopt involves relaxing constraints on unification so that correct information contained in a badly formed sentence may still be used to obtain a coherent overall analysis. We look at a range of errors, drawn from experience with learners at various levels, covering word internal problems (addition of inappropriate affixes, failure to apply morphotactic rules properly) and problems with relations between words (local constraints on features, and word order problems). As feedback is an important factor in learning, we look into different types of feedback that can be used to evaluate which is the most appropriate for the aim of our system.

Page generated in 0.0241 seconds