Dans les systèmes flexionnels, il arrive que des propriétés morphosyntaxiques soient exprimées différemment d’un lexème à l’autre. Pour décrire ces systèmes, il est usuel d’énumérer un petit nombre de classes flexionnelles formant une partition des lexèmes. Les systèmes flexionnels suivent cependant une organisation beaucoup plus complexe, et en raison d’un flou méthodologique, les travaux sont souvent en désaccord sur l’inventaire exact des classes.Cette thèse se place dans la perspective Mot et Paradigme et élabore des outils computationnels permettant d’observer précisément la structure de similarité des systèmes de classes flexionnelles en se fondant sur des lexiques de formes fléchies. Nous étudions les verbes de l’arabe, de l’anglais, du chatino de Zenzontepec, du chatino de Yaitepec, du français, du navajo, du portugais européen, ainsi que les noms du Russe.Dans une première partie, nous proposons de décrire le comportement flexionnel des lexèmes au moyen des alternances entre leur formes. Nous présentons un algorithme pour inférer automatiquement des patrons d’alternances reliant deux formes de surface d’un même lexème. Nous employons ces patrons pour quantifier le problème de remplissage des cases de paradigme. Dans une seconde partie, nous nous interrogeons sur la structure de similarité des systèmes flexionnels. Nous commençons par classer les lexèmes en microclasses, fondées sur l’identité du comportement flexionnel. Celles-ci sont nombreuses, et parfois très similaires entre elles. Nous proposons ensuite un algorithme fondé sur la longueur de description permettant de regrouper les microclasses en un petit nombre de macroclasses correspondant à la notion traditionnelle de classe flexionnelle. Enfin, nous montrons que le modèle le plus fidèle pour décrire les similarités au sein de ces systèmes est un treillis dont chaque nœud constitue une classe flexionnelle. Pour déduire cette hiérarchie à héritage multiple des patrons d’alternances, nous employons l’analyse de concepts formels / In some inflectional systems, the same morphosyntactic properties can be expressed differently across lexemes. These systems are usually described through the enumeration of a small number of inflection classes partitioning the inventory of lexemes. However, the actual structure of inflection class systems is much more complex, and methodological vagueness leads to contradictory accounts regarding inventories of inflection classes.This dissertation adopts the Word and Paradigm approach and elaborates computational tools to investigate precisely the similarity structure of inflection class systems based on inflectional lexicon. We study Arabic, Yaitepec Chatino, Zenzontepec Chatino, English, French, Navajo and European Portuguese verbs as well as Russian nouns.The first part defines the inflectional behavior of lexemes through the set of all surface alternations between their forms. We describe an algorithm to infer automatically alternation patterns between any two forms of a lexeme. We use alternation patterns to quantify the Paradigm Cell Filling Problem (PCFP). The second part investigates the similarity structure of inflectional systems. We start by classifying lexemes into microclasses, based on identity of inflectional behavior. These classes are numerous, and sometimes very similar. We then describe an algorithm based on minimal description length to gather microclasses into macroclasses which conform to the traditional notion of inflection class. Finally, we show that the most faithful model to describe similarities in inflectional systems is a lattice in which each node is an inflection class. To deduce this multiple inheritance hierarchy from alternation patterns, we use Formal Concept Analysis.
Identifer | oai:union.ndltd.org:theses.fr/2018USPCC041 |
Date | 06 July 2018 |
Creators | Beniamine, Sacha |
Contributors | Sorbonne Paris Cité, Bonami, Olivier |
Source Sets | Dépôt national des thèses électroniques françaises |
Language | French |
Detected Language | French |
Type | Electronic Thesis or Dissertation, Text, Collection |
Page generated in 0.002 seconds