• Refine Query
  • Source
  • Publication year
  • to
  • Language
  • 1
  • 1
  • Tagged with
  • 3
  • 3
  • 3
  • 2
  • 1
  • 1
  • 1
  • 1
  • 1
  • 1
  • 1
  • 1
  • 1
  • 1
  • 1
  • About
  • The Global ETD Search service is a free service for researchers to find electronic theses and dissertations. This service is provided by the Networked Digital Library of Theses and Dissertations.
    Our metadata is collected from universities around the world. If you manage a university/consortium/country archive and want to be added, details can be found on the NDLTD website.
1

Classification flexionnelles : Etude quantitative des structures de paradigmes / Inflectional classifications : A quantitative study of paradigm structures

Beniamine, Sacha 06 July 2018 (has links)
Dans les systèmes flexionnels, il arrive que des propriétés morphosyntaxiques soient exprimées différemment d’un lexème à l’autre. Pour décrire ces systèmes, il est usuel d’énumérer un petit nombre de classes flexionnelles formant une partition des lexèmes. Les systèmes flexionnels suivent cependant une organisation beaucoup plus complexe, et en raison d’un flou méthodologique, les travaux sont souvent en désaccord sur l’inventaire exact des classes.Cette thèse se place dans la perspective Mot et Paradigme et élabore des outils computationnels permettant d’observer précisément la structure de similarité des systèmes de classes flexionnelles en se fondant sur des lexiques de formes fléchies. Nous étudions les verbes de l’arabe, de l’anglais, du chatino de Zenzontepec, du chatino de Yaitepec, du français, du navajo, du portugais européen, ainsi que les noms du Russe.Dans une première partie, nous proposons de décrire le comportement flexionnel des lexèmes au moyen des alternances entre leur formes. Nous présentons un algorithme pour inférer automatiquement des patrons d’alternances reliant deux formes de surface d’un même lexème. Nous employons ces patrons pour quantifier le problème de remplissage des cases de paradigme. Dans une seconde partie, nous nous interrogeons sur la structure de similarité des systèmes flexionnels. Nous commençons par classer les lexèmes en microclasses, fondées sur l’identité du comportement flexionnel. Celles-ci sont nombreuses, et parfois très similaires entre elles. Nous proposons ensuite un algorithme fondé sur la longueur de description permettant de regrouper les microclasses en un petit nombre de macroclasses correspondant à la notion traditionnelle de classe flexionnelle. Enfin, nous montrons que le modèle le plus fidèle pour décrire les similarités au sein de ces systèmes est un treillis dont chaque nœud constitue une classe flexionnelle. Pour déduire cette hiérarchie à héritage multiple des patrons d’alternances, nous employons l’analyse de concepts formels / In some inflectional systems, the same morphosyntactic properties can be expressed differently across lexemes. These systems are usually described through the enumeration of a small number of inflection classes partitioning the inventory of lexemes. However, the actual structure of inflection class systems is much more complex, and methodological vagueness leads to contradictory accounts regarding inventories of inflection classes.This dissertation adopts the Word and Paradigm approach and elaborates computational tools to investigate precisely the similarity structure of inflection class systems based on inflectional lexicon. We study Arabic, Yaitepec Chatino, Zenzontepec Chatino, English, French, Navajo and European Portuguese verbs as well as Russian nouns.The first part defines the inflectional behavior of lexemes through the set of all surface alternations between their forms. We describe an algorithm to infer automatically alternation patterns between any two forms of a lexeme. We use alternation patterns to quantify the Paradigm Cell Filling Problem (PCFP). The second part investigates the similarity structure of inflectional systems. We start by classifying lexemes into microclasses, based on identity of inflectional behavior. These classes are numerous, and sometimes very similar. We then describe an algorithm based on minimal description length to gather microclasses into macroclasses which conform to the traditional notion of inflection class. Finally, we show that the most faithful model to describe similarities in inflectional systems is a lattice in which each node is an inflection class. To deduce this multiple inheritance hierarchy from alternation patterns, we use Formal Concept Analysis.
2

Recherche dans les bases de donnees satellitaires des paysages et application au milieu urbain: clustering, consensus et categorisation

Kyrgyzov, Ivan 30 May 2008 (has links) (PDF)
Les images satellitaires ont trouvées une large application pour l'analyse des ressources naturelles et des activités humaines. Les images à haute résolution, e.g., SPOT5, sont très nombreuses. Ceci donne un grand intérêt afin de développer de nouveaux aspects théoriques et des outils pour la fouille d'images. L'objectif de la thèse est la fouille non-supervisée d'images et inclut trois parties principales. Dans la première partie nous démontrons le contenu d'images à haute résolution. Nous décrivons les zones d'images par les caractéristiques texturelles et géométriques. Les algorithmes de clustering sont présentés dans la deuxième partie. Une étude de critères de validité et de mesures d'information est donnée pour estimer la qualité de clustering. Un nouveau critère basé sur la Longueur de Description Minimale (LDM) est proposé pour estimer le nombre optimal de clusters. Par ailleurs, nous proposons un nouveau algorithme hiérarchique basé sur le critère LDM à noyau. Une nouvelle méthode de ''combinaison de clustering'' est présentée dans la thèse pour profiter de différents algorithmes de clustering. Nous développons un algorithme hiérarchique pour optimiser la fonction objective basée sur une matrice de co-association. Une deuxième méthode est proposée qui converge à une solution globale. Nous prouvons que le minimum global peut être trouvé en utilisant l'algorithme de type ''mean shift''. Les avantages de cette méthode sont une convergence rapide et une complexité linéaire. Dans la troisième partie de la thèse un protocole complet de la fouille d'images est proposé. Différents clusterings sont représentés via les relations sémantiques entre les concepts.
3

Extraction de connaissances symboliques et relationnelles appliquée aux tracés manuscrits structurés en-ligne

Li, Jinpeng 23 October 2012 (has links) (PDF)
Notre travail porte sur l'extraction de connaissances sur des langages graphiques dont les symboles sont a priori inconnus. Nous formons l'hypothèse que l'observation d'une grande quantité de documents doit permettre de découvrir les symboles composant l'alphabet du langage considéré. La difficulté du problème réside dans la nature bidimensionnelle et manuscrite des langages graphiques étudiés. Nous nous plaçons dans le cadre de tracés en-ligne produit par des interfaces de saisie de type écrans tactiles, tableaux interactifs ou stylos électroniques. Le signal disponible est alors une trajectoire échantillonnée produisant une séquence de traits, eux-mêmes composés d'une séquence de points. Un symbole, élément de base de l'alphabet du langage, est donc composé d'un ensemble de traits possédant des propriétés structurelles et relationnelles spécifiques. L'extraction des symboles est réalisée par la découverte de sous-graphes répétitifs dans un graphe global modélisant les traits (noeuds) et leur relations spatiales (arcs) de l'ensemble des documents. Le principe de description de longueur minimum (MDL : Minimum Description Length) est mis en oeuvre pour choisir les meilleurs représentants du lexique des symboles. Ces travaux ont été validés sur deux bases expérimentales. La première est une base d'expressions mathématiques simples, la seconde représente des graphiques de type organigramme. Sur ces bases, nous pouvons évaluer la qualité des symboles extraits et comparer à la vérité terrain. Enfin, nous nous sommes intéressés à la réduction de la tâche d'annotation d'une base en considérant à la fois les problématiques de segmentation et d'étiquetage des différents traits.

Page generated in 0.101 seconds