• Refine Query
  • Source
  • Publication year
  • to
  • Language
  • 1
  • 1
  • Tagged with
  • 2
  • 1
  • 1
  • 1
  • 1
  • 1
  • 1
  • 1
  • 1
  • 1
  • 1
  • 1
  • 1
  • 1
  • 1
  • About
  • The Global ETD Search service is a free service for researchers to find electronic theses and dissertations. This service is provided by the Networked Digital Library of Theses and Dissertations.
    Our metadata is collected from universities around the world. If you manage a university/consortium/country archive and want to be added, details can be found on the NDLTD website.
1

Modélisation d'un discours étymologique. Prolégomènes à l'informatisation du Französisches Etymologisches Wörterbuch / Modelization of an etymological discourse. Prolegomena to the computerization of the Französisches Etymologisches Wörterbuch

Renders, Pascale 20 June 2011 (has links)
Le Französisches Etymologisches Wörterbuch, ouvrage de référence en linguistique française et romane, est actuellement sous-exploité, en raison des difficultés de consultation que posent ses particularités lexicographiques. La rétroconversion des 25 volumes imprimés en un dictionnaire informatisé, que la communauté scientifique appelle de ses voeux, pourrait remédier à ce problème. La densité et la complexité structurelle de l'ouvrage font toutefois craindre que l'opération se révèle peu raisonnable, voire utopique. Par ailleurs, l'informatisation présente le risque de dénaturer le discours fewien et d'ouvrir la voie à des pratiques de consultation incorrectes. Cette thèse se propose d'étudier la faisabilité du projet de rétroconversion du FEW, en prenant en compte toutes les contraintes qui lui sont imposées. Dans la première partie de l'étude, nous modélisons le discours étymologique fewien de façon à résoudre les difficultés de consultation et de lecture relevées, tout en respectant les structures de l'ouvrage. Cette modélisation, formalisée en XML, rend compte de deux dimensions complémentaires du FEW, correspondant à deux visions de l'oeuvre : comme un thesaurus d'unités lexicales d'une part, comme un recueil de monographies d'autre part. La seconde partie de notre étude examine comment appliquer le modèle au texte fewien de façon automatisée. Un logiciel de rétroconversion a été conçu dans ce but. Le noyau du logiciel est constitué d'une trentaine d'algorithmes qui identifient, dans un article du FEW, les divers types d'information pertinents et les balisent. L'application du logiciel sur un corpus de 150 articles du FEW produit des résultats de balisage comportant très peu d'erreurs problématiques. Le résultat est encore perfectible, mais il démontre la faisabilité d'une rétroconversion du FEW qui, moyennant la création d'outils d'exploitation appropriés (moteur et interface de recherche), devrait répondre à la majorité des attentes de la communauté scientifique, en rendant l'ouvrage plus accessible sans pour autant éluder la complexité et la profondeur de son discours. / The Französisches Etymologisches Wörterbuch, the reference book in French and Romance linguistics, is currently underused because its lexicographic features make it hard to search and hard to read. The retroconversion of the 25 printed volumes of the FEW into a computerized dictionary, as desired by the scientific community, may address this problem. The density and the structural complexity of the dictionary may however make retroconversion appear as an unreasonable, even utopian, endeavor. Furthermore, computerization induces the risk of skewing the fewian discourse, thus opening the way to incorrect search practices. This doctoral dissertation proposes to study the feasibility of the retroconversion of the FEW, taking into account all of the constraints on the project. In the first part of the study, we model the fewian etymological discourse in order to address the searchability and readability issues of the dictionary in a way that preserves its structures. This modeling, formalized in XML, takes account of two complementary dimensions of the FEW, corresponding to two visions of the dictionary: a thesaurus of lexical units on one hand, a collection of monographs on the other hand. The second part of our study examines how to apply the model to the fewian text in an automated fashion. A retroconversion software was constructed to this end. The kernel of the software is comprised of about thirty algorithms that identify and tag, in an article of the FEW, the various relevant types of information. The application of the software to a corpus of 150 FEW articles results in a tagging that exhibits very few problematic errors. There is still room for improving the tagging, but it already demonstrates the feasibility of a retroconversion of the FEW that, assuming the availability of appropriate exploitation tools (search engine and search interface), should address most of the expectations of the scientific community, making the dictionary more accessible without eluding the complexity and depth of the fewian discourse.
2

Interprétation interactive de documents structurés : application à la rétroconversion de plans d'architecture manuscrits

Ghorbel, Achraf 11 December 2012 (has links) (PDF)
Cette thèse entre dans le cadre de projet ANR-Mobisketch (http://mobisketch.irisa.fr/). Ce projet vise à élaborer une solution logicielle générique orientée stylo pour la réalisation de documents techniques : schémas, plans... L'objectif est d'aboutir à un continuum entre un document technique sous sa forme papier et ce même document sous sa forme numérique interprétée. Ce continuum nécessite deux analyseurs cohérents : un pour la phase de reconnaissance et un autre pour la composition/édition. Nous nous sommes intéressés dans cette thèse à l'analyseur pour la reconnaissance de documents. Le but de nos travaux était d'élaborer une approche interactive, générique et incrémentale. L'originalité de notre méthode de reconnaissance, nommée IMISketch, est la sollicitation de l'utilisateur durant la phase d'analyse. En effet, le processus d'analyse est capable de solliciter l'utilisateur s'il rencontre des cas d'ambigüités. Deux cas d'ambigüité peuvent se présenter : l'ambigüité structurelle et l'ambigüité de forme. L'ambigüité structurelle est levée par le système d'analyse quand il hésite entre deux segmentations différentes pour interpréter un symbole. Par exemple, dans un plan d'architecture, une ambigüité structurelle peut être levée pour trouver la bonne segmentation des primitives entre un mur et un ouvrant (porte, fenêtre, etc.). L'ambigüité de forme est levée s'il existe plusieurs hypothèses concurrentes pour étiqueter un symbole, par exemple une ambigüité entre une porte et une fenêtre. L'intégration de l'utilisateur dans la boucle de reconnaissance évite une correction a posteriori fastidieuse des erreurs de reconnaissance tout en permettant d'avoir un système auto-évolutif au fur et à mesure de l'analyse. Le processus de reconnaissance est basé sur une séparation de l'analyseur et des connaissances liées au type de document à reconnaître. Les connaissances structurelles a priori du document sont exprimées à travers un langage visuel grammatical basé sur l'écriture de règles de production. L'application de chaque règle est quantifiée par l'attribution d'un score à chaque hypothèse sous tendue par une branche de l'arbre d'analyse. La description grammaticale ainsi produite permet de piloter l'analyseur. Notre analyseur à base de règles est capable de mettre en concurrence des hypothèses possibles d'interprétation, afin de solliciter l'utilisateur lorsque c'est nécessaire. De plus, afin de limiter la combinatoire, l'analyseur se base sur un contexte local de recherche. Nous avons également mis en place un processus d'exploration hybride original, guidé par la description grammaticale, qui permet d'accélérer localement l'analyse tout en limitant le risque de réaliser une fausse interprétation. Notre méthode interactive a été validée sur les plans d'architecture dessinés à main levée. Ces plans sont composés de murs, de trois types d'ouvrants et d'une dizaine de classes de mobilier. Ces travaux montrent que la sollicitation de l'utilisateur permet d'améliorer la qualité de reconnaissance des documents.

Page generated in 0.0805 seconds