Global ETD Search

11	Contributions à l'alignement d'ontologies OWL par agrégation de similarités / Contributions to OWL ontologies alignment using similarity aggregation Zghal, Sami 21 December 2010 (has links) Dans le cadre de cette thèse, nous avons proposé plusieurs méthodes d'alignement à savoir: la méthode EDOLA, la méthode SODA et la méthode OACAS. Les trois méthodes procèdent dans une première phase à la transformation des deux ontologies à aligner sous la forme d'un graphe, O-Graph, pour chaque ontologie. Ces graphes permettent la représentation des ontologies sous une forme facile à l'exploitation. La méthode EDOLA est une approche se basant sur un modèle de calcul des similarités locale et globale. Ce modèle suit la structure du graphe pour calculer les mesures de similarité entre les noeuds des deux ontologies. Le module d'alignement associe pour chaque catégorie de noeuds une fonction d'agrégation. La fonction d'agrégation prend en considération toutes les mesures de similarités entre les couples de noeuds voisins au couple de noeud à apparier. La méthode SODA est une amélioration de la méthode EDOLA. En effet, la méthode SODA opère sur les ontologies OWL-DL, pour les aligner, à la place des ontologies décrites en OWL-Lite. La méthode SODA est une approche structurelle pour l'alignement d'ontologies OWL-DL. Elle opère en 3 étapes successives. La première étape permet de calculer la similarité linguistique à travers des mesures de similarité plus adaptées aux descripteurs des constituants des ontologies à apparier. La seconde étape détermine la similarité structurelle en exploitant la structure des deux graphes O-Graphs. La troisième étape déduit la similarité sémantique, en prenant en considération les deux types de similarités déjà calculées. La méthode d'alignement, OACAS, opère en 3 étapes successives pour produire l'alignement. La première étape permet de calculer la similarité linguistique composée. La similarité linguistique composée prend en considération tous les descripteurs des entités ontologiques à aligner. La seconde étape détermine la similarité de voisinage par niveau. La troisième étape agrège les composants de la similarité linguistique composée et la similarité de voisinage par niveau pour déterminer la similarité agrégée. / In this thesis, we have proposed three ontology alignment methods: EDOLA (Extended Diameter OWL-Lite Alignment) method, SODA (Structural Ontology OWL-DL Alignment) method and OACAS (Ontologies Alignment using Composition and Aggregation of Similarities) method. These methods rely on aggregation and composition of similarities and check the spread structure of the ontologies to be aligned. EDOLA method allows to align OWL-Lite ontologies whereas SODA and OACAS consider OWL-DL ontologies. The three proposed methods operate in a first step by transforming both ontologies to aligned as a graph, named O-Graph, for each ontology. This graph reproduces OWL ontologies to be easily manipulated during the alignment process. The obtained graphs describe all the information contained in the ontologies: entities, relations between entities and instances. Besides, the EDOLA method is a new approach that computes local and global similarities using a propagation technique of similarities through the O-Graphs. This model explores the structure of the considered O-Graphs to compute the similarity values between the nodes of both ontologies. The alignment model associates for each category of nodes an aggregation function. This function takes in consideration all the similarity measures of the couple of nodes to match. This aggregation function explores all descriptive information of this couple. EDOLA operates in two succesive steps. The first step computes the local similarity, terminological one, whereas the second step computes the global one. The SODA method is an improved version of EDOLA. In fact, it uses OWL-DL ontologies. SODA method is a structures approach for OWL-DL ontologies. The method operates in three successive steps and explores the structure the ontologies using O-Graphs. The first step computes linguistic similarity using appropriate similarity measures corresponding to the descriptors of ontological entities. The second step allows to compute structural similarity using the two graphs O-Graphs. The third step deduces the semantic similarity, by combining both similarities already computed, in order to outperform the alignment task. Read more Ontologies Agrégation de similarité Alignement Hétérogénéité OWL Mesure de similarité
12	Favoriser l'innovation dans une organisation par projets sous contraintes de ressources : définition d'une approche basée sur les processus / Promoting innovation in an organization by projects under resource constraints : definition of process based approach Penide, Thomas 20 May 2011 (has links) Dans le contexte globalisé de l'industrie moderne, l'innovation est devenue un enjeu majeur des entreprises. L'innovation ne doit plus être seulement vue comme le moyen de pérenniser ses activités à long terme, mais aussi comme une composante essentielle des activités quotidiennes de pilotage des organisations. Pour affronter ce problème, et plus particulièrement au sein du Pôle Innovation des Laboratoires Pierre Fabre, l'approche choisie se situe au croisement de deux ingénieries. L'ingénierie d'entreprise, premier prisme de notre étude, permet de déceler ce qui relève des activités quotidiennes dans les processus exécutés, tandis que l'ingénierie d'innovation révèle ce qui relève d'un processus d'innovation spécifique. Au croisement de ces deux ingénieries, une technique spécifique d'alignement a permis de définir une approche originale de management centré sur le processus d'innovation et favorisant la détection, le diagnostic et l'évaluation d'innovation potentielle au cœur même des activités quotidiennes et opérationnelles de réalisation des projets. L'ensemble des propositions de management de l'innovation ont été appliquées au Pôle Innovation, terreau de notre expérimentation, mettant en évidence des axes d'amélioration originaux. / In the globalised context of modern industry, innovation has become a major challenge for enterprises. Innovation should not only be seen as a way to sustain long-term activities, but also as an essential component of daily management activities of organizations. To address this problem, especially in the Innovation Center of Pierre Fabre Laboratories, the chosen approach is located at the crossroads of two engineerings. Enterprise engineering is the first prism of our study, detecting what is part of the daily activities in the running processes, while innovation engineering reveals what is specific to an innovation process. At the crossroads of these two engineerings, a specific alignment identifies an original management approach focused on the innovation process and promoting the detection, diagnosis and assessment of potential innovation in the daily activities and projects. All the proposals for an innovation management have been applied to the Innovation Center, a breeding ground for our experimentation, highlighting original areas for improvement. Read more Innovation Processus Bpm Alignement Innovation Process Bpm Alignment
13	ROMIE, une approche d'alignement d'ontologies à base d'instances Elbyed, Abdeltif 16 October 2009 (has links) (PDF) L'interoperabilite semantique est une question importante, largement identifiee dans les technologies d'organisation et de l'information et dans la communaute de recherche en systemes d'information. L'adoption large du Web afin d'acceder a des informations distribuees necessite l'interoperabilite des systemes qui gerent ces informations. Des solutions et reflexions comme le Web Semantique facilitent la localisation et l'integration des donnees d'une maniere plus intelligente par l'intermediaire des ontologies. Il offre une vision plus semantique et comprehensible du web. Pourtant, il souleve un certain nombre de defis de recherche. Un des principaux defis est de comparer et aligner les differentes ontologies qui apparaissent dans des taches d'integration. Le principal objectif de cette these est de proposer une approche d'alignement pour identifier les liens de correspondance entre des ontologies. Notre approche combine les techniques et les methodes d'appariement linguistiques, syntaxiques, structurelles ou encore semantiques (basees sur les instances). Elle se compose de deux phases principales : la phase d'enrichissement semantique des ontologies a comparer et la phase d'alignement ou de mapping. La phase d'enrichissement est basee sur l'analyse des informations que les ontologies developpent (des ressources web, des donnees, des documents, etc.) et qui sont associes aux concepts de l'ontologie. Notre intuition est que ces informations ainsi que les relations qui peuvent exister entre elles participent a l'enrichissement semantique entre les concepts. A l'issue de la phase d'enrichissement, une ontologie contient plus de relations semantiques entre les concepts qui seront exploitees dans la deuxieme phase. La phase de mapping prend deux ontologies enrichies et calcule la similarite entre les couples de concepts. Un processus de filtrage nous permet de reduire automatiquement le nombre de fausses relations. La validation des correspondances est un processus interactif direct (avec un expert) ou indirect (en mesurant le degre de satisfaction de l'utilisateur). Notre approche a donne lieu a un systeme de mapping appele ROMIE (Resource based Ontology Mapping within an Interactive and Extensible environment). Il a ete experimente et evalue dans deux differentes applications : une application biomedicale et une application dans le domaine de l'apprentissage enrichi par les technologies (ou e-learning). Read more [INFO] Computer Science Web sémantique Système multi-agent Alignement d'ontologies
14	Concise Pattern Learning for RDF Data Sets Interlinking / Apprentissage de motifs concis pour le liage de données RDF Fan, Zhengjie 04 April 2014 (has links) De nombreux jeux de données sont publiés sur le web à l’aide des technologies du web sémantique. Ces jeux de données contiennent des données qui représentent des liens vers des ressources similaires. Si ces jeux de données sont liés entre eux par des liens construits correctement, les utilisateurs peuvent facilement interroger des données à travers une interface uniforme, comme s’ils interrogeaient un jeu de données unique. Mais, trouver des liens corrects est très difficile car de nombreuses comparaisons doivent être effectuées. Plusieurs solutions ont été proposées pour résoudre ce problème : (1) l’approche la plus directe est de comparer les valeurs d’attributs d’instances pour identifier les liens, mais il est impossible de comparer toutes les paires possibles de valeurs d’attributs. (2) Une autre stratégie courante consiste à comparer les instances selon les attribut correspondants trouvés par l’alignement d’ontologies à base d’instances, qui permet de générer des correspondances d’attributs basés sur des instances. Cependant, il est difficile d’identifier des instances similaires à travers les ensembles de données car,dans certains cas, les valeurs des attributs en correspondance ne sont pas les mêmes.(3) Plusieurs méthodes utilisent la programmation génétique pour construire des modèles d’interconnexion afin de comparer différentes instances, mais elles souffrent de longues durées d’exécution.Dans cette thèse, une méthode d’interconnexion est proposée pour relier les instances similaires dans différents ensembles de données, basée à la fois sur l’apprentissage statistique et sur l’apprentissage symbolique. L’entrée est constituée de deux ensembles de données, des correspondances de classes sur les deux ensembles de données et un échantillon de liens “positif” ou “négatif” résultant d’une évaluation de l’utilisateur. La méthode construit un classifieur qui distingue les bons liens des liens incorrects dans deux ensembles de données RDF en utilisant l’ensemble des liens d’échantillons évalués. Le classifieur est composé de correspondances d’attributs entre les classes correspondantes et de deux ensembles de données,qui aident à comparer les instances et à établir les liens. Le classifieur est appelé motif d’interconnexion dans cette thèse. D’une part, notre méthode découvre des correspondances potentielles entre d’attributs pour chaque correspondance de classe via une méthode d’apprentissage statistique : l’algorithme de regroupement K-medoids,en utilisant des statistiques sur les valeurs des instances. D’autre part, notre solution s’appuie sur un modèle d’interconnexion par une méthode d’apprentissage symbolique: l’espace des versions, basée sur les correspondances d’attributs potentielles découvertes et l’ensemble des liens de l’échantillon évalué. Notre méthode peut résoudre la tâche d’interconnexion quand il n’existe pas de motif d’interconnexion combiné qui couvre tous les liens corrects évalués avec un format concis.L’expérimentation montre que notre méthode d’interconnexion, avec seulement1% des liens totaux dans l’échantillon, atteint une F-mesure élevée (de 0,94 à 0,99). / There are many data sets being published on the web with Semantic Web technology. The data sets usually contain analogous data which represent the similar resources in the world. If these data sets are linked together by correctly identifying the similar instances, users can conveniently query data through a uniform interface, as if they are connecting a single database. However, finding correct links is very challenging because web data sources usually have heterogeneous ontologies maintained by different organizations. Many existing solutions have been proposed for this problem. (1) One straight-forward idea is to compare the attribute values of instances for identifying links, yet it is impossible to compare all possible pairs of attribute values. (2) Another common strategy is to compare instances with correspondences found by instance-based ontology matching, which can generate attribute correspondences based on overlapping ranges between two attributes, while it is easy to cause incomparable attribute correspondences or undiscovered comparable attribute correspondences. (3) Many existing solutions leverage Genetic Programming to construct interlinking patterns for comparing instances, however the running times of the interlinking methods are usually long. In this thesis, an interlinking method is proposed to interlink instances for different data sets, based on both statistical learning and symbolic learning. On the one hand, the method discovers potential comparable attribute correspondences of each class correspondence via a K-medoids clustering algorithm with instance value statistics. We adopt K-medoids because of its high working efficiency and high tolerance on irregular data and even incorrect data. The K-medoids classifies attributes of each class into several groups according to their statistical value features. Groups from different classes are mapped when they have similar statistical value features, to determine potential comparable attribute correspondences. The clustering procedure effectively narrows the range of candidate attribute correspondences. On the other hand, our solution also leverages a symbolic learning method, called Version Space. Version Space is an iterative learning model that searches for the interlinking pattern from two directions. Our design can solve the interlinking task that does not have a single compatible conjunctive interlinking pattern that covers all assessed correct links with a concise format. The interlinking solution is evaluated with large-scale real-world data from IM@OAEI and CKAN. Experiments confirm that the solution with only 1% of sample links already reaches a high accuracy (up to 0.94-0.99 on F-measure). The F-measure quickly converges improving on other state-of-the-art approaches, by nearly 10 percent of their F-measure values. Read more Interconnexion Alignement d’ontologies Apprentissage Interlinking Ontology Matching Machine Learning 004
15	A Unified Approach for Dealing with Ontology Mappings and their Defects / Une approche Unifiée au Traitement de “Mappings” d’Ontologies et de leurs Défauts Abbas, Muhammad Aun 14 December 2016 (has links) Un mapping d’ontologies est un ensemble de correspondances. Chaque correspondance relie des artefacts, typiquement concepts et propriétés, d’une ontologie avec ceux d’une autre ontologie. Le mapping entre ontologies a suscité beaucoup d’intérêt durant ces dernières années. En effet, le mapping d’ontologies est largement utilisé pour mettre en oeuvre de l’interopérabilité et intégration (transformation de données, réponse à la requête, composition de web service) dans les applications, et également dans la création de nouvelles ontologies. D’une part, vérifier l’exactitude (logique) d’un mapping est devenu un prérequis fondamentale à son utilisation. D’autre part, pour deux ontologies données, plusieurs mappings peuvent être établis, obtenus par différentes méthodes d’alignement, ou définis manuellement. L’utilisation de plusieurs mappings entre deux ontologies dans une seule application ou pour synthétiser un seul mapping tirant profit de ces plusieurs mappings, peut générer des erreurs dans l’application ou dans le mapping synthétisé car ces plusieurs mappings peuvent être contradictoires. Dans les deux situations décrites ci-dessus, l’exactitude, la non-contradiction et autres propriétés sont généralement exprimées de façon formelle et vérifiées dans le contexte des ontologies formelles (par exemple, lorsque les ontologies sont représentées en logique) La vérification de ces propriétés est généralement effectuée à l’aide d’un seul formalisme, exigeant d’une part que les ontologies soient représentées par ce seul formalisme et, d’autre part, qu’une représentation formelle des mappings soit fournie, complétée par des notions formalisant les propriétés recherchées. Cependant, il existe une multitude de formalismes hétérogènes pour exprimer les ontologies, allant des plus informels (par exemple, du texte contrôlé, des modèles en UML) aux formels (par exemple, des logiques de description ou des catégories). Ceci implique que pour appliquer les approches existantes, les ontologies hétérogènes doivent être traduites (ou juste transformées, si l’ontologie source est exprimée de façon informelle ou si la traduction complète pour maintenir l’équivalence n’est pas possible) dans un seul formalisme commun et les mappings sont reformulés à chaque fois : seulement à l’issu de ce processus, les propriétés recherchées peuvent être établies. Même si cela est possible, ce processus peut produire à la fois des mappings corrects et incorrects vis-à-vis de ces propriétés, en fonction de la traduction (transformation) opérée. En effet, les propriétés recherchées dépendent du formalisme employé pour exprimer les ontologies et les mappings. Dans cette dissertation, des différentes propriétés ont été a été reformulées d’une manière unifiée dans le contexte d’ontologies hétérogènes utilisant la théorie de Galois. Dans ce contexte, les ontologies sont représentées comme treillis, et les mappings sont reformulés comme fonctions entre ces treillis. Les treillis sont des structures naturelles pour la représentation directe d’ontologies sans obligation de traduire ou transformer les formalismes dans lesquels les ontologies sont exprimées à l’origine. Cette reformulation unifiée a permis d’introduire une nouvelle notion de mappings compatibles et incompatibles. Il est ensuite formellement démontré que cette nouvelle notion couvre plusieurs parmi les propriétés recherchées de mappings, mentionnées dans l’état de l’art. L’utilisation directe de mappings compatibles et incompatibles est démontrée par l’application à des mappings d’ontologies de haut niveau. La notion de mappings compatibles et incompatibles est aussi appliquée sur des ontologies de domaine, mettant en évidence comment les mappings incompatibles génèrent des résultats incorrects pour la fusion d’ontologies. / An ontology mapping is a set of correspondences. Each correspondence relates artifacts, such as concepts and properties, of one ontology to artifacts of another ontology. In the last few years, a lot of attention has been paid to establish mappings between source ontologies. Ontology mapping is widely and effectively used for interoperability and integration tasks (data transformation, query answering, or web-service composition, to name a few), and in the creation of new ontologies. On the one side, checking the (logical) correctness of ontology mappings has become a fundamental prerequisite of their use. On the other side, given two ontologies, there are several ontology mappings between them that can be obtained by using different ontology matching methods or just stated manually. Using ontology mappings between two ontologies in combination within a single application or for synthesizing one mapping taking the advantage of two original mappings, may cause errors in the application or in the synthesized mapping because those original mappings may be contradictory (conflicting). In both situations, correctness is usually formalized and verified in the context of fully formalized ontologies (e.g. in logics), even if some “weak” notions of correctness have been proposed when ontologies are informally represented or represented in formalisms preventing a formalization of correctness (such as UML). Verifying correctness is usually performed within one single formalism, requiring on the one side that ontologies need to be represented in this unique formalism and, on the other side, a formal representation of mapping is provided, equipped with notions related to correctness (such as consistency). In practice, there exist several heterogeneous formalisms for expressing ontologies, ranging from informal (text, UML and others) to formal (logical and algebraic). This implies that, willing to apply existing approaches, heterogeneous ontologies should be translated (or just transformed if, the original ontology is informally represented or when full translation, keeping equivalence, is not possible) in one common formalism, mappings need each time to be reformulated, and then correctness can be established. This is possible but possibly leading to correct mappings under one translation and incorrect mapping under another translation. Indeed, correctness (e.g. consistency) depends on the underlying employed formalism in which ontologies and mappings are expressed. Different interpretations of correctness are available within the formal or even informal approaches questioning about what correctness is indeed. In the dissertation, correctness has been reformulated in the context of heterogeneous ontologies by using the theory of Galois connections. Specifically ontologies are represented as lattices and mappings as functions between those lattices. Lattices are natural structures for directly representing ontologies, without changing the original formalisms in which ontologies are expressed. As a consequence, the (unified) notion of correctness has been reformulated by using Galois connection condition, leading to the new notion of compatible and incompatible mappings. It is formally shown that the new notion covers the reviewed correctness notions, provided in distinct state of the art formalisms, and, at the same time, can naturally cover heterogeneous ontologies. The usage of the proposed unified approach is demonstrated by applying it to upper ontology mappings. Notion of compatible and incompatible ontology mappings is also applied on domain ontologies to highlight that incompatible ontology mappings give incorrect results when used for ontology merging. Read more Mapping d'ontologies Alignement d'ontologies Ontologies de haut niveau Ontology mapping 006.332
16	Femtosecond Filament Interaction As A Probe For Molecular Alignment McKee, Erik 01 January 2013 (has links) Femtosecond laser filamentation is a highly nonlinear propagation mode. When a laser pulse propagates with a peak power exceeding a critical value Pcr (5 GW at 800 nm in air), the Kerr effect tends to collapse the beam until the intensity is high enough to ionize the medium, giving rise to plasma defocusing. A dynamic competition between these two effects takes place leaving a thin and weakly ionized plasma channel in the trail of the pulse. When an ultrafast laser pulse interacts with molecules, it will align them, spinning them about their axis of polarization. As the quantum rotational wave packet relaxes, the molecules will experience periodic field-free alignment. Recent work has demonstrated the effect of molecular alignment on laser filamentation of ultra-short pulses. Revival of the molecular alignment can modify filamentation parameters as it can locally modify the refractive index and the ionization rate. In this thesis, we demonstrate with simulations and experiments that these changes in the filament parameters (collapse distance and filament plasma length) can be used to probe molecular alignment in CO2. Filamentation molecular alignement ultra fast physics Electromagnetics and Photonics Optics
17	Filtering parallel texts to improve translation model and cross-language information retrieval Cai, Jian January 2001 (has links) Mémoire numérisé par la Direction des bibliothèques de l'Université de Montréal. Filtrage du corpus de textes Alignement des phrases
18	L’antipassif dans les langues accusatives / The antipassive in accusative languages Janic, Katarzyna 17 December 2013 (has links) Le terme d’antipassif, qui s’inscrit depuis quarante ans dans le système des langues ergatives, désigne une construction intransitive ayant pour caractéristique générale la destitution du patient. Cette thèse remet en question l’opinion traditionnelle selon laquelle les constructions antipassives sont identifiées exclusivement dans les langues à alignement ergatif, et non dans les langues à alignement accusatif. Étant donné qu’une certaine proportion de langues ergatives utilise pour dériver l’antipassif le morphème polysémique réfléchie et/ou réciproque, dans cette étude nous nous sommes intéressée aux langues accusatives dont la marque antipassive présente la même caractéristique, d’où l’intérêt porté aux langues austronésiennes, Niger-Congo et Nilo-sahariennes, turciques, slaves et romanes. Dans la mesure où nous avons décidé de travailler sur les constructions antipassives dérivées par une marque étant à l’origine polysémique, l’impact sémantique de cette dernière sur l’ensemble de la construction apparaît comme non négligeable. Cette étude présente ainsi le double intérêt de s’appuyer sur une approche translinguistique, impliquant différentes familles de langues, et sur une vision bipolaire relative aux domaines de la syntaxe et de la sémantique. / The antipassive term, associated with ergative system since forty years, denotes an intransitive construction in which the patient argument is syntactically demoted. This study calls into question a traditional opinion according to which the antipassive phenomenon is encountered in ergative languages but not in those of accusative alignment. Since in some ergative languages the antipassive construction is triggered by a polysemous reflexive and/or reciprocal morpheme, this study deals exclusively with those accusative languages in which the antipassive marker presents the same characteristics (cf. Austronesian, Niger–Congo, Nilo-Saharan, Turkic, Slavonic, Romance languages). Building on the polysemous nature of such marker, its possible semantic impact on the whole derivation should also be taken into consideration. The aim of this study is to analyse the antipassive construction both from semantic and syntactic point of view in a crosslinguistic perspective. Read more Réflexivité Réciprocité Antipassif Valence Polysémie Alignement accusatif Alignement ergatif Typologie Reflexive Reciprocal Antipassive Valency Polysemy Accusative alignment Ergative alignment Typology
19	Confidence Measures for Alignment and for Machine Translation / Mesures de Confiance pour l’Alignement et pour la Traduction Automatique Xu, Yong 26 September 2016 (has links) En linguistique informatique, la relation entre langues différentes est souventétudiée via des techniques d'alignement automatique. De tels alignements peuvent êtreétablis à plusieurs niveaux structurels. En particulier, les alignements debi-textes aux niveaux phrastiques et sous-phrastiques constituent des sources importantesd'information dans pour diverses applications du Traitement Automatique du Language Naturel (TALN)moderne, la Traduction Automatique étant un exemple proéminent.Cependant, le calcul effectif des alignements de bi-textes peut êtreune tâche compliquée. Les divergences entre les langues sont multiples,de la structure de discours aux constructions morphologiques.Les alignements automatiques contiennent, majoritairement, des erreurs nuisantaux performances des applications.Dans cette situation, deux pistes de recherche émergent. La première est de continuerà améliorer les techniques d'alignement.La deuxième vise à développer des mesures de confiance fiables qui permettent aux applicationsde sélectionner les alignements selon leurs besoins.Les techniques d'alignement et l'estimation de confiance peuvent tous les deuxbénéficier d'alignements manuels.Des alignements manuels peuventjouer un rôle de supervision pour entraîner des modèles, et celuides données d'évaluation. Pourtant, la création des telles données est elle-mêmeune question importante, en particulier au niveau sous-phrastique, où les correspondancesmultilingues peuvent être implicites et difficiles à capturer.Cette thèse étudie des moyens pour acquérir des alignements de bi-textes utiles, aux niveauxphrastiques et sous-phrastiques. Le chapitre 1 fournit une description de nos motivations,la portée et l'organisation du travail, et introduit quelques repères terminologiques et lesprincipales notations.L'état-de-l'art des techniques d'alignement est revu dans la Partie I. Les chapitres 2 et3 décriventles méthodes respectivement pour l'alignement des phrases et des mots.Le chapitre 4 présente les bases de données d'alignement manuel,et discute de la création d'alignements de référence. Le reste de la thèse, la Partie II,présente nos contributions à l'alignement de bi-textes, en étudiant trois aspects.Le chapitre 5 présente notre contribution à la collection d'alignements de référence. Pourl'alignement des phrases, nous collectons les annotations d'un genre spécifiquede textes: les bi-textes littéraires. Nous proposons aussi un schéma d'annotation deconfiance. Pour l'alignement sous-phrastique,nous annotons les liens entre mots isolés avec une nouvelle catégorisation, et concevonsune approche innovante de segmentation itérative pour faciliter l'annotation des liens entre groupes de mots.Toutes les données collectées sont disponibles en ligne.L'amélioration des méthodes d'alignement reste un sujet important de la recherche. Nousprêtons une attention particulière à l'alignement phrastique, qui est souvent le point dedépart de l'alignement de bi-textes. Le chapitre 6 présente notre contribution. En commençantpar évaluer les outils d'alignement d'état-de-l'art et par analyser leurs modèles et résultats,nous proposons deux nouvelles méthodes pour l'alignement phrastique, qui obtiennent desperformances d'état-de-l'art sur un jeu de données difficile.L'autre sujet important d'étude est l'estimation de confiance. Dans le chapitre 7, nousproposons des mesures de confiance pour les alignements phrastique et sous-phrastique.Les expériences montrent que l'estimation de confiance des liens d'alignement reste undéfi remarquable. Il sera très utile de poursuivre cette étude pour renforcer les mesuresde confiance pour l'alignement de bi-textes.Enfin, notons que les contributions apportées dans cette thèse sont employées dans uneapplication réelle: le développement d'une liseuse qui vise à faciliter la lecturedes livres électroniques multilingues. / In computational linguistics, the relation between different languages is often studied through automatic alignment techniques. Such alignments can be established at various structural levels. In particular, sentential and sub-sentential bitext alignments constitute an important source of information in various modern Natural Language Processing (NLP) applications, a prominent one being Machine Translation (MT).Effectively computing bitext alignments, however, can be a challenging task. Discrepancies between languages appear in various ways, from discourse structures to morphological constructions. Automatic alignments would, at least in most cases, contain noise harmful for the performance of application systems which use the alignments. To deal with this situation, two research directions emerge: the first is to keep improving alignment techniques; the second is to develop reliable confidence measures which enable application systems to selectively employ the alignments according to their needs.Both alignment techniques and confidence estimation can benefit from manual alignments. Manual alignments can be used as both supervision examples to train scoring models and as evaluation materials. The creation of such data is, however, an important question in itself, particularly at sub-sentential levels, where cross-lingual correspondences can be only implicit and difficult to capture.This thesis focuses on means to acquire useful sentential and sub-sentential bitext alignments. Chapter 1 provides a non-technical description of the research motivation, scope, organization, and introduces terminologies and notation. State-of-the-art alignment techniques are reviewed in Part I. Chapter 2 and 3 describe state-of-the-art methods for respectively sentence and word alignment. Chapter 4 summarizes existing manual alignments, and discusses issues related to the creation of gold alignment data. The remainder of this thesis, Part II, presents our contributions to bitext alignment, which are concentrated on three sub-tasks.Chapter 5 presents our contribution to gold alignment data collection. For sentence- level alignment, we collect manual annotations for an interesting text genre: literary bitexts, which are very useful for evaluating sentence aligners. We also propose a scheme for sentence alignment confidence annotation. For sub-sentential alignment, we annotate one-to-one word links with a novel 4-way labelling scheme, and design a new approachfor facilitating the collection of many-to-many links. All the collected data is released on-line.Improving alignment methods remains an important research subject. We pay special attention to sentence alignment, which often lies at the beginning of the bitext alignment pipeline. Chapter 6 presents our contributions to this task. Starting by evaluating state-of-the-art aligners and analyzing their models and results, we propose two new sentence alignment methods, which achieve state-of-the-art performance on a difficult dataset.The other important subject that we study is confidence estimation. In Chapter 7, we propose confidence measures for sentential and sub-sentential alignments. Experiments show that confidence estimation of alignment links is a challenging problem, and more works on enhancing the confidence measures will be useful.Finally, note that these contributions have been employed in a real world application: the development of a bilingual reading tool aimed at facilitating the reading in a foreign language. Read more Mesures de confiance Estimation de Confiance Alignement de Bi-textes Alignement Phrastique Alignement de Mots Schème d’Annotation Corpus de Référence Traduction Automatique Confidence Measure Confidence Estimation Bitext Alignment Sentence Alignment Word Alignment Annotation Scheme Reference Corpus Machine Translation
20	Mise à l'épreuve de l'alignement des usages du Système d'Information : le cas de sociétés ayant confié leur Système d’Information à un Centre de Services Partagés / Testing the alignment of usages of the Information System : the case of companies having entrusted their Information System to a Shared Services Center Mathieu, Daniel 18 November 2013 (has links) Notre travail de recherche a comme but d’améliorer la compréhension que nous avons sur les centres de services partagés (CSP), un mode d’organisation qui est en vogue ces dernières années. Plus spécifiquement, l’objet de notre travail est d’explorer la singularité qui existe entre ce mode organisationnel spécifique qu’est le centre de service partagés appliqué au système d’information (SI) et à l’alignement stratégique de celui-ci avec l’entreprise. Le thème de ce travail est donc de tester l’impact d’un CSP qui a en charge la SI dans l’alignement des usages (après la phase de gestion du changement et donc de bascule). En d’autres mots, nous testons le lien entre le fait de confier une partie de son SI à un CSP et la variation de l’alignement des usages du SI. Nous avons envisagé d’étudier notre problématique sous un aspect de la variation de l’alignement du SI et de la « satisfaction » des parties prenantes. Nous nous sommes focalisé sur la phase post-basculement (Alignement des Usages). Cette démarche inclut les termes « dynamique » et « usage » et prend en compte les dimensions temporelle et relationnelle. Nos travaux s’inscrivent dans un domaine de recherches émergent, ce qui leur confère un caractère exploratoire. Nous avons construit notre stratégie et notre objet de recherche de manière progressive. Comme préalable indispensable, il nous a paru fondamental de réaliser une exploration théorique des thèmes associés à notre recherche afin de constituer à la fois le fondement et la justification de la démarche proposée. Les connaissances que nous avons acquises nous ont conduit à élaborer des propositions conceptuelles (6 hypothèses) dans une perspective constructiviste. Celles-ci ont été construites lors de tests préalables puis ont fait l’objet de mises à l’épreuve auprès d’une sélection d’entreprises européennes utilisant un ou plusieurs CSP. Il nous a semblé plus riche de disposer de données issues de la complémentarité de deux approches qualitatives. Notre investigation s’est donc déroulée de façon duale. Nous avons d’une part étudié en détail une entreprise en particulier et, d’autre part, nous avons réalisé une étude pluri-organisationnelle composée de 5 études de cas menées à partir de 9 entretiens semi-directifs.La diversité des résultats obtenus tend à démontrer la singularité de notre travail de recherche. Deux propositions sont à mettre en évidence. La première est que l’alignement des usages à long terme est renforcé par l’utilisation d’une organisation insérant en son sein des CSP (hypothèse 1) et la deuxième est liée au fait que les parties prenantes externes peuvent être plus facilement manœuvrables par les entreprises clientes qui utilisent un CSP (hypothèse 3). Plus globalement, nous constatons deux autres contributions intéressantes de nos travaux. La première est liée à la plus grande stabilité dans le cadre de changements profonds des organisations qui font par exemple l’expérience d’une fusion ou d’une acquisition (hypothèses deux et six). Notre recherche académique arrive dès lors à la conclusion que le CSP est un facteur habilitant la stabilité de l’entreprise qui l’utilise. La seconde contribution est essentielle, elle couvre les problématiques d’interface entre le CSP et les autres acteurs, principalement les autres parties prenantes internes. Les liens entre les différentes parties sont fondamentaux pour obtenir et maintenir un bon alignement. / The aim of our research is to improve the understanding that we have towards the Shared Service Centers (SSC), a way of organization which has been the trend in the last years. To be more specific, the aim of our work is to explore the existing singularity between this specific organizational method, which is the SSC applied to the Information System (IS) and the strategic alignment with the enterprise. The objective of this paper is therefore to test the impact of the IS alignment in a company which uses the SSC. We have considered to study our question under the aspect of the variation of the IS alignment and the stakeholder’s “satisfaction”. We focalized on the postoperative handover (alignment of usages). This approach includes the “dynamic” and “usage” terms and takes into account the temporary and relational dimensions. Our work is inserted in a new research field that provides them with an explorative characteristic. We have built our strategy and our research study in a progressive way. Beforehand, it has seemed to us crucial to undergo a theoretic exploration of the subjects related to our research, in order to build simultaneously the basis and the purpose of the mentioned approach. The knowledge we have acquired has led us to elaborate conceptual proposals (6 hypotheses) from a constructivist perspective. These proposals were built during initial exploration tests and afterwards they were tested in European companies using one or more SSC. It seemed to us more logical to adopt the complementarity of a dual qualitative approach. On one hand, we studied in detail one company and, on the other hand, we have realized a poly organizational study, composed by 5 case studies, which were based on 9 semi-directive interviews.The variety of the results obtained tends to demonstrate the singularity of our research. Two proposals must be highlighted. The first one is that the strategic alignment in the long term is reinforced by the use of a SSC (hypothesis 1) and the second one is linked to the fact that the external stakeholders can be easily managed by the clients’ enterprises which use a SSC (hypothesis 3). More generally, we have verified two other interesting contributions during our research. The first one is linked to a larger stability in the case of deep changes as, for example, a merger or a takeover (hypothesis 2 and 6). Our academic research has reached the conclusion that the SSC is a factor which offers stability to the company that uses it. The second contribution is fundamental, that is, it covers the importance of the interfaces between the SSC and the other internal parties involved. The connections between the different groups are essential in order to obtain and to maintain a good alignment. Read more Systèmes d’information Centre de services partagés Alignement stratégique Alignement stratégique des usages Information Systems Shared Service Center Strategic Alignment Strategic Alignment of Usages 650

Search results