• Refine Query
  • Source
  • Publication year
  • to
  • Language
  • 101
  • 19
  • 5
  • 1
  • 1
  • 1
  • Tagged with
  • 130
  • 64
  • 56
  • 53
  • 41
  • 37
  • 30
  • 28
  • 28
  • 22
  • 21
  • 19
  • 19
  • 18
  • 18
  • About
  • The Global ETD Search service is a free service for researchers to find electronic theses and dissertations. This service is provided by the Networked Digital Library of Theses and Dissertations.
    Our metadata is collected from universities around the world. If you manage a university/consortium/country archive and want to be added, details can be found on the NDLTD website.
111

Projection multilingue d'annotations pour dialogues avancés

Julien, Simon 12 1900 (has links)
Depuis quelques années, les applications intégrant un module de dialogues avancés sont en plein essor. En revanche, le processus d’universalisation de ces systèmes est rapidement décourageant : ceux-ci étant naturellement dépendants de la langue pour laquelle ils ont été conçus, chaque nouveau langage à intégrer requiert son propre temps de développement. Un constat qui ne s’améliore pas en considérant que la qualité est souvent tributaire de la taille de l’ensemble d’entraînement. Ce projet cherche donc à accélérer le processus. Il rend compte de différentes méthodes permettant de générer des versions polyglottes d’un premier système fonctionnel, à l’aide de la traduction statistique. L’information afférente aux données sources est projetée afin de générer des données cibles parentes, qui diminuent d’autant le temps de développement subséquent. En ce sens, plusieurs approches ont été expérimentées et analysées. Notamment, une méthode qui regroupe les données avant de réordonner les différents candidats de traduction permet d’obtenir de bons résultats. / For a few years now, there has been an increasing number of applications allowing advanced dialog interactions with the user. However, the universalization of those systems quickly becomes painful : since they are highly dependent on the original development language, each new language to integrate requires an additionnal and significative time investment. A matter that only gets worse considering quality usually rests on the size of training set. This project tries to speed up the overall process. It presents various methods to generate multilingual versions of a first functionnal system, using statistical machine translation. Information from the source data is projected to another language in order to create similar target data, which then reduces the upcoming development time. Many approaches were tested and analysed. In particular, a method that regroups data in clusters before reordering the associated translation candidates shows promising results.
112

L’arabe face à la modernité : la néologie dans la presse arabe du 19e siècle / Arabic in front of the modernity : the neology in the Arabic press of the 19th century

Jhima, Kaled 19 June 2010 (has links)
Dans le cadre de ce travail, il est question d’analyser un corpus de néologisme épuisé dans plusieurs journaux de 19ème siècle. En effet, nous avons étudié des nouvelles formes néologiques, lexicales et syntaxiques, et les procédés de formation néologique que les journalistes avaient choisis pour faire face à la modernité que le monde arabe et du coup la langue arabe ont connue à cette époque, appelée l’époque de la renaissance où le lexique a connu un plein essor à l’aide de plusieurs procédés de formation néologique, tels l’emprunt, le changement sémantique et la création morphosyntaxique. Cet essor paraît en réalité comme le résultat nécessaire d’une alliance de deux facteurs: celui de la communauté linguistique, avec ses besoins de se renouveler sans cesse et le temps qui accentue cette nécessité; celle de créer des mots nouveaux pour répondre à ses besoins nouveaux. Nous avons traité ce sujet en trois parties : la première porte sur des problèmes théoriques de la néologie. Autrement dit, une réflexion théorique sur le phénomène même où nous avons ainsi soulevé quelques-unes des problématiques dérivant de l’analyse de la néologie, tels, l’histoire et la définition de la néologie et celle du néologisme auxquelles nous avons consacré le premier chapitre de la deuxième partie, la néologie et les approches linguistiques modernes que nous avons traitées dans le deuxième chapitre et le problème des typologies et de classifications abordé dans le troisième chapitre.La deuxième partie, quant à elle, nous l’avons consacrée à l’analyse des néologismes lexicaux de notre corpus en trois chapitres où nous avons traité dans chacun l’un des aspects de la néologie. Dans le premier, nous avons analysé les néologies de forme, d’après l’approche théorique d’A. Roman qui divise le système de l’arabe en deux sous-systèmes à savoir le système de nomination qui se préoccupe de la formation des unités lexicales simples et son jumeau le système de communication qui se charge de la formation des unités complexes. Le deuxième chapitre, nous l’avons réservé à l’analyse des autres néologismes crées par d’autres moyens du système de l’arabe. Il s’agit, dans ce cas, des néologismes sémantiques produits par des procédés sémantiques, en l’occurrence le processus tropologique, métaphore et métonymie, paratropologique, extension et resserrement de sens. Dan le troisième chapitre, nous avons étudié les néologismes venus d’autres systèmes linguistiques, en l’occurrence des termes que les journalistes ont empruntés à des langues étrangères.Dans la troisième partie, nous avons abordé le problème de néologie syntaxique en deux chapitres: dans le premier, nous avons traité les néologismes survenus dans le domaine verbal, notamment les nouvelles relations entre des modus verbaux et leurs expansions complétives. Quant au deuxième, nous y avons révélé et analysé certains changements concernant quelques fonctionnels, tels que, des coordonnants, des translatifs. / Within the framework of this work, it is question to analyze a corpus of neologism exhausted in several newspapers of 19th century this Indeed, we studied new neological, lexical and syntactical forms, and the processes of neological formation which the journalists had chosen to face the modernity which the Arabic world and the blow the Arabic language knew about this time period, called up the period of the revival where the lexicon knew a full development by means of several processes of neological formation, such the loan, the semantic change and the morphosyntactic creation. This development appears in reality as the necessary result of an alliance of two factors that of the speech community, with its needs being ceaselessly renewed and the time which stresses this necessity: that to create new words to answer These new needs. We treated this subject in three parts: The first one concerns theoretical problems of the neology.Such, the history and the definition of the neology and that of the neologism to whom we dedicated the first chapter of the second part the neology and the modern linguistic approaches which we treated in the second chapter and the problem of the typologies and the classifications approached on the third chapter.The second part, as for her, we dedicated her to the analysis of the lexical neologisms of our corpus in three chapters where we treated in each one of the aspects of the neology. In the first one, we analyzed the neologies of shape, according to the theoretical approach of A. Roman who divides the system of Arabic into two sub-systems namely the system of appointment which worries about the formation of the simple unités items and his twin the system of communication which takes care of the formation of the complex units. The second chapter, we reserved him(it) for the analysis of the other neologisms create by the other means of the system of Arabic. It is, in that case, about semantic neologisms produced by semantic processes, in this particular case the process tropologique, metaphor and metonymy, paratropologique, extension and contraction of sense. In the third chapter, we studied the neologisms come from the other linguistic systems, in this particular case the terms which the journalists borrowed from foreign languages.In the third part we approached the problem of syntactic neology in two chapters: in the first one, we treated the neologisms arisen in the verbal domain, in particular the new relations between verbal modus and their substantival expansions. As for the second, we revealed there and analyzed certain changes concerning some functional, such as, co-ordinating conjunctions, translative.
113

Connaissance inter-entreprises et optimisation combinatoire / Inter-companies knowledge and combinatorial optimization

Ould Mohamed Lemine, Mohamed 17 June 2014 (has links)
La connaissance inter-entreprises permet à chaque société de se renseigner sur ses clients, ses fournisseurs et de développer son activité tout en limitant le risque lié à la solvabilité ou retard de paiement de ses partenaires. Avec les tensions de trésorerie, la nécessité de la croissance et l'augmentation de la concurrence, ce domaine devient plus que jamais stratégique aussi bien pour les PME que pour les grands groupes. La quantité de données traitée dans ce domaine, les exigences de qualité et de fraîcheur, la nécessité de croiser ces données pour déduire des nouvelles informations et indicateurs, posent plusieurs problèmes pour lesquels l'optimisation en général et l'optimisation combinatoire en particulier peuvent apporter des solutions efficaces. Dans cette thèse, nous utilisons l'optimisation combinatoire, l'algorithmique du texte et la théorie des graphes pour résoudre efficacement des problèmes issus du domaine de la connaissance inter-entreprises et posés par Altares D&B. Dans un premier temps, nous nous intéressons à la qualité de la base de données des dirigeants. Ce problème combine la détection et suppression des doublons dans une base de données et la détection d'erreurs dans une chaîne de caractères. Nous proposons une méthode de résolution basée sur la normalisation des données et l'algorithmique de texte et de comparaison syntaxique entre deux chaînes de caractères. Les résultats expérimentaux montrent non seulement que cette méthode est pertinente dans la détection et la suppression des doublons mais aussi qu'elle est efficace de point du vue temps de traitement. Nous nous focalisons par la suite sur les données des liens capitalistiques et nous considérons le problème de calcul des liens indirects et l'identification des têtes des groupes. Nous présentons une méthode de résolution basée sur la théorie des graphes. Nous testons cette méthode sur plusieurs instances réelles. Nous prouvons l'efficacité de cette méthode par son temps de traitement et par l'espace de calcul qu'elle utilise. Enfin, nous remarquons que le temps de calcul de celui-ci augmente de façon logarithmique en fonction de la taille d'instance. Enfin, nous considérons le problème de l'identification des réseaux d'influence. Nous formalisons ce problème en termes de graphes et nous le ramenons à un problème de partitionnement de graphe qui est NP-difficile dans ce cas général. Nous proposons alors une formulation en programme linéaire en nombre entier pour ce problème. Nous étudions le polyèdre associé et décrivons plusieurs classes de contraintes valides. Nous donnons des conditions nécessaires pour que ces contraintes définissent des facettes et discutons des algorithmes de séparations de ces contraintes. En utilisant les résultats polyédraux obtenus, nous développons un algorithme de coupes et branchements. Enfin, nous donnons quelques résultats expérimentaux qui montrent l'efficacité de notre algorithme de coupes et branchements / The inter-companies knowledge allows to every partner to learn about its customers, its suppliers and to develop its activity. Also this permits to limit the risk related to the creditworthiness, or the late payment of its partners. With the cash flow pressures, the need for growth and increased competition, this area becomes more strategic than ever, for both small (PME) and large groups. The amount of data processed in this domain, the requirements of quality and freshness, the need to cross these data to obtain new information and indicators, yield several optimization problems for which the recent techniques and computational tools can bring effective solutions. In this thesis, we use combinatorial optimization, text algorithms as well as graph theory to solve efficiently problems arising in the field of inter-companies knowledge. In particular, such problems was encountered in Altares D&B. First, we focus on the quality of the managers database. This problem combines the detection and removal of duplicates in a database, as well as the error detection in a string. We propose a method for solving this problem, based on data normalization, text algorithms and syntactic comparison between two strings. Our experimental results show that this method is relevant for the detection and removal of duplicates, and it is also very efficient in terms of processing time. In a second part of the thesis, we address a problem related to the data of ownership links. We compute the indirect links, and identify the group heads. We propose a method for solving this problem using graph theory and combinatorial optimization. We then perform a set of experiments on several real-world instances. The computational results show the effectiveness of our method in terms of CPU-time and resource allocation. In fact, the CPU time for computation increases logarithmically with the size of the instances. Finally, we consider the problem of identifying influence networks. We give a description of this problem in terms of graphs, and show that it can reduce to a graph partitioning problem. The latter is NP-hard. We then propose an integer linear programming formulation to model the problem. We investigate the associated polyhedron and describe several classes of valid inequalities. We give some necessaryand sufficient conditions for these inequalities to define facets of the considered polyhedron, and we discuss the related separation problems. Based on the obtained polyhedral results, we devise a Branch-and-Cut algorithm to solve the problem. Some numerical results are presented to show the efficiency of our algorithm.
114

Les verbes latins signifiant « combattre » dans la poésie épique, d’Ennius aux poètes flaviens (IIIe s. av. J.-C. – Ier s. ap. J.-C.). Approche sémantique, morphologique et syntaxique / A Study of the Latin Verbs Meaning “Fight” in Epic Poetry from Ennius to the Flavian Poets (IIIrd b. C. – Ist a. D.). A Semantic, Morphological and Syntactic Approach

Taous, Tatiana 02 December 2013 (has links)
La thèse étudie les dénominations du procès de combattre en latin et montre que l’évolution des signes linguistiques est corrélative des realia historiques et politiques. Cette étude sémantique articule différentes approches et propose un éclairage linguistique et anthropologique sur les verbes signifiant « combattre » dans la poésie épique latine. Au vu des problématiques liées à tout sujet onomasiologique, une partie préliminaire se concentre sur l’établissement du corpus de verbes. Les première et seconde parties confrontent l’approche sémantique aux approches morphologique et syntaxique. Les lexèmes retenus sont décrits plus précisément afin de déterminer s’ils adoptent des tendances morphologiques et rectionnelles particulières, rattachables à leur signifié. La première partie permet, à travers l’étude des radicaux, des morphèmes (temps – personne) et des préverbes, de dégager des spécificités morphosémantiques en relation avec les trois types morphologiques isolés (verbes simples, locutions et préverbés). La seconde partie étudie, dans une perspective sémantico-syntaxique, les rôles sémantiques et les types rectionnels et crée des zones d’intersection entre lexèmes, qui ne rejoignent pas toujours les trois types morphologiques. Ces nouveaux recoupements permettent d’opposer les lexèmes et de déterminer les motivations (littéraires ou anthropologiques) de leurs emplois. La thèse en arrive à l’idée que la perpétuation ou le renouvellement des signes linguistiques pour dénoter le procès « combattre » a partie liée avec des données culturelles et anthropologiques et que le genre épique est un genre littéraire vivant, qui suit la mouvance et les idéologies de son temps. / This study of Latin verbs meaning “to fight” in epic poetry shows that the evolution of linguistic signs and lexical units reflects extralinguistic phenomena. It is a semantic study which, by combining several approaches, sheds new light, both linguistic and anthropological, on the verbs meaning “to fight” in Latin epic poetry. The preliminary chapter (after the introduction) presents the selected verbs belonging to the corpus. In the first and second sections of the work, the contrast is drawn between a fundamentally semantic approach to the verbs and a more morphological and syntactical approach. The first section analyses the verbs’ synchronic radicals, their tenses, their personal morphemes, and their preverbs, in order to show their semantic specificities in the context of the three morphological types in which they may be found: simple verbs, verbal phrases and preverbed verbs. In a semantic-syntactic approach, the second section deals with the participant roles and syntactic environments and creates new intersections between lexemes. These links shed light on the oppositions that exist between the individual lexemes and determine the – literary or anthropological – motivations in the use of the selected verbs. The conclusion makes two important points. Firstly, we see that the continuation or the renewal of linguistic signs and lexical units denoting the process of fighting also depend on cultural and anthropological factors. Secondly, it is made clear that the epic literary genre in Latin is not frozen throughout the historical periods studied here, since it is continually evolving and adapting to the changes and ideologies of the times.
115

The role of the Ruah YHWH in creative transformation : a process theology perspective applied to Judges 14

Alfani Bantea, Roger 11 1900 (has links)
La Ruah YHWH joue un rôle important dans la transformation créative de l’univers et des entités actuelles; cependant, une réflexion concernant les modalités de ce rôle reste à développer. La théologie processuelle offre une plateforme à partir de laquelle sont examinées diverses facettes des rôles que peut jouer la Ruah YHWH dans un monde où le chaos semble dominer. L’objectif de ce mémoire est justement d’explorer la Ruah YHWH dans son rôle de transformation créative au service, ultimement de l’ordre, de la paix et de l’harmonie dans le monde, les communautés, la vie des entités actuelles, etc. Le Chapitre 1 passe en revue des notions clés de la théologie processuelle. Le concept des “entités actuelles” est d’abord défini. Sont ensuite examinées les différentes phases du devenir d’une entité actuelle. Finalement, les concepts de “créativité” et de “transformation”, dans une perspective de la Ruah YHWH font l’objet d’observations attentives avant d’aborder « trois natures » de Dieu, à savoir primordiale, conséquente, et superjective. Le Chapitre 2 s’intéresse à la péricope centrale de ce mémoire : Juges 13:24-14:20. Le découpage de la structure de cette péricope est basé sur des critères de critique textuelle et d’analyse syntaxique. La première analyse s’attarde aux difficultés que le texte hébreu présente, alors que la deuxième met l’accent sur l’organisation structurelle des propositions grammaticales des versets. Les deux analyses me permettent ensuite de proposer une traduction du péricope. Le Chapitre 3 se veut une application de ce qui a été élaboré au Chapitre 1 sur la péricope analysée au Chapitre 2. Ce troisième chapitre permet de mettre en pratique une approche processuelle originale développée par Robert David dans son livre Déli_l’ ÉCRITURE. Dans la foulée des chapitres qui le précèdent, le Chapitre 4 propose quelques principes herméneutiques contemporains pouvant éclairer le rôle de la Ruah YHWH dans l’avancée créative du monde : vie, amour, et paix. / The Ruah YHWH plays a key role in the creative transformation of both the universe and actual entities; however, that role has still to be developed. Process theology, of which I shall endeavour to define some important notions in Chapter 1, offers a platform I shall attempt to build upon in order to examine such an important role in a chaotic world. The aim of this dissertation is to explore the Ruah YHWH in Her role of creative transformation, which I argue to ultimately be that of bringing order, peace, and harmony in the world, communities, the life of actual entities, etc. Chapter 1 is an overview of some key notions of process theology: first, the concept of “actual entities” is defined. Secondly, I examine the phases of concrescence in the becoming of an actual entity. And finally, I look at the concepts of creativity and transformation in the perspective of the Ruah YHWH prior to examining the “three natures” of God, primordial, consequent, and superjective. Chapter 2 defines the pericope of this dissertation: Judges 13:24-14:20. The structure of the pericope is based upon the methods of textual criticism and syntactical analysis. While the first examination deals with some difficulties the original Hebrew text presents, the second deals with the structural organization of the verses grammatical propositions. The two examinations allow me to propose a translation of the pericope. Chapter 3 is an application of what was laid out in Chapter 1 on the pericope established in Chapter 2. In the course of the third chapter, I employ an innovative (original) processual approach developed by Robert David in his recent book Déli_ l’ÉCRITURE. Then, Chapter 4 proposes, out of the preceding chapters, some contemporary hermeneutical principles which enlighten the role of the Ruah YHWH in the creative transformation of the world: life, love, and peace.
116

Caractérisation phonétique et phonologique du syntagme intermédiaire en français : de la production à la perception

Michelas, Amandine 04 July 2011 (has links)
Le travail présenté ici est sous-tendu par deux observations majeures. Premièrement, la plupart des modèles proposés pour le français s’accordent sur l’existence de deux niveaux de structure prosodique: le syntagme accentuel et le syntagme intonatif. Deuxièmement, bien que l’existence d’un niveau additionnel de structure situé entre ces deux niveaux ait été proposé pour le français, les propriétés phonétiques et phonologiques de ce constituant n’ont pas clairement été définies. Dans cette thèse nous avons fourni des preuves de l’existence du syntagme intermédiaire (ip) à la fois en production et en perception de la parole. Grâce à cinq expérimentations menées dans le cadre de la phonologie de laboratoire, nous avons caractérisé les propriétés phonético-phonologiques de ce constituant et attesté de son rôle dans le traitement perceptif du langage. Les résultats obtenus en production montrent que l’ip est le domaine de l’abaissement des accents mélodiques en français. Sa frontière droite est marquée par un allongement pré-frontière ainsi qu’un accent de syntagme responsable du retour à la ligne de référence du registre. Les analyses menées en perception ont montré que les frontières droites du syntagme accentuel et du syntagme intermédiaire sont utilisées très tôt dans le processus de traitement syntaxique. Les indices phonétiques et phonologiques présents à ces frontières permettent aux auditeurs du français de construire des attentes sur la structure syntaxique des énoncés perçus. Une analyse séparée des différents types d’indices acoustiques a également montré qu’en l’absence de marquage tonal, les indices de durée semblent suffisants dans le but de marquer la frontière de syntagme accentuel. Un marquage conjoint de la frontière droite d’ip par les indices mélodiques et l’allongement pré-frontière semble au contraire nécessaire pour que les auditeurs du français perçoivent et utilisent cette frontière dans le traitement du langage. / The work described here is grounded by two major observations. Firstly, most of the French intonation models agree on the existence of two levels of prosodic phrasing: the accentual phrase and the intonation phrase. Secondly, although the existence of an additional level of structure ranked between these two levels has been proposed for French, the phonetic and phonological properties of this intermediate phrase (ip) have not been clearly defined. In this thesis we provide evidence for the existence of an intermediate level of phrasing in French through both speech production and perception studies. Results of five experiments conducted within the framework of laboratory phonology revealed specific ip phonetic and phonological properties and tested its role in the perceptual processing of language. The production studies showed that the ip is the domain of downstep in French and that its right boundary is marked by a phrase accent responsible for a return to the register reference line. Analyses conducted in perception showed that the accentual phrase and intermediate phrase right boundaries are used early in the syntactic processing. Phonetic and phonological indices at these boundaries allow French listeners to build expectations about the syntactic structure of spoken utterances. A separate analysis of different types of acoustic cues showed that without tonal marking, pre-boundary lengthening seems to be sufficient to mark the accentual phrase boundary. Joint marking through melodic and lengthening cues appears to be necessary to perceive and make use of the ip boundary in language processing.
117

Composition sémantique pour la langue orale / Semantic composition for spoken language understanding

Duvert, Frédéric 10 November 2010 (has links)
La thèse présentée ici a pour but de proposer des systèmes de détection, de composition de constituants sémantiques et d’interprétation dans la compréhension de la langue naturelle parlée. Cette compréhension se base sur un système de reconnaissance automatique de la parole qui traduit les signaux oraux en énoncés utilisables par la machine. Le signal de la parole, ainsi transcrit, comporte un ensemble d’erreurs liées aux erreurs de reconnaissance (bruits, parasites, mauvaise prononciation...). L’interprétation de cet énoncé est d’autant plus difficile qu’il est issu d’un discours parlé, soumis à la disfluence du discours, aux auto-corrections... L’énoncé est de plus agrammatical, car le discours parlé lui-même est agrammatical. L’application de méthodes d’analyses grammaticales ne produit pas de bons résultats d’interprétation, sur des textes issus de transcriptions de la parole. L’utilisation de méthodes d’analyses syntaxiques profondes est à éviter. De ce fait, une analyse superficielle est envisagée. Un des premiers objectifs est de proposer une représentation du sens. Il s’agit de considérer des ontologies afin de conceptualiser le monde que l’on décrit. On peut exprimer les composants sémantiques en logique du premier ordre avec des prédicats. Dans les travaux décrits ici, nous représentons les éléments sémantiques par des frames (FrameNet ). Les structures de frames sont hiérarchisées, et sont des fragments de connaissances auxquels on peut insérer, fusionner ou inférer d’autres fragments de connaissances. Les structures de frames sont dérivables en formules logiques. Nous proposons un système de compréhension de la parole à partir de règles logiques avec le support d’une ontologie, afin de pouvoir créer des liens à partir de composants sémantiques. Puis, nous avons mené une étude sur la découverte des supports syntaxiques des relations sémantiques. Nous proposons une expérience de composition sémantique afin d’enrichir les composants sémantiques de base. Enfin, nous présentons un système de détection de lambda-expression pour mettre en hypothèse les relations à trouver à travers le discours / The thesis presented here is intended to provide detection systems, composition of components and semantic interpretation in the natural spoken language understanding. This understanding is based on an automatic speech recognition system that translates the signals into oral statements used by the machine. The transcribed speech signal, contains a series of errors related to recognition errors (noise, poor pronunciation...). The interpretation of this statement is difficult because it is derived from a spoken discourse, subject to the disfluency of speech, forself-correction... The statement is more ungrammatical, because the spoken discourse itself is ungrammatical. The application of grammatical analysis methods do not produce good results interpretation, on the outcome of speech transcription. The use of deep syntactic analysis methods should be avoided. Thus, a superficial analysis is considered. A primary objective is to provide a representation of meaning. It is considered ontologies to conceptualize the world we describe. We can express the semantic components in first order logic with predicates. In the work described here, we represent the semantic elements by frames (FrameNet ). The frames are hierarchical structures, and are fragments of knowledge which can be inserted, merge or infer other fragments of knowledge. The frames are differentiable structures in logical formulas. We propose a system for speech understanding from logical rules with the support of an ontology in order to create links from semantic components. Then, we conducted a study on the discovery supports syntactic semantic relationships. We propose a compositional semantics experience to enrich the basic semantic components. Finally, we present a detection system for lambda-expression hypothesis to find the relationship through discourse
118

Projection multilingue d'annotations pour dialogues avancés

Julien, Simon 12 1900 (has links)
No description available.
119

Modèles exponentiels et contraintes sur les espaces de recherche en traduction automatique et pour le transfert cross-lingue / Log-linear Models and Search Space Constraints in Statistical Machine Translation and Cross-lingual Transfer

Pécheux, Nicolas 27 September 2016 (has links)
La plupart des méthodes de traitement automatique des langues (TAL) peuvent être formalisées comme des problèmes de prédiction, dans lesquels on cherche à choisir automatiquement l'hypothèse la plus plausible parmi un très grand nombre de candidats. Malgré de nombreux travaux qui ont permis de mieux prendre en compte la structure de l'ensemble des hypothèses, la taille de l'espace de recherche est généralement trop grande pour permettre son exploration exhaustive. Dans ce travail, nous nous intéressons à l'importance du design de l'espace de recherche et étudions l'utilisation de contraintes pour en réduire la taille et la complexité. Nous nous appuyons sur l'étude de trois problèmes linguistiques — l'analyse morpho-syntaxique, le transfert cross-lingue et le problème du réordonnancement en traduction — pour mettre en lumière les risques, les avantages et les enjeux du choix de l'espace de recherche dans les problèmes de TAL.Par exemple, lorsque l'on dispose d'informations a priori sur les sorties possibles d'un problème d'apprentissage structuré, il semble naturel de les inclure dans le processus de modélisation pour réduire l'espace de recherche et ainsi permettre une accélération des traitements lors de la phase d'apprentissage. Une étude de cas sur les modèles exponentiels pour l'analyse morpho-syntaxique montre paradoxalement que cela peut conduire à d'importantes dégradations des résultats, et cela même quand les contraintes associées sont pertinentes. Parallèlement, nous considérons l'utilisation de ce type de contraintes pour généraliser le problème de l'apprentissage supervisé au cas où l'on ne dispose que d'informations partielles et incomplètes lors de l'apprentissage, qui apparaît par exemple lors du transfert cross-lingue d'annotations. Nous étudions deux méthodes d'apprentissage faiblement supervisé, que nous formalisons dans le cadre de l'apprentissage ambigu, appliquées à l'analyse morpho-syntaxiques de langues peu dotées en ressources linguistiques.Enfin, nous nous intéressons au design de l'espace de recherche en traduction automatique. Les divergences dans l'ordre des mots lors du processus de traduction posent un problème combinatoire difficile. En effet, il n'est pas possible de considérer l'ensemble factoriel de tous les réordonnancements possibles, et des contraintes sur les permutations s'avèrent nécessaires. Nous comparons différents jeux de contraintes et explorons l'importance de l'espace de réordonnancement dans les performances globales d'un système de traduction. Si un meilleur design permet d'obtenir de meilleurs résultats, nous montrons cependant que la marge d'amélioration se situe principalement dans l'évaluation des réordonnancements plutôt que dans la qualité de l'espace de recherche. / Most natural language processing tasks are modeled as prediction problems where one aims at finding the best scoring hypothesis from a very large pool of possible outputs. Even if algorithms are designed to leverage some kind of structure, the output space is often too large to be searched exaustively. This work aims at understanding the importance of the search space and the possible use of constraints to reduce it in size and complexity. We report in this thesis three case studies which highlight the risk and benefits of manipulating the seach space in learning and inference.When information about the possible outputs of a sequence labeling task is available, it may seem appropriate to include this knowledge into the system, so as to facilitate and speed-up learning and inference. A case study on type constraints for CRFs however shows that using such constraints at training time is likely to drastically reduce performance, even when these constraints are both correct and useful at decoding.On the other side, we also consider possible relaxations of the supervision space, as in the case of learning with latent variables, or when only partial supervision is available, which we cast as ambiguous learning. Such weakly supervised methods, together with cross-lingual transfer and dictionary crawling techniques, allow us to develop natural language processing tools for under-resourced languages. Word order differences between languages pose several combinatorial challenges to machine translation and the constraints on word reorderings have a great impact on the set of potential translations that is explored during search. We study reordering constraints that allow to restrict the factorial space of permutations and explore the impact of the reordering search space design on machine translation performance. However, we show that even though it might be desirable to design better reordering spaces, model and search errors seem yet to be the most important issues.
120

Perception et apprentissage des structures musicales et langagières : études des ressources cognitives partagées et des effets attentionnels / Musical and linguistic structure perception and learning : investigation of shared cognitive resources and attentionnal effects

Hoch, Lisianne 09 July 2010 (has links)
La musique et le langage sont des matériels structurés à partir de principes combinatoires. Les auditeurs ont acquis des connaissances sur ces régularités structurelles par simple exposition. Ces connaissances permettent le développement d’attentes sur les événements à venir en musique et en langage. Mon travail de thèse étudiait deux aspects de la spécificité versus la généralité des processus de traitement de la musique et du langage: la perception et l’apprentissage statistique.Dans la première partie (perception), les Études 1 à 4 ont montré que le traitement des structures musicales influence le traitement de la parole et du langage présenté en modalité visuelle, reflétant l’influence des mécanismes d’attention dynamique (Jones, 1976). Plus précisément, le traitement des structures musicales interagissait avec le traitement des structures syntaxiques, mais pas avec le traitement des structures sémantiques en langage (Étude 3). Ces résultats sont en accord avec l’hypothèse de ressources d’intégration syntaxique partagées de Patel (2003). Nos résultats et les précédentes études sur les traitements simultanés des structures musicales et linguistiques (syntaxiques et sémantiques), nous ont incités à élargir l’hypothèse de ressources d’intégration partagées au traitement d’autres d’informations structurées qui nécessitent également des ressources d’intégration structurelle et temporelle. Cette hypothèse a été testée et confirmée par l’observation d’une interaction entre les traitements simultanés des structures musicales et arithmétiques (Étude 4). Dans la deuxième partie (apprentissage), l’apprentissage statistique était étudié en comparaison directe pour des matériels verbaux et non-verbaux. Plus particulièrement, nous avons étudié l’influence de l’attention dynamique guidée par des indices temporels non-acoustiques (Études 5 et 6) et acoustiques (Étude 7) sur l’apprentissage statistique. Les indices temporels non-acoustiques influençaient l’apprentissage statistique de matériels verbaux et non-verbaux. En accord avec la théorie de l’attention dynamique (Jones, 1976), une hypothèse est que les indices temporels non-acoustiques guident l’attention dans le temps et influencent l’apprentissage statistique.Les études de ce travail de thèse ont suggéré que les ressources d’attention dynamique influençaient la perception et l’apprentissage de matériels structurés et que les traitements des structures musicales et d’autres informations structurées (e.g., langage, arithmétique) partagent des ressources d’intégration structurelle et temporelle. L’ensemble de ces résultats amène de nouvelles questions sur la possible influence du traitement des structures auditives tonales et temporelles sur les capacités cognitives générales de séquencement notamment requises pour la perception et l’apprentissage d’informations séquentielles structurées.Jones, M. R. (1976). Time, our lost dimension: Toward a new theory of perception, attention, and memory. Psychological Review, 83(5), 323-355. doi:10.1037/0033-295X.83.5.323Patel, A. D. (2003). Language, music, syntax and the brain. Nature Neuroscience, 6(7), 674-681. doi:10.1038/nn1082 / Music and language are structurally organized materials that are based on combinatorial principles. Listeners have acquired knowledge about these structural regularities via mere exposure. This knowledge allows them to develop expectations about future events in music and language perception. My PhD investigated two aspects of domain-specificity versus generality of cognitive functions in music and language processing: perception and statistical learning.In the first part (perception), musical structure processing has been shown to influence spoken and visual language processing (Études 1 & 4), partly due to dynamic attending mechanisms (Jones, 1976). More specifically, musical structure processing has been shown to interact with linguistic-syntactic processing, but not with linguistic-semantic processing (Étude 3), thus supporting the hypothesis of shared syntactic resources for music and language processing (Patel, 2003). Together with previous studies that have investigated simultaneous musical and linguistic (syntactic and semantic) structure processing, we proposed that these shared resources might extend to the processing of other structurally organized information that require structural and temporal integration resources. This hypothesis was tested and supported by interactive influences between simultaneous musical and arithmetic structure processing (Étude 4). In the second part (learning), statistical learning was directly compared for verbal and nonverbal materials. In particular, we aimed to investigate the influence of dynamic attention driven by non-acoustic (Études 5 & 6) and acoustic (Étude 7) cues on statistical learning. Non-acoustic temporal cues have been shown to influence statistical learning of verbal and nonverbal artificial languages. In agreement with the dynamic attending theory (Jones, 1976), we proposed that non-acoustic temporal cues guide attention over time and influence statistical learning.Based on the influence of dynamic attending mechanisms on perception and learning and on evidence of shared structural and temporal integration resources for the processing of musical structures and other structured information, this PhD opens new questions about the potential influence of tonal and temporal auditory structure processing on general cognitive sequencing abilities, notably required in structured sequence perception and learning.Jones, M. R. (1976). Time, our lost dimension: Toward a new theory of perception, attention, and memory. Psychological Review, 83(5), 323-355. doi:10.1037/0033-295X.83.5.323Patel, A. D. (2003). Language, music, syntax and the brain. Nature Neuroscience, 6(7), 674-681. doi:10.1038/nn1082

Page generated in 0.033 seconds