Global ETD Search

1	Résolution d'anaphores et identification des chaînes de coréférence selon le type de texte Boudreau, Sylvie January 2004 (has links) Mémoire numérisé par la Direction des bibliothèques de l'Université de Montréal. Résolution d'anaphores Chaîne de coréférence Nom propre Traitement automatique de texte Linguistique du texte Langage de balisage XML
2	L'acquisition de la coréférence chez les enfants ayant un trouble développemental du langage : revue méta-analytique des facteurs influençant ce phénomène Murphy-Pilon, Joanie 07 1900 (has links) Le présent projet vise à mieux comprendre les difficultés reliées à l’acquisition de la coréférence chez les enfants francophones présentant un trouble développemental du langage (TDL) et à déterminer les différents facteurs influençant son acquisition et sa maitrise. La définition actuelle du TDL indique qu’il s’agit d’une difficulté du langage oral qui affecte à la fois la compréhension et l’expression. Il s’agit d’un trouble neurodéveloppemental caractérisé par des retards développementaux très variables dans une ou plusieurs sphères langagières. Deux théories sont vues en détail : la théorie de la complexité des structures syntaxiques (van der Lely et Stollwerck, 1997) et la théorie du déficit de la mémoire de travail (Montgomery et Evans, 2009). La première propose que les difficultés d’utilisation de la coréférence soient dues à la représentation innée de la syntaxe qui serait immature pour les enfants TDL et, en particulier, le principe B qui ne serait pas acquis. En revanche, Montgomery et Evans soutiennent que cette difficulté de compréhension et d’utilisation provient d’une limitation quant à la mémoire de travail plus précisément avec l’allocation et la capacité des ressources attentionnelles. Nous concluons que les différents facteurs influençant l’acquisition de la coréférence chez les enfants ayant un TDL sont les suivants : premièrement, l’enfant doit posséder les connaissances lexicales et sémantiques reliées aux pronoms et aux anaphores ; deuxièmement, l’enfant doit acquérir des connaissances syntaxiques afin de connaitre les antécédents possibles pour les pronoms et les anaphores ainsi que les règles les reliant. Finalement, la mémoire de travail et l’allocation et la capacité des ressources mentales jouent un rôle important dans la résolution des anaphores. Il est donc clair, selon nous, que les théories ne sont pas totalement suffisantes pour expliquer les troubles de la coréférence, mais qu’elles permettent d’expliquer en partie d’autres types de problèmes qui sont nécessaires pour la résolution de l’anaphore. La résolution des anaphores est un phénomène important surtout chez les enfants francophones puisqu’il s’agirait d’un marqueur clinique du trouble en français. / This project aims to understand the difficulties related to the acquisition of coreference of French speaking children with developmental language disorder (DLD) and to determine the various factors influencing its acquisition and mastery. The current definition of DLD indicates that it is a spoken language difficulty that affects both comprehension and expression. It is a neurodevelopmental disorder characterized by highly variable developmental delays in one or more language spheres. Two theories are seen in detail: the computational grammatical complexity (CGC) hypothesis (van der Lely and Stollwerck, 1997) and the working memory–based account (Montgomery and Evans, 2009). The CGC theory proposes that the difficulties of using coreference are due to the innate representation of the syntax which would be immature for DLD children and particularly the principle B which would not be acquired. In contrast, Montgomery and Evans argue that this difficulty in understanding and using anaphoras stems from a limitation in working memory and specifically with the allocation and capacity of attentional resources. Different factors influencing the acquisition of coreference in children with are discussed. First, the child must have lexical and semantic knowledge related to pronouns and anaphoras. Second, the child must acquire syntactic knowledge in order to know the possible antecedents for pronouns and anaphoras as well as the rules connecting them. Finally, working memory and the allocation and capacity of mental resources play an important role in the resolution of anaphoras. It is thus clear, according to us, that the theories are not totally sufficient to explain the deficit in coreference, but they partly explain other types of problems which are necessary for the resolution of the anaphora. The resolution of anaphoras is an important phenomenon for a good understanding of developmental language disorder, especially in French speaking children, since it is a clinical marker of the disorder in French. Trouble développemental du langage TDL Developmental language disorder DLD Acquisition Coreference Coréférence Dysphasie
3	Cognitive Computational Models of Pronoun Resolution / Modèles cognitifs et computationnels de la résolution des pronoms Seminck, Olga 23 November 2018 (has links) La résolution des pronoms est le processus par lequel un pronom anaphorique est mis en relation avec son antécédent. Les humains en sont capables sans efforts notables en situation normale. En revanche, les systèmes automatiques ont une performance qui reste loin derrière, malgré des algorithmes de plus en plus sophistiqués, développés par la communauté du Traitement Automatique des Langues. La recherche en psycholinguistique a montré à travers des expériences qu'au cours de la résolution de nombreux facteurs sont pris en compte par les locuteurs. Une question importante se pose : comment les facteurs interagissent et quel poids faut-il attribuer à chacun d'entre eux ? Une deuxième question qui se pose alors est comment les théories linguistiques de la résolution des pronoms incorporent tous les facteurs. Nous proposons une nouvelle approche à ces problématiques : la simulation computationnelle de la charge cognitive de la résolution des pronoms. La motivation pour notre approche est double : d'une part, l'implémentation d'hypothèses par un système computationnel permet de mieux spécifier les théories, d’autre part, les systèmes automatiques peuvent faire des prédictions sur des données naturelles comme les corpus de mouvement oculaires. De cette façon, les modèles computationnels représentent une alternative aux expériences classiques avec des items expérimentaux construits manuellement. Nous avons fait plusieurs expériences afin d'explorer les modèles cognitifs computationnels de la résolution des pronoms. D'abord, nous avons simulé la charge cognitive des pronoms en utilisant des poids de facteurs de résolution appris sur corpus. Ensuite, nous avons testé si les concepts de la Théorie de l’Information sont pertinents pour prédire la charge cognitive des pronoms. Finalement, nous avons procédé à l’évaluation d’un modèle psycholinguistique sur des données issues d’un corpus enrichi de mouvements oculaires. Les résultats de nos expériences montrent que la résolution des pronoms est en effet multi-factorielle et que l’influence des facteurs peut être estimée sur corpus. Nos résultats montrent aussi que des concepts de la Théorie de l’Information sont pertinents pour la modélisation des pronoms. Nous concluons que l’évaluation des théories sur des données de corpus peut jouer un rôle important dans le développement de ces théories et ainsi amener dans le futur à une meilleure prise en compte du contexte discursif. / Pronoun resolution is the process in which an anaphoric pronoun is linked to its antecedent. In a normal situation, humans do not experience much cognitive effort due to this process. However, automatic systems perform far from human accuracy, despite the efforts made by the Natural Language Processing community. Experimental research in the field of psycholinguistics has shown that during pronoun resolution many linguistic factors are taken into account by speakers. An important question is thus how much influence each of these factors has and how the factors interact with each-other. A second question is how linguistic theories about pronoun resolution can incorporate all relevant factors. In this thesis, we propose a new approach to answer these questions: computational simulation of the cognitive load of pronoun resolution. The motivation for this approach is two-fold. On the one hand, implementing hypotheses about pronoun resolution in a computational system leads to a more precise formulation of theories. On the other hand, robust computational systems can be run on uncontrolled data such as eye movement corpora and thus provide an alternative to hand-constructed experimental material. In this thesis, we conducted various experiments. First, we simulated the cognitive load of pronouns by learning the magnitude of impact of various factors on corpus data. Second, we tested whether concepts from Information Theory were relevant to predict the cognitive load of pronoun resolution. Finally, we evaluated a theoretical model of pronoun resolution on a corpus enriched with eye movement data. Our research shows that multiple factors play a role in pronoun resolution and that their influence can be estimated on corpus data. We also demonstrate that the concepts of Information Theory play a role in pronoun resolution. We conclude that the evaluation of hypotheses on corpus data enriched with cognitive data ---- such as eye movement data --- play an important role in the development and evaluation of theories. We expect that corpus based methods will lead to a better modelling of the influence of discourse structure on pronoun resolution in future work. Pronom Anaphore Coréférence Résolution Modèle mixte Occulométrie Temps de lecture Corpus Métrique de coût cognitif Théorie de l’Information Pronoun Anaphora Coreference Resolution Mixed effects model Eye-tracking Reading times Corpus Cognitive cost metric Information Theory
4	Vers des moteurs de recherche "intelligents" : un outil de détection automatique de thèmes. Méthode basée sur l'identification automatique des chaînes de référence Longo, Laurence 12 December 2013 (has links) (PDF) Cette thèse se situe dans le domaine du Traitement Automatique des Langues et vise à optimiser la classification des documents dans les moteurs de recherche. Les travaux se concentrent sur le développement d'un outil de détection automatique des thèmes des documents (ATDS-fr). Utilisant peu de connaissances, la méthode hybride adoptée allie des techniques statistiques de segmentation thématique à des méthodes linguistiques identifiant des marqueurs de cohésion. Parmi eux, les chaînes de référence - séquence d'expressions référentielles se rapportant à la même entité du discours (e.g. Paul...il...cet homme) - ont fait l'objet d'une attention particulière, car elles constituent un indice textuel important dans la détection des thèmes (i.e. ce sont des marqueurs d'introduction, de maintien et de changement thématique). Ainsi, à partir d'une étude des chaînes de référence menée dans un corpus issu de genres textuels variés (analyses politiques, rapports publics, lois européennes, éditoriaux, roman), nous avons développé un module d'identification automatique des chaînes de référence RefGen qui a été évalué suivant les métriques actuelles de la coréférence. RefGen Détection automatique de thèmes chaînes de référence traitement automatique des langues sémantique lexicale coréférence genres textuels segmentation thématique marqueurs linguistiques cohésion linguistique de corpus
5	Vers des moteurs de recherche "intelligents" : un outil de détection automatique de thèmes : méthode basée sur l'identification automatique des chaînes de référence / Toward "intelligent" search engines : an automatic topic detection tool : method based on automatic reference chains identification Longo, Laurence 12 December 2013 (has links) Cette thèse se situe dans le domaine du Traitement Automatique des Langues et vise à optimiser la classification des documents dans les moteurs de recherche. Les travaux se concentrent sur le développement d’un outil de détection automatique des thèmes des documents (ATDS-fr). Utilisant peu de connaissances, la méthode hybride adoptée allie des techniques statistiques de segmentation thématique à des méthodes linguistiques identifiant des marqueurs de cohésion. Parmi eux, les chaînes de référence – séquence d’expressions référentielles se rapportant à la même entité du discours (e.g. Paul…il…cet homme) – ont fait l’objet d’une attention particulière, car elles constituent un indice textuel important dans la détection des thèmes (i.e. ce sont des marqueurs d’introduction, de maintien et de changement thématique). Ainsi, à partir d’une étude des chaînes de référence menée dans un corpus issu de genres textuels variés (analyses politiques, rapports publics, lois européennes,éditoriaux, roman), nous avons développé un module d’identification automatique des chaînes de référence RefGen qui a été évalué suivant les métriques actuelles de la coréférence. / This thesis in the field of Natural Language Processing aims at optimizing documents classification in search engines. This work focuses on the development of a tool that automatically detects documents topics (ATDS-fr). Using poor knowledge, the hybrid method combines statistical techniques for topic segmentation and linguistic methods that identify cohesive markers. Among them, reference chains - sequences of referential expressions referring to the same entity (e.g. Paul ... he ... this man) - have been given special attention as they are important topic markers (i.e. they are markers of topic introduction, maintenance and change). Thus, from a study of reference chains extracted from a corpus composed of various textual genres (newspapers, public reports, European laws, editorials and novel) we developed RefGen, an automatic reference chains identification module, which was evaluated according to current coreference metrics. Détection automatique de thèmes Chaînes de référence Traitement automatique des langues Sémantique lexicale Coréférence Genres textuels Segmentation thématique Marqueurs linguistiques Cohésion Linguistique de corpus Topic detection Reference chains Natural language processing Lexical semantics Coreference Textual genre Topic segmentation Linguistic markers Cohesion Corpus linguistics 401.4 004.678

1

Page generated in 0.0302 seconds