Spelling suggestions: "subject:"syntaxe / sémantique"" "subject:"syntaxe / émantique""
1 |
Modéliser l'acquisition de la syntaxe du langage naturel via l'hypothèse de la primauté du sensTellier, Isabelle 08 December 2005 (has links) (PDF)
L'objet de ce travail est la modélisation informatique de la capacité d'apprentissage de la syntaxe de leur langue naturelle par les enfants. Une synthèse des connaissances psycho-linguistiques sur la question est donc tout d'abord proposée. Le point de vue adopté pour la modélisation accorde une place privilégiée à la sémantique, qui est supposée acquise avant la syntaxe. Le Principe de compositionnalité, éventuellement adapté, est mis à contribution pour formaliser les liens entre syntaxe et sémantique, et le modèle d'apprentissage ''à la limite'' par exemples positifs de Gold est choisi pour régir les conditions de l'apprentissage. Nous présentons dans ce contexte divers résultats d'apprenabilité de classes de grammaires catégorielles à partir de divers types de données qui véhiculent des informations sémantiques. Nous montrons que, dans tous les cas, la sémantique contribue à spécifier les structures sous-jacentes aux énoncés, et à réduire ainsi l'espace de recherche des algorithmes d'apprentissage.
|
2 |
Les adjectifs psychologiques / Psych adjectivesVoicu, Roxana 29 October 2012 (has links)
Le présent travail vise à identifier le rôle non expérienceur qui figure dans la représentation sémantique des adjectifs psychologiques. La classe a été circonscrite à partir d’une définition sémantico-cognitive de l’expérience psychologique qui pose la structure dyadique des prédicats prototypiques appartenant à ce domaine. L’analyse a été poursuivie sur le plan sémantique pour partager la classe des adjectifs psychologiques selon qu’ils dénotent une expérience psychologique actualisée ou potentielle. La non actualisation de l’expérience psychologique repose sur l’hypothèse de modalité, circonscrite au niveau de la sémantique lexicale en tant que modalité implicite (les dispositions psychologiques) et au niveau du discours, à l’aide de l’inférence (adjectifs causatifs). L’absence de stimulus se voit interpréter au terme de cette analyse sémantique comme conséquence de la présence de la modalité dans la représentation des adjectifs. A partir de ces résultats, l’analyse qui interroge le rôle non expérienceur est poursuivie uniquement dans le cas des adjectifs ayant une structure dyadique, qui dénotent une expérience psychologique actualisée. Deux domaines conceptuels divisent ce noyau : les états psychologiques et les sentiments. L’analyse de la représentation sémantique part des principes contraignants qui régissent l’interface de la sémantique et de la syntaxe. Sont relevées les limitations de l’approche syntaxique pour proposer ensuite une représentation sémantique qui se réclame d’une approche sémantique, libérée de sous la tutelle de la syntaxe. A la suite de Jackendoff (1990), la représentation sémantique s’organise sur deux niveaux, un niveau thématique et un niveau des macro-rôles. Telle qu’elle est proposée dans Jackendoff (1990) la représentation thématique est une illustration de l’hypothèse localiste qui est ainsi mise à l’épreuve de la représentation des adjectifs psychologiques. L’expérienceur ne figure pas au niveau thématique où il a comme correspondants les rôles de location et de destination. Les adjectifs d’état psychologique sont représentés au niveau thématique par les rôles de thème et de source, cette dernière servant à codifier selon l’hypothèse localiste la notion de cause. D’autres prépositions localistes sont relevées pour l’expression de la cause mais les syntagmes qu’elles introduisent ne sont pas sous-catégorisés par l’adjectif, ce qui en fait des adjoints. Les adjectifs de sentiments ont une représentation qui consiste dans les rôles de thème et de destination ou de source. Au niveau des macro- rôles, les adjectifs comme les autres prédicats psychologiques n’ont que deux rôles, l’expérienceur et le stimulus. / The aim of the thesis is to identify the thematic role of the non-experiencer argument in the semantic structure of psych adjectives. The class of psych adjectives is identified on the basis of the cognitive semantic definition of psychological experience which proposes a binary structure for prototypical predicates belonging to this class. The analysis is carried out at a semantic level and divides the class into two sub-classes according to whether the psychological experience denoted by the adjectives is actualized or potential. The non-actualization of the psychological experience relies on the modality hypothesis, identified at the lexical semantics level as implicit modality (psychological dispositions), or, at the discourse level, by means of inference (causative adjectives). For the former, the absence of a stimulus is interpreted as a consequence of the presence of implicit modality in their semantic structure. On the basis of these results, the analysis is restricted to those adjectives with a binary structure, the adjectives which denote an actualized psychological experience. Two conceptual domains divide this core class of adjectives: psychological states and feelings. Starting from the semantic representation of psychological verbs, we discuss the correspondence principle at the syntax-semantics interface. The analysis highlights the limitations of the syntactic approach and proposes a semantic representation within a semantic approach free of syntactic constraints. Following Jackendoff (1990), the semantic representation is structured into two levels, the thematic level and the macro-role level. As proposed by Jackendoff, the thematic level relies on the localist hypothesis, which in turn is supported by the representation of psych adjectives. The experiencer role is not present at the thematic level, or it corresponds to the location or goal roles. The psychological state adjectives are represented at the thematic level by the theme and source roles, the latter serving, according to the localist hypothesis, to encode the notion of cause. Other locative prepositions serve to encode the concept of causation but the phrases headed by them do not belong to the sub-categorization frame of adjectives, functioning as adjuncts. The adjectives of emotion have two roles on their thematic tier, theme and goal or source. On their macro-roles tier, similarly to other psych predicates, adjectives have only two roles, experiencer and stimulus.
|
3 |
PRINCIPES D'ASSISTANCE A LA MAITRISE D'OUVRAGE POUR LA MODELISATION ET L'INTEGRATION D'EXPERTISECandlot, Alexandre 27 September 2006 (has links) (PDF)
L'intégration des expertises métiers constitue un enjeu primordial des nouvelles générations des systèmes de gestion globale du cycle de vie du produit. La maîtrise d'ouvrage de telles intégrations est rendue difficile par la complexité de la gestion de la connaissance proportionnelle à celle croissante du produit, la diversité des acteurs de tels projets et le manque de retour au cours ou à l'issue de déploiements de tels projets passés et présents. Ces travaux de thèse ont été menés en parallèle d'un cas d'étude sur le projet USIQUICK, visant à l'automatisation de la génération de gamme d'usinage. Cette expérience a également été confrontée à des projets dans d'autres secteurs de l'industrie ou des services. La contribution de cette thèse propose un ensemble d'outils conceptuels utilisables en préparation ou au cours d'un projet d'intégration d'expertise. En phase amont cet ensemble d'outils peut être utilisé pour consolider les expériences précédentes et constituer des grilles d'analyses pour la prise de décision des méthodologies à déployer. Au cours du projet, cette base méthodologique d'outils donne à la maîtrise d'ouvrage des critères d'analyse pour évaluer la dynamique de projet. Elle permet de faire émerger les problèmes liés à la modélisation de l'expertise, de préparer les phases de programmation et de faire ressortir dans ces deux cas des lieux de représentations propices à l'émergence d'indicateurs de performance relatifs à la spécificité du projet étudié. L'apport méthodologique pour la maîtrise d'ouvrage est constitué de la proposition et de l'analyse des quatre « piliers » de ressources à la modélisation et à l'intégration d'expertise (réseaux de concepts, listes de spécifications, corpus de document, outils de gestion). Ces piliers permettent de justifier une série de phases décrivant les enjeux de la modélisation (phases d'identification, d'extraction, de structuration et de formalisation) et de l'intégration (phases de raffinement, de spécification des développements, de diffusion et de maintenance). Grâce à une analyse des niveaux de maturité de la gestion initiale et attendue de l'expertise, ces « piliers » et ces phases permettent de cadrer le contexte d'un retour d'expérience ou d'un projet à déployer. En parallèle, trois couples de concepts, syntaxe / sémantique, infrastructure / architecture, domaine / projet, permettent un questionnement pour identifier les zones potentielles de problèmes dans les représentations et envisager des axes de résolution. Il est ainsi permis de contribuer au rapprochement du systématisme épistémologique de la gestion des connaissances avec la pratique empirique et pragmatique contenue dans les savoirs. La consolidation des liens entre ces aspects de l'expertise permet un pilotage de projet par des éléments réels de connaissances et d'expertise.
|
4 |
Approche logique des grammaires pour les langues naturellesAnoun, Houda 24 October 2007 (has links) (PDF)
Les contributions majeures de cette thèse s'articulent autour des trois axes de base de la linguistique computationnelle, à savoir la logique, la linguistique et l'informatique. Nous proposons ainsi un nouveau système non-directionnel GLE permettant de simuler les opérations transformationnelles du Programme Minimaliste dans un cadre logique qui fait appel au raisonnement hypothétique de manière contrôlée. La pertinence de ce formalisme est soulignée en montrant sa capacité à prendre en charge des phénomènes linguistiques complexes, nécessitant un partage contraint de ressources, tels que le liage d'anaphores ou la résolution d'ellipse. En outre, nous présentons un atelier logique, nommé ICHARATE, destiné à la recherche et l'enseignement de la linguistique computationnelle. Cet outil est composé de bibliothèques pour l'assistant à la démonstration Coq, qui comprennent la formalisation de systèmes logiques avancés dédiés au traitement des langues naturelles, dont la logique multimodale.
|
5 |
Étiquetage grammatical symbolique et interface syntaxe-sémantique des formalismes grammaticaux lexicalisés polarisésMorey, Mathieu 03 November 2011 (has links) (PDF)
Les travaux de cette thèse portent sur l'analyse syntaxique et sémantique de la phrase, en utilisant pour l'analyse syntaxique un formalisme grammatical lexicalisé polarisé et en prenant comme exemple les grammaires d'interaction. Dans les formalismes grammaticaux lexicalisés, les polarités permettent de contrôler explicitement la composition des structures syntaxiques. Nous exploitons d'abord le besoin de composition exprimé par certaines polarités pour définir une notion faible de réduction de grammaire applicable à toute grammaire lexicalisée polarisée. Nous étudions ensuite la première phase de l'analyse syntaxique des formalismes lexicalisés: l'étiquetage grammatical. Nous exploitons là encore le besoin de composition de certaines polarités pour concevoir trois méthodes symboliques de filtrage des étiquetages grammaticaux que nous implantons sur automate. Nous abordons enfin l'interface syntaxe-sémantique des formalismes lexicalisés. Nous montrons comment l'utilisation de la réécriture de graphes comme modèle de calcul permet concrètement d'utiliser des structures syntaxiques riches pour calculer des représentations sémantiques sous-spécifiées.
|
6 |
Production, compréhension et imitation des constructions causatives chez des enfants monolingues francophones et bulgarophones âgés de 3 à 6 ans / Production, comprehension and imitation of the causative constructions by monolingual French and Bulgarian 3 to 6 year old childrenBezinska, Yanka 30 June 2014 (has links)
La présente recherche doctorale traite des constructions causatives dans une perspective développementale et contrastive. Elle poursuit un double objectif. D'une part, démontrer que la complexité morphosyntaxique des mécanismes causatifs joue un rôle important dans le processus de leur acquisition par les enfants. D'autre part, prendre en considération plusieurs habiletés langagières (production, compréhension, imitation) pour explorer pleinement les divers niveaux de maitrise des constructions causatives. Les deux langues que nous étudions – le français et le bulgare – n'utilisent pas les mêmes mécanismes pour encoder la notion de causativité. Le français privilégie le prédicat complexe faire + Vinf, mais accepte également quelques causatifs lexicaux (nourrir X). Le bulgare fait appel à trois procédés : lexical (xranja X – nourrir X), morphologique (le préfixe ‘raz-' : razsmivam X – faire rire X) et périphrastique (karam X da V présent – inciter X à ce que V présent). Un total de 113 francophones (71 enfants et 42 adultes) et de 96 bulgarophones (56 enfants et 40 adultes) participent à cette étude contrastive ; tous sont des locuteurs natifs monolingues. Les enfants sont répartis en trois tranches d'âge (3-4 ans, 4-5 ans et 5-6 ans) et ils participent à trois tâches expérimentales (production, compréhension, imitation). Les adultes sont enregistrés uniquement en tâche de production. Notre recherche aboutit à quelques résultats intéressants. Premièrement, entre 3 et 6 ans, la conceptualisation de la causativité ne pose pas de problèmes particuliers aux enfants francophones et bulgarophones ; ils comprennent les mécanismes causatifs de leur langue. Deuxièmement, l'ordre d'acquisition des formes causatives est étroitement lié à leur degré de complexité morphosyntaxique. Dans les deux langues étudiées, les causatifs lexicaux sont complètement maitrisés par les enfants. En revanche, malgré son caractère compact et sa simplicité formelle, le causatif morphologique du bulgare semble apparaitre tardivement. La présence d'erreurs par surgénéralisation chez les enfants âgés de 5 à 6 ans révèle que l'acquisition de ce mécanisme causatif n'est pas achevée. La construction périphrastique karam X da V présent, quant à elle, peut être considérée comme maitrisée, puisqu'entre 4 et 5 ans, les habiletés des enfants bulgares à la produire sont déjà très proches de l'usage adulte. Enfin, le prédicat complexe faire + Vinf est en voie de stabilisation ; les enfants français doivent faire quelques ajustements au niveau de l'intégrité de la séquence faire + Vinf et de l'usage de l'argument causataire (sa fonction syntaxique et sa présence dans les énoncés). Troisièmement, le rappel de la structure des mécanismes causatifs en tâche d'imitation améliore les performances productives des enfants. En conclusion, par la prise en compte de trois habiletés langagières, cette étude apporte un éclairage dans la recherche sur les constructions causatives. Dans l'esprit du Modèle de compétition et des approches basées sur l'usage, notre travail valide également la pertinence de trois principaux facteurs déterminant l'ordre d'acquisition des unités linguistiques : 1/ fréquence dans l'input (ou disponibilité) ; 2/ fiabilité (ou spécialisation dans l'expression d'une fonction communicative) ; 3/ complexité (formelle et conceptuelle). / The present study investigates the causative constructions from a developmental and cross-linguistic perspective. On the one hand, it aims to show the important role of the morphosyntactic complexity of causative mechanisms during language acquisition. On the other hand, it aims to examine different language skills (production, comprehension, imitation) in order to explore various levels of mastery of the causative constructions in two languages, French and Bulgarian. The two languages under investigation, French and Bulgarian, do not use the same mechanisms to express causativity. French uses the faire + Vinf complex predicate and some lexical causatives (nourrir X – feed X). In Bulgarian, the causativity is expressed using three mechanisms: lexical (xranja X – feed X), morphological (prefix ‘raz-': razsmivam X - make X laugh) and periphrastic construction (karam X da V pres – make that X + V pres). A total of 113 L1 French speakers (71 children and 42 adults) and 96 L1 Bulgarian speakers (56 children and 40 adults) took part in this cross-linguistic study. The children were divided into three age groups: 3-4, 4-5 and 5-6 years of age; they all participated in three experimental tasks (production, comprehension and imitation). The adults took part in one experimental task (production). Our cross-linguistic study provided some interesting results. Firstly, the conceptualization of causativity is equally understood in both languages, each child group globally understands the causative mechanisms available in their own language. Secondly, the order of acquisition of the causative mechanisms is tightly linked to its degree of morphosyntactic complexity. In both languages, lexical causatives are already mastered by all the children groups. Surprisingly enough, in Bulgarian, the morphological causative appears to be a late language development, as children as old as 5 to 6 years produce overgeneralizations of this mechanism, that means it is not yet mastered. In the Bulgarian data, we found that the periphrastic construction is acquired between the ages of 4 to 5 years; the children of this age group already show an adult-like ability in producing this analytical causative mechanism. In the French data, we found that the production of the faire + Vinf complex predicate begins to stabilize; however, children have to adjust both the integrity of the faire + Vinf structure and the usage of the causee argument (its syntactic function and its presence in the utterance). Thirdly, in instances when the structure of causative mechanisms is present during the imitation task, the children's production is improved. In conclusion, by including various language skills (production, comprehension and imitation), this study brings a new perspective in investigating the causative constructions. Our research is also consistent with both the Competition model and the usage-based approaches; it validates the relevance of three major factors determining the order of acquisition of the linguistic structures: 1/ input frequency (or ‘cue availability'); 2/ cue reliability; 3/ formal and semantic complexity (or ‘cue cost').
|
7 |
Calculs de représentations sémantiques et syntaxe générative : les grammaires <br />minimalistes catégoriellesAmblard, Maxime 21 September 2007 (has links) (PDF)
Les travaux de cette thèse se situent dans le cadre de la linguistique computationnelle. La problématique est de définir une interface syntaxe / sémantique basée sur les théories de la grammaire générative.<br />Une première partie, concernant le problème de l'analyse syntaxique, présente tout d'abord, la syntaxe générative, puis un formalisme la réalisant: les grammaires minimalistes de Stabler. <br />À partir de ces grammaires, nous réalisons une étude sur les propriétés de l'opération de fusion pour laquelle nous définissons des notions d'équivalence, ainsi qu'une modélisation abstraite des lexiques.<br />Une seconde partie revient sur le problème de l'interface. Pour cela, nous proposons un formalisme de type logique, basé sur la logique mixte (possédant des connecteurs commutatifs et non-commutatifs), qui équivaut, sous certaines conditions, aux grammaires de Stabler. <br />Dans ce but, nous introduisons une normalisation des preuves de cette logique, normalisation permettant de vérifier la propriété de la sous-formule. Ces propriétés sont également étendues au calcul de Lambek avec produit.<br />À partir de l'isomorphisme de Curry-Howard, nous synchronisons un calcul sémantique avec les preuves réalisant l'analyse syntaxique. Les termes de notre calcul font appel aux propriétés du lambda mu-calcul, ainsi qu'à celles de la DRT (Discourse Representative Theory).<br />Une dernière partie applique ces formalismes à des cas concrets. Nous établissons des fragments d'une grammaire du français autour du problème des clitiques.
|
8 |
Surface Realisation from Knowledge Bases / Bases de connaissances et réalisation de surfaceGyawali, Bikash 20 January 2016 (has links)
La Génération Automatique de Langue Naturelle vise à produire des textes dans une langue humaine à partir d'un ensemble de données non-linguistiques. Elle comprend généralement trois sous-tâches principales: (i) sélection et organisation d'un sous-ensemble des données d'entrée; ii) détermination des mots à utiliser pour verbaliser les données d'entrée; et (iii) regroupement de ces mots en un texte en langue naturelle. La dernière sous-tâche est connue comme la tâche de Réalisation de Surface (RS). Dans ma thèse, j'étudie la tâche de RS quand les données d'entrée sont extraites de Bases de Connaissances (BC). Je présente deux nouvelles approches pour la réalisation de surface à partir de bases de connaissances: une approche supervisée et une approche faiblement supervisée. Dans l'approche supervisée, je présente une méthode basée sur des corpus pour induire une grammaire à partir d'un corpus parallèle de textes et de données. Je montre que la grammaire induite est compacte et suffisamment générale pour traiter les données de test. Dans l'approche faiblement supervisée, j'explore une méthode pour la réalisation de surface à partir de données extraites d'une BC qui ne requière pas de corpus parallèle. À la place, je construis un corpus de textes liés au domaine et l'utilise pour identifier les lexicalisations possibles des symboles de la BC et leurs modes de verbalisation. J'évalue les phrases générées et analyse les questions relatives à l'apprentissage à partir de corpus non-alignés. Dans chacune de ces approches, les méthodes proposées sont génériques et peuvent être facilement adaptées pour une entrée à partir d'autres ontologies / Natural Language Generation is the task of automatically producing natural language text to describe information present in non-linguistic data. It involves three main subtasks: (i) selecting the relevant portion of input data; (ii) determining the words that will be used to verbalise the selected data; and (iii) mapping these words into natural language text. The latter task is known as Surface Realisation (SR). In my thesis, I study the SR task in the context of input data coming from Knowledge Bases (KB). I present two novel approaches to surface realisation from knowledge bases: a supervised approach and a weakly supervised approach. In the first, supervised, approach, I present a corpus-based method for inducing a Feature Based Lexicalized Tree Adjoining Grammar from a parallel corpus of text and data. I show that the induced grammar is compact and generalises well over the test data yielding results that are close to those produced by a handcrafted symbolic approach and which outperform an alternative statistical approach. In the weakly supervised approach, I explore a method for surface realisation from KB data which does not require a parallel corpus. Instead, I build a corpus from heterogeneous sources of domain-related text and use it to identify possible lexicalisations of KB symbols and their verbalisation patterns. I evaluate the output sentences and analyse the issues relevant to learning from non-parallel corpora. In both these approaches, the proposed methods are generic and can be easily adapted for input from other ontologies for which a parallel/non-parallel corpora exists
|
9 |
Analyse comparative des constructions causatives en mandarin et en anglaisXu, Mengwan 04 1900 (has links)
Les constructions causatives ont fait l’objet d’une attention particulière dans les études linguistiques, non seulement parce qu’elles font partie des innombrables expressions qui composent le système langagier humain, mais parce qu'elles reflètent également la mesure dans laquelle la cognition humaine perçoit et interprète la nature de la causation. Parmi les diverses causatives prédicatives, nous accordons une attention particulière aux causatives analytiques tirées des données anglaises et mandarines – deux langues qui comptent le plus grand nombre de locuteurs au monde : les constructions cause, make, have, shi (使) et rang (让). Guidé par le programme cartographique et minimaliste de la syntaxe générative, ce travail fournit, dans un premier temps, une recension des caractéristiques sémantico-syntaxiques qui permettent d’unir ou de distinguer les causatives de l’anglais et du mandarin. Ensuite, nous passons en revue les approches existantes qui discutent de la structure sous-jacente des constructions visées afin d’examiner à quel point ces approches pourraient nous guider dans la description des données interlinguistiques. Finalement, sur la base de ces approches, nous tentons de proposer une structure syntaxique plus universelle des causatives anglaises/mandarines tout en tenant compte des particularités sémantiques et des spécificités interlinguistiques. En plus d'adopter une configuration syntaxique monoclausale qui scinde la couche vP en deux, nous insistons également sur la nécessité d’introduire un trait évènementiel [contrôle] et de déterminer la valeur sémantique des verbes impliqués dans chaque structure causative anglaise/mandarine. / Causative constructions have received particular attention in linguistic studies, not only because they are part of the countless expressions that constitute the human language system, but also because they reflect the extent to which human cognition perceives and interprets the nature of causation. Among the various predicative causatives, this study focuses on analytic causatives drawn from English and Mandarin data - two languages with the largest number of speakers in the world: the cause, make, have, shi (使) and rang (让) constructions. Driven by the cartographic and minimalist program of generative syntax, this work first provides a survey of the semantic-syntactic features that unite or distinguish English and Mandarin causatives. Next, we review existing approaches that discuss the underlying structure of the target constructions to examine how these approaches might guide us in describing cross-linguistic data. Finally, based on these approaches, we attempt to propose a more universal syntactic structure of English/Mandarin causatives while considering semantic particularities and cross-linguistic specificities. In addition to adopting a monoclausal structure that splits the vP layer in two, we also insist on the need to introduce an event feature [control] and to determine the semantic value of verbs involved in each English/Mandarin causative structure.
|
Page generated in 0.0607 seconds