Global ETD Search

131	Grammaires locales pour l'analyse automatique de textes : méthodes de construction et outils de gestion Constant, Matthieu 08 September 2003 (has links) (PDF) L'explosion du nombre de documents disponibles (notamment sur Internet) a rendu le domaine du Traitement Automatique des Langues (TAL) et ses outils incontournables. De nombreux chercheurs marquent l'importance de la linguistique dans ce domaine. Ils préconisent la construction de larges bases de descriptions linguistiques, composées de lexiques et de grammaires. Cette démarche a un gros inconvénient : elle nécessite un investissement lourd qui s'inscrit sur le long terme. Pour palier à ce problème, il est nécessaire de mettre au point des méthodes et des outils informatiques d'aide à la construction de composants linguistiques fins et directement applicables à des textes. Nous nous sommes penché sur le problème des grammaires locales qui décrivent des contraintes précises et locales sous la forme de graphes. Deux questions fondamentales se posent : - Comment construire efficacement des grammaires précises, complètes et applicables à des textes ? - Comment gérer leur nombre et leur éparpillement ? Comme solution au premier problème, nous avons proposé un ensemble de méthodes simples et empiriques. Nous avons exposé des processus d'analyse linguistique et de représentation à travers deux phénomènes : les expressions de mesure (un immeuble d'une hauteur de 20 mètres) et les adverbes de lieu contenant un nom propre locatif (à l'île de la Réunion), deux points critiques du TAL. Sur la base de M. Gross (1975), nous avons ramené chaque phénomène à une phrase élémentaire. Ceci nous a permis de classer sémantiquement certains phénomènes au moyen de critères formels. Nous avons systématiquement étudié le comportement de ces phrases selon les valeurs lexicales de ses éléments. Les faits observés ont ensuite été représentés formellement soit directement dans des graphes à l'aide d'un éditeur, soit par l'intermédiaire de tables syntaxiques ensuite converties semiautomatiquement en graphes. Au cours de notre travail, nous avons été confronté à des systèmes relationnels de tables syntaxiques pour lesquels la méthode standard de conversion due à E. Roche (1993) ne fonctionnait plus. Nous avons donc élaboré une nouvelle méthode adaptée avec des formalismes et des algorithmes permettant de gérer le cas où les informations sur les graphes à construire se trouvent dans plusieurs tables. En ce qui concerne le deuxième problème, nous avons proposé et implanté un prototype de système de gestion de grammaires locales : une bibliothèque en-ligne de graphes. Le but à terme est de centraliser et de diffuser les grammaires locales construites au sein du réseau RELEX. Nous avons conçu un ensemble d'outils permettant à la fois de stocker de nouveaux graphes et de rechercher des graphes suivant différents critères. L'implémentation d'un moteur de recherche de grammaires nous a également permis de nous pencher sur un nouveau champ d'investigation dans le domaine de la recherche d'information : la recherche d'informations linguistiques dans des grammaires locales. [INFO:INFO_OH] Computer Science/Other analyse automatique de textes analyse syntaxique complément prépositionnel locatif expression de mesure gestion de grammaires locales grammaire locale graphe lexique-grammaire nom propre géographique réseau récursif de transitions
132	Antelope, une plate-forme de TAL permettant d'extraire les sens du texte : théorie et applications de l'interface syntaxe-sémantique Chaumartin, François-Régis 25 September 2012 (has links) (PDF) Créer rapidement un analyseur sémantique dédié à une tâche particulière n'est pas une tâche aisée. En effet, composants d'analyse et ressources linguistiques sont souvent définis avec des formats incompatibles entre eux, ce qui en rend l'assemblage complexe. Nous souhaitons apporter une réponse opérationnelle à ce problème avec la plate-forme de traitement linguistique Antelope, dont cette thèse décrit les principes de conception et de réalisation. En partie basée sur la Théorie Sens-Texte (TST), Antelope permet une analyse syntaxique et sémantique de corpus de volume important ; son objectif est de " rendre calculable " du texte tout-venant : avis de consommateurs, textes encyclopédiques, documents RH, articles de presse... Pour cela, Antelope intègre (i) plusieurs composants prêts à l'emploi, couvrant les principales tâches de TAL, qui interagissent au sein d'un modèle de données linguistiques unifié ; (ii) un lexique sémantique multilingue à large couverture constitué à partir de différentes sources. Un effort d'intégration permet d'offrir une plate-forme robuste et homogène ; l'ensemble constitue une interface syntaxe-sémantique opérationnelle. La thèse présente la plate-forme et la compare à d'autres projets de référence ; elle souligne les bonnes pratiques à prendre en termes d'architecture logicielle pour qu'un tel ensemble complexe reste maintenable ; elle introduit aussi une démarche semi-supervisée d'acquisition de connaissances à large échelle. traitement de corpus analyse syntaxique et sémantique lexique sémantique désambiguïsation extraction d'information Théorie Sens-Texte
133	Le lexique-grammaire des verbes du grec moderne : constructions transitives non locatives à un complément d'objet direct Voskaki, Ourania 25 March 2011 (has links) (PDF) Cette étude a pour objectif la description syntaxique et sémantique des constructions transitives non locatives à un complément d'objet direct en grec moderne : N0 V N1. Nous nous sommes appuyée sur le cadre théorique de la grammaire transformationnelle de Zellig S. Harris et sur le cadre méthodologique du Lexique-Grammaire, défini par Maurice Gross et développé au Laboratoire d'Automatique Documentaire et Linguistique. À partir de 16 560 entrées verbales morphologiques, nous procédons à la classification des constructions transitives non locatives, à partir de 24 classes distinctes, sur la base de critères formels posés. Un inventaire de 2 934 emplois verbaux à construction transitive non locative à un complément d'objet direct a été ainsi produit et scindé en neuf classes. Parmi ces emplois, 1 884 sont formellement décrits dans 9 tables de lexique-grammaire établies : plus précisément, il s'agit de celles qui impliquent des constructions à un complément d'objet direct illustrant les concepts " apparition " (table 32GA), " disparition " (32GD), objet " concret " (32GC), " partie du corps " (32GCL), substantif " humain " (32GH), substantif avec " pluriel obligatoire " (32GPL). En outre, la transformation passive est largement interdite pour les emplois verbaux recensés dans la table 32GNM, alors que les tables 32GCV et 32GRA regroupent des verbes acceptant une transformation à verbe support. Nous présentons l'application des données linguistiques recensées dans le traitement automatique des langues naturelles (TALN), avec la conversion automatique des tables en automates à états finis récursifs, suivie de nos suggestions sur leur applicabilité à la traduction en français et à l'enseignement du grec moderne (langue maternelle ou étrangère) : acquisition/apprentissage Analyse syntactico-sémantique Tables du lexique-grammaire Propriétés transformationnell
134	Induction de lexiques bilingues à partir de corpus comparables et parallèles Jakubina, Laurent 07 1900 (has links) No description available. corpus parallèle corpus comparable alignement embedding représentation de mots reclassement supervisé induction lexique bilingue Parallel corpus Comparable corpus Alignment Bilingual lexicons induction Word representation Supervised reclassification
135	Comparaison de différentes méthodes de classification : application aux langues bantu du nord-ouest / New approaches in linguistic classification : application to Northwestern Bantu languages Grollemund, Rebecca 17 September 2012 (has links) Ce travail de thèse propose une étude des nouvelles méthodes de classification, dites phylogénétiques, empruntées à la biologie dans le but de proposer une nouvelle classification linguistique. Les langues étudiées appartiennent à la famille « bantu », présentes au sein de la famille linguistique Niger-Congo, parlée en Afrique. De nombreux travaux ont été établis sur les langues bantu, montrant ainsi la complexité de cette famille linguistique. Notre étude se spécialise sur la zone « Nord-Ouest », qui comprend les pays suivants : Cameroun, Guinée Équatoriale, Gabon, Congo et République Démocratique du Congo. Ce travail présente une nouvelle classification de ces langues à travers l’étude du lexique. Nous avons ainsi constitué une base de données de 100 mots appartenant au vocabulaire de base pour les 207 langues retenues. Plusieurs arbres ont été générés par l’application des algorithmes Neighbor-Joining (Saitou et Nei, 1987) et Neighbor-Net (Bryant et Moulton, 2004). L’étude de la classification des langues du Nord-Ouest a permis de mieux comprendre les relations de proximité linguistiques qui existent entre les langues parlées dans cette région. De même, l’analyse de la classification a permis de proposer un schéma de migrations des langues bantu. / This dissertation is presenting a linguistic classification based on phylogenetic methods borrowed from biology. The sample of languages considered here belongs to the Bantu family, a linguistic sub branch of Niger-Congo languages spoken in Africa. Numerous publications have shown a complexity and the diversity of Bantu languages. Our study focus on the North-West region which includes the following countries: Cameroon, Equatorial Guinea, Gabon, Congo and Democratic Republic of Congo. This new classification is based on the comparison of lexical items. We have organized a database including 100 words from the basic vocabulary for 207 languages. Several tree representations were obtained by using Neighbor-Joining (Saitou and Nei, 1987) and Neighbor-Net (Bryant and Moulton, 2004) algorithms.This study allows us to get a better understanding of the linguistic proximity of these languages. It also provides a historical scenario for Bantu migrations. Bantu Bantoïde Classification linguistique Gabon Cameroun Guinée Équatoriale Congo République Démocratique du Congo Lexique Phylogénétique Arbre phylogénétique Migration Bantu Bantoid Linguistic classification Gabon Cameroon Equatorial Guinea Congo Democratic Republic of Congo Lexicon Phylogenetics Phylogenetic tree Migration
136	De la sémantique textuelle en arabe : cohésion discursive et sens lexical / Of textual semantics in Arabic : Discursive cohesion and lexical meaning Ben Achour, Riadh 17 March 2012 (has links) Le travail présenté ici se situe dans le cadre général d’élaborer une méthodologie de traitement du sens lexical dans une dimension textuelle – textes arabes et énoncés (types et occurrences) plus courts – à la lumière de la sémantique interprétative de F. Rastier. Pour ce faire, cette étude cherche tout d’abord à déterminer le statut du texte en linguistique moderne et dans la pensée traditionnelle arabe. Il s’agit de revenir sur les facteurs-clés qui ont donné lieu à la prise en compte du palier textuel dans les études linguistiques modernes et dans la tradition grammaticale, rhétorique et exégétique arabe.S’inspirant des travaux en sémantique interprétative de F. Rastier, le présent travail entend rendre compte par le biais d’une application pratique (analyse des textes arabes) du rôle essentiel que jouent l’analyse sémique, l’isotopie sémantique, le contexte et la pratique sociale en cours, dans l’assignation du sens aux unités lexicales. Après avoir présenté les limites des modèles textuels issus de deux approches sémantiques formelles (véri-conditionnelle) et cognitives, l’objectif de cette recherche est de montrer la pertinence de l’application du modèle Rastérien – issu d’une approche sémantique structurale – à des textes arabes. / This work falls within the general framework of developing a working methodology for processing lexical meaning within a text. It seeks to apply François Rastier’s theory of interpretive semantics to Arabic texts and utterances. The thesis starts with a survey of the state of the text in both traditional Arabic thinking and modern linguistics. Such a survey reveals the key factors that have brought the textual level to the fore, in modern linguistics on the one hand, and Arabic traditional grammar, rhetoric and exegetics on the other hand. This study seeks to apply Rastier’s notion of interpretive semantics to texts and examples in Arabic. The overall objective of this close textual approach is to highlight the fundamental role of semantic analysis, semantic isotopy, context and the current social practices in assigning lexical meaning. The thesis attempts also to show the shortcomings of textual models offered by two semantic approaches, namely the formal (truth-conditional) and the cognitive approaches; in order to highlight the pertinence of Rastier’s model within a structural semantic approach to Arabic texts. Cohésion Concept Conjonction Contexte Genre Isotopie Lexique Linguistique Norme sociale Mot Phrase Sémantique Sème Sens Signification Cohesion Concept Conjunction Context Genre Isotopy Lexicon Linguistics Social norm Word Sentence Semantics Seme Meaning (Sense) Signification
137	Raconter une crise : La mémoire et la vie familiale dans les œuvres de Natalia Ginzburg et de Marguerite Duras / Crisis : Memory and family life in the works of Natalia Ginzburg and Marguerite Duras Pettinotto, Jean-Philippe 15 May 2013 (has links) Le thème des relations familiales est récurrent dans les œuvres de Natalia Ginzburg et de Marguerite Duras car il leur offre un cadre leur permettant d’interroger deux éléments de la construction narrative : la structure de l’œuvre et la syntaxe narrative.Cependant la singularité de leurs œuvres littéraires réside moins dans la reconstitution de vies familiales, que dans « l’image parlante » qu’elles en donnent. En effet, les deux romancières interrogent la réalité familiale comme lieu de remise en cause du langage. À travers les incompréhensions et les maux de la vie familiale, elles dénoncent en fait un phénomène qui dépasse le cadre restreint de la famille : l’inauthenticité du langage quotidien. Premièrement, il s’agit, dans cette étude, d’observer en quoi Natalia Ginzburg et Marguerite Duras refusent l’ordre narratif traditionnel lorsqu’il leur faut représenter le chaos de la vie familiale. Deuxièmement, nous montrons comment elles opérèrent une reconstitution du monde passant, d’un côté, par la création de liens de causes à effets entre les événements, et de l’autre, par l’entrée en crise du langage. Troisièmement, nous observons pour finir comment la recherche de l’unité familiale conduit les deux auteures à subvertir les normes du langage littéraire pour retrouver, dépasser et même abolir, le temps passé perdu. En somme, ce travail de recherche, effectué dans la cadre d’une cotutelle de thèse entre l’Université Lumière Lyon2 et l’Università degli studi di Torino a pour ambition salutaire de faire connaître un peu plus qu’elles ne le sont déjà, les œuvres de Natalia Ginzburg en France et celles de Marguerite Duras en Italie. / The theme of family relationships is recurrent in the works of Natalia Ginzburg and Marguerite Duras because it offers them a framework to question at least two elements of narrative construction: the structure of the work and the narrative syntax.However, the peculiarity of their literary works lies less in the description of family lives than in "the talking image" that they provide of these lives. Indeed, the two novelists look at the family as a means to question language. Through the misunderstandings and pains of family life, they emphasize in fact a phenomenon that goes beyond the narrow limits of the family: the falsity of everyday language.Firstly, in this study, we observe how Natalia Ginzburg and Marguerite Duras refuse the traditional narrative order when they need to represent the chaos of family life. Secondly, we show how they perform a reconstruction of the world proceeding through the creation of cause-effect links between the events, and through the breakdown of language. Thirdly, we see how the search for family unity led both authors to subvert the norms of literary language to rediscover, go beyond and even destroy the lost past.This research work was carried out in the framework of a joint PhD program of the University Lumière Lyon 2 and the Università degli studi di Torino ; in addition to the academic interest that it might generate, this thesis aims at making Natalia Ginzburg's works a little better known in France and those of Marguerite Duras a little better known in Italy. Vie familiale Lexique familial Ecriture mémorielle Crise Famille Unité Mémoire Conflit générationnel Marguerite Duras Natalia Ginzburg Family life Family sayings Memory Writing Crisis Family Unity Memory Generational conflict Marguerite Duras Natalia Ginzburg
138	« Le langage de passions » : la visione morale di Manzoni e le sue fonti / "Le langage de passions" : Manzoni’s moral vision and his sources / « Le langage de passions » : La vision morale de Manzoni et ses sources Maiolini, Elena 20 February 2015 (has links) En accusant le théâtre de familiariser les consciences avec le « langage des passions », Pierre Nicolelançait une condamnation à laquelle Manzoni a pensé pendant longtemps. Le thème de la moralitélittéraire offre un point de vue intéressant sur le rapport dynamique – et largement inexploré – deManzoni à l’égard des auteurs reconnus de philosophie morale du XVIIe siècle français. En fortesyntonie avec ces derniers sur des contenus étiques et religieux, et des questions de méthode et delangue, Manzoni mena une analyse passionnée du statut moral des lettres, dans un dialogue directavec des censeurs qu’on n’avait jamais démenti. Cette étude porte donc à démontrer que sa réponse,esquissée dans un discours critique inachevé, arriva par le biais même de son oeuvre, par laquelle ilproposait une façon de représenter les passions comme une noble fonction cognitive, avec unvocabulaire qui se réfère largement au lexique des orateurs mêmes, dont les sermons conservés danssa bibliothèque montrent d’importants signes de lecture. Cette étude, qui commence avec unevérification documentaire, est structurée en deux parties. La première se compose d’un chapitre dédiéaux positions sur la moralité de la littérature entre le XVIIe et le XIXe siècle, suivi de trois autres oùnous analysons le langage manzonien des passions par mots clés (l’orgueil, l’amour-passion et lacolère), orientés par les traités du XVIIe siècle, les tragédies de Corneille, Racine et Shakespearecommentées par Manzoni, ainsi que les textes du dramaturge et romancier. La deuxième partie secompose d’un lexique manzonien de la vie morale. / By accusing the theatre of teaching the dangerous «language of passions», Pierre Nicole gave ajudgment of which Manzoni would have thought for a long time. The subject of literary moralityoffers an interesting view of Manzoni’s relationship – dynamic and largely unexplored – with thebeloved authors of the French 17th century moral philosophy. Being in strong syntony with them inethical and religious issues, as well as in questions of method and language, Manzoni carried out apassionate analysis on the role of literature, in a direct dialogue with censors, who, according to him,hadn’t received a convincing answer to that point of time. This study shows that Manzoni’s response,outlined in an unfinished speech, proposed a concrete way of representing passions, not as futile andtoxic divertissement, but with a noble cognitive function. We attempt to show that Manzoni’slanguage owes much to the moralists themselves, «deep and keen observers of the human heart»,whose sermons, stored on the shelves of Manzoni’s library, contain various signs of reading.Concieved as a philological and documentary analysis of these texts, the thesis is structured in twoparts. The first one consist of a chapter that deals with the 17th-19th centuries positions on literarymorality, and other three chapters which are dedicated to Manzoni’s vocabulary of pride, love-passionand anger. This analysis takes into account the 17th century moral treaties, the tragedies of Corneille,Racine and Shakespeare, all commented by Manzoni, and Manzoni’s playwright and novelist’sproduction. The second part consists of an essay dealing with a Manzonian lexicon of the words ofthe moral life. Alessandro Manzoni Pierre Nicole Jacques-Bénigne Bossuet Jean Racine Pierre Corneille Shakespeare Moralité littéraire Orgueil Amour-passion Colère Lexique Alessandro Manzoni Pierre Nicole Jacques-Bénigne Bossuet Jean Racine Pierre Corneille Shakespeare Literary morality Pride Love-passion Anger Lexicon
139	Caractérisation phonétique et phonologique du syntagme intermédiaire en français : de la production à la perception Michelas, Amandine 04 July 2011 (has links) Le travail présenté ici est sous-tendu par deux observations majeures. Premièrement, la plupart des modèles proposés pour le français s’accordent sur l’existence de deux niveaux de structure prosodique: le syntagme accentuel et le syntagme intonatif. Deuxièmement, bien que l’existence d’un niveau additionnel de structure situé entre ces deux niveaux ait été proposé pour le français, les propriétés phonétiques et phonologiques de ce constituant n’ont pas clairement été définies. Dans cette thèse nous avons fourni des preuves de l’existence du syntagme intermédiaire (ip) à la fois en production et en perception de la parole. Grâce à cinq expérimentations menées dans le cadre de la phonologie de laboratoire, nous avons caractérisé les propriétés phonético-phonologiques de ce constituant et attesté de son rôle dans le traitement perceptif du langage. Les résultats obtenus en production montrent que l’ip est le domaine de l’abaissement des accents mélodiques en français. Sa frontière droite est marquée par un allongement pré-frontière ainsi qu’un accent de syntagme responsable du retour à la ligne de référence du registre. Les analyses menées en perception ont montré que les frontières droites du syntagme accentuel et du syntagme intermédiaire sont utilisées très tôt dans le processus de traitement syntaxique. Les indices phonétiques et phonologiques présents à ces frontières permettent aux auditeurs du français de construire des attentes sur la structure syntaxique des énoncés perçus. Une analyse séparée des différents types d’indices acoustiques a également montré qu’en l’absence de marquage tonal, les indices de durée semblent suffisants dans le but de marquer la frontière de syntagme accentuel. Un marquage conjoint de la frontière droite d’ip par les indices mélodiques et l’allongement pré-frontière semble au contraire nécessaire pour que les auditeurs du français perçoivent et utilisent cette frontière dans le traitement du langage. / The work described here is grounded by two major observations. Firstly, most of the French intonation models agree on the existence of two levels of prosodic phrasing: the accentual phrase and the intonation phrase. Secondly, although the existence of an additional level of structure ranked between these two levels has been proposed for French, the phonetic and phonological properties of this intermediate phrase (ip) have not been clearly defined. In this thesis we provide evidence for the existence of an intermediate level of phrasing in French through both speech production and perception studies. Results of five experiments conducted within the framework of laboratory phonology revealed specific ip phonetic and phonological properties and tested its role in the perceptual processing of language. The production studies showed that the ip is the domain of downstep in French and that its right boundary is marked by a phrase accent responsible for a return to the register reference line. Analyses conducted in perception showed that the accentual phrase and intermediate phrase right boundaries are used early in the syntactic processing. Phonetic and phonological indices at these boundaries allow French listeners to build expectations about the syntactic structure of spoken utterances. A separate analysis of different types of acoustic cues showed that without tonal marking, pre-boundary lengthening seems to be sufficient to mark the accentual phrase boundary. Joint marking through melodic and lengthening cues appears to be necessary to perceive and make use of the ip boundary in language processing. Découpage prosodique Syntagme accentuel Syntagme intermédiaire Intonation Accès au lexique Traitement syntaxique Phonologie de laboratoire Français Prosodic phrasing Accentual phrase Intermediate phrase Intonation Lexical access Syntactic processing Laboratory phonology French
140	L’effet de la langue seconde sur le traitement des mots composés chinois chez les locuteurs bilingues chinois-français et chinois-anglais Li, Shiyu 12 1900 (has links) La présente étude a examiné si les équivalents traductionnels en français ou en anglais des constituants des mots composés chinois peuvent influencer la reconnaissance des composés chinois et, si oui, s’ils affectent ce processus de la même manière. Nous avons mené une expérience d’amorçage par répétition du constituant, où les cibles étaient des mots composés chinois bimorphémiques, précédés d’un de leurs constituants ou d’un stimulus non relié. Des bilingues chinois-français et chinois-anglais ont été assignés à trois conditions d’amorçage, où les amorces étaient traduites dans leur L2 (français ou anglais) ou répétées en L1 (chinois, transcrit en pinyin). Les résultats des conditions d’amorçage en L2 révèlent que les participants reconnaissaient les mots composés chinois comme de vrais mots significativement plus rapidement lorsqu’ils étaient précédés d’un de leurs constituants, en français ou en anglais, que lorsqu’ils étaient précédés d’un stimulus non relié. Cet effet n’est pas limité à une L2 spécifique, puisque les effets d’amorçage des constituants provoqués par les amorces en français et en anglais ont partagé le même patron. Nous n’avons pas trouvé d’effet d’amorçage par répétition d’un constituant en chinois, ce qui pourrait être dû à la difficulté à traiter le pinyin. Nous proposons que l’effet d’amorçage par répétition du constituant en L2 sur le traitement des mots composés chinois appuie l’hypothèse d’un lexique mental bilingue intégré caractérisé par une connectivité au niveau non seulement lexicale, mais aussi infralexicale. / The present study investigated whether the French or English translation equivalents of Chinese compound constituents affect Chinese compound recognition and, if so, whether they affect processing in a comparable manner. We conducted a constituent priming experiment, where targets were bimorphemic Chinese compounds, preceded by one of their constituents or an unrelated item. Chinese-French and Chinese-English bilinguals were assigned to three priming conditions, where primes were translated into their L2 French or L2 English or repeated in their L1 Chinese (transcribed as Pinyin syllables). Results from the L2 priming conditions indicated that participants recognized Chinese compounds as real words significantly faster when they were preceded by one of their constituents, in either French or English, than they were when preceded by an unrelated stimulus. This effect was not restricted to a particular L2, as constituent priming effects produced by French primes patterned with English primes. We failed to find a significant constituent priming effect in the L1 priming condition, possibly due to difficulty in processing Pinyin. We argue that the L2 constituent priming effects on Chinese compound processing provide evidence in favour of an integrated bilingual mental lexicon characterized by lexical as well as sublexical connectivity. lexique mental bilingue traitement des mots composés le chinois translangagier bilingues chinois-français bilingues chinois-anglais bilingual mental lexicon compound processing Chinese cross-language Chinese-French bilinguals Chinese-English bilinguals

Search results