Spelling suggestions: "subject:"morphosyntax"" "subject:"morphosyntactic""
1 |
Adjectif en Persan : étude morphosyntaxique et sémantiqueMir Marashi, Fatemeh 21 October 2011 (has links) (PDF)
Notre étude a commencé par une brève présentation de la langue persane et des parties du discours suivi par la démonstration de l'adjectif persan dans la grammaire contemporaine, notion floue dans les études antérieures. Étant donné que l'adjectif persan n'a pas de marquage flexionnel, cette étude exploratoire a pour but d'identifier des critères pertinents pour distinguer la catégorie adjectivale des autres catégories existantes (notamment nominale et verbale). Le résultat de ce travail nous a conduits à une étude morphosyntaxique et sémantique nous permettant de conclure au fait que l'adjectif persan est une sous-catégorie de la catégorie nominale.
|
2 |
Outils et ressources linguistiques pour l'alignement de textes multilingues français-vietnamiensNguyen, Thi Minh Huyen 10 October 2006 (has links) (PDF)
Le travail présenté dans ce mémoire porte sur la construction des outils et ressources linguistiques pour les tâches fondamentales de traitement automatique de la langue vietnamienne, dans un contexte monolingue ainsi que multilingue. Nous présentons pour cette langue encore peu étudiée des solutions possibles aux problèmes d'annotation morpho-syntaxique (définition de descripteurs lexicaux « de référence », construction d'un lexique avec ces descriptions, des outils de segmentation et d'étiquetage lexical), d'analyse syntaxique (première tentative de modélisation de la grammaire vietnamienne en employant le formalisme TAG, cadre de construction de ressources pour l'analyse syntaxique) et d'alignement multilingue (constitution d'un corpus multilingue, développement d'un système d'alignement multilingue). Afin d'assurer la réutilisabilité des travaux réalisés, et dans l'espoir de les voir stimuler le développement du TAL au Vietnam, nous avons apporté une attention particulière aux questions de normalisation de la gestion des ressources linguistiques.
|
3 |
Adjectif en Persan : étude morphosyntaxique et sémantique / Persian adjective : morphosyntactic and semantic studyMirmarashi, Fatemeh 21 October 2011 (has links)
Notre étude a commencé par une brève présentation de la langue persane et des parties du discours suivi par la démonstration de l'adjectif persan dans la grammaire contemporaine, notion floue dans les études antérieures. Étant donné que l'adjectif persan n'a pas de marquage flexionnel, cette étude exploratoire a pour but d’identifier des critères pertinents pour distinguer la catégorie adjectivale des autres catégories existantes (notamment nominale et verbale). Le résultat de ce travail nous a conduits à une étude morphosyntaxique et sémantique nous permettant de conclure au fait que l'adjectif persan est une sous-catégorie de la catégorie nominale. / Our study begins with a brief presentation of the Persian language and the parts of speech followed by the demonstration of the Persian adjective in the contemporary grammar and to look for this vague notion in the previous studies. Given that the Persian adjective has no inflected marking, this search aims to identifying distinctive criteria to distinguish the adjectival category from the other existing categories (in particular nominal and verbal). The results of this work conduct us towards a morphosyntactic and semantic study which allowing us to conclude that the Persian adjective is a subcategory of the nominal category.
|
4 |
Morphosyntactic learning of french as a second language / L'apprentissage morphosyntaxique du français langue secondeCarrasco-Ortiz, Haydee 27 July 2012 (has links)
La présente thèse a pour but d'étudier l'apprentissage morphosyntaxique du français comme langue seconde (L2). Elle cherche à examiner l'hypothèse proposée par certains modèles linguistiques et neurocognitifs selon laquelle les difficultés observées chez des bilingues tardifs à maitriser les connaissances morphosyntaxiques en L2 peuvent s'expliquer par un échec lors de la représentation mentale et le traitement de l'information morphosyntaxique, en comparaison avec les locuteurs natifs. Ainsi, les travaux présentés dans cette thèse utilisent des mesures électrophysiologiques afin de déterminer si ces difficultés sont associées (a) à la réalisation phonologique des inflexions morphologiques de la langue cible et (b) à l'interférence de la langue maternelle (L1). Les résultats démontrent que les apprenants tardifs sont capables d'acquérir des représentations morphosyntaxiques similaires à celle des locuteurs natifs. Nous avons également montré que l'information phonologique comprise dans les inflexions morphologiques joue un rôle important dans l'apprentissage morphosyntaxique en L2. Ces résultats nous ont permis de conclure que la capacité des apprenants bilingues à traiter l'information morphosyntaxique en L2 est moins influencée par la L1 à un niveau avancé d'apprentissage, tout en restant affectée par les propriétés morphosyntaxiques de la langue cible. De plus, ces résultats plaident en faveur des modèles linguistiques et neurocognitifs qui postulent que le traitement morphosyntaxique chez les bilingues avancés implique les même processus cognitifs que ceux des locuteurs natifs. / This thesis investigates morphosyntactic learning in adult second language (L2) learners of French. It examines the assumption posited by linguistic and neurocognitive models according to which L2 learners' difficulty in fully mastering morphosyntactic knowledge is due to a failure to mentally represent and process morphosyntactic information in a native-like manner. The series of experiments presented in this thesis use ERPs to investigate whether the difficulties that late L2 learners encounter in processing morphosyntactic agreement can be explained by (a) the phonological realization of inflectional morphology in the target language and (b) interference from the learners' native language (L1). The findings demonstrate that late L2 learners can achieve native-like processing of morphosyntactic knowledge at high levels of proficiency, regardless of the status of the morphosyntactic system in their L1. In addition, we provide evidence that phonological information contained in inflectional morphology plays an important role in the acquisition and processing of morphosyntactic agreement in L2. It is thus argued that L2 learners' processing of morphosyntactic agreement is less influenced by the L1 at high levels of proficiency, while still being potentially affected by the specific morphosyntactic properties of the target language. These findings give further support to linguistic and neurocognitive models positing that morphosyntactic processing in adult L2 learners involves mental representations and cognitive mechanisms similar to those used by native speakers.
|
5 |
La disparition du sujet-nul dans l’ancien français : Analyse de l’avancement du sujet pronominal obligatoire dans l’ancien français du XIIe siècle / Study on the progress of the obligatorification of the pronominal subject in Old French of the 12th centuryGütschow, Silvia January 2024 (has links)
L’étude porte sur des changements morphosyntaxiques de l’ancien français en étudiant la transition d’une langue à sujet-nul à une langue à sujet pronominal exprimé obligatoire comme c‘est le cas du français moderne. Dans ce but, une partie du Bestiaire de Philippe Thaon, œuvre médiévale du XIIe siècle, est analysée. Les occurrences du sujet-nul sont quantifiées et les régimes d’expression et omission du sujet pronominal sont examinés en prenant en compte le type deproposition et position verbale. Les résultats exposent une forte asymétrie entre les propositions principales et subordonnées quant à la fréquence relative du sujet-nul, les premières montrant un taux plus élevé de sujet-nul (87 %) que les dernières (56,5 %). Cette asymétrie est en concordance avec des études antérieures portant sur des textes du XIIe et surtout du XIIIe siècles (Offredi, 2006; Zimmermann, 2014) et résulte de l’organisation syntaxique à verbe second des propositions principales, ce qui permet l’omission du sujet en positions postverbales (Adams, 1987; Vance, 1997). En revanche, le régime d’expression du sujet pronominal dans les propositions subordonnées est moins bien défini ; tandis que l’étude actuelle confirme la flexibilité syntaxique dans les subordonnées, les conditions qui favorisent la réalisation du sujet ouvert restent à déterminer. Ces résultats peuvent cependant confirmer que l’ancien français du XIIe siècle n’est plus une langue à sujet-nul traditionnelle et que la transition a déjà commencé. / The present study investigated morphosyntactic changes in Old French by studying the transition from a null-subject language to a language with an obligatory pronominal subject, like Modern French. To this end the Bestiaire by Philippe de Thaon, a medieval literary work from the 12th century is analysed. The occurrence of null-subjects is quantified and the patterns of expression and omission of the pronominal subject are examined with regards to the proposition type and verbal position. The results expose a strong asymmetry between the main clauses and subordinate clauses, where the former display higher rates of null-subjects (87 %) compared with the latter (56,5 %). This asymmetry is in agreement with previous findings of the 12th century, and particularly the 13th century (Offredi, 2006; Zimmermann, 2014), resulting from a verb-second order in main clauses which allows for the omission of pronominal subjects in postverbal positions (Adams,1987; Vance, 1997). However, the conditions of the overt pronominal subject in subordinate clauses are less well-understood and while the present study confirms the greater syntactic flexibility in these clauses, the analysis did not reveal any factors helping to discern the observed pattern and more comprehensive research would be needed in this area. Yet, this study confirms what previously has been indicated that Old French of the 12th century is no longer a traditional null-subject language, and the transition is already well under way.
|
6 |
Traitement automatique du dialecte tunisien à l'aide d'outils et de ressources de l'arabe standard : application à l'étiquetage morphosyntaxique / Natural Language Processing Of Tunisian Dialect using Standard Arabic Tools and Resources : application to Part-Of-Speech TaggingHamdi, Ahmed 04 December 2015 (has links)
Le développement d’outils de traitement automatique pour les dialectes de l’arabe se heurte à l’absence de ressources pour ces derniers. Comme conséquence d’une situation de diglossie, il existe une variante de l’arabe, l’arabe moderne standard, pour laquelle de nombreuses ressources ont été développées et ont permis de construire des outils de traitement automatique de la langue. Étant donné la proximité des dialectes de l’arabe, avec l’arabe moderne standard, une voie consiste à réaliser une conversion surfacique du dialecte vers l’arabe mo- derne standard afin de pouvoir utiliser les outils existants pour l’arabe standard. Dans ce travail, nous nous intéressons particulièrement au traitement du dialecte tunisien. Nous proposons un système de conversion du tunisien vers une forme approximative de l’arabe standard pour laquelle l’application des outils conçus pour ce dernier permet d’obtenir de bons résultats. Afin de valider cette approche, nous avons eu recours à un étiqueteur morphosyntaxique conçu pour l’étiquetage de l’arabe standard. Ce dernier permet d’assigner des étiquettes morphosyntaxiques à la sortie de notre système de conver- sion. Ces étiquettes sont finalement projetées sur le tunisien. Notre système atteint une précision de 89% suite à la conversion qui repré- sente une augmentation absolue de ∼20% par rapport à l’étiquetage d’avant la conversion. / Developing natural language processing tools usually requires a large number of resources (lexica, annotated corpora, ...), which often do not exist for less- resourced languages. One way to overcome the problem of lack of resources is to devote substantial efforts to build new ones from scratch. Another approach is to exploit existing resources of closely related languages. Taking advantage of the closeness of standard Arabic and its dialects, one way to solve the problem of limited resources, consists in performing a conversion of Arabic dialects into standard Arabic in order to use the tools developed to handle the latter. In this work, we focus especially on processing Tunisian Arabic dialect. We propose a conversion system of Tunisian into a closely form of standard Arabic for which the application of natural language processing tools designed for the latter provides good results. In order to validate our approach, we focused on part-of-speech tagging. Our system achieved an accuracy of 89% which presents ∼20% of absolute improvement over a standard Arabic tagger baseline.
|
7 |
On Computational Stylistics : mining Literary Texts for the Extraction of Characterizing Stylistic Patterns / De la stylistique computationnelle : fouille de textes littéraires pour l'extraction de motifs stylistiques caractérisantsBoukhaled, Mohamed Amine 13 September 2016 (has links)
Notre thèse se situe dans le domaine interdisciplinaire de la stylistique computationnelle, à savoir l'application des méthodes statistiques et computationnelles à l'étude du style littéraire. Historiquement, la plupart des travaux effectués en stylistique computationnelle se sont concentrés sur les aspects lexicaux. Dans notre thèse, l’accent est mis sur l'aspect syntaxique du style qui est beaucoup plus difficile à analyser étant donné sa nature abstraite. Comme contribution principale, dans cette thèse, nous travaillons sur une approche à l'étude stylistique computationnelle de textes classiques de littérature française d'un point de vue herméneutique, où découvrir des traits linguistiques intéressants se fait sans aucune connaissance préalable. Plus concrètement, nous nous concentrons sur le développement et l'extraction des motifs morphosyntaxiques. Suivant la ligne de pensée herméneutique, nous proposons un processus de découverte de connaissances pour la caractérisation stylistique accentué sur la dimension syntaxique du style et permettant d'extraire des motifs pertinents à partir d'un texte donné. Ce processus proposé consiste en deux étapes principales, une étape d'extraction de motifs séquentiels suivi de l'application de certaines mesures d'intérêt. En particulier, l'extraction de tous les motifs syntaxiques possibles d'une longueur donnée est proposée comme un moyen particulièrement utile pour extraire des caractéristiques intéressantes dans un scénario exploratoire. Nous proposons, évaluons et présentons des résultats sur les trois mesures d'intérêt proposées, basée chacune sur un raisonnement théorique linguistique et statistique différent. / The present thesis locates itself in the interdisciplinary field of computational stylistics, namely the application of statistical and computational methods to the study of literary style. Historically, most of the work done in computational stylistics has been focused on lexical aspects especially in the early decades of the discipline. However, in this thesis, our focus is put on the syntactic aspect of style which is quite much harder to capture and to analyze given its abstract nature. As main contribution, we work on an approach to the computational stylistic study of classic French literary texts based on a hermeneutic point of view, in which discovering interesting linguistic patterns is done without any prior knowledge. More concretely, we focus on the development and the extraction of complex yet computationally feasible stylistic features that are linguistically motivated, namely morpho-syntactic patterns. Following the hermeneutic line of thought, we propose a knowledge discovery process for the stylistic characterization with an emphasis on the syntactic dimension of style by extracting relevant patterns from a given text. This knowledge discovery process consists of two main steps, a sequential pattern mining step followed by the application of some interestingness measures. In particular, the extraction of all possible syntactic patterns of a given length is proposed as a particularly useful way to extract interesting features in an exploratory scenario. We propose, carry out an experimental evaluation and report results on three proposed interestingness measures, each of which is based on a different theoretical linguistic and statistical backgrounds.
|
8 |
Approche multi-niveaux pour l'analyse des données textuelles non-standardisées : corpus de textes en moyen français / Multi-level approach for the analysis of non-standardized textual data : corpus of texts in middle frenchAouini, Mourad 19 March 2018 (has links)
Cette thèse présente une approche d'analyse des textes non-standardisé qui consiste à modéliser une chaine de traitement permettant l’annotation automatique de textes à savoir l’annotation grammaticale en utilisant une méthode d’étiquetage morphosyntaxique et l’annotation sémantique en mettant en œuvre un système de reconnaissance des entités nommées. Dans ce contexte, nous présentons un système d'analyse du Moyen Français qui est une langue en pleine évolution dont l’orthographe, le système flexionnel et la syntaxe ne sont pas stables. Les textes en Moyen Français se singularisent principalement par l’absence d’orthographe normalisée et par la variabilité tant géographique que chronologique des lexiques médiévaux.L’objectif est de mettre en évidence un système dédié à la construction de ressources linguistiques, notamment la construction des dictionnaires électroniques, se basant sur des règles de morphologie. Ensuite, nous présenterons les instructions que nous avons établies pour construire un étiqueteur morphosyntaxique qui vise à produire automatiquement des analyses contextuelles à l’aide de grammaires de désambiguïsation. Finalement, nous retracerons le chemin qui nous a conduits à mettre en place des grammaires locales permettant de retrouver les entités nommées. De ce fait, nous avons été amenés à constituer un corpus MEDITEXT regroupant des textes en Moyen Français apparus entre le fin du XIIIème et XVème siècle. / This thesis presents a non-standardized text analysis approach which consists a chain process modeling allowing the automatic annotation of texts: grammar annotation using a morphosyntactic tagging method and semantic annotation by putting in operates a system of named-entity recognition. In this context, we present a system analysis of the Middle French which is a language in the course of evolution including: spelling, the flexional system and the syntax are not stable. The texts in Middle French are mainly distinguished by the absence of normalized orthography and the geographical and chronological variability of medieval lexicons.The main objective is to highlight a system dedicated to the construction of linguistic resources, in particular the construction of electronic dictionaries, based on rules of morphology. Then, we will present the instructions that we have carried out to construct a morphosyntactic tagging which aims at automatically producing contextual analyzes using the disambiguation grammars. Finally, we will retrace the path that led us to set up local grammars to find the named entities. Hence, we were asked to create a MEDITEXT corpus of texts in Middle French between the end of the thirteenth and fifteenth centuries.
|
9 |
La négation simple et la négation composée en français préclassique / Simple negation and compound negation in pre-classical FrenchLafond-Zine, Claire 22 November 2014 (has links)
La question du système des morphèmes de la négation simple ou composée en français suscite depuis toujours l’intérêt de la linguistique mais reste traitée de manière fluctuante par la linguistique diachronique qui l’étudie de façon inégale selon les périodes de l’histoire du français. En effet, concernant la période préclassique (1550-1630), si cette question est régulièrement abordée, aucune étude approfondie et détaillée du système de la négation n’existe à ce jour. Ainsi, ce travail s’inscrit au croisement d’une double visée de la recherche en linguistique : d’une part, celle d’un éclairage nouveau sur la question des marques grammaticales de la négation en français ; d’autre part, celle d’une réactualisation des questionnements sur la langue préclassique qui, longtemps négligée, jouit depuis une vingtaine d’années d’un regain d’intérêt croissant. La finalité de cette étude est de proposer une description précise de l’organisation et du fonctionnement du système des signes grammaticaux de la négation simple et de la négation composée (non, ne, ne…pas, ne…point, ne…jamais, etc.) à travers leurs divers emplois et leurs jeux de concurrence, tels qu’ils apparaissent dans un vaste corpus de textes de la période préclassique (1550-1630). Les méthodes de la morphosyntaxe et de la sémantique se sont avérées ici tout à fait adéquates, tout comme le cadre théorique de la psychomécanique du langage dont les postulats permettent de traiter en profondeur les enjeux et les subtilités impliqués par cette recherche. / The issue of simple and compound negation morphemes system in French language has always attracted a lot of interest. However, diachronic linguistics tackles this question in an uneven way according to different periods of French language’s history. Thus, although it is regularly mentioned, no detailed study about system of negation in pre-Classical French (1550-1630) exists so far.Therefore, this work has dual benefits for linguistics research: on the one hand it sheds a new light on the question of grammatical markers of negation in French; on the other hand it renews questions on the pre-Classical French language, which has been a topic of growing interest over the last two decades.The goal of this research is first to offer a detailed description of the organisation and operation of the system of simple and compound negation grammatical markers (non, ne, ne…pas, ne…point, ne…jamais, etc.) according to their different usages as they appear in a large text corpus of pre-Classical period (1550-1630). Their competition is also investigated. Morphosyntax and semantic methods turned out to be very efficient, as well as the theoretical framework of language psychomecanics whose postulates allow an in depth analysis of the issues and intricacies involved in this research.
|
10 |
L'énoncé averbal en allemand et en kabyle (berbère) / Non-verbal utterance in German and Kabyle (Berber)Bouzidi, Said 10 July 2015 (has links)
Cette étude compare le fonctionnement de l’énoncé averbal (EAV) en kabyle et en allemand, en prenant comme cadre théorique la triade sémantico-logique établie par Zemb (1978), i. e. le thème (ce dont on parle), le rhème (ce qu’on en dit) et le phème (lieu d’articulation de la modalisation et de la négation) appliquée par Behr et Quintin (1996) et Behr (2013) à la catégorisation des EAV de l’allemand. Nous postulons que chaque langue dispose de moyens morphosyntaxiques, contextuelles et situationnelles contribuant à la réalisation d’EAV et que ces moyens sont plus étendus en kabyle. Nous supposons qu’il existe des structures sémantico-logiques uniques qui pourraient s’exprimer à travers des structures morphosyntaxiques variées. Nous supposons enfin que les EAV réalisent toutes les modalités, disposent de moyens morphologiques et/ ou contextuels permettant de les localiser dans le cadre temporel. Parmi les résultats, nous avons constaté que les EAV sont plus fréquents en kabyle grâce aux structures prédicatives grammaticalisées, sauf l’EAV représentant une continuité syntaxique avec le segment de gauche dont la fréquence en allemand est due au scrambling. Au niveau syntaxique, la pré-/postposition du thème par rapport au rhème obéit à des contraintes liées à la langue, i. e. l’état du nom en kabyle et la définitude du GN en allemand ; des contraintes propres à l’EAV se manifestent dans la prédilection pour l’ordre rhème-thème en allemand. Les EAV expriment toutes les modalités, ils sont situés dans le temps par les circonstants, certains démonstratifs ou le contexte, et les nominalisations en tant que rhème existentiel expriment l’aspectualité télique et atélique. / The study compares the functioning of non-verbal utterances in German and Kabyle (Berber) using the Zemb’s (1978) semantico-logical triad as a theoretical framework, i.e. the theme (what is being talked about), the rheme (what is said about the theme) and the phème (place of articulation of modalisation and negation), applied by Behr and Quintin (1996) and Behr (2013) to categorisation of German non-verbal utterances. We posit that each language has morphosyntactic, contextual and situational means allowing the construction of non-verbal utterances and that these means are more extensive in Kabyle.We also hypothesise that there are unique semantico-logical structures which could be expressed through varied morphosyntactical structures. Finally, we presume that non-verbal utterances express all the modalities; they have morphological and/ or contextual possibilities which locate them within the temporal framework. We have observed, among other results, that the frequency of non-verbal utterances is higher in Kabyle due to grammaticalized predicative structures, except for those depending syntactically on a main sentence, which could be explained by the scrambling-process. At the syntactic level, the pre-/postposition of the rheme in relation to the theme is subject to language specific constraints, i.e. changes in the noun state in Kabyle, the determination and definiteness in German; constraints concerning non-verbal utterances appear in the preference of the rheme-theme order in German. Non-verbal utterances express all modalities; they are located in time by circumstances, by some demonstratives or by the context, and nominalisations as existential rheme express telic and atelic aspectuality.
|
Page generated in 0.0716 seconds