Global ETD Search

1	Outils et ressources linguistiques pour l'alignement de textes multilingues français-vietnamiens Nguyen, Thi Minh Huyen 10 October 2006 (has links) (PDF) Le travail présenté dans ce mémoire porte sur la construction des outils et ressources linguistiques pour les tâches fondamentales de traitement automatique de la langue vietnamienne, dans un contexte monolingue ainsi que multilingue. Nous présentons pour cette langue encore peu étudiée des solutions possibles aux problèmes d'annotation morpho-syntaxique (définition de descripteurs lexicaux « de référence », construction d'un lexique avec ces descriptions, des outils de segmentation et d'étiquetage lexical), d'analyse syntaxique (première tentative de modélisation de la grammaire vietnamienne en employant le formalisme TAG, cadre de construction de ressources pour l'analyse syntaxique) et d'alignement multilingue (constitution d'un corpus multilingue, développement d'un système d'alignement multilingue). Afin d'assurer la réutilisabilité des travaux réalisés, et dans l'espoir de les voir stimuler le développement du TAL au Vietnam, nous avons apporté une attention particulière aux questions de normalisation de la gestion des ressources linguistiques. Traitement automatique des langues vietnamien analyse morphosyntaxique analyse syntaxique alignement multilingue
2	La négation simple et la négation composée en français préclassique / Simple negation and compound negation in pre-classical French Lafond-Zine, Claire 22 November 2014 (has links) La question du système des morphèmes de la négation simple ou composée en français suscite depuis toujours l’intérêt de la linguistique mais reste traitée de manière fluctuante par la linguistique diachronique qui l’étudie de façon inégale selon les périodes de l’histoire du français. En effet, concernant la période préclassique (1550-1630), si cette question est régulièrement abordée, aucune étude approfondie et détaillée du système de la négation n’existe à ce jour. Ainsi, ce travail s’inscrit au croisement d’une double visée de la recherche en linguistique : d’une part, celle d’un éclairage nouveau sur la question des marques grammaticales de la négation en français ; d’autre part, celle d’une réactualisation des questionnements sur la langue préclassique qui, longtemps négligée, jouit depuis une vingtaine d’années d’un regain d’intérêt croissant. La finalité de cette étude est de proposer une description précise de l’organisation et du fonctionnement du système des signes grammaticaux de la négation simple et de la négation composée (non, ne, ne…pas, ne…point, ne…jamais, etc.) à travers leurs divers emplois et leurs jeux de concurrence, tels qu’ils apparaissent dans un vaste corpus de textes de la période préclassique (1550-1630). Les méthodes de la morphosyntaxe et de la sémantique se sont avérées ici tout à fait adéquates, tout comme le cadre théorique de la psychomécanique du langage dont les postulats permettent de traiter en profondeur les enjeux et les subtilités impliqués par cette recherche. / The issue of simple and compound negation morphemes system in French language has always attracted a lot of interest. However, diachronic linguistics tackles this question in an uneven way according to different periods of French language’s history. Thus, although it is regularly mentioned, no detailed study about system of negation in pre-Classical French (1550-1630) exists so far.Therefore, this work has dual benefits for linguistics research: on the one hand it sheds a new light on the question of grammatical markers of negation in French; on the other hand it renews questions on the pre-Classical French language, which has been a topic of growing interest over the last two decades.The goal of this research is first to offer a detailed description of the organisation and operation of the system of simple and compound negation grammatical markers (non, ne, ne…pas, ne…point, ne…jamais, etc.) according to their different usages as they appear in a large text corpus of pre-Classical period (1550-1630). Their competition is also investigated. Morphosyntax and semantic methods turned out to be very efficient, as well as the theoretical framework of language psychomecanics whose postulates allow an in depth analysis of the issues and intricacies involved in this research. Négation simple Négation composée Français préclassique Morphèmes négatifs Analyse morphosyntaxique Sémantique Psychomécanique du langage Linguistique diachronique Simple negation Compound negation Pre-classical French Negatives morphemes Morphosyntactic analysis Semantics Psychomechanics of language Diachronic linguistics
3	Codes linguistiques et alternance de codes chez les immigrants égyptiens en France / Language codes and code switching among the Egyptian immigrants in France El Shafey, Ezzat 21 June 2019 (has links) Cette thèse étudie pour la première fois les pratiques langagières de la communauté grandissante des immigrés égyptiens en France. L’analyse morphosyntaxique a comme cadre la théorie insertionnelle Matrix Language Frame de Myers-Scotton (1993, 1997 et 2000). Nous constatons que les Égyptiens de la première génération recourent à l’alternance codique sans s’en rendre compte ou sans le reconnaître tandis que ceux de la deuxième génération sont conscients des caractéristiques linguistiques nées du contact des langues. De plus, la femme égyptienne, avec son rôle de maintien de l’arabe auprès de ses enfants, trouve sa féminité dans l’apprentissage du français et par conséquent elle joue un rôle important dans la pratique de l’alternance codique au sein de la famille. Les raisons de l’alternance codique chez les Égyptiens sont variées, par exemple : la citation ou le discours rapporté ; la désignation d’un interlocuteur en faisant intégrer à un groupe un interlocuteur tenu à l’écart ; l’humour qui caractérise notamment les Égyptiens de la première génération ; la spontanéité et la précision en optant directement pour le lexème le plus immédiatement disponible, même s’il est dans une langue différente par rapport au reste de la communication. Nos informateurs de la première génération ont recours aux procédés morphologiques pour simplifier l’usage des mots français ayant des sons qui n’existent pas en arabe égyptien ou ceux qui se composent de plus de trois syllabes. Nous exploitons les caractéristiques de ce contact des langues pour aider les élèves égyptiens nouvellement arrivés à réussir leur scolarité et s’intégrer dans la société française via la maîtrise du français. / This thesis analyses for the first time the language practices of the growing community of Egyptian immigrants in France. The morphosyntactical analysis is made in the framework of insertional theory Matrix Language Frame of Myers-Scotton (1993, 1997 and 2000). We find that the Egyptians of the first generation resort to code switching without realizing it or recognizing it while those of second generation are aware of the linguistic characteristics of the language contact. Furthermore, the Egyptian woman, with her role of maintaining Arabic with her children, finds her femininity in learning French and therefore she plays an important role in the practice of code switching within the family. The reasons of the code switching in the Egyptian community are varied, for example, the quotation or the reported speech ; the designation of an interlocutor by integrating into a group an interlocutor kept apart ; the humor that particularly characterizes the Egyptians of the first generation ; the spontaneity and the precision by opting directly for the most immediately available lexeme even if it is in a different language than the rest of the communication. Our informants of the first generation use morphological procedures to simplify the use of French words having sounds that don’t exist in Egyptian Arabic or those that consist of more than three syllables. We use the characteristics of this language contact to help Egyptian students newlly arrived to succeed in their schooling and integrate into the French society through the mastering of French language. Alternance codique Intra-phrastique Myers-Scotton Analyse morphosyntaxique Raisons d'alternance codique Emprunt Calque UPE2A Code switching Intra-Sentential Myers-Scotton Morphosyntactic analysis Reasons of code switching Borrowing Layer
4	L'identification des entités nommées en arabe en vue de leur extraction et classification automatiques : la construction d’un système à base de règles syntactico-sémantique / Identification of arabic named entities with a view to their automatique extraction an classification : a syntactico-semantic rule based system Asbayou, Omar 01 December 2016 (has links) Cette thèse explique et présente notre démarche de la réalisation d’un système à base de règles de reconnaissance et de classification automatique des EN en arabe. C’est un travail qui implique deux disciplines : la linguistique et l’informatique. L’outil informatique et les règles la linguistiques s’accouplent pour donner naissance à une nouvelle discipline ; celle de « traitement automatique des langues », qui opère sur des niveaux différents (morphosyntaxique, syntaxique, sémantique, syntactico-sémantique etc.). Nous avons donc, dans ce qui nous concerne, mis en œuvre des informations et règles linguistiques nécessaires au service du logiciel informatique, qui doit être en mesure de les appliquer, pour extraire et classifier, par des annotations syntaxiques et/ou sémantiques, les différentes classes d’entités nommées.Ce travail de thèse s’inscrit donc dans un cadre général de traitement automatique des langues, mais plus particulièrement dans la continuité des travaux réalisés au niveau de l’analyse morphosyntaxique par la conception et la réalisation des bases des données lexicales SAMIA et ensuite DIINAR avec l’ensemble de résultats de recherches qui en découlent. C’est une tâche qui vise à l’enrichissement lexical par des entités nommées simples et complexes, et qui veut établir la transition de l’analyse morphosyntaxique vers l’analyse syntaxique, et syntatico-sémantique dans une visée plus générale de l’analyse du contenu textuel. Pour comprendre de quoi il s’agit, il nous était important de commencer par la définition de l’entité nommée. Et pour mener à bien notre démarche, nous avons distingué entre deux types principaux : pur nom propre et EN descriptive. Nous avons aussi établi une classification référentielle en se basant sur diverses classes et sous-classes qui constituent la référence de nos annotations sémantiques. Cependant, nous avons dû faire face à deux difficultés majeures : l’ambiguïté lexicale et les frontières des entités nommées complexes. Notre système adopte une approche à base de règles syntactico-sémantiques. Il est constitué, après le Niveau 0 d’analyse morphosyntaxique, de cinq niveaux de construction de patrons syntaxiques et syntactico-sémantiques basés sur les informations linguistique nécessaires (morphosyntaxiques, syntaxiques, sémantique, et syntactico-sémantique). Ce travail, après évaluation en utilisant deux corpus, a abouti à de très bons résultats en précision, en rappel et en F–mesure. Les résultats de notre système ont un apport intéressant dans différents application du traitement automatique des langues notamment les deux tâches de recherche et d’extraction d’informations. En effet, on les a concrètement exploités dans les deux applications (recherche et extraction d’informations). En plus de cette expérience unique, nous envisageons par la suite étendre notre système à l’extraction et la classification des phrases dans lesquelles, les entités classifiées, principalement les entités nommées et les verbes, jouent respectivement le rôle d’arguments et de prédicats. Un deuxième objectif consiste à l’enrichissement des différents types de ressources lexicales à l’instar des ontologies. / This thesis explains and presents our approach of rule-based system of arabic named entity recognition and classification. This work involves two disciplines : linguistics and computer science. Computer tools and linguistic rules are merged to give birth to a new discipline : Natural Languge Processsing, which operates in different levels (morphosyntactic, syntactic, semantic, syntactico-semantic…). So, in our particular case, we have put the necessary linguistic information and rules to software sevice. This later should be able to apply and implement them in order to recognise and classify, by syntactic and semantic annotations, the different named entity classes.This work of thesis is incorporated within the general domain of natural language processing, but it particularly falls within the scope of the continuity of the accomplished work in terms of morphosyntactic analysis and the realisation of lexical data bases of SAMIA and then DIINAR as well as the accompanying scientific recearch. This task aimes at lexical enrichement with simple and complex named entities and at establishing the transition from the morphological analysis into syntactic and syntactico-semantic analysis. The ultimate objective is text analysis. To understand what it is about, it was important to start with named entity definition. To carry out this task, we distinguished between two main named entity types : pur proper name and descriptive named entities. We have also established a referential classification on the basis of different classes and sub-classes which constitue the reference for our semantic annotations. Nevertheless, we are confronted with two major difficulties : lexical ambiguity and the frontiers of complex named entities. Our system adoptes a syntactico-semantic rule-based approach. After Level 0 of morpho-syntactic analysis, the system is made up of five levels of syntactic and syntactico-semantic patterns based on tne necessary linguisic information (i.e. morphosyntactic, syntactic, semantic and syntactico-semantic information).This work has obtained very good results in termes of precision, recall and F-measure. The output of our system has an interesting contribution in different applications of the natural language processing especially in both tasks of information retrieval and information extraction. In fact, we have concretely exploited our system output in both applications (information retrieval and information extraction). In addition to this unique experience, we envisage in the future work to extend our system into the sentence extraction and classification, in which classified entities, mainly named entities and verbs, play respectively the role of arguments and predicates. The second objective consists in the enrichment of different types of lexical resources such as ontologies. Entités nommées en arabe Système à base de règles Règles syntacttico-sémantiques Attributs des classes Niveaux de règles Analyse morphosyntaxique DIINAR Analyse syntaxique Relations sémantiques Déclencheurs Arabic named entities Rule base syntem Syntacttico-sémantic rules Class attributes Rule levels Morphosyntactic analysis DIINAR Syntactic analysis Semantic relations Trigger words 492.7

1

Page generated in 0.1176 seconds