51 |
Le développement de corpus annotés pour la langue arabe / Building annotated corpora for the Arabic languageZaghouani, Wajdi 06 January 2015 (has links)
L’objectif de cette thèse est de montrer les différentes facettes de l’annotation de corpus dans la langue arabe. Nous présentons nos travaux scientifiques sur l’annotation de corpus et sur la création de ressources lexicales dans la langue arabe. D’abord, nous discutons des méthodes, des difficultés linguistiques, des guides d’annotation, de l’optimisation de l’effort d’annotation, ainsi que de l’adaptation à la langue arabe de procédures d’annotation existantes. Ensuite, nous montrons la complémentarité entre les différentes couches d’annotation. Enfin, nous illustrons l’importance de ces travaux pour le traitement automatique des langues en illustrant quelques exemples de ressources et d’applications. / The goal of this thesis is to show the various aspects of corpus annotation in the Arabic language. We present our publications on corpus annotation and lexical resources creation in the Arabic language. First, we discuss the methods, the language difficulties, the annotation guidelines, the annotation effort optimization limits and how we adapted some of the existing annotation procedures to the Arabic language. Furthermore, we show the complementarity between the different layers of annotations. Finally, we illustrate the importance of our work for natural language processing by illustrating some examples of resources and applications.
|
52 |
La sensibilité précoce à la morphologie dans l'acquisition de la lecture et de l'orthographe en langue arabeEl Akiki, Carole 12 September 2018 (has links)
Studies in alphabetic languages suggest the presence of morphological processing in reading already at the beginning of learning (Casalis et al, 2015). The linguistic characteristics of Arabic, particularly its richness in morphological derivations, could have implications for the acquisition of reading and spelling. In expert readers, studies with priming techniques showed morphological decomposition of Arabic words (Boudelaa and Marslen-Wilson, 2015) but there is almost no research available on beginning readers. In addition, derived words in Arabic (example: kātib) are formed from the combination of a consonantal root (K-T-B) and a vocal pattern (_ā_i_). These two morphemes cannot be isolated either aurally or visually as independent units but are part of an abstract mental representation. This could make their identification difficult for beginning readers. Our thesis aims at evaluating the presence of morphological processes in the recognition of written words, with 139 Lebanese children, from the first to the fourth grade. In a first cross-sectional study, we examined the effect of root and pattern frequency on reading and the contribution of morphological and phonological knowledge to the reading of words and pseudowords and to the comprehension of written words. In the second study, we looked for the presence of this effect in spelling. The third study is longitudinal. The same children carried out, one year after the first evaluation, the tests of the cross-sectional study.The results suggest that the ability to read and spell in Arabic is influenced very early by the awareness of the morphological composition, more specifically the familiarity with the patterns. / Les études sur les langues alphabétiques suggèrent la présence de traitements morphologiques en lecture même en début d’apprentissage (Casalis et al, 2015). Les spécificités linguistiques de l’arabe, plus particulièrement la richesse en dérivations morphologiques, pourraient avoir des implications sur l’acquisition de la lecture et de l’orthographe. Les études par des techniques d’amorçage ont montré une décomposition morphologique des mots en arabe chez le lecteur expert (Boudelaa et Marslen-Wilson, 2015) mais il n’y a presque pas de recherches disponibles sur le début d’apprentissage. Par ailleurs, les mots dérivés en arabe (exemple :kātib) sont formés à partir de la combinaison d’une racine consonantique (k-t-b) et d’un schème vocalique (_ā_i_). Ces deux morphèmes ne peuvent être isolés auditivement ou visuellement en unités indépendantes mais ils font partie d’une représentation mentale abstraite. Ceci pourrait rendre leur identification difficile pour des apprentis lecteurs. Notre thèse vise l’évaluation de la présence de traitements morphologiques dans la reconnaissance des mots écrits, auprès de 139 enfants libanais, de la première à la quatrième année de primaire. Dans une première étude transversale, nous avons examiné l’effet de la fréquence de la racine et du schème sur la lecture ainsi que la contribution des connaissances morphologiques et phonologiques à la lecture de mots et de pseudomots et à la compréhension de mots écrits. Dans la deuxième étude, nous avons recherché la présence de cet effet en orthographe. La troisième étude est longitudinale. Les mêmes enfants ont effectué, un an après la première passation, les tests de l’étude transversale.Les résultats suggèrent que la capacité de lecture et d’orthographe en arabe est influencée très tôt par la prise de conscience de la composition morphologique, plus spécifiquement la familiarité avec les schèmes. / Doctorat en Sciences psychologiques et de l'éducation / info:eu-repo/semantics/nonPublished
|
53 |
Langue italienne en bouche marocaine – la prononciation des voyelles italiennes par des étudiants arabophones / Italian through the mouths of Moroccans – the pronunciation of Italian vowels by Arabic-speaking learnersSalah Eddine, Tarik 18 May 2016 (has links)
La présente thèse est dédiée à l'étude du système vocalique de l'interlangue desMarocains étudiant la langue italienne (LE), et ce dans le but de déterminer lalangue qui a le plus d’influence sur la prononciation correcte des voyellesitaliennes: l’arabe (LM) ou le français (L2).La partie expérimentale de l’étude a eu lieu au sein de la Faculté de Ain Chock-Casablanca, au cours de l'année scolaire 2012-2013. Dans le but de constituer unebase de données, sur laquelle cette étude est basée, des étudiants ont étéenregistrés en train de lire une liste de phrases contenant des paires minimales.Pour vérifier leur prononciation nous nous sommes appuyé sur un groupe decontrôle natif de langue italienne. Toutes les données ont été, dans une secondephase, traitées avec Praat et analysées dans une feuille de calcul Excel (LFSAG).Pour la visualisation des voyelles nous avons utilisé le plan classique F1-F2.Après avoir analysé les différentes erreurs de prononciation des voyellesitaliennes, nous avons remarqué qu’elles sont souvent attribuables à des difficultésphonologiques dues à l'échange des phonèmes /i/ avec /e/ et /u/ avec /o/ et viceversa.Les résultats obtenus révèlent que l'interférence de la langue française estmoins importante et qu’elle se produit uniquement dans le cas des mots qui ont lemême aspect graphique. Aussi, l’étude réalisée montre que l’arabe est la languequi influe le plus sur la prononciation des voyelles italiennes.En effet, une analyse du système phonologique de la langue arabe et du dialectemarocain révèle qu’il se caractérise par des modalités d’articulation secondairesramenées traditionnellement au concept d’emphase. Ces dernières modifient letimbre de la consonne affectée qui, à son tour, détermine le timbre de la voyellequi l’entoure. Si l'articulation des voyelles italiennes est indépendante du contexteconsonantique, celle des voyelles arabes est en partie dépendante de la consonnequi les précède ou qui les suit. Au contact avec une consonne emphatique, letimbre des voyelles change, le /u/ est articulé comme [o], et le /i/ comme un [e] etvice-versa.Les résultats obtenus dans cette recherche confirment que les facteurs influençantla prononciation des voyelles italiennes sont les modalités emphatiques présentesen arabe. Ces difficultés peuvent être surmontées à l’aide d’exercices spécifiquespermettant aux étudiants d’acquérir de nouvelles habitudes d'articulation menant àune bonne prononciation de la langue italienne / This thesis is dedicated to the analysis of the vocalic system of the interlanguageof Moroccan students of Italian (FL). The aim of this work is to determine whichis the language that has the biggest influence on the pronunciation of Italianvowels: Arabic (NL) or French (L2).The empirical part of this research took place in the faculty of Ain Chock-Casablanca, during the academic year 2012-2013. The informants, on whose datathe research is based, were been recorded while reading a list of sentences whichcontains minimal pairs. In order to verify the correct pronunciation we used acontrol group of Italian natives (recorded at the University of Turin). All the oraldata were treated with PRAAT and analyzed in an electronic document (LFSAG).For visualization of the vowel spaces we opted for the measurement of the firstand the second formants and their display in F1-F2 diagrams.After analyzing the different errors of pronunciation of the Italian vowels wenoticed that they are attributable to phonological difficulties due to vocalicexchange of the phonemes /e/ with /i/ and /o/ with /u/ and vice-versa. Additionallythe results show that the interference of the French language less than expected,and only occurs when there are two words with the same graphical aspect. Arabic,on the other hand, as the mother tongue of all the informants, is the languagewhich has the most effect on the pronunciation Italian vowels.The analysis of the phonological system of both Moroccan and standard Arabichas revealed that it is characterized by secondary articulation manners which aretraditionally attributed to emphasis, which modifies the timbre of the consonant.The consonant in its turn change that of the adjacent vowel. While the articulationof the Italian vowels is more independent from the consonantal context, thearticulation of the Arabic vowels appears to be dependent on the context sincetheir timbre depends partially on the preceding and following consonants: if theseare emphatic, then the vowel is emphatic ([e], [o]), and if they are not emphatic,then the vowel is non emphatic ([i], [u]).The results obtained in this research confirm that what affects the pronunciation ofthe vowels are the emphatic modes present in Moroccan and standard Arabic.These difficulties can be overcome with specific exercises, which allow thestudents to acquire new articulatory habits in order to reach a good pronunciationof the Italian language. / La presente tesi è dedicata all’analisi del sistema vocalico dell’interlingua deglistudenti marocchini di italiano (LS) per risalire alla lingua che interferisce di piùsulla corretta pronuncia delle vocali italiane: arabo (LM) o francese (L2).La parte empirica si è svolta presso la Facoltà di Ain Chock-Casablanca (FLSU),durante l’anno scolastico 2012-2013. Gli informanti, sui cui dati si basa la ricerca,sono stati registrati mentre leggevano una lista di frasi contenenti coppie minime.Per verificare la loro pronuncia ci siamo affidati a un gruppo di controllo nativo diitaliano (registrato presso l’Università di Torino). Tutti i dati orali sono statitrattati in una seconda fase con PRAAT e analizzati in un foglio elettronicopredisposto per la rappresentazione dei grafici (LFSAG). Per la visualizzazionedelle vocali abbiamo optato per la misura della prima e della seconda formante ela rappresentazione sui classici diagrammi F1 - F2.Dopo aver analizzato i diversi errori di pronuncia delle vocali italiane abbiamonotato che sono prevalentemente riconducibili a difficoltà fonologiche dovute alloscambio vocalico del fonema /e/ col fonema /i/ e del fonema /o/ col fonema /u/ eviceversa. I risultati ottenuti rivelano che l’interferenza della lingua francese èminore del previsto e si verifica quando si hanno due parole che presentano lostesso aspetto grafico. Quanto all’arabo è la lingua che influisce molto di più sullapronuncia delle vocali italiane essendo la madrelingua di tutti gli informanti.In effetti, l’analisi del sistema fonologico sia dell’arabo marocchino sia di quellostandard, rivela che si caratterizza per la presenza di modalità articolatoriesecondarie, ricondotte tradizionalmente alla cosiddetta enfasi che cambia il timbrodella consonate che a sua volta cambia quello della vocale adiacente. Sel’articolazione delle vocali italiane risulta più indipendente dal contestoconsonantico, quella delle vocali arabe, invece, avviene in modo dipendente dalcontesto dato che il loro timbro dipende in parte dalla consonante che precede osegue, cioè se è enfatica ne consegue una vocale enfatica ([e], [o]), e se invecenon è enfatica ne consegue una vocale non enfatica ([i], [u]).I risultati ottenuti in questa ricerca confermano che ciò che influisce sullapronuncia delle vocali italiane sono le modalità enfatiche presenti sia in dialettomarocchino sia in lingua araba. Tali difficoltà possono essere superate con degliesercizi specifici permettendo agli studenti di acquisire nuove abitudiniarticolatorie cui consegue una buona pronuncia della lingua italiana
|
54 |
Construction de ressources linguistiques arabes à l’aide du formalisme de grammaires de propriétés en intégrant des mécanismes de contrôle / Building arabic linguistic resources using the property grammar formalism by integrating control mechanismsBensalem, Raja 14 December 2017 (has links)
La construction de ressources linguistiques arabes riches en informations syntaxiques constitue un enjeu important pour le développement de nouveaux outils de traitement automatique. Cette thèse propose une approche pour la création d’un treebank de l’arabe intégrant des informations d’un type nouveau reposant sur le formalisme des Grammaires de Propriétés. Une propriété syntaxique caractérise une relation pouvant exister entre deux unités d’une certaine structure syntaxique. Cette grammaire est induite automatiquement à partir du treebank arabe ATB, ce qui constitue un enrichissement de cette ressource tout en conservant ses qualités. Cet enrichissement a été également appliqué aux résultats d’analyse d’un analyseur état de l’art du domaine, le Stanford Parser, offrant la possibilité d’une évaluation s’appuyant sur un ensemble de mesures obtenues à partir de cette ressource. Les étiquettes des unités de cette grammaire sont structurées selon une hiérarchie de types permettant la variation de leur degré de granularité, et par conséquent du degré de précision des informations. Nous avons pu ainsi construire, à l’aide de cette grammaire, d’autres ressources linguistiques arabes. En effet, sur la base de cette nouvelle ressource, nous avons développé un analyseur syntaxique probabiliste à base de propriétés syntaxiques, le premier appliqué pour l'arabe. Une grammaire de propriétés lexicalisée probabiliste fait partie de son modèle d’apprentissage pour pouvoir affecter positivement le résultat d’analyse et caractériser ses structures syntaxiques avec les propriétés de ce modèle. Nous avons enfin évalué les résultats obtenus en les comparant à celles du Stanford Parser. / The building of syntactically informative Arabic linguistic resources is a major issue for the development of new machine processing tools. We propose in this thesis to create an Arabic treebank that integrates a new type of information, which is based on the Property Grammar formalism. A syntactic property is a relation between two units of a given syntactic structure. This grammar is automatically induced from the Arabic treebank ATB. We enriched this resource with the property representations of this grammar, while retaining its qualities. We also applied this enrichment to the parsing results of a state-of-the-art analyzer, the Stanford Parser. This provides the possibility of an evaluation using a measure set, which is calculated on this resource. We structured the tags of the units in this grammar according to a type hierarchy. This permit to vary the granularity level of these units, and consequently the accuracy level of the information. We have thus been able to construct, using this grammar, other Arabic linguistic resources. Secondly, based on this new resource, we developed a probabilistic syntactic parser based on syntactic properties. This is the first analyzer of this type that we have applied to Arabic. In the learning model, we integrated a probabilistic lexicalized property grammar that may positively affect the parsing result and describe its syntactic structures with its properties. Finally, we evaluated the parsing results of this approach by comparing them to those of the Stanford Parser.
|
55 |
La diglossie et son influence sur la production langagière arabe : Étude théorique et pratique à partir de copies d’examen et d’un extrait télévisé / Diglossia and its influence on Arabic language production : Practical study based on exam papers and a television extractShahin, Fadi 26 November 2014 (has links)
Cette thèse est une étude de terrain portant sur la diglossie et la production langagière de l’arabe.Depuis l’article de Ferguson (1959), de nombreux travaux sont apparus, très souvent pour critiquer la vision dichotomique proposée par cet auteur.Après avoir retracé l’histoire de la langue arabe de ses origines à nos jours, nous avons étudié les travaux réalisés par les arabophones sur leur langue. Les linguistes arabophones, de l’époque médiévale jusqu’à la Naḥda, ont-Ils été conscients de la situation diglossique ? Partant de cette étude, nous avons voulu démontrer à travers deux corpus, l’un écrit, l’autre oral, l’étendue de l’influence de la variété basse (dialectale) sur la variété haute (littérale) dans la production langagière de la langue arabe. Dans cette perspective, nous avons utilisé des copies d’étudiants de différents niveaux, débutants, intermédiaires et avancés. Pour l’étude de l’oral, nous nous sommes appuyés sur un corpus médiatique.Peut-On faire usage d’une variété sans subir l’interférence de la seconde ? Telle est la question à laquelle nous tentons de répondre dans cette thèse. / This thesis is a field study on diglossia and Arabic language production. Since the article by Ferguson (1959), numerous studies have appeared, often criticizing the dichotomous vision proposed by this author.After tracing the history of the Arabic language from its origins to the present day, we have studied the works of Arabic-Speakers on their language. From medieval times until the Naḥda, were Arabic-Speaking linguists aware of the diglossic situation?Using this historical perspective as a point of departure, we wanted to demonstrate the extent of the influence of the low variety (vernacular) on the high variety (literary) in Arabic language production through two sets of language production, one written and one oral. With this in mind, we used exam papers of students of different levels: beginner, intermediate and advanced. For the study of the oral, we relied on a television extract.Can we make use of one variety without being subjected to interference from the second? This is the question that we attempt to address in this thesis.
|
56 |
Butrus al-Tûlâwî (1657-1746). Présentation de son oeuvre philosophique. Edition critique et traduction des deux premiers examens (bahth-s) du Livre de la Logique (al-Mantiq) / Butrus al-Tûlâwî (1656/7-1745/6). Presentation of his philosophical works. Critical edition and translation of the first two examinations (bahth-s) of the Book of Logic (al-Mantiq)Morel, Teymour 09 June 2018 (has links)
Originaire de Tūlā (Liban) le religieux maronite Buṭrus al-Tūlāwī (1657-1746) fut élève du Collège maronite de Rome où il suivit la totalité du cursus scolastique enseigné par les pères jésuites. Après son retour en Orient, il partit pour Alep pour servir son Église et y composa une importante œuvre philosophique et théologique. Il est certes bien connu des historiens pour son rôle dans l’histoire de l’Église maronite et pour la place que ses écrits occupèrent dans les sphères religieuse et intellectuelle au Proche-Orient. Toutefois, son œuvre philosophique n’a été que peu étudiée et n’a jamais fait l’objet d’une édition critique. Dans cette thèse, nous proposons une édition critique accompagnée d’une traduction française commentée des deux premiers examens (baḥṯ-s) du Livre de la Logique (al-Manṭiq), enseigné dès 1693. Cette partie est précédée par un inventaire détaillé des 153 témoins des textes philosophiques d’al-Tūlāwī, Logique y compris, inventaire dont les résultats servent de point de départ pour une réflexion sur la circulation de ce corpus. Nous consacrons le chapitre suivant à une analyse stemmatique des 24 témoins de la Logique, qui, sur les 29 répertoriés, nous sont accessibles pour mettre en évidence l’existence de trois versions distinctes dans lesquelles ce texte a circulé et qui jouent un rôle capital dans les principes de notre édition, qui est synoptique, et dans l’eliminatio codicum. Les références doctrinales employées par al-Tūlāwī dans ses traités sont variées et nombreuses. Nous présentons et référençons, au chapitre suivant, toutes les citations qui, dans la Logique, proviennent de deux grandes figures de la philosophie : Jean Damascène et Avicenne. / Born in Tūlā (Lebanon), the Maronite clergyman Buṭrus al-Tūlāwī (1657-1746) was a pupil at the Maronite College of Rome, where he followed the whole scholastic curriculum taught by Jesuit fathers. After his return to the East, he left for Aleppo to serve his Church and there he composed an important series of philosophical and theological works. To be sure, he is well known among historians for his role in the history of the Maronite Church and for the place his writings occupied in the religious and intellectual spheres in the Near-East. Nevertheless, his philosophical works have not been the object of much research so far and were never critically edited. In this dissertation, we offer a critical edition accompanied by a commented French translation of the two first examinations (baḥṯ-s) of the Book of Logic (al-Manṭiq), taught in 1693 onward. That part is preceded by a detailed inventory of the 153 witnesses of al-Tūlāwī’s philosophical texts, Logic included, the results of which constitute the starting point for a reflection on the circulation of this corpus. In the following chapter, we proceed to the stemmatic analysis of the 24 witnesses of the Logic to which we could have access out of the 29 listed, in order to underline the existence of three distinct versions in which this text circulated, and which are of paramount importance for the principles of our edition, which is synoptic, and for the eliminatio codicum. The doctrinal references used by al-Tūlāwī in his treatises are varied and numerous. We present and reference, in the following chapter, all the quotations which are, in the Logic, taken from two major figures of philosophy: John Damascene and Avicenna.
|
57 |
Méthodes d'acquisition terminologique en arabe : Application au domaine médical / Terminology acquisition methods in Arabic : Application in the medical domainNeifar, Wafa 18 March 2019 (has links)
L'objectif de cette thèse est de lever les verrous que constituent le manque de disponibilité de ressources ou d'outils TAL pour la langue arabe dans les domaines de spécialité en proposant des méthodes permettant l'extraction de termes à partir de textes en arabe standard moderne. Dans ce contexte, nous avons d'abord construit un corpus parallèle anglais-arabe dans un domaine de spécialité. Il s'agit d'un ensemble de textes médicaux produits par la bibliothèque nationale de médecine américaine (NLM). Par la suite, nous avons proposé des méthodes d'acquisition terminologique, permettant d'extraire des termes ou d'acquérir des relations entre ces termes, pour la langue arabe en se basant sur: i)adaptation d'un extracteur terminologique existant pour la languefrançaise ou anglaise, ii) l'exploitation de la translittération des termes anglais en caractères arabes et iii) l'application de la la notion de transfert translingue. Appliqué au niveau terminologique, le transfert consiste à mettre en œuvre un processus d'extraction de termes ou d'acquisition de relations entre termes sur des textes d'une langue source (ici, le français ou l'anglais) puis à transférer les informations extraites sur des textes d'une langue cible (ici, l’arabe standard moderne) pour ainsi identifier le même type d'informations terminologiques. Nous avons évalué les listes de termes monolingues et bilingues obtenues lors des différentes expériences que nous avons réalisées, suivant une méthode transparente, directe et semi-automatique: les termes candidats extraits sont confrontés à une terminologie de référence avant d'être vérifiés manuellement. Cette évaluation suit un protocole que nous avons proposé. / The goal of this thesis is to reduce the lack of available resources and NLP tools for Arabic language in specialised domains by proposing methods allowing the extraction of terms from texts in Modern Standard Arabic. In this context, we first constructed an English-Arabic parallel corous in a specific domain.It is a set of medical texts produced by the US National Library of Medicine (NLM). Thereafter, we have proposed terminological acquisition methods, toextract terms or acquire relations between these terms, for Arabic based on: i) the adaptation of an existing terminology extractor for French or English, ii) the transliteration of English terms in Arabic characters and iii) cross-lingual transfer. Applied at the terminological level, transfer aims to implement a process of term extraction or relationship acquisition between terms in the texts of a source language (here, French or English) and then to transfer the extracted information to target language texts (in this case, Modern Standard Arabic), thereby identifying the same type of terminologicalinformation. We have evaluated the monolingual and bilingual term lists that we have obtained by the experiments we carried out, according to a transparent, direct and semi-automatic method: the extracted term candidates are confronted with a reference terminology before being validated manually. This evaluation follows a protocol that we proposed.
|
58 |
Classifications et grammaires des invariants lexicaux arabes en prévision d’un traitement informatique de cette langue. Construction d’un modèle théorique de l’arabe : la grammaire des invariants lexicaux temporels / Classifications and grammars of Arab lexical invariants in anticipation of an automatic processing of this language. Construction of a theoretical model of Arabic : grammar of temporal lexical invariantsGhoul, Dhaou 07 December 2016 (has links)
Cette thèse porte sur la classification et le traitement des invariants lexicaux arabes qui expriment un aspect temporel afin de créer un modèle qui présente chaque invariant sous la forme d’un schéma de grammaire (automates à états finis). Dans ce travail nous avons limité notre traitement seulement pour 20 invariants lexicaux. Notre hypothèse part du principe que les invariants lexicaux sont situés au même niveau structural (formel) que les schèmes dans le langage quotient (squelette) de la langue arabe. Ils cachent beaucoup d’informations et entraînent des attentes syntaxiques qui permettent de prédire la structure de la phrase.Au début de cette thèse, nous abordons la notion « invariant lexical » en exposant les différents niveaux d’invariance. Ensuite, nous classons les invariants étudiés dans cette thèse selon plusieurs critères.La deuxième partie de cette thèse fait l’objet de notre propre étude concernant les invariants lexicaux temporels dans laquelle nous commençons par une présentation de notre méthode d’étude linguistique ainsi que la modélisation par schémas de grammaires des invariants lexicaux temporels étudiés. Ensuite, nous abordons l’analyse proprement dite des invariants lexicaux simples comme « ḥattā, baʿda » et complexes comme « baʿdamā, baynamā ».Enfin, une application expérimentale « Kawâkib » a été employée pour détecter et identifier les invariants lexicaux en montrant leurs points forts aussi bien que leurs lacunes. Nous proposons également une nouvelle vision de la prochaine version de « Kawâkib » qui peut représenter une application pédagogique de l'arabe sans lexique. / This thesis focuses on the classification and the treatment of Arabic lexical invariants that express a temporal aspect. Our aim is to create a diagram of grammar (finite state machine) for each invariant. In this work, we limited our treatment to 20 lexical invariants. Our assumption is that the lexical invariants are located at the same structural level (formal) as the schemes in the language quotient (skeleton) of the Arabic language. They hide much information and involve syntactic expectations that make it possible to predict the structure of the sentence.In the first part of our research tasks, we present the concept of “invariant lexical” by exposing the various levels of invariance. Then, we classify the invariants according to several criteria.The second part is the object of our own study concerning the temporal lexical invariants. We present our linguistic method as well as our approach of modelling using diagrams of grammars. Then, we analyze the simple lexical invariants such “ḥattā, baʿda” and the complexes ones such “baʿdamā, baynamā”.Finally, an experimental application “Kawâkib” was used to detect and identify the lexical invariants by showing their strong points as well as their gaps. We also propose a new vision of the next version of “Kawâkib” that can represent a teaching application of Arabic without lexicon.
|
59 |
Analyse morphologique robuste de l'arabe et applications pédagogiques / Robust morphological analyser for Arabic and teaching applicationsMars, Mourad 13 July 2012 (has links)
Deux problématiques se croisent dans nos travaux de recherches, ils ne font pas parties du même domaine: la première est issue du TAL (Traitement Automatique des Langues), la seconde est relié au domaine de l'ALAO (Apprentissage des Langues Assisté par Ordinateur).La première partie de nos travaux de recherches rentre dans le cadre de l'analyse morphologique des textes arabes. Pour la création d'un analyseur morphologique, nous avons commencé par la réalisation de toutes les ressources nécessaires (Dictionnaires pour la langue arabe, Matrices de compatibilités, Règles, Corpus d'apprentissage, Modèle de langage, etc.). Nous avons utilisé une approche statistique basée sur les Modèles de Markov Cachés (MMC) qui adhère à des principes de bonne pratique bien établis dans le domaine de l'analyse morphologique. Cette méthodologie a donné naissance à @rab-Morph : un analyseur morphologique robuste et performant pour l'arabe.La deuxième partie des travaux menés se situe dans le cadre de l'ALAO, où l'objectif principal est d'apporter des éléments de réponse à la question suivante ; comment peut-on profiter des outils issues du TAL arabe pour apporter des solutions aux plateformes d'apprentissage de l'arabe langue étrangère? Pour y parvenir et montrer l'intérêt d'avoir recours à des procédures, solutions et outils TAL pour l'apprentissage des langues, nous avons développé un prototype pour l'apprentissage de l'arabe baptisé @rab-Learn. Cet environnement utilise des outils issues du TAL, principalement notre analyseur morphologique @rab-Morph, pour créer des activités pédagogiques variés et automatiser d'avantage le traitement de la langue dans ces plateformes. / L'auteur n'a pas fourni de résumé en anglais
|
60 |
L'acquisition des relatives. : Etude des erreurs commises par des apprenants arabophones saoudiens de français langue étrangère. / The acquisition of relatives. : Study of errors committed by Arabic-speaking learners of French as a foreign language.Alqahtani, Salha 30 June 2017 (has links)
Cette recherche identifie et analyse les différentes erreurs, intervenant dans le cadre de la relativisation, commises par des apprenants arabophones saoudiens. L’étude se fonde sur un corpus de 1670 relatives. Constitué dans un cadre institutionnel, ce corpus réunit des productions écrites obtenues dans des emplois contraints, semi-contraints et plus spontanés. Les résultats confirment le fait que la relativisation en français relève d’une complexité linguistique et représente une incontestable difficulté dans le parcours d’un apprenant de FLE. Quelle que soit la fonction relativisée (sujet < OD < syntagme prépositionnel : où < dont < F. Comp.), quelle que soit la forme attendue (quiSU < où < dont < F.comp. < que < qu’) les erreurs sont nombreuses. Les principales difficultés, situées à la jonction de la matrice et de la relative, concernent le choix de la forme requise et l’extraction de la préposition. Si la hiérarchie d’accessibilité de Keenan et Comrie (1977) est globalement respectée (les relativisations les plus basses suscitant plus d’erreurs), certaines données cependant la remettent en cause : la relativisation d’un oblique semble parfois plus accessible que la relativisation d’un objet indirect (où OBL parait plus accessible que dont OI ou que l’emploi d’une forme amalgamée OI ou oblique OI). Il s’avère, en outre, que l’écart entre les langues en contact occasionne des erreurs, dues à des transferts négatifs et, notamment, à une indifférenciation entre stratégie du joncteur (arabe standard moderne) et stratégie du pronom relatif (français) et à la reconduction de modalités de sélection du relativiseur propre à l’arabe standard moderne. On note également un recours à un complémenteur universel (transfert de l’arabe dialectal ?) parfois associé à un pronom résomptif. / This research identifies and analyzes the various errors made by Saudi Arabian-speaking learners in the context of relativization. The study is based on a corpus of 1670 relative. Constituted in an institutional framework, this corpus combines written productions obtained in constrained, semi-constrained and more spontaneous uses. The results confirm the fact that relativisation in French is linguistically complex and represents an undeniable difficulty in the course of a learner. Regardless of the relativized function (sujet < OD < syntagme prépositionnel: où < dont < F. Comp), whatever the expected form (quiSU < où < dont < F.comp. < que < qu’) mistakes are numerous. The main difficulties, located at the junction of the matrix and the relative, concern the choice of the required form and the extraction of the preposition. Although the hierarchy of accessibility of Keenan and Comrie (1977) is generally respected (the lowest relativities causing more errors), some data, however, call it into question: the relativization of an oblique seems sometimes more accessible than the relativisation of an indirect object (où OBL appears more accessible than dont OI or the use of an amalgamated form OI or oblique OI). Moreover, the gap between the languages in contact causes errors, due to negative transfers and, in particular, to an indifference between the strategy of the junctor (modern standard Arabic) and the relative pronoun (French) strategy and to the renewal of modalities for selecting the relativiser of modern standard Arabic. We also note a recourse to a universal complementor (transfer of dialectal Arabic?) Sometimes associated with a resumptive pronoun.
|
Page generated in 0.0706 seconds