• Refine Query
  • Source
  • Publication year
  • to
  • Language
  • 42
  • 8
  • 3
  • 2
  • Tagged with
  • 58
  • 30
  • 17
  • 16
  • 15
  • 14
  • 13
  • 13
  • 11
  • 10
  • 10
  • 9
  • 9
  • 9
  • 8
  • About
  • The Global ETD Search service is a free service for researchers to find electronic theses and dissertations. This service is provided by the Networked Digital Library of Theses and Dissertations.
    Our metadata is collected from universities around the world. If you manage a university/consortium/country archive and want to be added, details can be found on the NDLTD website.
41

Approche bilingue et multimodale de l'oralité chez l'enfant sourd : outils d'analyses, socialisation, développement

Estève, Isabelle 18 October 2011 (has links) (PDF)
L'objectif de cette thèse est la description de l'oralité de l'enfant sourd et de son développement à travers le prisme d'une double perspective : celle du bilinguisme et de la multimodalité. Cette double perspective permet d'envisager l'oralité dans toutes ses dimensions - vocales et gestuelles d'une part, verbales et non-verbales d'autre part - afin de rendre compte de la spécificité des dynamiques langagières intra- et inter-modalités impliquées dans le développement des compétences de symbolisations orales chez l'enfant sourd, locuteur bilingue bimodal (français/LSF) en devenir. L'étude s'appuie sur les productions langagières de 30 enfants scolarisés dans des structures différentes (oraliste, bilingue, "mixte"). Les réflexions sur les outils d'analyse développés pour appréhender, décrire et transcrire les pratiques des locuteurs sourds dans leurs aspects bilingues et multimodaux constituent le premier volet de notre travail. Le second volet s'attache à rendre compte de la place des langues et des modalités dans les parcours de socialisation langagière des enfants sourds en analysant les stratégies adaptatives mises en oeuvre dans la diversité des interactions quotidiennes auxquelles ils sont confrontés dans l'espace scolaire, avec les enseignants ainsi qu'avec leurs pairs sourds ou entendants. Le troisième volet se centre plus particulièrement sur la manière dont les dimensions langagières et linguistiques de la bimodalité sont impliquées dans le développement des compétences orales - lexicales et narratives - des enfants sourds.
42

Noms humains de phase : problèmes de classifications ontologiques et linguistiques / Phase human nouns : problems ontological and linguistic classifications

Aleksandrova, Angelina 30 April 2013 (has links)
Le travail de cette thèse se situe dans le domaine de la sémantique nominale et porte sur un échantillon de noms dénotant les humains (NH) pendant les différentes phases de vie : bébé, enfant, adolescent, adulte, vieillard (N-[âge]). Elle poursuit un triple objectif. D’abord, il s’agit d’offrir une description linguistique fine d’un ensemble de N-[âge] dont le fonctionnement est resté méconnu jusqu’à présent. En démontrant leur caractère hybride – les N-[âge] dénotent à la fois des propriétés référentiellement essentielles et intrinsèquement transitoires – nous mettons en évidence des paramètres inédits pour la description des NH en général. Enfin, notre thèse explore la possibilité d’un élargissement notionnel du domaine aspectuel vers la sémantique nominale en interrogeant la notion de phase et en démontrant que l’ensemble des N-[âge] bénéficie d’une structure phasale. / This thesis research lies in the field of nominal semantics and focuses on a sample of nouns denoting humans (HN) during different stages of life: infant, child, teenager, adult, elderly (N-[age]). It is three fold. First, this works aims at offering a linguistic description of a set of N-[age] whose operation has remained unknown until now. Demonstrating their hybrid nature - N-[age] denote both referentially essential and intrinsically transient properties - we provide novel parameters for the description of HN in general. Finally, this thesis explores the possibility of notional extension of the aspectual domain to nominal semantics by questioning the concept of phase and by demonstrating that all N-[age] have a phasal structure.
43

Développement de la compétence orthographique : étude des connaissances des frontières lexicales d’élèves sans difficulté à l’écrit et d’élèves dyslexiques du primaire

Costerg, Agnès 05 1900 (has links)
No description available.
44

Une contribution à l'amélioration des ressources terminographiques : étude terminologique fondée sur un corpus de textes de spécialité du domaine du droit de l'internet / A contribution to the improvement of terminographic resources : terminological study based on a specialized corpus in the field of Internet law

Liczner, Aleksandra 28 September 2016 (has links)
Le présent travail se donne comme objectif de proposer une méthode de description complète des unités terminologiques du domaine du droit de l’Internet. Il s’agit d’un modèle hybride permettant de refléter à la fois la dimension linguistique et conceptuelle des termes et plus précisément, les relations lexico-sémantiques et les liens conceptuels que ces derniers entretiennent avec d’autres unités terminologiques et lexicales appartenant au vocabulaire du domaine et ceci par le biais de leur comportement dans l’univers discursif. Le projet, que nous avons baptisé DITerm, s’inscrit donc dans une démarche résolument descriptive dont l’ambition est de rendre compte des usages observés dans la langue de spécialité donnée. Le modèle en question est créé à partir d’un corpus de textes juridiques d’environ 5 000 000 mots et doit servir de base à la conception d’un dictionnaire spécialisé d’encodage destiné aux traducteurs dont la langue de travail est le français. Le terme, tel qu’il est envisagé dans le cadre de cette étude, constitue une unité à dimensions multiples qui doit être considérée sous différents angles. Sa description est donc basée sur l’analyse de ses relations lexicales, conceptuelles et contextuelles et s’inspire largement des modèles lexicographiques. Le projet DITerm a pour arrière-plan théorique la Lexicologie Explicative et Combinatoire, composante lexicologique de la théorie Sens-Texte (Mel’čuk et al. 1995) ainsi que la théorie des cadres et ses différentes applications (Minsky, Fillmore, Martin). La méthodologie adoptée dans ce projet s’inscrit dans le cadre de la linguistique de corpus (Sinclair). Le modèle DITerm propose de décrire chaque terme comme le centre d’une constellation autour de laquelle gravitent de nombreux termes coordonnés formant ce que Cornu (2002) appelle des familles opérationnelles. Pour modéliser les relations que partage le terme vedette avec les unités qui ont tendance à apparaître dans son univers contextuel, nous avons recours à des formules explicites fondées sur un métalangage compréhensible pour tous. Ce formalisme, basé sur la paraphrase, correspond en partie à la vulgarisation des fonctions lexicales. Il présente par ailleurs l’avantage de pouvoir s’adapter à la représentation des liens d’ordre conceptuel. Deplus, la description est enrichie par la mise en place d’un modèle d’annotation des contextes au moyen des cadres sémantiques à la FrameNet permettant de mettre en évidence les liens indirects entretenus par les termes / The aim of this work is to propose a holistic description of terminological units in the field of Internet law, based on a hybrid model that reflectis both the linguistic and the conceptual dimension of terms. To be more precise, this model aims to point out the lexical-semantic relationships and conceptual links that those terms maintain with other terminological and lexical units belonging to the Internet law vocabulary, by studying their behavior in the discursive universe. The project (which we call DITerm) is part of a descriptive approach whose ambition is to explain observed usage in the specialized language at hand. The model was created using acorpus made up of legal texts which totals about 5 000,000 words. The model will be used as the basis for the conception of a specialized encoding dictionary. This dictionary is intended for translators with French language as their working language. The term, as it is viewed in this study, is a multi-dimensional unity which should be considered from many angles. Its description is hence based on the analysis of its lexical, conceptual and contextual relationships which is widely inspired by lexicographical models. Thetheoretical background of the DITerm project is Explanatory and Combinatorial Lexicology, the lexicological component of Meaning-Text Theory (Mel’čuk et al. 1995). We also draw inspiration from the frame theory and its different applications (Minsky’s Frame System Theory,Fillmore’s Frame Semantics). The methodology adopted in this project fits into the framework of corpus linguistics (Sinclair).The DITerm model proposes to describe each term as the center of a constellation around which several coordinated terms gravitate, creating what Cornu (2002) calls operational families. In order to model the relationships the term shares with the units which tend to appear in its contextual universe, we rely on several explicit formulas based on a broadly comprehensible metalanguage. This formalism, which is based on paraphrase, correlates partly with the popularization of the lexical functions. On the other hand, it has the advantage of adapting to the representation of conceptual links. In addition, the description is enriched by the implementation of an annotation model of the contexts in which the terms occur, which makes it possible to account for indirect links that are maintained by terms. This annotation model is an application of the FrameNet methodology.
45

Des modèles de langage pour la reconnaissance de l'écriture manuscrite / Language Modelling for Handwriting Recognition

Swaileh, Wassim 04 October 2017 (has links)
Cette thèse porte sur le développement d'une chaîne de traitement complète pour réaliser des tâches de reconnaissance d'écriture manuscrite non contrainte. Trois difficultés majeures sont à résoudre: l'étape du prétraitement, l'étape de la modélisation optique et l'étape de la modélisation du langage. Au stade des prétraitements il faut extraire correctement les lignes de texte à partir de l'image du document. Une méthode de segmentation itérative en lignes utilisant des filtres orientables a été développée à cette fin. La difficulté dans l’étape de la modélisation optique vient de la diversité stylistique des scripts d'écriture manuscrite. Les modèles optiques statistiques développés sont des modèles de Markov cachés (HMM-GMM) et les modèles de réseaux de neurones récurrents (BLSTM-CTC). Les réseaux récurrents permettent d’atteindre les performances de l’état de l’art sur les deux bases de référence RIMES (pour le Français) et IAM (pour l’anglais). L'étape de modélisation du langage implique l'intégration d’un lexique et d’un modèle de langage statistique afin de rechercher parmi les hypothèses proposées par le modèle optique, la séquence de mots (phrase) la plus probable du point de vue linguistique. La difficulté à ce stade est liée à l’obtention d’un modèle de couverture lexicale optimale avec un minimum de mots hors vocabulaire (OOV). Pour cela nous introduisons une modélisation en sous-unités lexicales composée soit de syllabes soit de multigrammes. Ces modèles couvrent efficacement une partie importante des mots hors vocabulaire. Les performances du système de reconnaissance avec les unités sous-lexicales dépassent les performances des systèmes de reconnaissance traditionnelles de mots ou de caractères en présence d’un fort taux de mots hors lexique. Elles sont équivalentes aux modèles traditionnels en présence d’un faible taux de mots hors lexique. Grâce à la taille compacte du modèle de langage reposant sur des unités sous-lexicales, un système de reconnaissance multilingue unifié a été réalisé. Le système multilingue unifié améliore les performances de reconnaissance par rapport aux systèmes spécialisés dans chaque langue, notamment lorsque le modèle optique unifié est utilisé. / This thesis is about the design of a complete processing chain dedicated to unconstrained handwriting recognition. Three main difficulties are adressed: pre-processing, optical modeling and language modeling. The pre-processing stage is related to extracting properly the text lines to be recognized from the document image. An iterative text line segmentation method using oriented steerable filters was developed for this purpose. The difficulty in the optical modeling stage lies in style diversity of the handwriting scripts. Statistical optical models are traditionally used to tackle this problem such as Hidden Markov models (HMM-GMM) and more recently recurrent neural networks (BLSTM-CTC). Using BLSTM we achieve state of the art performance on the RIMES (for French) and IAM (for English) datasets. The language modeling stage implies the integration of a lexicon and a statistical language model to the recognition processing chain in order to constrain the recognition hypotheses to the most probable sequence of words (sentence) from the language point of view. The difficulty at this stage is related to the finding the optimal vocabulary with minimum Out-Of-Vocabulary words rate (OOV). Enhanced language modeling approaches has been introduced by using sub-lexical units made of syllables or multigrams. The sub-lexical units cover an important portion of the OOV words. Then the language coverage depends on the domain of the language model training corpus, thus the need to train the language model with in domain data. The recognition system performance with the sub-lexical units outperformes the traditional recognition systems that use words or characters language models, in case of high OOV rates. Otherwise equivalent performances are obtained with a compact sub-lexical language model. Thanks to the compact lexicon size of the sub-lexical units, a unified multilingual recognition system has been designed. The unified system performance have been evaluated on the RIMES and IAM datasets. The unified multilingual system shows enhanced recognition performance over the specialized systems, especially when a unified optical model is used.
46

Implémentation des collocations pour la réalisation de texte multilingue

Lambrey, Florie 12 1900 (has links)
La génération automatique de texte (GAT) produit du texte en langue naturelle destiné aux humains à partir de données non langagières. L’objectif de la GAT est de concevoir des générateurs réutilisables d’une langue à l’autre et d’une application à l’autre. Pour ce faire, l’architecture des générateurs automatiques de texte est modulaire : on distingue entre la génération profonde qui détermine le contenu du message à exprimer et la réalisation linguistique qui génère les unités et structures linguistiques exprimant le message. La réalisation linguistique multilingue nécessite de modéliser les principaux phénomènes linguistiques de la manière la plus générique possible. Or, les collocations représentent un de ces principaux phénomènes linguistiques et demeurent problématiques en GAT, mais aussi pour le Traitement Automatique des Langues en général. La Théorie Sens-Texte analyse les collocations comme des contraintes de sélection lexicale. Autrement dit, une collocation est composée de trois éléments : (i) la base, (ii) le collocatif, choisi en fonction de la base et (iii) d’une relation sémantico-lexicale. Il existe des relations sémantico-lexicales récurrentes et systématiques. Les fonctions lexicales modélisent ces relations. En effet, des collocations telles que peur bleue ou pluie torrentielle instancient une même relation, l’intensification, que l’on peut décrire au moyen de la fonction lexicale Magn : Magn(PEUR) = BLEUE, Magn(PLUIE) = TORRENTIELLE, etc. Il existe des centaines de fonctions lexicales. Ce mémoire présente la méthodologie d’implémentation des collocations dans un réalisateur de texte multilingue, GÉCO, à l’aide des fonctions lexicales standard syntagmatiques simples et complexes. Le cœur de la méthodologie repose sur le regroupement des fonctions lexicales ayant un fonctionnement similaire dans des patrons génériques. Au total, plus de 26 000 fonctions lexicales ont été implémentées, représentant de ce fait une avancée considérable pour le traitement des collocations en réalisation de texte multilingue. / Natural Language Generation (NLG) produces text in natural language from non-linguistic content. NLG aims at developing generators that are reusable across languages and applications. In order to do so, these systems’ architecture is modular: while the deep generation module determines the content of the message to be expressed, the text realization module maps the message into its most appropriate linguistic form. Multilingual text realization requires to model the core linguistic phenomena that one finds in language. Collocations represent one of the core linguistic phenomena that remain problematic not only in NLG, but also in Natural Language Processing in general. The Meaning-Text theory analyses collocations as constraints on lexical selection. In other words, a collocation is made up of three constituents: (i) the base, (ii) the collocate, chosen according to (iii) a semantico-lexical relation. Some of these semantico-lexical relations are systematic and shared by many collocations. Lexical functions are a system for modeling these relations. In fact, collocations such as heavy rain or strong preference instantiate the same relation, intensity, can be described with the lexical function Magn: Magn(RAIN) = HEAVY, Magn(PREFERENCE) = STRONG, etc. There are hundreds of lexical functions. Our work presents a methodology for the implementation of collocations in a multilingual text realization engine, GÉCO, that relies on simple and complex syntagmatic standard lexical functions. The principal aspect of the methodology consists of regrouping lexical functions that show a similar behavior into generic patterns. As a result, 26 000 lexical functions have been implemented, which is a considerable progress in the treatment of collocations in multilingual text realization.
47

Facteurs cognitifs liés à l'acquisition du lexique orthographique

Stanké, Brigitte 08 1900 (has links)
La présente thèse a pour objectif d’étudier le rôle des facteurs cognitifs (traitement phonologique et visuoattentionnel et mémoire lexicale orthographique) dans l’acquisition des connaissances orthographiques implicites et explicites. Afin d’examiner les liens entre les différents facteurs cognitifs et les connaissances orthographiques, une étude longitudinale a été réalisée à l’aide d’un échantillon de 338 enfants suivis de la maternelle 5 ans à la fin de la deuxième année du primaire. À la fin de la maternelle, les enfants ont été évalués à l’aide d’une épreuve d’orthographe approchée et d’épreuves évaluant les facteurs cognitifs en jeu dans l’apprentissage du langage écrit (traitement phonologique, traitement visuoattentionnel et mémoire à court et à long terme). Les connaissances lexicales orthographiques explicites de ces mêmes enfants ont été évaluées en fin de première et de deuxième années. Le premier article de cette thèse rapporte les données d’une étude réalisée auprès des enfants scolarisés en maternelle 5 ans. Cette étude vise l’établissement d’un lien entre, d’une part, la capacité de traitement phonologique, visuoattentionnel et de mémoire lexicale orthographique et, d’autre part, les connaissances orthographiques implicites des enfants qui n’ont pas encore eu d’enseignement formel de l’écriture. Les résultats indiquent que, contrairement à ce qui a été longtemps avancé, la capacité de traitement phonologique n’est pas le seul facteur cognitif à intervenir, puisque la capacité de mémoire lexicale orthographique à long terme ainsi que la capacité visuoattentionnelle contribuent de façon importante et indépendante à l’acquisition des connaissances orthographiques implicites des enfants de la maternelle 5 ans. La mémoire lexicale orthographique est même le facteur qui apporte la plus forte contribution. La deuxième étude de cette thèse vise à déterminer, parmi les facteurs cognitifs évalués en maternelle, celui ou ceux qui permettent de prédire les connaissances orthographiques explicites ultérieures, c'est-à-dire celles de première et de deuxième années du primaire. Les résultats de cette deuxième étude indiquent que les préalables nécessaires à l’acquisition des connaissances orthographiques lexicales sont les capacités de traitement phonologique ainsi que les capacités de la mémoire à court et à long terme. La troisième étude de cette thèse a pour but de mettre en lumière le rôle prédictif que joue le niveau des connaissances orthographiques des enfants de maternelle quant au niveau ultérieur de leurs connaissances orthographiques en première et deuxième années, en lien avec les capacités cognitives qui sous-tendent l’apprentissage du langage écrit, en particulier le traitement phonologique, le traitement visuoattentionnel et la mémoire lexicale orthographique. Les résultats de cette dernière étude permettent de montrer que, parmi les facteurs évalués en maternelle, le niveau des connaissances orthographiques implicites apporte une contribution unique à l’ensemble du niveau des connaissances orthographiques ultérieures. L’influence des connaissances orthographiques précoces sur l’acquisition ultérieure n’est pas surprenante. En effet, la première étude avait montré que le niveau de ces connaissances est fonction non seulement de la capacité de mémoire orthographique lexicale mais également de la capacité de traitement phonologique et visuottentionnel. Les résultats issus de ces trois études présentent un intérêt non négligeable dans la compréhension de l’acquisition du langage écrit. En effet, ces recherches ont permis de montrer qu’avant même l’apprentissage formel de l’écrit, l’enfant témoigne de connaissances implicites non négligeables sur la langue écrite et que c’est à partir de ces connaissances que s’élaboreront ses connaissances explicites ultérieures. Ces connaissances sont tributaires de multiples facteurs parmi lesquels la capacité de mémoire lexicale orthographique, facteur cognitif dont la contribution n’avait pas été démontrée jusqu’à présent. Les résultats de cette recherche montrent qu’il est possible d’envisager des outils de dépistage précoce qui permettront d’identifier les enfants à risque de présenter des difficultés spécifiques d’apprentissage du langage écrit. Ce dépistage permettrait de mettre en place des interventions mieux ciblées et précoces, ce qui réduirait ainsi l’impact des difficultés sur les apprentissages scolaires. / The objective of the present thesis was to study the relation between cognitive factors (phonological treatment, visuo-attentional and lexical orthographic memory) and the acquisition of implicit and explicit orthographic knowledge. A longitudinal study was conducted on a sample of 338 children from the kindergarten to their second year of primary schooling. At the end of kindergarten, the tasks were an invented spelling test and tests assessing the cognitive factors at issue in the apprenticeship of written speech (phonological treatment, visuo-attentional treatment and short and long term memory). The lexical explicit orthographic knowledge of these same children was evaluated at the end of their first and second year of school. The objective of the first study was to establish a link between the phonological treatment, visuo-attentional and orthographic lexical memory abilities and implicit orthographic knowledge of the children, before their formal apprenticeship of written speech. The results showed that, contrary to what was long been advanced, the phonological treatment is not the only cognitive factor into play since the long term orthographic lexical memory ability as well as the visuo-attentional ability properly and independently contribute to the acquisition of orthographic knowledge. The orthographic lexical memory is the factor which provides the strongest contribution. The aim of the second study was to determine which cognitive factors assessed in kindergarten predict the subsequent explicit orthographic knowledge in first and second grades. The results showed that the necessary conditions to the acquisition of lexical orthographic knowledge are phonological treatment ability, as well as short and long term memory abilities. The goal of third article was to bring to light the predictive role played by the spelling knowledge of kindergarten children to their orthographical knowledge in first and second grades, in connection with the cognitive abilities which are at the root of the apprenticeship of the written spelling, more particularly the phonological treatment, the visuo-attentional treatment and orthographic lexical memory. The regressive analyses showed that, among the factors investigated in kindergarten, the implicit orthographical knowledge brings a unique contribution to the subsequent spelling knowledge evaluated by different orthographic tasks in first and second grades. The important impact of early orthographical knowledge on the subsequent acquisition is not surprising because the first study proved that this knowledge is not only depending on the capability of lexical orthographical memory but also on the capability of phonological treatment. The results coming from those three articles present a non-negligible interest in the understanding of the acquisition of the written speech. Indeed, these studies permitted to prove that, even before the formal apprenticeship of the writing, the child shows a genuine implicit knowledge of the written language. Moreover, and it is from this knowledge that the subsequent explicit knowledge will be built up. This knowledge is dependent upon multiple factors among which are the ability of orthographic lexical memory, a cognitive factor whose contribution was not yet proven. The results of this research showed that it is possible to consider early screening measures in order to identify children susceptible to present specific apprenticeship difficulties in the written language. This screening would allow an early and better targeted intervention, which would then reduce the impact of difficulties on the academic apprenticeships.
48

Facteurs cognitifs liés à l'acquisition du lexique orthographique

Stanké, Brigitte 08 1900 (has links)
La présente thèse a pour objectif d’étudier le rôle des facteurs cognitifs (traitement phonologique et visuoattentionnel et mémoire lexicale orthographique) dans l’acquisition des connaissances orthographiques implicites et explicites. Afin d’examiner les liens entre les différents facteurs cognitifs et les connaissances orthographiques, une étude longitudinale a été réalisée à l’aide d’un échantillon de 338 enfants suivis de la maternelle 5 ans à la fin de la deuxième année du primaire. À la fin de la maternelle, les enfants ont été évalués à l’aide d’une épreuve d’orthographe approchée et d’épreuves évaluant les facteurs cognitifs en jeu dans l’apprentissage du langage écrit (traitement phonologique, traitement visuoattentionnel et mémoire à court et à long terme). Les connaissances lexicales orthographiques explicites de ces mêmes enfants ont été évaluées en fin de première et de deuxième années. Le premier article de cette thèse rapporte les données d’une étude réalisée auprès des enfants scolarisés en maternelle 5 ans. Cette étude vise l’établissement d’un lien entre, d’une part, la capacité de traitement phonologique, visuoattentionnel et de mémoire lexicale orthographique et, d’autre part, les connaissances orthographiques implicites des enfants qui n’ont pas encore eu d’enseignement formel de l’écriture. Les résultats indiquent que, contrairement à ce qui a été longtemps avancé, la capacité de traitement phonologique n’est pas le seul facteur cognitif à intervenir, puisque la capacité de mémoire lexicale orthographique à long terme ainsi que la capacité visuoattentionnelle contribuent de façon importante et indépendante à l’acquisition des connaissances orthographiques implicites des enfants de la maternelle 5 ans. La mémoire lexicale orthographique est même le facteur qui apporte la plus forte contribution. La deuxième étude de cette thèse vise à déterminer, parmi les facteurs cognitifs évalués en maternelle, celui ou ceux qui permettent de prédire les connaissances orthographiques explicites ultérieures, c'est-à-dire celles de première et de deuxième années du primaire. Les résultats de cette deuxième étude indiquent que les préalables nécessaires à l’acquisition des connaissances orthographiques lexicales sont les capacités de traitement phonologique ainsi que les capacités de la mémoire à court et à long terme. La troisième étude de cette thèse a pour but de mettre en lumière le rôle prédictif que joue le niveau des connaissances orthographiques des enfants de maternelle quant au niveau ultérieur de leurs connaissances orthographiques en première et deuxième années, en lien avec les capacités cognitives qui sous-tendent l’apprentissage du langage écrit, en particulier le traitement phonologique, le traitement visuoattentionnel et la mémoire lexicale orthographique. Les résultats de cette dernière étude permettent de montrer que, parmi les facteurs évalués en maternelle, le niveau des connaissances orthographiques implicites apporte une contribution unique à l’ensemble du niveau des connaissances orthographiques ultérieures. L’influence des connaissances orthographiques précoces sur l’acquisition ultérieure n’est pas surprenante. En effet, la première étude avait montré que le niveau de ces connaissances est fonction non seulement de la capacité de mémoire orthographique lexicale mais également de la capacité de traitement phonologique et visuottentionnel. Les résultats issus de ces trois études présentent un intérêt non négligeable dans la compréhension de l’acquisition du langage écrit. En effet, ces recherches ont permis de montrer qu’avant même l’apprentissage formel de l’écrit, l’enfant témoigne de connaissances implicites non négligeables sur la langue écrite et que c’est à partir de ces connaissances que s’élaboreront ses connaissances explicites ultérieures. Ces connaissances sont tributaires de multiples facteurs parmi lesquels la capacité de mémoire lexicale orthographique, facteur cognitif dont la contribution n’avait pas été démontrée jusqu’à présent. Les résultats de cette recherche montrent qu’il est possible d’envisager des outils de dépistage précoce qui permettront d’identifier les enfants à risque de présenter des difficultés spécifiques d’apprentissage du langage écrit. Ce dépistage permettrait de mettre en place des interventions mieux ciblées et précoces, ce qui réduirait ainsi l’impact des difficultés sur les apprentissages scolaires. / The objective of the present thesis was to study the relation between cognitive factors (phonological treatment, visuo-attentional and lexical orthographic memory) and the acquisition of implicit and explicit orthographic knowledge. A longitudinal study was conducted on a sample of 338 children from the kindergarten to their second year of primary schooling. At the end of kindergarten, the tasks were an invented spelling test and tests assessing the cognitive factors at issue in the apprenticeship of written speech (phonological treatment, visuo-attentional treatment and short and long term memory). The lexical explicit orthographic knowledge of these same children was evaluated at the end of their first and second year of school. The objective of the first study was to establish a link between the phonological treatment, visuo-attentional and orthographic lexical memory abilities and implicit orthographic knowledge of the children, before their formal apprenticeship of written speech. The results showed that, contrary to what was long been advanced, the phonological treatment is not the only cognitive factor into play since the long term orthographic lexical memory ability as well as the visuo-attentional ability properly and independently contribute to the acquisition of orthographic knowledge. The orthographic lexical memory is the factor which provides the strongest contribution. The aim of the second study was to determine which cognitive factors assessed in kindergarten predict the subsequent explicit orthographic knowledge in first and second grades. The results showed that the necessary conditions to the acquisition of lexical orthographic knowledge are phonological treatment ability, as well as short and long term memory abilities. The goal of third article was to bring to light the predictive role played by the spelling knowledge of kindergarten children to their orthographical knowledge in first and second grades, in connection with the cognitive abilities which are at the root of the apprenticeship of the written spelling, more particularly the phonological treatment, the visuo-attentional treatment and orthographic lexical memory. The regressive analyses showed that, among the factors investigated in kindergarten, the implicit orthographical knowledge brings a unique contribution to the subsequent spelling knowledge evaluated by different orthographic tasks in first and second grades. The important impact of early orthographical knowledge on the subsequent acquisition is not surprising because the first study proved that this knowledge is not only depending on the capability of lexical orthographical memory but also on the capability of phonological treatment. The results coming from those three articles present a non-negligible interest in the understanding of the acquisition of the written speech. Indeed, these studies permitted to prove that, even before the formal apprenticeship of the writing, the child shows a genuine implicit knowledge of the written language. Moreover, and it is from this knowledge that the subsequent explicit knowledge will be built up. This knowledge is dependent upon multiple factors among which are the ability of orthographic lexical memory, a cognitive factor whose contribution was not yet proven. The results of this research showed that it is possible to consider early screening measures in order to identify children susceptible to present specific apprenticeship difficulties in the written language. This screening would allow an early and better targeted intervention, which would then reduce the impact of difficulties on the academic apprenticeships.
49

Apprentissage incrémental pour la construction de bases lexicales évolutives : application en désambiguïsation d'entités nommées

Girault, Thomas 18 June 2010 (has links) (PDF)
Certaines applications du traitement automatique des langues sont amenées à traiter des flux de données textuelles caractérisés par l'emploi d'un vocabulaire en perpétuelle évolution, que ce soit au niveau de la création des mots que des sens de ceux existant déjà. En partant de ce constat, nous avons mis au point un algorithme incrémental pour construire automatiquement et faire évoluer une base lexicale qui répertorie des unités lexicales non étiquetées sémantiquement observées dans des flux. Cette base lexicale est représentée par un treillis de Galois qui organise des concepts formels (assimilés à des unités de sens) sur des niveaux de granularité allant du très spécifique au très général. Cette représentation est complétée par une modélisation vectorielle visualisable qui tient compte des aspects continus du sens et de la proximité sémantique entre concepts. Ce modèle est alors exploité pour propager l'étiquetage manuel d'un petit nombre d'entités nommées (EN : unités lexicales qui se référent habituellement à des personnes, des lieux, des organisations...) à d'autres EN non étiquetées observées dans un flux pendant la construction incrémentale du treillis. Les concepts de ce treillis sont enrichis avec les étiquettes d'EN observées dans un corpus d'apprentissage. Ces concepts et leurs étiquettes attachées sont respectivement employés pour l'annotation non supervisée et la classification supervisée des EN d'un corpus de test.
50

Vers une typologie des collocations à verbe support en malgache

Hanitramalala, Rita 04 1900 (has links)
No description available.

Page generated in 0.0443 seconds