Global ETD Search

101	Contribution à l'étude du traitement des erreurs au niveau lexico-syntaxique dans un texte écrit en français Strube Den Lima, Vare Lucia 15 March 1990 (has links) (PDF) Cette thèse aborde le thème du traitement des erreurs aux niveaux lexical et syntaxique dans un texte écrit en français. Nous présentons d'abord une approche générale des erreurs pouvant apparaitre dans un texte. Nous donnons les éléments de base d'un ensemble de méthodes utilisées actuellement dans le traitement d'erreurs aux niveaux lexical et syntaxique et décrivons des méthodes de correction proposées dans les principales études réalisées dans le domaine de la correction. Après une brève description de l'environnement pilaf de traitement de la langue naturelle, ou s'insère l'étude en question, nous proposons et décrivons la mise en œuvre d'un algorithme de correction d'erreurs lexicales par la phonétique applicable a un dictionnaire de grandeur réelle. Cet algorithme realise la transduction phonétique du mot a corriger, suivie de sa reconstitution graphique. Nous présentons ensuite la mise en œuvre d'un pré-prototype de vérification syntaxique et de correction des erreurs d'accord. La vérification syntaxique est réalisée par unifications de traits; la détection d'une faute d'accord est a l'origine d'une correction par génération morphologique. Une maquette de détection/correction d'erreurs au niveau lexico-syntaxique permet de démontrer la faisabilité d'un système multi-algorithmique de détection/correction d'erreurs au niveau lexico-syntaxique traitement d'erreurs typologie des erreurs méthodes de correction correction lexicale par phonétique vérification syntaxique correction de fautes d'accord accord du participe passé
102	Méthode et outils pour la création et l'évaluation automatiques de structures de bases lexicales multilingues (symétriques) à lexies et axies Teeraparbseree, Aree 27 September 2005 (has links) (PDF) Cette thèse aborde le problème de la structuration de bases lexicales multilingues (BDLM) en lexies et axies, à partir de ressources existantes. Ce travail est motivé par l'inadéquation des techniques existantes utilisées isolément, pour la structuration de BDLM.<br />Pour résoudre ce problème, la stratégie proposée est de composer des techniques existantes de désambiguïsation pour structurer semi-automatiquement des bases lexicales multilingues à lexies et acceptions interlingues. De plus, cette thèse propose une catégorisation des critères d'évaluation de la qualité des BDLM, ainsi que les mesures correspondantes.<br />Cette stratégie a été implémentée dans Jeminie, un système logiciel adaptable qui permet d'implémenter à la fois des méthodes de structuration de BDLM et des mesures de qualité, sous la forme de modules logiciels réutilisables.<br />Des compositions arbitraires de ces modules peuvent être définies par un lexicologue dans un langage de haut niveau d'abstraction, ce qui permet d'adapter facilement la structuration et l'évaluation de qualité en fonction des objectifs du lexicologue et des ressources disponibles sans nécessiter de connaissances en programmation.<br />L'intérêt de cette approche a été validé expérimentalement : la qualité des BDLM obtenues est meilleure par combinaison de techniques qu'avec chaque technique antérieure utilisée seule. base lexicale multilingue acception interlingue évaluation de qualité lexicographie computationnelle
103	Sublim : un systeme universel de bases lexicales multilingues et Nadia : sa specialisation aux bases lexicales interlingues par acceptions Serasset, Gilles 08 December 1994 (has links) (PDF) Le but de cette these est de definir et developper un systeme de bases lexicales multilingues independant des applications et des theories linguistiques. Elle debute donc par une etude des dictionnaires (imprimes ou electroniques) et des outils de gestion de bases lexicales, avec, notamment, le projet ESPRIT MULTILEX, considere comme l'effort le plus avance, mais qui presente quelques faiblesses (architecture lexicale par transfert, structures linguistiques codees sous forme de structures de traits types.). La deuxieme partie de cette these est consacree a la definition de SUBLIM, un systeme de gestion de bases lexicales multilingues qui permet de specifier l'architecture lexicale (organisation des dictionnaires) et l'architecture linguistique (organisation des informations linguistiques des unites des dictionnaires), sans imposer de contraintes ni sur les types de dictionnaires choisis, ni sur les structures linguistiques utilisees. La troisieme et derniere partie de cette these presente une specialisation de ce systeme generique en un systeme dedie a la gestion de bases lexicales multilingues fondees sur les acceptions interlingues : NADIA. Cette approche generalise certaines methodes interlingues comme celle du projet de traduction multilingue ULTRA, et permet la definition de bases lexicales multilingues ne se basant pas sur une approche par connaissances. Base de donnees lexicales Multilinguisme Dictionnaire electronique Interlingua Architecture linguistique Architecture lexicale Representation de connaissances Lisp CLOS
104	Outils d'exploration de corpus et désambiguïsation lexicale automatique AUDIBERT, Laurent 15 December 2003 (has links) (PDF) Ce travail de thèse adresse le problème de la désambiguïsation lexicale automatique à l'aide de méthodes d'apprentissage supervisé. Dans une première partie, nous proposons un ensemble de puissants outils de manipulation de corpus linguistiques étiquetés. Pour réaliser ces outils, nous avons développé une bibliothèque C++ qui implémente un langage élaboré et expressif d'interrogation de corpus, basé sur des méta-expressions régulières. Dans une seconde partie, nous comparons divers algorithmes d'apprentissage supervisé, que nous utilisons ensuite pour mener à bien une étude systématique et approfondie de différents critères de désambiguïsation, basés sur la cooccurrence de mots et plus généralement de n-grammes. Nos résultats vont parfois à l'encontre de certaines pratiques dans le domaine. Par exemple, nous montrons que la suppression des mots grammaticaux dégrade les performances et que les bigrammes permettent d'obtenir de meilleurs résultats que les unigrammes. [INFO:INFO_OH] Computer Science/Other Désambiguïsation lexicale automatique traitement automatique des langues concordancier analyseur expression régulière corpus lexicalement étiqueté apprentissage supervisé cooccurrences n-grammes
105	Le Mot et la Chose Revisités: le Cas de la Polysémie Systématique Arapinis, Alexandra 19 December 2009 (has links) (PDF) La polysémie systématique, qui occupe une place grandissante dans les débats de sémantique lexicale depuis les années 1990, semble remettre à l'ordre du jour la question fondamentale du rapport entre les mots et les choses. Partant du constat que ces phénomènes de multi-sens n'impliquent pas de réel changement de référence, mais semblent au contraire mettre en jeu différentes parties ou aspects d'un même référent, ce travail propose une relecture métaphysique de deux modèles typés de la polysémie systématique (le Generative Lexicon de Pustejovsky et la Type Composition Logic de Asher), visant à clarifier les notions d'aspect/partie/constituant d'un objet, mobilisées dans la formulation des règles compositionnelles de génération des significations contextuelles. Philosophie du langage Sémantique lexicale Polysémie systématique Ontologie Réalité institutionnelle Synthétique a priori
106	La dimension argumentative des collocations textuelles en corpus électronique spécialisé au domaine du TAL(N) Dubreil, Estelle 20 October 2006 (has links) (PDF) Traditionnellement, l'association lexicale préexistant au phénomène collocationnel est qualifiée d'arbitraire. Or en soumettant les collocations textuelles – CT – à l'analyse sémantico-discursive des possibles argumentatifs – PA –, modèle de description de la signification lexicale, non seulement cette association s'avère bien souvent argumentativement motivée, mais parfois prédictible. Aussi, nous postulons qu'une CT correspond potentiellement soit à une collocation argumentative, soit à une relation argumentative, soit enfin à une collocation arbitraire. Cette triple hypothèse a été testée sur le corpus électronique spécialisé TAL(N), grâce à une méthodologie pluridisciplinaire adaptée au caractère électronique des données (outils logiciels et Internet). Les résultats obtenus valident notre hypothèse par la présence équilibrée de collocations argumentatives et de relations argumentatives, comparée aux collocations arbitraires. Ces résultats nous confortent dans l'idée de reconsidérer le caractère arbitraire du principe d'association collocationnelle et nous permet d'en proposer une description en termes de blocs d'argumentations externes. [INFO:INFO_OH] Computer Science/Other collocation textuelle possible argumentatif motivation argumentative collocation arbitraire signification lexicale bloc d'argumentation corpus électronique communauté TAL(N) linguistique de corpus
107	Évaluation de deux méthodes d’identification des liens lexicaux : méthode manuelle et méthode statistique Poudrier, Caroline 05 1900 (has links) Ce mémoire présente une évaluation des différentes méthodes utilisées en lexicographie afin d’identifier les liens lexicaux dans les dictionnaires où sont répertoriées des collocations. Nous avons ici comparé le contenu de fiches du DiCo, un dictionnaire de dérivés sémantiques et de collocations créé selon les principes de la lexicologie explicative et combinatoire, avec les listes de cooccurrents générées automatiquement à partir du corpus Le Monde 2002. Notre objectif est ici de proposer des améliorations méthodologiques à la création de fiches de dictionnaire du type du DiCo, c’est-à-dire, des dictionnaires d’approche qualitative, où la collocation est définie comme une association récurrente et arbitraire entre deux items lexicaux et où les principaux outils méthodologiques utilisés sont la compétence linguistique de ses lexicographes et la consultation manuelle de corpus de textes. La consultation de listes de cooccurrents est une pratique associée habituellement à une approche lexicographique quantitative, qui définit la collocation comme une association entre deux items lexicaux qui est plus fréquente, dans un corpus, que ce qui pourrait être attendu si ces deux items lexicaux y étaient distribués de façon aléatoire. Nous voulons mesurer ici dans quelle mesure les outils utilisés traditionnellement dans une approche quantitative peuvent être utiles à la création de fiches lexicographiques d’approche qualitative, et de quelle façon leur utilisation peut être intégrée à la méthodologie actuelle de création de ces fiches. / This paper presents an evaluation of the various methods used in lexicography in order to identify the lexical bonds in dictionaries where collocations are indexed. We compared the contents of entries of the DiCo, a dictionary of semantic derivatives and collocations created according to the principles of explanatory and combinative lexicology, with the lists of cooccurrents generated automatically from the Le Monde 2002 corpus. Our objective here is to propose improvement in the methodology of creation of dictionary entry of DiCo-like dictionaries, i.e., dictionaries of a qualitative approach, where collocation is defined as the recurring and arbitrary associations between two lexical items and where the principal methodological tools used are the linguistic ability of its lexicographers and the manual consultation of corpus of text. The consultation of lists of cooccurrents is a practice associated traditionally with a quantitative lexicographical approach, which defines collocation as an association between two lexical items, which is more frequent, in a corpus, than what could be expected if these two lexical items were randomly distributed in corpus. We want to evaluate in what respect the tools used traditionally in a quantitative approach can be used for the creation of lexicographical entries of a qualitative approach, and how their use can be integrated into the current methology of creation of these entries. collocations fonctions lexicales Lexicologie Explicative et Combinatoire statistique lexicale théorie Sens-Texte collocations lexical function Explanatory Combinatorial Lexicology lexical statistics Meaning-Text theory
108	Représentations du sens lexical en lexicologie explicative et combinatoire : étude de trois formalisations spécifiques Samson-Fauteux, Mélissa 08 1900 (has links) Cette étude porte sur les différentes formalisations du sens linguistique dans le cadre de la théorie Sens-Texte (TST) ; elle s’intéresse notamment à la représentation sémantique, la représentation la plus importante dans la modélisation du sens d’énoncés et d’unités lexicales de la langue. Cette étude a trois objectifs : premièrement, décrire trois formalisations de la représentation sémantique existant dans la TST – les réseaux sémantiques, les définitions lexicographiques et les définitions de la BDéf (des définitions très formalisées) ; deuxièmement, identifier les disparités et les décalages entre les formalisations choisies ; troisièmement, proposer des modifications aux formalisations existantes pour réduire au maximum ces disparités. / This study explores the different formalisations of linguistic meaning as encountered in the Meaning-Text Theory (MST) framework. Its main interest is semantic representation, which is the most important representation in the modeling of the meaning of utterances and lexical units. This study has three objectives: first, describing three existing formalisations of semantic representation in the MST – semantic networks, lexicographical definitions, and BDéf definitions (definitions that are extremely formalized); second, identifying the discrepancies between these formalisations; finally, proposing modifications to these formalisations in order to reduce the disparities as much as possible. définition lexicographique lexicographical definition sémantique lexicale lexical semantic formalisation de la sémantique semantic formalization Lexicologie explicative et combinatoire Explanatory combinatorial lexicology réseaux sémantiques semantic networks
109	Apports de l’imagerie optique à l’étude de l’impact du niveau de scolarité sur la contribution des lobes frontaux à la production de mots Maheux, Manon 08 1900 (has links) Le vieillissement normal est associé à une réorganisation cérébrale qui peut être influencée par plusieurs facteurs. Des théories comme la réserve cognitive de Stern (2002) tentent d’expliquer les effets de ces différents facteurs. Certains, le niveau de scolarité par exemple, sont encore mal connus. Pourtant, le niveau de scolarité est connu pour avoir un impact sur les performances cognitives tout au long de la vie. Le but de ce mémoire est d’étudier les effets du niveau de scolarité sur l’oxygénation cérébrale de personnes âgées en santé lors d’une tâche d’évocation lexicale orthographique et sémantique. Chaque tâche est divisée selon un critère « plus productive » et « moins productive ». Les âgés faiblement scolarisés produisent moins de mots que les âgés fortement scolarisés. De plus, la différence de mots produits entre le critère plus productif et moins productif est plus grande pour la tâche sémantique que pour la tâche orthographique. Du point de vue hémodynamique, les deux groupes ont des activations semblables, contredisant le phénomène HAROLD. De plus, les participants peu scolarisés tendent à activer de façon plus importante l’hémisphère gauche, peu importe la tâche ou la condition. Par contre, les activations varient selon la tâche et la condition dans le cas du groupe fortement scolarisé. / Normal aging is associated with cerebral reorganisation which can be influenced by many factors. For example, the theory cognitive reserve (Stern, 2002) is trying to explain how those factors can have an impact on the reorganization. However, some factors, such as educational level, are known to have an impact on cognitive performance. The aim of this dissertation is to study the effect of educational level in cerebral oxygenation of healthy older adults during both phonologic and semantic verbal fluency tasks. Each task is divided into two criteria: more productive and less productive. Behavioural data showed that less educated elderly generate fewer words than more educated ones for both tasks. Moreover, the differences between the number of words for the more productive criterion and the less productive one are higher for the semantic than for the phonologic task. NIRS data showed that both groups activated prefrontal cortex, without difference between them. In addition, less educated participants tend to have bigger activations in the left hemisphere regardless of the task and the criterion. On the other hand, higher educated participants’ activations vary according to the task and the criterion unlike the HAROLD model’s predictions. Vieillissement Scolarité Réorganisation cérébrale Réserve cognitive Évocation lexicale Imagerie optique Aging Education Cerebral reorganization Cognitive reserve Verbal fluency Near-infrared spectroscopy
110	Effets de la croissance des capacités respiratoires sur la longueur des énoncés et sur la diversité lexicale Lalonde, Brigitte 08 1900 (has links) Brown (1973) a proposé la « longueur moyenne des énoncés » (LME) comme indice standard du développement langagier. La LME se calcule selon le nombre moyen de morphèmes dans 100 énoncés de parole spontanée. L’hypothèse sous-jacente à cet indice est que la complexité syntaxique croît avec le nombre de morphèmes dans les énoncés. Selon Brown, l’indice permet d’estimer le développement d’une « compétence grammaticale » jusqu’à environ quatre morphèmes. Certains auteurs ont toutefois critiqué le manque de fiabilité de la LME et la limite de quatre morphèmes. Des rapports démontrent des variations de la LME avec l’âge, ce qui suggère que des facteurs comme la croissance des capacités respiratoires peuvent influencer l’indice de Brown. La présente étude fait état de ces problèmes et examine comment la LME et certaines mesures de diversité lexicale varient selon le développement des capacités respiratoires. On a calculé la LME et la diversité lexicale dans la parole spontanée de 50 locuteurs mâles âgés de 5 à 27 ans. On a également mesuré, au moyen d’un pneumotachographe, la capacité vitale (CV) des locuteurs. Les résultats démontrent que la LME et des mesures de diversité lexicale corrèlent fortement avec la croissance de la CV. Ainsi, la croissance des fonctions respiratoires contraint le développement morphosyntaxique et lexical. Notre discussion fait valoir la nécessité de réévaluer l’indice de la LME et la conception « linguistique » du développement langagier comme une compétence mentale qui émerge séparément de la croissance des structures de performance. / Brown (1973) proposed the « mean length of utterance » (MLU) as a standard index of language development. MLU is calculated by counting the mean number of morphemes in 100 utterances of spontaneous speech. The underlying hypothesis of this index is that syntactic complexity rises with the number of morphemes in utterances. According to Brown, MLU indexes the development of a « grammatical competence » up to about four morphemes. However, authors have criticized the lack of reliability of the MLU and the limit of four morphemes. Reported variations in MLU with age also suggest that factors such as the growth of respiratory capacities can influence Brown’s index. The present study reviews those problems and examines how the MLU and certain measures of lexical diversity vary according to the development of respiratory capacities. We calculated the MLU and the lexical diversity in the spontaneous speech of 50 male speakers aged 5 to 27 years. We also measured, with a pneumotachograph, the vital capacity (VC) of the speakers. The results show that MLU and measures of lexical diversity strongly correlate with the growth of VC. Thus, the growth of respiratory functions constrains morphosyntactic and lexical development. Our discussion focuses on the necessity to revaluate the MLU index and a « linguistic » conception of language development as a mental competence emerging separately from the growth of performance structures. Longueur d’énoncés Diversité lexicale Respiration Parole Développement du langage oral Utterance length Lexical diversity Breathing Speech Language development of spoken language

Search results