• Refine Query
  • Source
  • Publication year
  • to
  • Language
  • 21
  • 4
  • 2
  • Tagged with
  • 30
  • 30
  • 28
  • 20
  • 19
  • 19
  • 19
  • 17
  • 16
  • 15
  • 15
  • 14
  • 13
  • 10
  • 9
  • About
  • The Global ETD Search service is a free service for researchers to find electronic theses and dissertations. This service is provided by the Networked Digital Library of Theses and Dissertations.
    Our metadata is collected from universities around the world. If you manage a university/consortium/country archive and want to be added, details can be found on the NDLTD website.
21

Représentation des connaissances sémantiques lexicales de la Théorie Sens-Texte : conceptualisation, représentation, et opérationnalisation des définitions lexicographiques / Meaning-Text Theory lexical semantic knowledge representation : conceptualization, representation, and operationalization of lexicographic definitions

Lefrançois, Maxime 24 June 2014 (has links)
Nous présentons une recherche en ingénierie des connaissances appliquée aux prédicats linguistiques et aux définitions lexicographiques de la théorie Sens-Texte (TST). Notre méthodologie comporte trois étapes. 1. Nous montrons en quoi la conceptualisation de la TST devrait être étendue pour faciliter sa formalisation. Nous justifions la nécessité de définir un niveau sémantique profond (SemP) à base de graphes. Nous y définissons la notion de type d'unité sémantique profonde et sa structure actancielle, de sorte que leur organisation hiérarchique puisse correspondre à une hiérarchie de sens au sein de laquelle ces structures actancielles sont héritées et spécialisées. Nous reconceptualisons les définitions lexicographiques au niveau SemP, et au niveau du dictionnaire. Finalement, nous présentons un prototype d'éditeur de définitions basé sur la manipulation directe de graphes. 2. Nous proposons un formalisme de représentation des connaissances adapté à cette conceptualisation. Nous démontrons que les logiques de description et le formalisme des Graphes Conceptuels ne sont pas adaptés, et nous construisons alors un nouveau formalisme, dit des Graphes d'Unités. 3. Nous étudions l'opérationnalisation du formalisme des Graphes d'Unités. Nous lui associons une sémantique formelle basée sur la théorie des modèles et l'algèbre relationnelle, et montrons que les conditions de décidabilité du raisonnement logique correspondent aux intuitions des lexicographes. Nous proposons également une implémentation du formalisme avec les standards du web sémantique, ce qui permet de profiter des architectures existantes pour l'interopérationnalisation sur le web des données lexicales liées. / We present our research in applying knowledge engineering to linguistic predicates and lexicographic definitions of the Meaning-Text Theory (MTT). We adopt a three-step methodology. 1. We first show how the MTT conceptualization should be extended to ease its formalization. We justify the need of defining a new graph-based deep semantic level. We define the notion of deep semantic unit types and its actantial structure, so that their hierarchical organization may correspond to a hierarchy of meanings, inside which actantial structures are inherited and specialized. We re-conceptualize lexicographic definitions at the deep semantic level, and at the level of dictionaries. Finally, we present a definition editor prototype based on graph direct manipulation, which will allow us, in future work, to integrate our formal model into explanatory combinatorial lexicographic projects. 2. We then propose a knowledge representation formalism (KR) adapted for this conceptualization. We demonstrate that Description Logics and the Conceptual Graphs formalism do not fit our needs. This leads us to construct a new knowledge representation formalism: the Unit Graphs formalism. 3. Finally, we operationalize the Unit Graphs formalism. We assign it a formal semantic model, which we create based on model theory and relational algebra. We then show that the reasoning decidability conditions match the intuitions that lexicographers have. We also provide an implementation using semantic web standards, which enable us to use existing architectures for sharing, interoperability, and knowledge querying over the web of lexical linked data.
22

Antelope, une plate-forme de TAL permettant d'extraire les sens du texte : théorie et applications de l'interface syntaxe-sémantique

Chaumartin, François-Régis 25 September 2012 (has links) (PDF)
Créer rapidement un analyseur sémantique dédié à une tâche particulière n'est pas une tâche aisée. En effet, composants d'analyse et ressources linguistiques sont souvent définis avec des formats incompatibles entre eux, ce qui en rend l'assemblage complexe. Nous souhaitons apporter une réponse opérationnelle à ce problème avec la plate-forme de traitement linguistique Antelope, dont cette thèse décrit les principes de conception et de réalisation. En partie basée sur la Théorie Sens-Texte (TST), Antelope permet une analyse syntaxique et sémantique de corpus de volume important ; son objectif est de " rendre calculable " du texte tout-venant : avis de consommateurs, textes encyclopédiques, documents RH, articles de presse... Pour cela, Antelope intègre (i) plusieurs composants prêts à l'emploi, couvrant les principales tâches de TAL, qui interagissent au sein d'un modèle de données linguistiques unifié ; (ii) un lexique sémantique multilingue à large couverture constitué à partir de différentes sources. Un effort d'intégration permet d'offrir une plate-forme robuste et homogène ; l'ensemble constitue une interface syntaxe-sémantique opérationnelle. La thèse présente la plate-forme et la compare à d'autres projets de référence ; elle souligne les bonnes pratiques à prendre en termes d'architecture logicielle pour qu'un tel ensemble complexe reste maintenable ; elle introduit aussi une démarche semi-supervisée d'acquisition de connaissances à large échelle.
23

Identification et modélisation lexicographique des dépendances syntaxiques régies du français: le cas des dépendances nominales

Arbour Barbaud, Évelyne 04 1900 (has links)
Cette recherche porte sur l’interface entre la sémantique lexicale et la syntaxe, et elle s’inscrit dans le cadre du projet de base lexicale DiCo (acronyme pour Dictionnaire de combinatoire) à l’Observatoire de Linguistique Sens-Texte [OLST] de l’Université de Montréal. Le projet découle d'une volonté d'inscrire de façon concise et complète, à même le dictionnaire, le comportement syntaxique typique à chaque unité lexicale. Dans cette optique, nous encodons la cooccurrence des lexies nominales du DiCo avec leurs actants à l'intérieur d'un tableau de régime lexical (aussi connu sous le nom de schéma valenciel, structure argumentale, cadre de sous-catégorisation, structure prédicats-arguments, etc.), en notant entre autres les dépendances syntaxiques de surface impliquées. Dans ce mémoire, nous présentons les propriétés syntaxiques d'une dépendance nominale du français, celle que nous avons nommée attributive adnominale, de façon à exposer une méthodologie d'identification et de caractérisation des dépendances syntaxiques de surface. Nous donnons également la liste des dépendances nominales régies identifiées au cours de ce travail. Par la suite, nous exposons la création d'une base de données de régimes généralisés du français nommée CARNAVAL. Finalement, nous discutons des applications possibles de notre travail, particulièrement en ce qui a trait à la création d'une typologie des régimes lexicaux du français. / This research focuses on the interface between lexical semantics and syntax, and is part of the lexical database project called DiCo (acronym for Dictionnaire de combinatoire) at the Observatoire de Linguistique Sens-Texte [OLST] at the University of Montreal. The project aims to register in a concise and complete way the typical syntactic behavior of each lexical unit directly in the dictionary. To this end, we encode the co-occurrence of the DiCo's nominal lexical units with their actants within a government pattern (also known as valency structure, subcategorization frame, predicate-argument structure, etc.), using, among other things, the surface syntactic dependencies involved. In this dissertation, we present the syntactic properties of a French nominal dependency, the one that we named attributive adnominale, so as to expose a methodology for the identification and the characterization of surface syntactic dependencies. We also give the list of valence-controlled nominal dependencies that were identified in our work. Subsequently, we describe the creation of a database of generalized French government patterns named CARNAVAL. Finally, we discuss possible applications of our work, particularly in regard to the creation of a typology of French government patterns.
24

Didactique de la paraphrase : évaluation et développement de la compétence paraphrastique chez l'apprenant de français langue seconde

Tsedryk, Alexandra 18 January 2013 (has links)
This thesis aims to contribute to the improvement of the paraphrasing competence, or the ability to produce synonymous sentences, of advanced learners of French as a second language (L2). While possessing solid grammatical skills, advanced learners still produce lexical and stylistic errors and experience difficulties in reformulating their discourse. Paraphrasing competence is crucial for a language learner since it helps him to present an idea more clearly or circumvent a lexical gap, while allowing the learner to express the same meaning in multiple ways. The theoretical framework adopted is Meaning-Text lin-guistic theory (MTT), that attaches a great deal of importance to the description of lexical and paraphrastic relations and uses well-developped formal tools for the modeling of these relations. The thesis has two objectives. The first consists in elaborating a methodology for evalua-ting the paraphrasing competence of a speaker. The notion of paraphrasing competence is defined, and a test assessing the ability to paraphrase is created and administered to An-glophone learners of French and native speakers. Quantitative and qualitative criteria to establish four levels of paraphrasing competence – elementary, intermediate, advanced and superior - are identified. Characteristics of advanced learners’ paraphrasing competence are described. While pro-ducing all types of paraphrases, the L2 learner uses less lexico-syntactic paraphrasing operations, such as synonymic, antonymic or derivative substitutions. His paraphrasing means are less diverse than those of a native speaker. He also produces a high number of paraphrases with lexical and syntactic errors. The second objective of the thesis is to propose a didactic method of teaching paraphrase, taking into consideration the challenges that paraphrasing poses for L2 learners, identified by means of the paraphrasing test. Concepts of the Meaning-Text Theory are presented in a user-friendly format so that the theoretical linguistic knowledge becomes more accessible to L2 learners. A structured and explicit teaching approach is adopted, based on: (i) a selection of key concepts pertaining to the paraphrase and their definitions ; (ii) a selection of MTT paraphrasing rules and their explanation; (iii) paraphrasing exercices.The advocated pedagogical approach may serve as a reference tool for paraphrase didactics in French.
25

A lexical semantic study of Dene Suliné, an Athabaskan language

Holden, Joshua 08 1900 (has links)
Cette thèse constitue une étude systématique du lexique du déné sųłiné, une langue athabaskane du nord-ouest canadien. Elle présente les définitions et les patrons de combinatoire syntaxique et lexicale de plus de 200 unités lexicales, lexèmes et phrasèmes, qui représentent une partie importante du vocabulaire déné sųłiné dans sept domaines: les émotions, le caractère humain, la description physique des entités, le mouvement des êtres vivants, la position des entités, les conditions atmospheriques et les formations topologiques, en les comparant avec le vocubulaire équivalent de l'anglais. L’approche théorique choisie est la Théorie Sens-Texte (TST), une approche formelle qui met l’accent sur la description sémantique et lexicographique empiriques. La présente recherche relève d'importantes différences entre le lexique du déné sųłiné et celui de l'anglais à tous les niveaux: dans la correspondence entre la représentation conceptuelle, considérée (quasi-)extralinguistique, et la structure sémantique; dans les patrons de lexicalisation des unités lexicales, et dans les patrons de combinatoire syntaxique et lexicale, qui montrent parfois des traits propres au déné sųłiné intéressants. / This work constitutes a systematic lexical semantic study of Dene Sųłiné, an Athabaskan language from northwestern Canada. As such, it presents the lexicographic definitions, syntactic and lexical combinatorial patterns of over 200 lexical units (lexemes and idioms) representing part of the core Dene Sųłiné vocabulary for seven semantic fields: terms to describe emotions, human character, physical description, position of an object, atmospheric conditions and topographical features. The theoretical approach used is Meaning-Text Theory (MTT), a formal linguistic approach with a strong empirical focus on semantics and lexicography. This work finds significant differences between Dene Sųłiné and English at all levels: in the relationship between of (quasi-)extralinguistic concepts and linguistic meanings, in the lexicalization or conflation patterns one finds in meanings of lexical units, and finally in the syntactic and lexical combinatorial patterns, which also show interesting language-specific tendencies.
26

Vers une typologie des collocations à verbe support en malgache

Hanitramalala, Rita 04 1900 (has links)
No description available.
27

Intégration de VerbNet dans un réalisateur profond

Galarreta-Piquette, Daniel 08 1900 (has links)
No description available.
28

Le traitement des locutions en génération automatique de texte multilingue

Dubé, Michaelle 08 1900 (has links)
La locution est peu étudiée en génération automatique de texte (GAT). Syntaxiquement, elle forme un syntagme, alors que sémantiquement, elle ne constitue qu’une seule unité. Le présent mémoire propose un traitement des locutions en GAT multilingue qui permet d’isoler les constituants de la locution tout en conservant le sens global de celle-ci. Pour ce faire, nous avons élaboré une solution flexible à base de patrons universels d’arbres de dépendances syntaxiques vers lesquels pointent des patrons de locutions propres au français (Pausé, 2017). Notre traitement a été effectué dans le réalisateur de texte profond multilingue GenDR à l’aide des données du Réseau lexical du français (RL-fr). Ce travail a abouti à la création de 36 règles de lexicalisation par patron (indépendantes de la langue) et à un dictionnaire lexical pour les locutions du français. Notre implémentation couvre 2 846 locutions du RL-fr (soit 97,5 %), avec une précision de 97,7 %. Le mémoire se divise en cinq chapitres, qui décrivent : 1) l’architecture classique en GAT et le traitement des locutions par différents systèmes symboliques ; 2) l’architecture de GenDR, (principalement sa grammaire, ses dictionnaires, son interface sémantique-syntaxe et ses stratégies de lexicalisations) ; 3) la place des locutions dans la phraséologie selon la théorie Sens-Texte, ainsi que le RL-fr et ses patrons syntaxiques linéarisés ; 4) notre implémentation de la lexicalisation par patron des locutions dans GenDR, et 5) notre évaluation de la couverture de la précision de notre implémentation. / Idioms are rarely studied in natural language generation (NLG). Syntactically, they form a phrase, while semantically, they correspond to a single unit. In this master’s thesis, we propose a treatment of idioms in multilingual NLG that enables us to isolate their constituents while preserving their global meaning. To do so, we developed a flexible solution based on universal templates of syntactic dependency trees, onto which we map French-specific idiom patterns (Pausé, 2017). Our work was implemented in Generic Deep Realizer (GenDR) using data from the Réseau lexical du français (RL-fr). This resulted in the creation of 36 template-based lexicalization rules (independent of language) and of a lexical dictionary for French idioms. Our implementation covers 2846 idioms of the RL-fr (i.e., 97.5%), with an accuracy of 97.7%. We divided our analysis into five chapters, which describe: 1) the classical NLG architecture and the handling of idioms by different symbolic systems; 2) the architecture of GenDR (mainly its grammar, its dictionaries, its semantic-syntactic interface, and its lexicalization strategies); 3) the place of idioms in phraseology according to Meaning-Text Theory (théorie Sens-Texte), the RL-fr and its linearized syntactic patterns; 4) our implementation of the template lexicalization of idioms in GenDR; and 5) our evaluation of the coverage and the precision of our implementation.
29

L’erreur lexicale au secondaire : analyse d’erreurs lexicales d’élèves de 3e secondaire et description du rapport à l’erreur lexicale d’enseignants de français

Anctil, Dominic 12 1900 (has links)
Cette recherche vise à décrire 1) les erreurs lexicales commises en production écrite par des élèves francophones de 3e secondaire et 2) le rapport à l’erreur lexicale d’enseignants de français (conception de l’erreur lexicale, pratiques d’évaluation du vocabulaire en production écrite, modes de rétroaction aux erreurs lexicales). Le premier volet de la recherche consiste en une analyse d’erreurs à trois niveaux : 1) une description linguistique des erreurs à l’aide d’une typologie, 2) une évaluation de la gravité des erreurs et 3) une explication de leurs sources possibles. Le corpus analysé est constitué de 300 textes rédigés en classe de français par des élèves de 3e secondaire. L’analyse a révélé 1144 erreurs lexicales. Les plus fréquentes sont les problèmes sémantiques (30%), les erreurs liées aux propriétés morphosyntaxiques des unités lexicales (21%) et l’utilisation de termes familiers (17%). Cette répartition démontre que la moitié des erreurs lexicales sont attribuables à une méconnaissance de propriétés des mots autres que le sens et la forme. L’évaluation de la gravité des erreurs repose sur trois critères : leur acceptation linguistique selon les dictionnaires, leur impact sur la compréhension et leur degré d’intégration à l’usage. Les problèmes liés aux registres de langue sont généralement ceux qui sont considérés comme les moins graves et les erreurs sémantiques représentent la quasi-totalité des erreurs graves. Le troisième axe d’analyse concerne la source des erreurs et fait ressortir trois sources principales : l’influence de la langue orale, la proximité sémantique et la parenté formelle entre le mot utilisé et celui visé. Le second volet de la thèse concerne le rapport des enseignants de français à l’erreur lexicale et repose sur l’analyse de 224 rédactions corrigées ainsi que sur une série de huit entrevues menées avec des enseignants de 3e secondaire. Lors de la correction, les enseignants relèvent surtout les erreurs orthographiques ainsi que celles relevant des propriétés morphosyntaxiques des mots (genre, invariabilité, régime), qu’ils classent parmi les erreurs de grammaire. Les erreurs plus purement lexicales, c’est-à-dire les erreurs sémantiques, l’emploi de termes familiers et les erreurs de collocation, demeurent peu relevées, et les annotations des enseignants concernant ces types d’erreurs sont vagues et peu systématiques, donnant peu de pistes aux élèves pour la correction. L’évaluation du vocabulaire en production écrite est toujours soumise à une appréciation qualitative, qui repose sur l’impression générale des enseignants plutôt que sur des critères précis, le seul indicateur clair étant la répétition. Les explications des enseignants concernant les erreurs lexicales reposent beaucoup sur l’intuition, ce qui témoigne de certaines lacunes dans leur formation en lien avec le vocabulaire. Les enseignants admettent enseigner très peu le vocabulaire en classe au secondaire et expliquent ce choix par le manque de temps et d’outils adéquats. L’enseignement du vocabulaire est toujours subordonné à des tâches d’écriture ou de lecture et vise davantage l’acquisition de mots précis que le développement d’une réelle compétence lexicale. / This research aims to describe 1) francophone students’ lexical errors in writing and 2) teachers’ relation to lexical errors (conception of error, vocabulary evaluation practices, feedback provided). The first part of the research consists in a three-level error analysis: 1) a linguistic description based on an error typology, 2) an evaluation of error gravity and 3) an explanation of the possible sources of error. The corpus analyzed is composed of 300 texts written in French class by 3rd year high school students. The analysis revealed 1144 lexical errors. The most common are semantic problems (30%), errors related to morphosyntactic properties of words (21%) and the use of colloquial words (17%). This distribution shows that half of the lexical errors are due to a lack of knowledge of word properties other than meaning and form. The evaluation of error gravity is based on three criteria: their acceptability according to dictionaries, their impact on comprehension and their degree of integration to language. Problems related to register are usually those perceived as less serious and semantic problems represent the vast majority of serious errors. The third level of analysis concerns the possible causes of the errors and identifies three main sources: influence of oral language, semantic proximity and formal similarity between the word used and the target word. The second part of the thesis concerns French teachers’ relation to lexical errors and is based on the analysis of 224 corrected essays and eight interviews. When correcting, teachers focus their attention on errors involving morphosyntactic properties of words (gender, invariability, government pattern), which they consider as grammatical errors. The more genuine lexical errors (semantic errors, use of colloquial words and collocation errors) are rarely pointed out, and comments provided regarding these types of errors are vague and inconsistent, giving students very few hints for correction. The evaluation of vocabulary in written production is always subject to a qualitative assessment, based on the teacher’s general impression rather than specific criteria, the only clear indicator being repetition. The explanations teachers provide about lexical problems rely heavily on intuition, which shows some deficiencies in their training in regards to vocabulary.
30

L’erreur lexicale au secondaire : analyse d’erreurs lexicales d’élèves de 3e secondaire et description du rapport à l’erreur lexicale d’enseignants de français

Anctil, Dominic 12 1900 (has links)
Cette recherche vise à décrire 1) les erreurs lexicales commises en production écrite par des élèves francophones de 3e secondaire et 2) le rapport à l’erreur lexicale d’enseignants de français (conception de l’erreur lexicale, pratiques d’évaluation du vocabulaire en production écrite, modes de rétroaction aux erreurs lexicales). Le premier volet de la recherche consiste en une analyse d’erreurs à trois niveaux : 1) une description linguistique des erreurs à l’aide d’une typologie, 2) une évaluation de la gravité des erreurs et 3) une explication de leurs sources possibles. Le corpus analysé est constitué de 300 textes rédigés en classe de français par des élèves de 3e secondaire. L’analyse a révélé 1144 erreurs lexicales. Les plus fréquentes sont les problèmes sémantiques (30%), les erreurs liées aux propriétés morphosyntaxiques des unités lexicales (21%) et l’utilisation de termes familiers (17%). Cette répartition démontre que la moitié des erreurs lexicales sont attribuables à une méconnaissance de propriétés des mots autres que le sens et la forme. L’évaluation de la gravité des erreurs repose sur trois critères : leur acceptation linguistique selon les dictionnaires, leur impact sur la compréhension et leur degré d’intégration à l’usage. Les problèmes liés aux registres de langue sont généralement ceux qui sont considérés comme les moins graves et les erreurs sémantiques représentent la quasi-totalité des erreurs graves. Le troisième axe d’analyse concerne la source des erreurs et fait ressortir trois sources principales : l’influence de la langue orale, la proximité sémantique et la parenté formelle entre le mot utilisé et celui visé. Le second volet de la thèse concerne le rapport des enseignants de français à l’erreur lexicale et repose sur l’analyse de 224 rédactions corrigées ainsi que sur une série de huit entrevues menées avec des enseignants de 3e secondaire. Lors de la correction, les enseignants relèvent surtout les erreurs orthographiques ainsi que celles relevant des propriétés morphosyntaxiques des mots (genre, invariabilité, régime), qu’ils classent parmi les erreurs de grammaire. Les erreurs plus purement lexicales, c’est-à-dire les erreurs sémantiques, l’emploi de termes familiers et les erreurs de collocation, demeurent peu relevées, et les annotations des enseignants concernant ces types d’erreurs sont vagues et peu systématiques, donnant peu de pistes aux élèves pour la correction. L’évaluation du vocabulaire en production écrite est toujours soumise à une appréciation qualitative, qui repose sur l’impression générale des enseignants plutôt que sur des critères précis, le seul indicateur clair étant la répétition. Les explications des enseignants concernant les erreurs lexicales reposent beaucoup sur l’intuition, ce qui témoigne de certaines lacunes dans leur formation en lien avec le vocabulaire. Les enseignants admettent enseigner très peu le vocabulaire en classe au secondaire et expliquent ce choix par le manque de temps et d’outils adéquats. L’enseignement du vocabulaire est toujours subordonné à des tâches d’écriture ou de lecture et vise davantage l’acquisition de mots précis que le développement d’une réelle compétence lexicale. / This research aims to describe 1) francophone students’ lexical errors in writing and 2) teachers’ relation to lexical errors (conception of error, vocabulary evaluation practices, feedback provided). The first part of the research consists in a three-level error analysis: 1) a linguistic description based on an error typology, 2) an evaluation of error gravity and 3) an explanation of the possible sources of error. The corpus analyzed is composed of 300 texts written in French class by 3rd year high school students. The analysis revealed 1144 lexical errors. The most common are semantic problems (30%), errors related to morphosyntactic properties of words (21%) and the use of colloquial words (17%). This distribution shows that half of the lexical errors are due to a lack of knowledge of word properties other than meaning and form. The evaluation of error gravity is based on three criteria: their acceptability according to dictionaries, their impact on comprehension and their degree of integration to language. Problems related to register are usually those perceived as less serious and semantic problems represent the vast majority of serious errors. The third level of analysis concerns the possible causes of the errors and identifies three main sources: influence of oral language, semantic proximity and formal similarity between the word used and the target word. The second part of the thesis concerns French teachers’ relation to lexical errors and is based on the analysis of 224 corrected essays and eight interviews. When correcting, teachers focus their attention on errors involving morphosyntactic properties of words (gender, invariability, government pattern), which they consider as grammatical errors. The more genuine lexical errors (semantic errors, use of colloquial words and collocation errors) are rarely pointed out, and comments provided regarding these types of errors are vague and inconsistent, giving students very few hints for correction. The evaluation of vocabulary in written production is always subject to a qualitative assessment, based on the teacher’s general impression rather than specific criteria, the only clear indicator being repetition. The explanations teachers provide about lexical problems rely heavily on intuition, which shows some deficiencies in their training in regards to vocabulary.

Page generated in 0.0234 seconds