Global ETD Search

21	Le traitement des locutions en génération automatique de texte multilingue Dubé, Michaelle 08 1900 (has links) La locution est peu étudiée en génération automatique de texte (GAT). Syntaxiquement, elle forme un syntagme, alors que sémantiquement, elle ne constitue qu’une seule unité. Le présent mémoire propose un traitement des locutions en GAT multilingue qui permet d’isoler les constituants de la locution tout en conservant le sens global de celle-ci. Pour ce faire, nous avons élaboré une solution flexible à base de patrons universels d’arbres de dépendances syntaxiques vers lesquels pointent des patrons de locutions propres au français (Pausé, 2017). Notre traitement a été effectué dans le réalisateur de texte profond multilingue GenDR à l’aide des données du Réseau lexical du français (RL-fr). Ce travail a abouti à la création de 36 règles de lexicalisation par patron (indépendantes de la langue) et à un dictionnaire lexical pour les locutions du français. Notre implémentation couvre 2 846 locutions du RL-fr (soit 97,5 %), avec une précision de 97,7 %. Le mémoire se divise en cinq chapitres, qui décrivent : 1) l’architecture classique en GAT et le traitement des locutions par différents systèmes symboliques ; 2) l’architecture de GenDR, (principalement sa grammaire, ses dictionnaires, son interface sémantique-syntaxe et ses stratégies de lexicalisations) ; 3) la place des locutions dans la phraséologie selon la théorie Sens-Texte, ainsi que le RL-fr et ses patrons syntaxiques linéarisés ; 4) notre implémentation de la lexicalisation par patron des locutions dans GenDR, et 5) notre évaluation de la couverture de la précision de notre implémentation. / Idioms are rarely studied in natural language generation (NLG). Syntactically, they form a phrase, while semantically, they correspond to a single unit. In this master’s thesis, we propose a treatment of idioms in multilingual NLG that enables us to isolate their constituents while preserving their global meaning. To do so, we developed a flexible solution based on universal templates of syntactic dependency trees, onto which we map French-specific idiom patterns (Pausé, 2017). Our work was implemented in Generic Deep Realizer (GenDR) using data from the Réseau lexical du français (RL-fr). This resulted in the creation of 36 template-based lexicalization rules (independent of language) and of a lexical dictionary for French idioms. Our implementation covers 2846 idioms of the RL-fr (i.e., 97.5%), with an accuracy of 97.7%. We divided our analysis into five chapters, which describe: 1) the classical NLG architecture and the handling of idioms by different symbolic systems; 2) the architecture of GenDR (mainly its grammar, its dictionaries, its semantic-syntactic interface, and its lexicalization strategies); 3) the place of idioms in phraseology according to Meaning-Text Theory (théorie Sens-Texte), the RL-fr and its linearized syntactic patterns; 4) our implementation of the template lexicalization of idioms in GenDR; and 5) our evaluation of the coverage and the precision of our implementation. locution expression polylexicale génération automatique de texte lexicalisation théorie Sens-Texte réalisation linguistique idiom multiword expressions multilingual natural language generation lexicalization Meaning-Text theory linguistic realization
22	L’erreur lexicale au secondaire : analyse d’erreurs lexicales d’élèves de 3e secondaire et description du rapport à l’erreur lexicale d’enseignants de français Anctil, Dominic 12 1900 (has links) Cette recherche vise à décrire 1) les erreurs lexicales commises en production écrite par des élèves francophones de 3e secondaire et 2) le rapport à l’erreur lexicale d’enseignants de français (conception de l’erreur lexicale, pratiques d’évaluation du vocabulaire en production écrite, modes de rétroaction aux erreurs lexicales). Le premier volet de la recherche consiste en une analyse d’erreurs à trois niveaux : 1) une description linguistique des erreurs à l’aide d’une typologie, 2) une évaluation de la gravité des erreurs et 3) une explication de leurs sources possibles. Le corpus analysé est constitué de 300 textes rédigés en classe de français par des élèves de 3e secondaire. L’analyse a révélé 1144 erreurs lexicales. Les plus fréquentes sont les problèmes sémantiques (30%), les erreurs liées aux propriétés morphosyntaxiques des unités lexicales (21%) et l’utilisation de termes familiers (17%). Cette répartition démontre que la moitié des erreurs lexicales sont attribuables à une méconnaissance de propriétés des mots autres que le sens et la forme. L’évaluation de la gravité des erreurs repose sur trois critères : leur acceptation linguistique selon les dictionnaires, leur impact sur la compréhension et leur degré d’intégration à l’usage. Les problèmes liés aux registres de langue sont généralement ceux qui sont considérés comme les moins graves et les erreurs sémantiques représentent la quasi-totalité des erreurs graves. Le troisième axe d’analyse concerne la source des erreurs et fait ressortir trois sources principales : l’influence de la langue orale, la proximité sémantique et la parenté formelle entre le mot utilisé et celui visé. Le second volet de la thèse concerne le rapport des enseignants de français à l’erreur lexicale et repose sur l’analyse de 224 rédactions corrigées ainsi que sur une série de huit entrevues menées avec des enseignants de 3e secondaire. Lors de la correction, les enseignants relèvent surtout les erreurs orthographiques ainsi que celles relevant des propriétés morphosyntaxiques des mots (genre, invariabilité, régime), qu’ils classent parmi les erreurs de grammaire. Les erreurs plus purement lexicales, c’est-à-dire les erreurs sémantiques, l’emploi de termes familiers et les erreurs de collocation, demeurent peu relevées, et les annotations des enseignants concernant ces types d’erreurs sont vagues et peu systématiques, donnant peu de pistes aux élèves pour la correction. L’évaluation du vocabulaire en production écrite est toujours soumise à une appréciation qualitative, qui repose sur l’impression générale des enseignants plutôt que sur des critères précis, le seul indicateur clair étant la répétition. Les explications des enseignants concernant les erreurs lexicales reposent beaucoup sur l’intuition, ce qui témoigne de certaines lacunes dans leur formation en lien avec le vocabulaire. Les enseignants admettent enseigner très peu le vocabulaire en classe au secondaire et expliquent ce choix par le manque de temps et d’outils adéquats. L’enseignement du vocabulaire est toujours subordonné à des tâches d’écriture ou de lecture et vise davantage l’acquisition de mots précis que le développement d’une réelle compétence lexicale. / This research aims to describe 1) francophone students’ lexical errors in writing and 2) teachers’ relation to lexical errors (conception of error, vocabulary evaluation practices, feedback provided). The first part of the research consists in a three-level error analysis: 1) a linguistic description based on an error typology, 2) an evaluation of error gravity and 3) an explanation of the possible sources of error. The corpus analyzed is composed of 300 texts written in French class by 3rd year high school students. The analysis revealed 1144 lexical errors. The most common are semantic problems (30%), errors related to morphosyntactic properties of words (21%) and the use of colloquial words (17%). This distribution shows that half of the lexical errors are due to a lack of knowledge of word properties other than meaning and form. The evaluation of error gravity is based on three criteria: their acceptability according to dictionaries, their impact on comprehension and their degree of integration to language. Problems related to register are usually those perceived as less serious and semantic problems represent the vast majority of serious errors. The third level of analysis concerns the possible causes of the errors and identifies three main sources: influence of oral language, semantic proximity and formal similarity between the word used and the target word. The second part of the thesis concerns French teachers’ relation to lexical errors and is based on the analysis of 224 corrected essays and eight interviews. When correcting, teachers focus their attention on errors involving morphosyntactic properties of words (gender, invariability, government pattern), which they consider as grammatical errors. The more genuine lexical errors (semantic errors, use of colloquial words and collocation errors) are rarely pointed out, and comments provided regarding these types of errors are vague and inconsistent, giving students very few hints for correction. The evaluation of vocabulary in written production is always subject to a qualitative assessment, based on the teacher’s general impression rather than specific criteria, the only clear indicator being repetition. The explanations teachers provide about lexical problems rely heavily on intuition, which shows some deficiencies in their training in regards to vocabulary. Erreur lexicale Vocabulaire Analyse d'erreurs Langue première Production écrite Correction Didactique du français au secondaire Rapport à l'erreur Théorie Sens-Texte Lexical error Vocabulary Error analysis French teaching Written production Correction High school Error treatment in L1 writing Error gravity Meaning-Text Theory
23	L’erreur lexicale au secondaire : analyse d’erreurs lexicales d’élèves de 3e secondaire et description du rapport à l’erreur lexicale d’enseignants de français Anctil, Dominic 12 1900 (has links) Cette recherche vise à décrire 1) les erreurs lexicales commises en production écrite par des élèves francophones de 3e secondaire et 2) le rapport à l’erreur lexicale d’enseignants de français (conception de l’erreur lexicale, pratiques d’évaluation du vocabulaire en production écrite, modes de rétroaction aux erreurs lexicales). Le premier volet de la recherche consiste en une analyse d’erreurs à trois niveaux : 1) une description linguistique des erreurs à l’aide d’une typologie, 2) une évaluation de la gravité des erreurs et 3) une explication de leurs sources possibles. Le corpus analysé est constitué de 300 textes rédigés en classe de français par des élèves de 3e secondaire. L’analyse a révélé 1144 erreurs lexicales. Les plus fréquentes sont les problèmes sémantiques (30%), les erreurs liées aux propriétés morphosyntaxiques des unités lexicales (21%) et l’utilisation de termes familiers (17%). Cette répartition démontre que la moitié des erreurs lexicales sont attribuables à une méconnaissance de propriétés des mots autres que le sens et la forme. L’évaluation de la gravité des erreurs repose sur trois critères : leur acceptation linguistique selon les dictionnaires, leur impact sur la compréhension et leur degré d’intégration à l’usage. Les problèmes liés aux registres de langue sont généralement ceux qui sont considérés comme les moins graves et les erreurs sémantiques représentent la quasi-totalité des erreurs graves. Le troisième axe d’analyse concerne la source des erreurs et fait ressortir trois sources principales : l’influence de la langue orale, la proximité sémantique et la parenté formelle entre le mot utilisé et celui visé. Le second volet de la thèse concerne le rapport des enseignants de français à l’erreur lexicale et repose sur l’analyse de 224 rédactions corrigées ainsi que sur une série de huit entrevues menées avec des enseignants de 3e secondaire. Lors de la correction, les enseignants relèvent surtout les erreurs orthographiques ainsi que celles relevant des propriétés morphosyntaxiques des mots (genre, invariabilité, régime), qu’ils classent parmi les erreurs de grammaire. Les erreurs plus purement lexicales, c’est-à-dire les erreurs sémantiques, l’emploi de termes familiers et les erreurs de collocation, demeurent peu relevées, et les annotations des enseignants concernant ces types d’erreurs sont vagues et peu systématiques, donnant peu de pistes aux élèves pour la correction. L’évaluation du vocabulaire en production écrite est toujours soumise à une appréciation qualitative, qui repose sur l’impression générale des enseignants plutôt que sur des critères précis, le seul indicateur clair étant la répétition. Les explications des enseignants concernant les erreurs lexicales reposent beaucoup sur l’intuition, ce qui témoigne de certaines lacunes dans leur formation en lien avec le vocabulaire. Les enseignants admettent enseigner très peu le vocabulaire en classe au secondaire et expliquent ce choix par le manque de temps et d’outils adéquats. L’enseignement du vocabulaire est toujours subordonné à des tâches d’écriture ou de lecture et vise davantage l’acquisition de mots précis que le développement d’une réelle compétence lexicale. / This research aims to describe 1) francophone students’ lexical errors in writing and 2) teachers’ relation to lexical errors (conception of error, vocabulary evaluation practices, feedback provided). The first part of the research consists in a three-level error analysis: 1) a linguistic description based on an error typology, 2) an evaluation of error gravity and 3) an explanation of the possible sources of error. The corpus analyzed is composed of 300 texts written in French class by 3rd year high school students. The analysis revealed 1144 lexical errors. The most common are semantic problems (30%), errors related to morphosyntactic properties of words (21%) and the use of colloquial words (17%). This distribution shows that half of the lexical errors are due to a lack of knowledge of word properties other than meaning and form. The evaluation of error gravity is based on three criteria: their acceptability according to dictionaries, their impact on comprehension and their degree of integration to language. Problems related to register are usually those perceived as less serious and semantic problems represent the vast majority of serious errors. The third level of analysis concerns the possible causes of the errors and identifies three main sources: influence of oral language, semantic proximity and formal similarity between the word used and the target word. The second part of the thesis concerns French teachers’ relation to lexical errors and is based on the analysis of 224 corrected essays and eight interviews. When correcting, teachers focus their attention on errors involving morphosyntactic properties of words (gender, invariability, government pattern), which they consider as grammatical errors. The more genuine lexical errors (semantic errors, use of colloquial words and collocation errors) are rarely pointed out, and comments provided regarding these types of errors are vague and inconsistent, giving students very few hints for correction. The evaluation of vocabulary in written production is always subject to a qualitative assessment, based on the teacher’s general impression rather than specific criteria, the only clear indicator being repetition. The explanations teachers provide about lexical problems rely heavily on intuition, which shows some deficiencies in their training in regards to vocabulary. Erreur lexicale Vocabulaire Analyse d'erreurs Langue première Production écrite Correction Didactique du français au secondaire Rapport à l'erreur Théorie Sens-Texte Lexical error Vocabulary Error analysis French teaching Written production Correction High school Error treatment in L1 writing Error gravity Meaning-Text Theory

Page generated in 0.0573 seconds