Spelling suggestions: "subject:"lexicosémantique"" "subject:"lexicosémantiques""
1 |
Consolidation endogène de réseaux lexico-sémantiques : Inférence et annotation de relations, règles d'inférence et langage dédié / Endogenous consolidation of lexico-semantic networksZarrouk, Manel 03 November 2015 (has links)
Développer des ressources lexico-sémantiques pour le Traitement Automatique des Langues Naturelles est un enjeu majeur du domaine. Ces ressources explicitant notamment des connaissances que seuls les humains possèdent, ont pour but de permettre aux applications de TALNune compréhension de texte assez fine et complète. De nouvelles approches populaires de construction de ces dernières impliquant l'externalisation ouverte (crowdsourcing) émergent en TALN. Elles ont confirmé leur efficacité et leur pertinence. Cependant, les ressources obtenues ne sont pas exemptes d'informations erronées ou de silences causés par l'absence de certaines relations sémantiques pertinentes et primordiales pour la bonne qualité. Dans ce travail de recherche, nous prenons comme exemple d'étude le réseau lexico-sémantique du projet JeuxDeMots et nous proposons un système de consolidation endogène pour ce type de réseaux.Ce système se base principalement sur l'enrichissement du réseau par l'inférence et l'annotation de nouvelles relations à partir de celles existantes, ainsi que l'extraction de règles d'inférence permettant de (re)générer une grande partie du réseau. Enfin, un langage dédié de manipulation du système de consolidation et du réseau lexico-sémantique est conçu et un premier prototype a été implémenté. / Developing lexico-semantic resources is a major issue in the Natural Language Processing field.These resources, by making explicit inter alia some knowledge possessed only by humans, aim at providing the ability of a precise and complete text understanding to NLP tasks. Popular resources-building strategies involving crowdsourcing are flowering in NLP and are proved to be successful. However, the resulted resources are not free of errors and lack some important semantic relations. In this PhD thesis, we used the french lexico-semantic network from the project JeuxDeMots as a case-study. We designed an endogenous consolidation system for this type of networks based on inferring and annotating new semantic relations using the already existing ones, as well as extracting and proposing inference rules able to (re)generate a considerable part of the network. In addition, we conceived a domain specific language for manipulating the consolidation system along with the network itself and a prototype was implemented.
|
2 |
Sémiostylistique de l'œuvre poétique de Louis Aragon / Semiostylistics of the Poetic Works of Louis AragonSoudani, Hind 03 October 2014 (has links)
Les concepts de topos, graphè, éthos et pathos contribuent activement à marquer la singularité d’une œuvre poétique, en l’occurrence, dans le cadre de notre thèse, celle de Louis Aragon (1897- 1982).Aragon fut l’inspirateur de compositeurs et d’interprètes comme « Kosma, Douai, Ferré, Ferrat, Brassens, Claveau, Montand, Trenet, Béart, Morelli, Martin, Ogeret ». Il déclare même qu’il aime qu’on lise ses poèmes mais préfère qu’on les chante. Outre l’importance de la dimension visuelle, la composante sonore et rythmique s’avère elle aussi capitale dans la perception et la réception de la poésie d’Aragon. C’est la raison pour laquelle nous avons opté dans notre thèse pour une étude analytique sémiostylistique et lexico-sémantique de l’œuvre poétique aragonienne.La sémiostylistique est « l’étude du fonctionnement sémiotique du style d’un texte ». En nous inspirant des travaux de G. Molinié, nous avons tenté d’analyser le « conglomérat lexico-syntactico-rhétorico-thématique » qui caractérise la poésie aragonienne en tentant d’ « apprécier la littérarité » des « segments occurrents, et [de] détecter leur spécificité ». Cela nous a permis de poser la question des conditions de la littérarité, de sa mesure, de sa valeur à réception et donc de l’effet de l’art à travers des procédés d’unité ou, au contraire, de subversion. / The concepts topos, graph, ethos and pathos actively contribute to highlight the singularity of a poetic work, such as that of Louis Aragon (1897-1982), the object of study of the present thesis. Aragon inspired many composers and singers such as "Kosma, Douai, Shoed, Ferrat, Brassens, Archstone, Montand, Trenet, Béart, Morelli, Martin, Ogeret".He even declares that he likes that his poems to be read but prefers are sung. Apart from the importance of the visual dimension, the sound and rhythmic components are also capital in the perception and the reception of the poetry of Aragon. This is why I opted in the present thesis for a semiostylistic and lexico-semantic analytical study of Aragon’s works of poetry. Semiostylistics is "the study of the semiotic operation of the style of a given text". Inspired by the works of G. Molinié, I tried to analyse the "conglomerate of lexico-syntactic, rhetorical and thematic characteristics" of Aragon’s poetry while trying "to appreciate the literariness" of the "occurring segments, and to detect their specificity" which enabled me to explore the conditions of the literary value, its measurement, its value at reception and, thus, the effect of art through the processes of unity or, on the contrary, subversion.
|
3 |
LE DISCOURS POLITIQUE RELATIF A AMÉNAGEMENT LINGUISTIQUE EN FRANCE (1997-2002)Cherkaoui Messin, Kenza 03 December 2009 (has links) (PDF)
LE DISCOURS POLITIQUE RELATIF À L'AMENAGEMENT LINGUISTIQUE EN FRANCE (1997-2002) L'histoire de France est marquée depuis le XVIe siècle par l'uniformisation linguistique. La République a ouvert son ère par une Terreur politique qui s'est accompagnée de Terreur linguistique. Depuis, France et français sont intimement liés dans l'organisation comme dans les imaginaires politiques. Or, à un moment récent et bref de l'histoire de France, lors de la XIème législature (1997-2002), le débat a émergé quant à l'opportunité de reconnaitre une diversité linguistique de moins en moins importante sur le territoire national, les locuteurs des langues régionales disparaissant progressivement par un pur effet démographique. En effet, le débat sur la Charte européenne des langues régionales ou minoritaires (1999) puis sur le statut de la Corse (2001) a occupé la scène politique et médiatique française comme rarement les questions de statut des langues en France l'avaient fait. La multiplicité des lieux d'expression et des conditions de production et de réception des discours politiques a nécessité, pour aborder ce que les médias nomment « la classe politique » et que nous définissons comme une communauté discursive, la construction d'un corpus fortement hétérogène. Séances parlementaires à l'Assemblée nationale ou au Sénat, rapports, avis, projets ou propositions de loi, questions au gouvernement, mais également expression de la communauté discursive des hommes et des femmes politiques dans la presse écrite et audiovisuelle ont été réunis pour tenter de saisir le débat dans son ensemble. L'hétérogénéité constitutive du corpus a justifié un traitement différencié des sous corpus, en fonction de leur lieu de production et de leurs conditions de transmission : le corpus parlementaire, représentant plus de 250000 mots a fait l'objet d'un traitement automatique par Lexico3, ce qui a permis d'entrer dans le corpus. Le traitement lexicométrique de l'ensemble parlementaire et traitement manuel des corpus médiatiques ont été articulés de manière féconde : une analyse de discours à entrée lexicale a été possible grâce à la façon dont le traitement automatique a mis en valeur des phénomènes de catégorisation opérées par les locuteurs au moyen du lexique. L'approche lexico-sémantique a été complétée d'une cartographie des arguments en présence : la communauté discursive des hommes politiques dessine des imaginaires sociodiscursifs. Des idéologies concurrentes de ce qu'est la Nation et de son devenir s'opposent alors.
|
4 |
L'organisation du système lexico-sémantique dans le cerveau monolingue et bilingue en développement / Lexical-semantic system organization in the monolingual and bilingual developing brainSirri, Louah 13 March 2015 (has links)
L'objectif de cette thèse est d'étudier le développement du système lexico-sémantique chez les enfants monolingues et bilingues. La question posée est la suivante : quand et comment les significations des mots commencent à être reliées entre elles et à s'intégrer dans un système sémantique interconnecté. Dans un premier temps, trois études ont été menées chez des enfants monolingues français. L'Etude 1, a pour but d'observer si les mots sont organisés selon des liens taxonomiques (e.g., cochon - cheval). L'Etude 2 explore si l'effet d'amorçage sémantique est sous-tendu par des mécanismes cognitifs, comme les processus d'activation automatique et contrôlé. Puis enfin, l'Etude 3 observe si les mots sont organisés en fonction de leur distance de similarité sémantique (e.g., vache - mouton versus vache - cerf). Dans un deuxième temps, deux études ont été conduites chez des enfants apprenant deux langues simultanément. L'Etude 4 vise à déterminer si les mots sont taxonomiquement liés dans chacune des langues. L'Etude 5 explore si les mots présentés dans une langue activent leurs représentations sémantiques dans l'autre langue et vice versa. Dans le but de répondre à ces questions, le traitement lexico-sémantique a été étudié en utilisant deux techniques : l'eye-tracking et les potentiels évoqués (PEs). Ces deux techniques enregistrent lors de la présentation des mots des réponses comportementales (Etude 3) et neuronales (Etude 1, 2, 4 et 5) de haute résolution temporelle. Les Etudes 1 et 2 montrent que chez les monolingues les mots sont liés taxonomiquement à l'âge de 18 et 24 mois. Durant le développement du langage, les deux processus d'activation automatique et contrôlé sont impliqués dans le traitement des mots (Etude 2). L'Etude 3 montre qu'à 24 mois, les mots sont organisés dans le système lexico-sémantique en développement selon la distance des similarités sémantiques. L'Etude 4 montre que chez les enfants bilingues, le traitement sémantique ne diffère pas selon les deux langues, mais la topographie des PEs varie selon la langue traitée. L'Etude 5 montre que les mots présentés dans une langue activent leurs représentations sémantiques dans la deuxième langue et vice versa. Toutefois, la topographie des PEs est modulée selon la direction de traduction. Ces résultats suggèrent que l'acquisition de deux langues, bien qu'elle soit très précoce, requière deux ressources neuronales bien distinctes, sous-tendant ainsi le traitement lexico-sémantique des langues dominante et non-dominante. / The present doctoral research explored the developing lexical-semantic system in monolingual and bilingual toddlers. The question of how and when word meanings are first related to each other and become integrated into an interconnected semantic system was investigated. Three studies were conducted with monolingual French learning children which aimed at exploring how words are organized, that is, according to taxonomic relationships (e.g., pig - horse) and to semantic similarity distances between words (e.g., cow - sheep versus cow - deer), and whether cognitive mechanisms, such as automatic activation and controlled processes, underlie priming effects. An additional two studies conducted with children learning two languages simultaneously, aimed at determining, first, whether taxonomically related word meanings, in each of the two languages, are processed in a similar manner. The second goal was to explore whether words presented in one language activate words in another language, and vice versa. In an attempt to answer these questions, lexical-semantic processing was explored by two techniques: eye-tracking and event-related potentials (ERPs) techniques. Both techniques provide high temporal resolution measures of word processing but differ in terms of responses. Eye-movement measurements (Study III) reflect looking preferences in response to spoken words and their time-course, whereas ERPs reflect implicit brain responses and their activity patterns (Study I, II, IV, and V). Study I and II revealed that words are taxonomically organized at 18 and 24-month-olds. Both automatic and controlled processes were shown to be involved in word processing during language development (Study II). Study III revealed that at 24-month-olds, categorical and feature overlap between items underpin the developing lexical-semantic system. That is, lexical-items in each semantic category are organized according to graded similarity distances. Productive vocabulary skills influenced word recognition and were related to underlying cognitive mechanisms. Study IV revealed no differences in terms of semantic processing in the bilinguals¿ two languages, but the ERP distribution across the scalp varied according to the language being processed. Study V showed that words presented in one language activate their semantic representations in the second language and the other way around. The distribution of the ERPs depended, however, on the direction of translation. The results suggest that even early dual language experience yields distinct neural resources underlying lexical-semantic processing in the dominant and non-dominant languages during language acquisition.
|
5 |
L'organisation du système lexico-sémantique dans le cerveau monolingue et bilingue en développement / Lexical-semantic system organization in the monolingual and bilingual developing brainSirri, Louah 13 March 2015 (has links)
L'objectif de cette thèse est d'étudier le développement du système lexico-sémantique chez les enfants monolingues et bilingues. La question posée est la suivante : quand et comment les significations des mots commencent à être reliées entre elles et à s'intégrer dans un système sémantique interconnecté. Dans un premier temps, trois études ont été menées chez des enfants monolingues français. L'Etude 1, a pour but d'observer si les mots sont organisés selon des liens taxonomiques (e.g., cochon - cheval). L'Etude 2 explore si l'effet d'amorçage sémantique est sous-tendu par des mécanismes cognitifs, comme les processus d'activation automatique et contrôlé. Puis enfin, l'Etude 3 observe si les mots sont organisés en fonction de leur distance de similarité sémantique (e.g., vache - mouton versus vache - cerf). Dans un deuxième temps, deux études ont été conduites chez des enfants apprenant deux langues simultanément. L'Etude 4 vise à déterminer si les mots sont taxonomiquement liés dans chacune des langues. L'Etude 5 explore si les mots présentés dans une langue activent leurs représentations sémantiques dans l'autre langue et vice versa. Dans le but de répondre à ces questions, le traitement lexico-sémantique a été étudié en utilisant deux techniques : l'eye-tracking et les potentiels évoqués (PEs). Ces deux techniques enregistrent lors de la présentation des mots des réponses comportementales (Etude 3) et neuronales (Etude 1, 2, 4 et 5) de haute résolution temporelle. Les Etudes 1 et 2 montrent que chez les monolingues les mots sont liés taxonomiquement à l'âge de 18 et 24 mois. Durant le développement du langage, les deux processus d'activation automatique et contrôlé sont impliqués dans le traitement des mots (Etude 2). L'Etude 3 montre qu'à 24 mois, les mots sont organisés dans le système lexico-sémantique en développement selon la distance des similarités sémantiques. L'Etude 4 montre que chez les enfants bilingues, le traitement sémantique ne diffère pas selon les deux langues, mais la topographie des PEs varie selon la langue traitée. L'Etude 5 montre que les mots présentés dans une langue activent leurs représentations sémantiques dans la deuxième langue et vice versa. Toutefois, la topographie des PEs est modulée selon la direction de traduction. Ces résultats suggèrent que l'acquisition de deux langues, bien qu'elle soit très précoce, requière deux ressources neuronales bien distinctes, sous-tendant ainsi le traitement lexico-sémantique des langues dominante et non-dominante. / The present doctoral research explored the developing lexical-semantic system in monolingual and bilingual toddlers. The question of how and when word meanings are first related to each other and become integrated into an interconnected semantic system was investigated. Three studies were conducted with monolingual French learning children which aimed at exploring how words are organized, that is, according to taxonomic relationships (e.g., pig - horse) and to semantic similarity distances between words (e.g., cow - sheep versus cow - deer), and whether cognitive mechanisms, such as automatic activation and controlled processes, underlie priming effects. An additional two studies conducted with children learning two languages simultaneously, aimed at determining, first, whether taxonomically related word meanings, in each of the two languages, are processed in a similar manner. The second goal was to explore whether words presented in one language activate words in another language, and vice versa. In an attempt to answer these questions, lexical-semantic processing was explored by two techniques: eye-tracking and event-related potentials (ERPs) techniques. Both techniques provide high temporal resolution measures of word processing but differ in terms of responses. Eye-movement measurements (Study III) reflect looking preferences in response to spoken words and their time-course, whereas ERPs reflect implicit brain responses and their activity patterns (Study I, II, IV, and V). Study I and II revealed that words are taxonomically organized at 18 and 24-month-olds. Both automatic and controlled processes were shown to be involved in word processing during language development (Study II). Study III revealed that at 24-month-olds, categorical and feature overlap between items underpin the developing lexical-semantic system. That is, lexical-items in each semantic category are organized according to graded similarity distances. Productive vocabulary skills influenced word recognition and were related to underlying cognitive mechanisms. Study IV revealed no differences in terms of semantic processing in the bilinguals¿ two languages, but the ERP distribution across the scalp varied according to the language being processed. Study V showed that words presented in one language activate their semantic representations in the second language and the other way around. The distribution of the ERPs depended, however, on the direction of translation. The results suggest that even early dual language experience yields distinct neural resources underlying lexical-semantic processing in the dominant and non-dominant languages during language acquisition.
|
6 |
L'organisation du système lexico-sémantique dans le cerveau monolingue et bilingue en développement / Lexical-semantic system organization in the monolingual and bilingual developing brainSirri, Louah 13 March 2015 (has links)
L'objectif de cette thèse est d'étudier le développement du système lexico-sémantique chez les enfants monolingues et bilingues. La question posée est la suivante : quand et comment les significations des mots commencent à être reliées entre elles et à s'intégrer dans un système sémantique interconnecté. Dans un premier temps, trois études ont été menées chez des enfants monolingues français. L'Etude 1, a pour but d'observer si les mots sont organisés selon des liens taxonomiques (e.g., cochon - cheval). L'Etude 2 explore si l'effet d'amorçage sémantique est sous-tendu par des mécanismes cognitifs, comme les processus d'activation automatique et contrôlé. Puis enfin, l'Etude 3 observe si les mots sont organisés en fonction de leur distance de similarité sémantique (e.g., vache - mouton versus vache - cerf). Dans un deuxième temps, deux études ont été conduites chez des enfants apprenant deux langues simultanément. L'Etude 4 vise à déterminer si les mots sont taxonomiquement liés dans chacune des langues. L'Etude 5 explore si les mots présentés dans une langue activent leurs représentations sémantiques dans l'autre langue et vice versa. Dans le but de répondre à ces questions, le traitement lexico-sémantique a été étudié en utilisant deux techniques : l'eye-tracking et les potentiels évoqués (PEs). Ces deux techniques enregistrent lors de la présentation des mots des réponses comportementales (Etude 3) et neuronales (Etude 1, 2, 4 et 5) de haute résolution temporelle. Les Etudes 1 et 2 montrent que chez les monolingues les mots sont liés taxonomiquement à l'âge de 18 et 24 mois. Durant le développement du langage, les deux processus d'activation automatique et contrôlé sont impliqués dans le traitement des mots (Etude 2). L'Etude 3 montre qu'à 24 mois, les mots sont organisés dans le système lexico-sémantique en développement selon la distance des similarités sémantiques. L'Etude 4 montre que chez les enfants bilingues, le traitement sémantique ne diffère pas selon les deux langues, mais la topographie des PEs varie selon la langue traitée. L'Etude 5 montre que les mots présentés dans une langue activent leurs représentations sémantiques dans la deuxième langue et vice versa. Toutefois, la topographie des PEs est modulée selon la direction de traduction. Ces résultats suggèrent que l'acquisition de deux langues, bien qu'elle soit très précoce, requière deux ressources neuronales bien distinctes, sous-tendant ainsi le traitement lexico-sémantique des langues dominante et non-dominante. / The present doctoral research explored the developing lexical-semantic system in monolingual and bilingual toddlers. The question of how and when word meanings are first related to each other and become integrated into an interconnected semantic system was investigated. Three studies were conducted with monolingual French learning children which aimed at exploring how words are organized, that is, according to taxonomic relationships (e.g., pig - horse) and to semantic similarity distances between words (e.g., cow - sheep versus cow - deer), and whether cognitive mechanisms, such as automatic activation and controlled processes, underlie priming effects. An additional two studies conducted with children learning two languages simultaneously, aimed at determining, first, whether taxonomically related word meanings, in each of the two languages, are processed in a similar manner. The second goal was to explore whether words presented in one language activate words in another language, and vice versa. In an attempt to answer these questions, lexical-semantic processing was explored by two techniques: eye-tracking and event-related potentials (ERPs) techniques. Both techniques provide high temporal resolution measures of word processing but differ in terms of responses. Eye-movement measurements (Study III) reflect looking preferences in response to spoken words and their time-course, whereas ERPs reflect implicit brain responses and their activity patterns (Study I, II, IV, and V). Study I and II revealed that words are taxonomically organized at 18 and 24-month-olds. Both automatic and controlled processes were shown to be involved in word processing during language development (Study II). Study III revealed that at 24-month-olds, categorical and feature overlap between items underpin the developing lexical-semantic system. That is, lexical-items in each semantic category are organized according to graded similarity distances. Productive vocabulary skills influenced word recognition and were related to underlying cognitive mechanisms. Study IV revealed no differences in terms of semantic processing in the bilinguals¿ two languages, but the ERP distribution across the scalp varied according to the language being processed. Study V showed that words presented in one language activate their semantic representations in the second language and the other way around. The distribution of the ERPs depended, however, on the direction of translation. The results suggest that even early dual language experience yields distinct neural resources underlying lexical-semantic processing in the dominant and non-dominant languages during language acquisition.
|
7 |
Le discours politique relatif à l'aménagement linguistique en France (1997-2002) / Political discourse regarding language management in France (1997-2002)Cherkaoui Messin, Kenza 03 December 2009 (has links)
L’histoire de France est marquée depuis le XVIe siècle par l’uniformisation linguistique. La République a ouvert son ère par une Terreur politique qui s’est accompagnée de Terreur linguistique. Depuis, France et français sont intimement liés dans l’organisation comme dans les imaginaires politiques. Or, à un moment récent et bref de l’histoire de France, lors de la XIème législature [1997-2002], le débat a émergé quant à l’opportunité de reconnaitre une diversité linguistique de moins en moins importante sur le territoire national, les locuteurs des langues régionales disparaissant progressivement par un pur effet démographique. En effet, le débat sur la Charte européenne des langues régionales ou minoritaires [1999] puis sur le statut de la Corse [2001] a occupé la scène politique et médiatique française comme rarement les questions de statut des langues en France l’avaient fait. La multiplicité des lieux d’expression et des conditions de production et de réception des discours politiques a nécessité, pour aborder ce que les médias nomment « la classe politique » et que nous définissons comme une communauté discursive, la construction d’un corpus fortement hétérogène. Séances parlementaires à l’Assemblée nationale ou au Sénat, rapports, avis, projets ou propositions de loi, questions au gouvernement, mais également expression de la communauté discursive des hommes et des femmes politiques dans la presse écrite et audiovisuelle ont été réunis pour tenter de saisir le débat dans son ensemble. L’hétérogénéité constitutive du corpus a justifié un traitement différencié des sous corpus, en fonction de leur lieu de production et de leurs conditions de transmission : le corpus parlementaire, représentant plus de 250000 mots a fait l’objet d’un traitement automatique par Lexico3, ce qui a permis d’entrer dans le corpus. Le traitement lexicométrique de l’ensemble parlementaire et traitement manuel des corpus médiatiques ont été articulés de manière féconde : une analyse de discours à entrée lexicale a été possible grâce à la façon dont le traitement automatique a mis en valeur des phénomènes de catégorisation opérées par les locuteurs au moyen du lexique. L’approche lexico-sémantique a été complétée d’une cartographie des arguments en présence : la communauté discursive des hommes politiques dessine des imaginaires sociodiscursifs. Des idéologies concurrentes de ce qu’est la Nation et de son devenir s’opposent alors. / French history is influenced, since the 16th century, by language standardisation. The French Republic has started its era through political Terror that was completed by language Terror. Since, France and French have been intertwined in terms of politics as well as in terms of collective representations. However, in recent years, during the mandate of L. Jospin as a Prime Minister [1997-2002], France debated about the possibility of acknowledging its language diversity. Although, for mere demographic reasons, this diversity is fading away, it meets a strong social support. In 1999, with the opportunity of signing the European Charter for Regional or Minority Languages and in 2001 at the time where a possible new status was debated for Corsica, a language debate finally took place in France. From this debate, we built a corpus constructed to take into account all accessible discourse produced by French political personnel, seen as a discursive community. The consequence of such a project is a highly heterogeneous corpus, where Parliament debates, reports, law propositions etc. adjoin excerpts from written and audiovisual media. This heterogeneity commanded to approach the data differently: the vast corpus gathered from the Parliament [250,000 words approx.] underwent statistical treatment through Lexico3. This lexico-semantic analysis was hinged on manual analysis of the somewhat numerically smaller media corpus thanks to the lexical categorisation phenomena that were put into light via statistics. This lexico-semantic approach was completed by the analysis of the arguments deployed by different sides of the discursive community, as well as by an exploration of their collective representations of language management. Ideology about both the Nation and its future emerge from the debate, on a much wider scale than for languages [country’s unity, human rights, diversity, etc.].
|
8 |
Description du lexique spécialisé chinois et constitution d'une ressource didactique adaptée pour locuteurs non sinophonesHan, Zhiwei 10 1900 (has links)
L’enseignement-apprentissage du lexique spécialisé chinois est un chemin semé d’obstacles. Pour les apprenants non natifs, les combinaisons lexicales spécialisées (CLS) (L’Homme, 2000) soulèvent des difficultés syntaxico sémantiques et représentent ainsi un défi majeur dans l’acquisition de compétences lexicales. On recense, toutefois, peu de propositions méthodologiques pour résoudre ces difficultés dans la littérature consacrée à la didactique du chinois sur objectifs spécifiques (COS) (Q. Li, 2011).
Dans cette recherche, nous nous attachons à explorer de quelle manière une méthode de description lexicale basée sur une représentation sémantique et syntaxique assiste les apprenants non natifs dans la résolution des problèmes lexicaux soulevés par les CLS.
Notre thèse vise à concevoir une méthode de description des CLS en vue de la résolution de difficultés lexicales par les locuteurs non sinophones. La méthode mise au point est appliquée à l’élaboration du dictionnaire CHINOINFO, une ressource lexicale chinois-français portant sur le domaine de l’informatique. Cette ressource s’adresse aux apprenants francophones du chinois. L’objectif secondaire de notre thèse consiste à évaluer l’efficacité du CHINOINFO auprès des apprenants francophones qui reçoivent une formation de chinois dans un établissement universitaire au Québec ou en Chine.
Notre recherche fait appel à des notions empruntées à trois cadres théoriques. Premièrement, la Lexicologie explicative et combinatoire (Mel’čuk et al., 1995) nous sert d’appui théorique pour fonder la description des CLS sur la représentation sémantique du lexique spécialisé. Deuxièmement, notre démarche de collecte et d’analyse des CLS est guidée par l’approche lexico sémantique à la terminologie (L’Homme, 2020a). Enfin, nous nous appuyons sur l’approche cognitive en didactique des langues secondes (Chastain, 1990) pour envisager une présentation structurée des connaissances lexicales.
Notre démarche méthodologique s’est déroulée en trois phases. Nous avons d’abord assemblé un corpus spécialisé chinois pour en extraire un échantillon de CLS et les renseignements permettant de les décrire. L’analyse des données collectées à partir du corpus nous a amenée à anticiper trois types de difficultés syntaxico-sémantiques soulevées par les CLS : 1) distinguer les acceptions d’un polysème dans différentes CLS; 2) différencier les sens distincts de CLS de forme identique; 3) choisir les cooccurrents appropriés d’un terme.
À la deuxième phase, nous avons mobilisé différentes stratégies pour décrire les propriétés syntaxico-sémantiques des CLS. Une méthode descriptive intégrant les solutions proposées a ensuite été appliquée à la création du CHINOINFO. Cette ressource en ligne répertorie 91 termes fondamentaux du domaine de l’informatique, pour lesquels nous avons encodé au total 282 termes reliés et 644 CLS. La structuration des données au sein des articles s’est largement inspirée de l’adaptation du DiCoInfo (Observatoire de linguistique Sens-Texte, 2022) à un dictionnaire d’apprentissage (Alipour, 2014). Différents moyens techniques ont été mis en œuvre pour assurer la convivialité de la ressource.
La dernière phase de notre recherche consiste en une expérimentation comparative visant à évaluer l’efficacité pédagogique du CHINOINFO. Nous avons fait passer un test lexical à deux groupes d’apprenants francophones, soit le groupe contrôle (GC) et le groupe expérimental (GE), en leur proposant un nombre d’outils de référence. Seul le GE a eu accès à CHINOINFO. Nous avons aussi collecté, au moyen de questionnaires de sondage, le profil des participants ainsi que leur appréciation sur le test et les outils de référence proposés.
De manière générale, l’analyse comparative des résultats du test lexical montre que le GE a mieux réussi à résoudre les trois types de difficultés soulevées par les CLS. Les participants étaient plutôt satisfaits de l’organisation du test. Le GE a eu moins de difficultés à réaliser le test puisqu’il se sentait mieux outillé pour trouver des éléments de réponses aux questions du test par rapport GC. Le GE s’est exprimé favorablement quant à l’utilité du CHINOINFO pour résoudre les problèmes lexicaux dans le cadre de notre expérimentation.
Pour conclure, les résultats de notre analyse fournissent des indices sur l’apport du CHINOINFO en tant qu’une ressource d’apprentissage des CLS, ce qui laisse entrevoir l’intérêt de la méthode de description lexicale que nous avons proposée dans un contexte pédagogique. / The teaching and learning of Chinese specialized lexicon is a path strewn with obstacles. For non-native learners, specialized lexical combinations (SLCs) (L’Homme, 2000) raise syntactic and semantic difficulties and thus represent a major challenge in the acquisition of lexical skills. However, there are few methodological proposals to solve these difficulties in the literature devoted to the teaching practice and applied research of Chinese for specific purposes (Q. Li, 2011).
In this research, we explore how a lexical description method based on semantic and syntactic representation assists non-native learners in solving lexical problems raised by SLCs.
This thesis aims at designing a method for describing SLCs to help non-Chinese speakers solve lexical difficulties. The proposed method is applied to develop CHINOINFO, a Chinese-French dictionary of computer science and information technology terms. This lexical resource is designed for French-speaking learners of Chinese and can also be used as a writing tool for language professionals (translators, technical writers, and proofreaders), as well as professionals in this field. The secondary objective of this thesis is to evaluate the pedagogical effectiveness of the developed resource among French-speaking university students.
This research draws on concepts derived from three theoretical frameworks. Firstly, the Explanatory and Combinatorial Lexicology (Mel’čuk et al., 1995) provides theoretical support for founding the lexical description on the representation of semantic features of the specialized lexicon. Secondly, the collection and analysis of SLCs are guided by the lexical-semantic approach to terminology (L’Homme, 2020a). Finally, we draw on the cognitive approach to second language didactics (Chastain, 1990) to explore the effective ways to organize and present the descriptive information of the specialized lexicon.
Our methodological approach was carried out in three stages. We started by assembling a specialized Chinese corpus to extract a sample of SLCs and their descriptive information. The analysis of the data collected from the corpus led us to anticipate three types of syntaxico-semantic difficulties raised by SLCs: 1) distinguishing polysemes in different SLCs; 2) identifying, in a given context, the meaning of a lexical combination that is syntactically ambiguous; and 3) selecting appropriate co-occurrents for a term.
In the second stage, we deployed different strategies to describe the syntaxico-semantic features of SLCs. Subsequently, a descriptive method that incorporates the proposed solutions has been applied to the creation of CHINOINFO. This online lexical resource contains 91 basic terms related to computer science and information technology. For these terms, we encoded a total of 282 related terms and 644 SLCs. The organization of content in the entries has been largely inspired by the conversion of DiCoInfo (Observatoire de linguistique Sens-Texte, 2022) into a learner’s dictionary (Alipour, 2014). We used various techniques to make the resource user-friendly.
The final stage of our research consists of a comparative experiment to evaluate the pedagogical effectiveness of CHINOINFO. We had two groups of French-speaking learners, the control group (CG) and the experimental group (EG), take a lexical test by providing them with several reference materials. Only the EG had access to CHINOINFO during the test. We also collected the information about the participants' learning profile and their appreciation of the test and the proposed reference materials.
Overall, the comparative analysis of the test results shows that the GE succeeded better in solving the three types of difficulties raised by the SLCs. The participants were quite satisfied with the organization of the lexical test. The EG encountered less difficulty in answering questions during the test since they felt better equipped to find elements of answers in the reference materials than the GC. The EG commented favorably on the utility of CHINOINFO in solving lexical problems.
To conclude, the results of our experiment provide clues about the pedagogical interest of CHINOINFO as a SLC learning resource, which suggests the relevance of the lexical description method we proposed in a pedagogical context.
|
Page generated in 0.0613 seconds