Global ETD Search

1	Etude de la paraphrase sous-phrastique en traitement automatique des langues Bouamor, Houda 11 June 2012 (has links) (PDF) La variabilité en langue est une source majeure de difficultés dans la plupart des applications du traitement automatique des langues. Elle se manifeste dans le fait qu'une même idée ou un même événement peut être exprimé avec des mots ou des groupes de mots différents ayant la même signification dans leur contexte respectif. Capturer automatiquement des équivalences sémantiques entre des unités de texte est une tâche complexe mais qui s'avère indispensable dans de nombreux contextes. L'acquisition a priori de listes d'équivalences met à disposition des ressources utiles pour, par exemple, améliorer le repérage d'une réponse à une question, autoriser des formulations différentes en évaluation de la traduction automatique, ou encore aider des auteurs à trouver des formulations plus adaptées. Dans cette thèse, nous proposons une étude détaillée de la tâche d'acquisition de paraphrases sous-phrastiques à partir de paires d'énoncés sémantiquement liés. Nous démontrons empiriquement que les corpus parallèles monolingues, bien qu'extrêmement rares, constituent le type de ressource le plus adapté pour ce genre d'étude. Nos expériences mettent en jeu cinq techniques d'acquisition, représentatives de différentes approches et connaissances, en anglais et en français. Afin d'améliorer la performance en acquisition, nous réalisons la combinaison des paraphrases produites par ces techniques par une validation reposant sur un classifieur automatique à maximum d'entropie bi-classe. Un résultat important de notre étude est l'identification de paraphrases qui défient actuellement les techniques étudiées, lesquelles sont classées et quantifiées en anglais et français. Nous examinons également dans cette thèse l'impact de la langue, du type du corpus et la comparabilité des paires des énoncés utilisés sur la tâche d'acquisition de paraphrases sous- phrastiques. Nous présentons le résultat d'une analyse de la performance des différentes méthodes testées en fonction des difficultés d'alignement des paires de paraphrases d'énoncés. Nous donnons, ensuite, un compte rendu descriptif et quantitatif des caractéristiques des paraphrases trouvées dans les différents types de corpus étudiés ainsi que celles qui défient les approches actuelles d'identification automatique. [INFO:INFO_OH] Computer Science/Other [INFO:INFO_OH] Informatique/Autre Corpus monolingues Acquisition de paraphrase Classification automatique de paraphrase Typologie de paraphrase
2	Etude de la paraphrase sous-phrastique en traitement automatique des langues / A study of sub-sentential paraphrases in Natural Language Processing Bouamor, Houda 11 June 2012 (has links) La variabilité en langue est une source majeure de difficultés dans la plupart des applications du traitement automatique des langues. Elle se manifeste dans le fait qu’une même idée ou un même événement peut être exprimé avec des mots ou des groupes de mots différents ayant la même signification dans leur contexte respectif. Capturer automatiquement des équivalences sémantiques entre des unités de texte est une tâche complexe mais qui s’avère indispensable dans de nombreux contextes. L’acquisition a priori de listes d’équivalences met à disposition des ressources utiles pour, par exemple, améliorer le repérage d’une réponse à une question, autoriser des formulations différentes en évaluation de la traduction automatique, ou encore aider des auteurs à trouver des formulations plus adaptées. Dans cette thèse, nous proposons une étude détaillée de la tâche d’acquisition de paraphrases sous-phrastiques à partir de paires d’énoncés sémantiquement liés. Nous démontrons empiriquement que les corpus parallèles monolingues, bien qu’extrêmement rares, constituent le type de ressource le plus adapté pour ce genre d’étude. Nos expériences mettent en jeu cinq techniques d’acquisition, représentatives de différentes approches et connaissances, en anglais et en français. Afin d’améliorer la performance en acquisition, nous réalisons la combinaison des paraphrases produites par ces techniques par une validation reposant sur un classifieur automatique à maximum d’entropie bi-classe. Un résultat important de notre étude est l’identification de paraphrases qui défient actuellement les techniques étudiées, lesquelles sont classées et quantifiées en anglais et français. Nous examinons également dans cette thèse l’impact de la langue, du type du corpus et la comparabilité des paires des énoncés utilisés sur la tâche d’acquisition de paraphrases sous- phrastiques. Nous présentons le résultat d’une analyse de la performance des différentes méthodes testées en fonction des difficultés d’alignement des paires de paraphrases d’énoncés. Nous donnons, ensuite, un compte rendu descriptif et quantitatif des caractéristiques des paraphrases trouvées dans les différents types de corpus étudiés ainsi que celles qui défient les approches actuelles d’identification automatique. / Language variation, or the fact that messages can be conveyed in a great variety of ways by means of linguistic expressions, is one of the most challenging and certainly fascinating features of language for Natural Language Processing, with wide applications in language analysis and generation. The term paraphrase is now commonly used to refer to textual units of equivalent meaning, down to the level of sub-sentential fragments. Although one can envisage to manually build high-coverage lists of synonyms, enumerating meaning equivalences at the level of phrases is too daunting a task for humans. Consequently, acquiring this type of knowledge by automatic means has attracted a lot of attention and significant research efforts have been devoted to this objective. In this thesis we use parallel monolingual corpora for a detailed study of the task of sub-sentential paraphrase acquisition. We argue that the scarcity of this type of resource is compensated by the fact that it is the most suited corpus type for studies on paraphrasing. We propose a large exploration of this task with experiments on two languages with five different acquisition techniques, selected for their complementarity, their combinations, as well as four monolingual corpus types of varying comparability. We report, under all conditions, a significant improvement over all techniques by validating candidate paraphrases using a maximum entropy classifier. An important result of our study is the identification of difficult-to-acquire paraphrase pairs, which are classified and quantified in a bilingual typology. Corpus monolingues Acquisition de paraphrase Classification automatique de paraphrase Typologie de paraphrase Monolingual corpora Paraphrase acquisition Paraphrase automatic classification Paraphrase typology
3	L'organisation du système lexico-sémantique dans le cerveau monolingue et bilingue en développement / Lexical-semantic system organization in the monolingual and bilingual developing brain Sirri, Louah 13 March 2015 (has links) L'objectif de cette thèse est d'étudier le développement du système lexico-sémantique chez les enfants monolingues et bilingues. La question posée est la suivante : quand et comment les significations des mots commencent à être reliées entre elles et à s'intégrer dans un système sémantique interconnecté. Dans un premier temps, trois études ont été menées chez des enfants monolingues français. L'Etude 1, a pour but d'observer si les mots sont organisés selon des liens taxonomiques (e.g., cochon - cheval). L'Etude 2 explore si l'effet d'amorçage sémantique est sous-tendu par des mécanismes cognitifs, comme les processus d'activation automatique et contrôlé. Puis enfin, l'Etude 3 observe si les mots sont organisés en fonction de leur distance de similarité sémantique (e.g., vache - mouton versus vache - cerf). Dans un deuxième temps, deux études ont été conduites chez des enfants apprenant deux langues simultanément. L'Etude 4 vise à déterminer si les mots sont taxonomiquement liés dans chacune des langues. L'Etude 5 explore si les mots présentés dans une langue activent leurs représentations sémantiques dans l'autre langue et vice versa. Dans le but de répondre à ces questions, le traitement lexico-sémantique a été étudié en utilisant deux techniques : l'eye-tracking et les potentiels évoqués (PEs). Ces deux techniques enregistrent lors de la présentation des mots des réponses comportementales (Etude 3) et neuronales (Etude 1, 2, 4 et 5) de haute résolution temporelle. Les Etudes 1 et 2 montrent que chez les monolingues les mots sont liés taxonomiquement à l'âge de 18 et 24 mois. Durant le développement du langage, les deux processus d'activation automatique et contrôlé sont impliqués dans le traitement des mots (Etude 2). L'Etude 3 montre qu'à 24 mois, les mots sont organisés dans le système lexico-sémantique en développement selon la distance des similarités sémantiques. L'Etude 4 montre que chez les enfants bilingues, le traitement sémantique ne diffère pas selon les deux langues, mais la topographie des PEs varie selon la langue traitée. L'Etude 5 montre que les mots présentés dans une langue activent leurs représentations sémantiques dans la deuxième langue et vice versa. Toutefois, la topographie des PEs est modulée selon la direction de traduction. Ces résultats suggèrent que l'acquisition de deux langues, bien qu'elle soit très précoce, requière deux ressources neuronales bien distinctes, sous-tendant ainsi le traitement lexico-sémantique des langues dominante et non-dominante. / The present doctoral research explored the developing lexical-semantic system in monolingual and bilingual toddlers. The question of how and when word meanings are first related to each other and become integrated into an interconnected semantic system was investigated. Three studies were conducted with monolingual French learning children which aimed at exploring how words are organized, that is, according to taxonomic relationships (e.g., pig - horse) and to semantic similarity distances between words (e.g., cow - sheep versus cow - deer), and whether cognitive mechanisms, such as automatic activation and controlled processes, underlie priming effects. An additional two studies conducted with children learning two languages simultaneously, aimed at determining, first, whether taxonomically related word meanings, in each of the two languages, are processed in a similar manner. The second goal was to explore whether words presented in one language activate words in another language, and vice versa. In an attempt to answer these questions, lexical-semantic processing was explored by two techniques: eye-tracking and event-related potentials (ERPs) techniques. Both techniques provide high temporal resolution measures of word processing but differ in terms of responses. Eye-movement measurements (Study III) reflect looking preferences in response to spoken words and their time-course, whereas ERPs reflect implicit brain responses and their activity patterns (Study I, II, IV, and V). Study I and II revealed that words are taxonomically organized at 18 and 24-month-olds. Both automatic and controlled processes were shown to be involved in word processing during language development (Study II). Study III revealed that at 24-month-olds, categorical and feature overlap between items underpin the developing lexical-semantic system. That is, lexical-items in each semantic category are organized according to graded similarity distances. Productive vocabulary skills influenced word recognition and were related to underlying cognitive mechanisms. Study IV revealed no differences in terms of semantic processing in the bilinguals¿ two languages, but the ERP distribution across the scalp varied according to the language being processed. Study V showed that words presented in one language activate their semantic representations in the second language and the other way around. The distribution of the ERPs depended, however, on the direction of translation. The results suggest that even early dual language experience yields distinct neural resources underlying lexical-semantic processing in the dominant and non-dominant languages during language acquisition. Système lexico-sémantique Potentiels évoqués Eye-tracking Développement du language Monolingues Bilingues Lexical-semantic system Event-related brain potentials Eye-tracking Language development Monolinguals Bilinguals 150
4	L'organisation du système lexico-sémantique dans le cerveau monolingue et bilingue en développement / Lexical-semantic system organization in the monolingual and bilingual developing brain Sirri, Louah 13 March 2015 (has links) L'objectif de cette thèse est d'étudier le développement du système lexico-sémantique chez les enfants monolingues et bilingues. La question posée est la suivante : quand et comment les significations des mots commencent à être reliées entre elles et à s'intégrer dans un système sémantique interconnecté. Dans un premier temps, trois études ont été menées chez des enfants monolingues français. L'Etude 1, a pour but d'observer si les mots sont organisés selon des liens taxonomiques (e.g., cochon - cheval). L'Etude 2 explore si l'effet d'amorçage sémantique est sous-tendu par des mécanismes cognitifs, comme les processus d'activation automatique et contrôlé. Puis enfin, l'Etude 3 observe si les mots sont organisés en fonction de leur distance de similarité sémantique (e.g., vache - mouton versus vache - cerf). Dans un deuxième temps, deux études ont été conduites chez des enfants apprenant deux langues simultanément. L'Etude 4 vise à déterminer si les mots sont taxonomiquement liés dans chacune des langues. L'Etude 5 explore si les mots présentés dans une langue activent leurs représentations sémantiques dans l'autre langue et vice versa. Dans le but de répondre à ces questions, le traitement lexico-sémantique a été étudié en utilisant deux techniques : l'eye-tracking et les potentiels évoqués (PEs). Ces deux techniques enregistrent lors de la présentation des mots des réponses comportementales (Etude 3) et neuronales (Etude 1, 2, 4 et 5) de haute résolution temporelle. Les Etudes 1 et 2 montrent que chez les monolingues les mots sont liés taxonomiquement à l'âge de 18 et 24 mois. Durant le développement du langage, les deux processus d'activation automatique et contrôlé sont impliqués dans le traitement des mots (Etude 2). L'Etude 3 montre qu'à 24 mois, les mots sont organisés dans le système lexico-sémantique en développement selon la distance des similarités sémantiques. L'Etude 4 montre que chez les enfants bilingues, le traitement sémantique ne diffère pas selon les deux langues, mais la topographie des PEs varie selon la langue traitée. L'Etude 5 montre que les mots présentés dans une langue activent leurs représentations sémantiques dans la deuxième langue et vice versa. Toutefois, la topographie des PEs est modulée selon la direction de traduction. Ces résultats suggèrent que l'acquisition de deux langues, bien qu'elle soit très précoce, requière deux ressources neuronales bien distinctes, sous-tendant ainsi le traitement lexico-sémantique des langues dominante et non-dominante. / The present doctoral research explored the developing lexical-semantic system in monolingual and bilingual toddlers. The question of how and when word meanings are first related to each other and become integrated into an interconnected semantic system was investigated. Three studies were conducted with monolingual French learning children which aimed at exploring how words are organized, that is, according to taxonomic relationships (e.g., pig - horse) and to semantic similarity distances between words (e.g., cow - sheep versus cow - deer), and whether cognitive mechanisms, such as automatic activation and controlled processes, underlie priming effects. An additional two studies conducted with children learning two languages simultaneously, aimed at determining, first, whether taxonomically related word meanings, in each of the two languages, are processed in a similar manner. The second goal was to explore whether words presented in one language activate words in another language, and vice versa. In an attempt to answer these questions, lexical-semantic processing was explored by two techniques: eye-tracking and event-related potentials (ERPs) techniques. Both techniques provide high temporal resolution measures of word processing but differ in terms of responses. Eye-movement measurements (Study III) reflect looking preferences in response to spoken words and their time-course, whereas ERPs reflect implicit brain responses and their activity patterns (Study I, II, IV, and V). Study I and II revealed that words are taxonomically organized at 18 and 24-month-olds. Both automatic and controlled processes were shown to be involved in word processing during language development (Study II). Study III revealed that at 24-month-olds, categorical and feature overlap between items underpin the developing lexical-semantic system. That is, lexical-items in each semantic category are organized according to graded similarity distances. Productive vocabulary skills influenced word recognition and were related to underlying cognitive mechanisms. Study IV revealed no differences in terms of semantic processing in the bilinguals¿ two languages, but the ERP distribution across the scalp varied according to the language being processed. Study V showed that words presented in one language activate their semantic representations in the second language and the other way around. The distribution of the ERPs depended, however, on the direction of translation. The results suggest that even early dual language experience yields distinct neural resources underlying lexical-semantic processing in the dominant and non-dominant languages during language acquisition. Système lexico-sémantique Potentiels évoqués Eye-tracking Développement du language Monolingues Bilingues Lexical-semantic system Event-related brain potentials Eye-tracking Language development Monolinguals Bilinguals 150
5	L'organisation du système lexico-sémantique dans le cerveau monolingue et bilingue en développement / Lexical-semantic system organization in the monolingual and bilingual developing brain Sirri, Louah 13 March 2015 (has links) L'objectif de cette thèse est d'étudier le développement du système lexico-sémantique chez les enfants monolingues et bilingues. La question posée est la suivante : quand et comment les significations des mots commencent à être reliées entre elles et à s'intégrer dans un système sémantique interconnecté. Dans un premier temps, trois études ont été menées chez des enfants monolingues français. L'Etude 1, a pour but d'observer si les mots sont organisés selon des liens taxonomiques (e.g., cochon - cheval). L'Etude 2 explore si l'effet d'amorçage sémantique est sous-tendu par des mécanismes cognitifs, comme les processus d'activation automatique et contrôlé. Puis enfin, l'Etude 3 observe si les mots sont organisés en fonction de leur distance de similarité sémantique (e.g., vache - mouton versus vache - cerf). Dans un deuxième temps, deux études ont été conduites chez des enfants apprenant deux langues simultanément. L'Etude 4 vise à déterminer si les mots sont taxonomiquement liés dans chacune des langues. L'Etude 5 explore si les mots présentés dans une langue activent leurs représentations sémantiques dans l'autre langue et vice versa. Dans le but de répondre à ces questions, le traitement lexico-sémantique a été étudié en utilisant deux techniques : l'eye-tracking et les potentiels évoqués (PEs). Ces deux techniques enregistrent lors de la présentation des mots des réponses comportementales (Etude 3) et neuronales (Etude 1, 2, 4 et 5) de haute résolution temporelle. Les Etudes 1 et 2 montrent que chez les monolingues les mots sont liés taxonomiquement à l'âge de 18 et 24 mois. Durant le développement du langage, les deux processus d'activation automatique et contrôlé sont impliqués dans le traitement des mots (Etude 2). L'Etude 3 montre qu'à 24 mois, les mots sont organisés dans le système lexico-sémantique en développement selon la distance des similarités sémantiques. L'Etude 4 montre que chez les enfants bilingues, le traitement sémantique ne diffère pas selon les deux langues, mais la topographie des PEs varie selon la langue traitée. L'Etude 5 montre que les mots présentés dans une langue activent leurs représentations sémantiques dans la deuxième langue et vice versa. Toutefois, la topographie des PEs est modulée selon la direction de traduction. Ces résultats suggèrent que l'acquisition de deux langues, bien qu'elle soit très précoce, requière deux ressources neuronales bien distinctes, sous-tendant ainsi le traitement lexico-sémantique des langues dominante et non-dominante. / The present doctoral research explored the developing lexical-semantic system in monolingual and bilingual toddlers. The question of how and when word meanings are first related to each other and become integrated into an interconnected semantic system was investigated. Three studies were conducted with monolingual French learning children which aimed at exploring how words are organized, that is, according to taxonomic relationships (e.g., pig - horse) and to semantic similarity distances between words (e.g., cow - sheep versus cow - deer), and whether cognitive mechanisms, such as automatic activation and controlled processes, underlie priming effects. An additional two studies conducted with children learning two languages simultaneously, aimed at determining, first, whether taxonomically related word meanings, in each of the two languages, are processed in a similar manner. The second goal was to explore whether words presented in one language activate words in another language, and vice versa. In an attempt to answer these questions, lexical-semantic processing was explored by two techniques: eye-tracking and event-related potentials (ERPs) techniques. Both techniques provide high temporal resolution measures of word processing but differ in terms of responses. Eye-movement measurements (Study III) reflect looking preferences in response to spoken words and their time-course, whereas ERPs reflect implicit brain responses and their activity patterns (Study I, II, IV, and V). Study I and II revealed that words are taxonomically organized at 18 and 24-month-olds. Both automatic and controlled processes were shown to be involved in word processing during language development (Study II). Study III revealed that at 24-month-olds, categorical and feature overlap between items underpin the developing lexical-semantic system. That is, lexical-items in each semantic category are organized according to graded similarity distances. Productive vocabulary skills influenced word recognition and were related to underlying cognitive mechanisms. Study IV revealed no differences in terms of semantic processing in the bilinguals¿ two languages, but the ERP distribution across the scalp varied according to the language being processed. Study V showed that words presented in one language activate their semantic representations in the second language and the other way around. The distribution of the ERPs depended, however, on the direction of translation. The results suggest that even early dual language experience yields distinct neural resources underlying lexical-semantic processing in the dominant and non-dominant languages during language acquisition. Système lexico-sémantique Potentiels évoqués Eye-tracking Développement du language Monolingues Bilingues Lexical-semantic system Event-related brain potentials Eye-tracking Language development Monolinguals Bilinguals 150
6	Pratiques langagières et rapports aux identités linguistiques chez les enseignants et les élèves du Haouz : cas des lycées d'Aït Ourir (Maroc) / Language practices and relations with linguistic identities of teachers and students in high schools of Ait Ourir, Haouz, Morocco Kaddouri, Lahcen 27 October 2017 (has links) Cette recherche a pour objet l’étude de la manifestation des langues au niveau du répertoire linguistique et au niveau du répertoire identitaire dans un milieu plurilingue, à savoir les lycées d’Aït Ourir au Maroc. Au niveau de la pratique, l’analyse des conversations a dévoilé que l’alternance codique est une pratique courante chez les enseignants et les élèves et que le poids de chaque langue dépend de son utilité. Au niveau identitaire, l’identité plurilingue est dominante et le poids de chaque langue correspond à celui de la biographie linguistique de nos enquêtés. Le rapport entre le répertoire linguistique et le répertoire identitaire est disproportionnel. En effet, la comparaison synchronique a dévoilé que les langues de notre étude n’ont pas le même poids aux deux niveaux. D'une part, les tours monolingues sont dominants par contre l’identité monolingue est faible. D'autre part, les tours mixtes n’ont pas de poids tandis que l’identité plurilingue est prépondérante. En outre, la comparaison diachronique a permis de déduire que le changement est continu au niveau de la pratique alors qu’il tend à être stable au niveau identitaire de l’adolescence à l’âge adulte. Ce qui indique que l’identification en une langue ne dépend pas de sa pratique. / This research aims at studying the different aspects of language use at the levels of linguistic and identity repertoires in a multilingual environment; namely high schools in Aït Ourir, Haouz Province, Morocco. The analysis of conversations in the daily usage of languages revealed that Code Switching is a common practice among teachers as well as pupils; and that the weight of each language used depends more on its usefulness to the purpose of speaking. At the identity level, multilingual identity is dominant and the weight of each language is dependent up on the linguistic biography of the person surveyed. Thus, the relationship between the linguistic and identity repertoires is disproportionate. Indeed, synchronically comparing the languages in study confirmed that they don’t have the same weight at the two levels. The monolingual turn-taking is dominating whereas the monolingual identity is weak. On the other hand, the mixed turn-taking is meaningless whilst multilingual identity is significant. Moreover, the diachronic comparison enabled us to deduce that the change is ongoing in practice while it seems steady from adolescence to adulthood which shows that identifying in a language doesn’t depend on its practice. Répertoire linguistique Répertoire identitaire Pratiques langagières Identité linguistique Tours monolingues Identité monolingue Tours mixtes Identité plurilingue Linguistic repertoire Identity repertoire Language practices Linguistic identity Monolingual turn Monolingual identity Mixed turn Multilingual identity

1

Page generated in 0.0634 seconds