Global ETD Search

1	Acquisition d'une langue seconde en milieu scolaire - Evaluation longitudinale réalisée auprès d'enfants francophones immergés en néerlandais. Lecocq, Katia 14 February 2008 (has links) Une évaluation longitudinale (de la 1ère à la 6ème année primaire) a été réalisée auprès d'enfants francophones apprenant le néerlandais comme langue seconde dans un contexte scolaire d'immersion linguistique. Leur développement linguistique a été comparé à celui d'enfants monolingues francophones et néerlandophones. Les objectifs de la recherche consistaient à déterminer (1) les conséquences positives ou négatives de la méthode immersive sur le développement linguistique des enfants dans leurs langues maternelle et seconde, (2) la langue la plus appropriée aux premiers pas dans l'acquisition de la lecture et de l'écriture (la langue maternelle ou la langue seconde caractérisée par un système écrit plus transparent), (3) les difficultés spécifiques rencontrées par ces enfants en immersion (acquisition de séquences phonologiques spécifiques à la langue seconde, interférences entre langues, etc.). Psycholinguistique comparaisons inter-langues immersion linguistique bilinguisme Psychologie cognitive
2	Fouille de documents et d'opinions multilingue / Mining Documents and Sentiments in Cross-lingual Context Saad, Motaz 20 January 2015 (has links) L’objectif de cette thèse est d’étudier les sentiments dans les documents comparables. Premièrement, nous avons recueillis des corpus comparables en anglais, français et arabe de Wikipédia et d’Euronews, et nous avons aligné ces corpus au niveau document. Nous avons en plus collecté des documents d’informations des agences de presse locales et étrangères dans les langues anglaise et arabe. Les documents en anglais ont été recueillis du site de la BBC, ceux en arabe du site d’Al-Jazzera. Deuxièmement, nous avons présenté une mesure de similarité cross-linguistique des documents dans le but de récupérer et aligner automatiquement les documents comparables. Ensuite, nous avons proposé une méthode d’annotation cross-linguistique en termes de sentiments, afin d’étiqueter les documents source et cible avec des sentiments. Enfin, nous avons utilisé des mesures statistiques pour comparer l’accord des sentiments entre les documents comparables source et cible. Les méthodes présentées dans cette thèse ne dépendent pas d’une paire de langue bien déterminée, elles peuvent être appliquées sur toute autre couple de langue / The aim of this thesis is to study sentiments in comparable documents. First, we collect English, French and Arabic comparable corpora from Wikipedia and Euronews, and we align each corpus at the document level. We further gather English-Arabic news documents from local and foreign news agencies. The English documents are collected from BBC website and the Arabic documents are collected from Al-jazeera website. Second, we present a cross-lingual document similarity measure to automatically retrieve and align comparable documents. Then, we propose a cross-lingual sentiment annotation method to label source and target documents with sentiments. Finally, we use statistical measures to compare the agreement of sentiments in the source and the target pair of the comparable documents. The methods presented in this thesis are language independent and they can be applied on any language pair Fouille de textes Corpus comparable Recherche d’information inter-Langues Projection inter-Langues Analyse des sentiments Text mining Natural language processing Comparable corpus Cross-Lingual information retrieval Cross-Lingual projection Sentiment analysis 006.312
3	L’expression du mouvement et son acquisition en français et en anglais : des premières formes aux premières constructions / Learning to express motion in English and French : from early communication to first constructions Rossi, Caroline 09 December 2010 (has links) Ce travail porte sur l’inscription de la notion extralinguistique de mouvement dans deux langues typologiquement différentes, et examine l’impact de ces différences sur les premiers développements langagiers. Les travaux récents sur la question montrent en effet qu’il existe des contraintes proprement linguistiques, en plus de contraintes générales liées à l’empreinte particulière qu’apporte la perception de l’espace et du mouvement à la cognition. Notre objectif est d’analyser la place de ces contraintes dans l’acquisition du langage, à partir de suivis longitudinaux d’enfants francophones et anglophones filmés dès les débuts du langage. Nous présentons d’abord plusieurs illustrations des hypothèses sur la précocité du mouvement, repérées dans les premières formes de communication : celles-ci dessinent des liens très précoces entre mouvement et langage, qui ne semblent pas dépendre de la langue adressée à l’enfant. Nous nous penchons ensuite sur l’impact des contraintes proprement linguistiques, que l’expression du déplacement fait apparaître. L’analyse du discours adressé à l’enfant permet de souligner l’importance des contextes de production, et de variations reflétant des choix énonciatifs différents : leur prise en compte atténue les différences inter-langues observées dans la littérature. Cependant, des contrastes plus marqués apparaissent dans les premières expressions du déplacement : ils montrent une prise en compte précoce des contraintes linguistiques. L’analyse de l’expression du déplacement en français révèle aussi une focalisation peut-être excessive de la typologie sémantique sur les valeurs spatiales. Pour montrer que la prise en compte des valeurs non spatiales importe y compris pour l’analyse de l’anglais, nous interrogeons l’articulation des valeurs spatiales et non spatiales dans l’acquisition des premières constructions, à partir d’un des premiers marqueurs utilisés par les enfants anglophones : up. / This dissertation starts from the expression of motion (an extralinguistic notion) in two typologically different languages, and analyses the impact of those differences in early language acquisition. Recent studies have highlighted the importance of linguistic constraints, in addition to general constraints linking our perception of space and motion with general cognitive processes. Our aim is to situate those constraints within a general understanding of first language acquisition: this will be achieved through analyses of longitudinal follow-ups of French and English-speaking children from early communication onwards. We start by isolating and discussing some features of early communication in which the primacy of motion is best illustrated. They are evidence for the existence of early links between motion and language, which do not seem to depend on the characteristics of the language acquired. We then examine the impact of linguistic constraints, as they appear in the expression of location changes. Child-directed speech shows important variations in context, but also in each speaker’s linguistic choices and strategies: cross-linguistic differences thus need to be reconsidered. However, more marked contrasts are seen in how children first express location changes: they are evidence for an early integration of linguistic constraints. Our analyses also underline the overrated status of spatial semantics in typology and cross-linguistic comparisons. In order to show that non spatial meaning matters, we finally question how both spatial and non-spatial semantics are implied in the acquisition of syntactic constructions with one of the first markers used by English-speaking children: up. Acquisition (précoce) du langage (L1) Mouvement Comparaison inter-langues Typologie sémantique Early (first) language acquisition Motion Cross-linguistic comparison Semantic typology
4	Les Triggers Inter-langues pour la Traduction Automatique Statistique Lavecchia, Caroline 23 June 2010 (has links) (PDF) Les recherches menées dans le cadre de mon doctorat concernent le domaine de la Traduction Automatique (TA), ou comment traduire d'une langue source vers une langue cible sans aucune intervention humaine. Mes travaux se sont plus particulièrement concentrés sur l'approche statistique de la TA qui consiste à utiliser différents modèles probabilistes appris sur des quantités importantes de corpus parallèles alignés afin de trouver la traduction la plus vraisemblable d'une phrase source. Deux problèmes étroitement liés à l'approche statistique de la TA sont abordés dans ce manuscrit : la collecte de corpus parallèles et l'estimation de modèles de traduction à partir de ces corpus. Un système de TA statistique extrait la connaissance dont il a besoin pour produire des traductions à partir de corpus parallèles dans lesquels chaque phrase source est associée à sa traduction dans la langue cible. De nombreux travaux utilisent comme corpus parallèle les actes du Parlement Européen disponibles gratuitement en différentes langues. De tels corpus ne sont pas adéquats pour la traduction de parole spontanée, c'est pourquoi j'ai décidé de construire des corpus parallèles à partir de sous-titres de films afin de construire un système de traduction plus réaliste. Les sous-titres sont des données complexes, ils ne peuvent constituer un corpus parallèle aligné dans leur état brut. Ils nécessitent une phase de pré-traitement et d'alignement. J'ai pour cela proposé une méthode originale basée sur la Programmation Dynamique qui aligne automatiquement les sous-titres. J'ai ainsi constitué une ressource importante et riche pour l'apprentissage des systèmes de TA statistique. La TA statistique repose sur l'utilisation de plusieurs modèles statistiques comme le modèle d'alignement, la table de traduction ou encore le modèle de distortion. La table de traduction est le modèle le plus indispensable à un système de TA statisque pour calculer la traduction la plus vraisemblable d'une phrase source. En effet, celle-ci donne les probabilités de traduction entre les couples de mots sources et cibles. Il existe différentes méthodes permettant l'estimation de ces tables de traduction. Elles ont habituellement recours à un alignement des mots obtenu automatiquement sur les corpus parallèles. Cette tâche d'alignement est une étape longue et fastidieuse qui fait appel à des algorithmes complexes. Le coeur de mon travail a été de repenser le problème et d'explorer de nouvelles pistes pour estimer les tables de traduction de mots et de séquences de mots, totalement différentes des méthodes état-de-l'art. J'ai proposé une approche originale basée sur le concept de triggers inter-langues qui ne nécessite aucun alignement des mots au sein des corpus parallèles. Les triggers inter-langues permettent de mettre en évidence des unités fortement corrélés en se basant sur l'Information Mutuelle. Dans notre cas les unités sont des séquences de mots sources et cibles. L'idée derrière ce concept est que si une séquence de mots sources est fortement corrélée à une séquence de mots cibles en termes d'IM, alors nous pouvons supposer que la présence de la première dans une phrase source déclenchera la présence de la seconde dans sa traduction et vice versa. J'ai proposé d'utiliser les triggers inter-langues sur les corpus parallèles dans le but de trouver les traductions possibles de séquences de mots et ainsi constituer une table de traduction. L'Information Mutuelle est une mesure de co-occurence qui se calcule simplement en un seul passage sur le corpus parallèle. Pour sélectionner les triggers interlangues, nous supposons que deux séquences sources et cibles co-occurent si elles apparaissent dans une même paire de phrases du corpus parallèle. De ce fait, ma méthode ne requiert qu'un alignement au niveau des phrases et non au niveau des mots au sein du corpus parallèle. L'utilisation des triggers inter-langues pour estimer une table de traduction rend mon approche moins complexe mais tout aussi efficace que les approches existantes. Dans un contexte de traduction mot-à-mot, la table de traduction obtenue grâce aux triggers inter-langues conduit à des traductions automatiques de meilleur qualité, en termes de score BLEU, que celles produites avec une table de traduction de mots estimée selon le modèle 3 d'IBM. Dans un contexte de traduction par groupe de mots, la table de traduction basée sur les triggers inter-langues amènent à des traductions automatiques dont le score BLEU est supérieur à 34 et proche de celui des traductions automatiques produites par une table de traduction de séquences estimées à partir de l'alignement des mots suivant les approches état-de-l'art. Mots-clés: Traduction Automatique Statistique, Triggers Inter-langues, Traduction Automatique à base de séquences [INFO] Computer Science Traduction Automatique Statistique Triggers Inter-langues Recuit Simulé
5	Parole, langues et disfluences : une étude linguistique et phonétique du bégaiement / Speech, languages and disfluencies : a linguistic and phonetic study of stuttering Didirkova, Ivana 24 November 2016 (has links) Le bégaiement est un trouble de la fluence de la parole qui se caractérise, entre autres, par une présence accrue d’accidents de parole venant entraver l’intelligibilité de l’énoncé. Ce travail de doctorat a pour objectif d’étudier les disfluences catégorisées comme pathologiques produites par des locuteurs qui bégaient et ce, en tâche de lecture et en situation de parole spontanée. Plus précisément, il s’agit, d’une part, de vérifier si des éléments morphologiques et phonétiques peuvent expliquer l’apparition d’un bégayage et, d’autre part, d’observer les événements articulatoires présents avant et pendant les disfluences. Pour mener à bien les études ayant trait aux éléments linguistiques posant le plus de difficultés aux personnes qui bégaient, 10 locuteurs francophones et 10 locuteurs slovacophones, tous atteints de ce trouble, ont été enregistrés en train de lire un texte et de parler spontanément dans leur langue maternelle. Quant aux travaux portant sur les événements moteurs se déroulant avant et durant les disfluences, ils ont été réalisés grâce à des données EMA acquises auprès de 4 locuteurs francophones (2 locuteurs qui bégaient et 2 sujets normo-fluents) en tâche de lecture. Nos résultats ont montré que les consonnes non-voisées et les occlusives faisaient partie des éléments les plus problématiques à prononcer pour les personnes bègues. L’étude morphologique a révélé que plus un mot contient de morphèmes et plus le risque de voir apparaître une disfluence est accru. Ce résultat doit notamment être mis en corrélation avec le nombre de syllabes présentes dans le mot. En ce qui concerne le second couple d’études, portant sur le niveau moteur de la parole bègue, nos données montrent, en particulier, des similitudes dans les événements articulatoires se déroulant au niveau supra-glottique entre les disfluences perçues acoustiquement comme des blocages et des prolongations. Enfin, une perturbation des gestes coarticulatoires a pu être relevée lors de la production de certaines disfluences. / Stuttering is a speech fluency disorder. It can be mainly characterized by an increased presence of disfluencies that affect the speech intelligibility. The aim of this thesis is to study stuttering-like disfluencies (SLDs) produced by persons who stutter (PWS) during reading tasks and during spontaneous speech. More specifically, we propose, as our first objective, to verify if any morphological or phonetic elements can explain the presence of these disfluencies. Our second objective is to observe articulatory events before and during SLDs. For the studies dealing with the linguistic and phonetic elements that can be problematic to PWS, 10 French-speaking and 10 Slovak-speaking PWS were recorded while reading a text and while having a conversation in their mother tongue. The studies on speech motor events taking place before and during SLDs were realized by means of an EMA. 4 French-speaking subjects participated in this part of the study (2 PWS and 2 control subjects). Our results show that non-voiced consonants and stops were part of the most problematic elements to produce for PWS. The morphological study reveals that the risk of a SLD appearance was higher when the word contained more morphemes. This result should be correlated to the number of syllables that constitute the word. As for the second couple of studies, they focus on the speech motor events in stuttered speech. Our data show that similar articulatory events can take place in the supraglottic cavity during disfluencies perceived as blocks or prolongations. Furthermore, a disruption of coarticulatory gestures was observed in certain disfluencies. Bégaiement Disfluences Étude inter-Langues Traits articulatoires Morphèmes Ema Stuttering Disfluencies Cross-Linguistic study Articulatory features Morphemes Ema
6	Compréhension de la parole dans la parole : une approche inter-langues pour évaluer les interférences linguistiques durant la compréhension / Speech-in-speech comprehension : a cross-linguistic study to evaluate the linguistic interference that occurs during the comprehension Gautreau, Aurore 20 December 2013 (has links) Cette thèse s’est intéressée aux interférences linguistiques intervenant dans la situation de la parole dans la parole, en comparant l’effet de masque de masqueurs paroliers générés dans une langue intelligible pour les participants (français) à celui de masqueurs paroliers générés dans des langues non connues (gaélique irlandais et italien), sur l’identification de mots cibles français. Une tâche de décision lexicale à -5 dB nous a permis d’observer des résultats significativement différents entre les masqueurs paroliers générés dans les langues inconnues (irlandais et italien), avec les masqueurs paroliers italiens qui ont réduit l’intelligibilité des mots cibles français avec la même efficacité que les masqueurs paroliers français, alors que les masqueurs paroliers irlandais ont conduit aux performances les plus élevées. L’utilisation de masqueurs de bruit fluctuant générés à partir de chacun des masqueurs paroliers, a montré que seuls les masqueurs paroliers générés dans une langue intelligible ont produit des interférences linguistiques de haut niveau en plus d’interférences acoustiques et linguistiques de bas niveau. Ainsi, la différence de performances observée entre les masqueurs paroliers irlandais et italiens serait expliquée au niveau acoustique et non à un niveau linguistique. De plus, bien que les masqueurs paroliers italiens et français aient eu des effets de masque équivalents, leurs interférences étaient de natures différentes. Lorsque l’italien devient intelligible pour les participants, les masqueurs paroliers italiens, comme ceux générés en français, produisent des interférences linguistiques de haut niveau, et ce, que les mots cibles soient produits dans la langue native des participants ou dans leur langue seconde. / This research aimed to explore the linguistic interference that occurs during the speech-in-speech situation, by comparing the masking effects of speech backgrounds that were produced in an intelligible language for the participants (i.e., French), to the masking effects of speech backgrounds that were produced in unknown foreign languages (i.e., Irish and Italian), on the identification of French target words. At -5 dB SNR, a lexical decision task revealed significantly divergent results with the unknown languages (i.e., Irish and Italian), with Italian and French speech backgrounds hindering French target word identification to a similar extent, whereas Irish speech backgrounds led to significantly better performances. Using fluctuating noise backgrounds derived from each speech background signals, showed that only the speech backgrounds generated in an intelligible language (i.e., French) produced linguistic interference of high level in addition to acoustic interference and linguistic interference of low level. Thus, the difference observed between the speech backgrounds in Irish and Italian can be explained at an acoustic level but not at a linguistic level. Moreover, although the speech backgrounds in French and in Italian had equivalent masking effects on French word identification, the nature of their interference was different. When Italian became intelligible to the participants, the speech backgrounds in Italian produced linguistic interference of high level like those generated in French, with the target words produced in the native language to the participants or in their second language. Inter-langues Bruit fluctuant Tâche de décision lexicale Accès au lexique Langue seconde Speech-in-speech comprehension Multilingual Fluctuating noise Linguistic interference of high level Lexical decision task Lexical access Second language
7	Voix de femmes, voix d'hommes : différences acoustiques, identification du genre par la voix et implications psycholinguistiques chez les locuteurs anglophones et francophones Pépiot, Erwan 03 April 2013 (has links) (PDF) Les différences entre les voix de femmes et d'hommes relèvent de problématiques complexes et pluridisciplinaires. Le travail de recherche présenté ici traite des aspects phonétiques et psycholinguistiques de ces différences inter-genres. Le premier chapitre est consacré à une revue de la littérature du domaine. Les différences acoustiques ainsi que leur origine sont abordées, de même que le processus d'identification du genre par la voix chez les auditeurs et les conséquences psycholinguistiques de ces différences acoustiques inter-genres. L'ensemble de ces études sont présentées de manière critique et des perspectives de recherche sont évoquées. Le deuxième chapitre présente une analyse acoustique de (pseudo-)mots dissyllabiques produits par des locuteurs anglophones du nord-est des Etats-Unis et des francophones parisiens. Les fréquences de résonance, le F0 moyen, la plage de variation de F0, le VOT, la différence d'intensité H1-H2 ainsi que la durée des énoncés ont été mesurés. Des différences inter-genres significatives ont été observées dans les deux langues sur chacun des paramètres testés. D'autre part, d'importantes variations inter-langues ont été constatées pour la plage de variation de F0, les formants vocaliques et la différence H1-H2. Ces résultats suggèrent que les différences acoustiques hommes-femmes sont en partie dépendantes de la langue. Les enregistrements analysés ont ensuite été utilisés dans le cadre d'une expérience d'identification du genre par la voix. Cette dernière a été menée conjointement sur des auditeurs francophones parisiens avec les stimuli français, et sur des auditeurs anglophones américains avec les stimuli anglais. Les auditeurs avaient pour tâche d'identifier le genre du locuteur ayant produit le stimulus et d'indiquer leur degré de certitude. Chez les locuteurs des deux langues, les pourcentages de bonnes réponses sont significativement supérieurs au seuil de chance dès la présentation d'une consonne sourde initiale de mot et la présentation d'une voyelle initiale suffit pour obtenir des scores proches des 100 %. On constate par ailleurs que les paramètres acoustiques n'ont pas influencé de la même manière les auditeurs des deux langues. Ainsi, le F0 moyen et la qualité de voix (H1-H2) semblent avoir plus fortement influencé les auditeurs anglophones que les francophones, à l'inverse de la fréquence des formants vocaliques et de la plage de variation de F0. Le quatrième et dernier chapitre est consacré à une expérience de détection de mots, réalisée auprès d'auditeurs francophones. Le but de cette expérience est de tester le temps de réponse des participants en fonction du genre du locuteur ayant produit le mot-cible. Les résultats suggèrent que les voix d'hommes et de femmes sont traitées par l'auditeur à vitesse équivalente, mais néanmoins comme deux entités différentes. D'autre part, aucune corrélation significative entre la fréquence fondamentale moyenne du mot-cible et le temps de réponse des auditeurs n'a pu être mise en évidence. En conclusion, il apparaît que les différences acoustiques inter-genres tout comme le processus d'identification du genre par la voix sont fortement dépendants de la langue et donc construits socialement. Des perspectives de recherche et des applications pratiques sont proposées. phonétique voix d'hommes voix de femmes différences acoustiques identification du genre par la voix traitement de la parole différences inter-langues locuteurs anglophones américains locuteurs francophones
8	Acquisition d'une seconde langue en milieu scolaire: évaluation longitudinale réalisée auprès d'enfants francophones immergés en néérlandais Lecocq, Katia 14 February 2008 (has links) Une évaluation longitudinale (de la 1ère à la 6ème année primaire) a été réalisée auprès d'enfants francophones apprenant le néerlandais comme langue seconde dans un contexte scolaire d'immersion linguistique. Leur développement linguistique a été comparé à celui d'enfants monolingues francophones et néerlandophones. Les objectifs de la recherche consistaient à déterminer (1) les conséquences positives ou négatives de la méthode immersive sur le développement linguistique des enfants dans leurs langues maternelle et seconde, (2) la langue la plus appropriée aux premiers pas dans l'acquisition de la lecture et de l'écriture (la langue maternelle ou la langue seconde caractérisée par un système écrit plus transparent), (3) les difficultés spécifiques rencontrées par ces enfants en immersion (acquisition de séquences phonologiques spécifiques à la langue seconde, interférences entre langues, etc.).<p> / Doctorat en Sciences Psychologiques et de l'éducation / info:eu-repo/semantics/nonPublished Psychologie Bilingualism in children -- Belgium Bilingualism -- Psychological aspects Second language acquisition Bilinguisme chez l'enfant -- Belgique Bilinguisme -- Aspect psychologique Langue seconde -- Acquisition Psycholinguistique comparaisons inter-langues immersion linguistique bilinguisme Psychologie cognitive

Search results