• Refine Query
  • Source
  • Publication year
  • to
  • Language
  • 84
  • 31
  • 22
  • 4
  • 4
  • 2
  • 2
  • 2
  • 1
  • 1
  • 1
  • Tagged with
  • 162
  • 68
  • 30
  • 30
  • 29
  • 29
  • 26
  • 26
  • 24
  • 20
  • 20
  • 16
  • 14
  • 14
  • 13
  • About
  • The Global ETD Search service is a free service for researchers to find electronic theses and dissertations. This service is provided by the Networked Digital Library of Theses and Dissertations.
    Our metadata is collected from universities around the world. If you manage a university/consortium/country archive and want to be added, details can be found on the NDLTD website.
141

Traduire Shâmlu, poète iranien en français / Translate Shâmlu, Iranian poet in French

Hempartian, Azita 23 December 2013 (has links)
La littérature persane est surtout connue en Occident par les excellentes traductions en français d'illustres poètes classiques comme Omar Khayyam, Roumi, Hafîz. Genre majeur de la littérature persane, la poésie s'impose pendant des siècles avec ses règles draconiennes de prosodie et de versification. Dans les années 1930, une jeune génération de poètes, sensibles aux transformations sociales, politiques, culturelles et ayant découvert la poésie et la littérature occidentales, s'est engagée dans une lutte systématique contre ces règles intangibles. Le pionnier de ce mouvement est Nimâ Yshij. Il rejette les règles de la poésie classique, aussi bien en ce qui concerne la métrique que la place de la rime. Ahmad Shâmlu, disciple de Nimâ, va plus loin en refusant même la prosodie. En rupture permanente, Shâmlu a marqué la poésie moderne persane, par son œuvre, par ses idées et par ses attitudes. Soucieux des événements de son temps et de sa société, ce poète, traducteur et directeur de revues, a lutté toute sa vie pour ses idéaux humanistes. Une anthologie de ses œuvres traduites en français permettra de faire découvrir aux amateurs ce grand poète persan moderne et contemporain. / Persian literature is best known in the West by the excellent French translations of famous classical poets like Omar Khayyam, Rumi, Hafeez. As a major genre of Persian literature, poetry has for centuries imposed draconian rules of prosody and versification. In the 1930s, younger generation of poets, sensitive to social, political and cultural changes, discovered Western poetry and literature, and engaged in a systamtic struggle against these intangible rules. the pioneer of this movment in Nima Yshij. Her rejected the rules of classical potry, where both versification and rhyme are concerned. Ahmad Shâmlu, a disciple of Nima, goes even further by refusing prosody. Breaking constantly with traditon, Shâmlu has left his mark on modern Persian poetry, in his work, and by his ideas and attitudes. Mindful of the events of his time and of his life for his humanistic ideals. An antthology of his works translatedinto French will enable poetry-lovers to discover this great modern contemporary Persian poet.
142

Synthèse de parole expressive au delà du niveau de la phrase : le cas du conte pour enfant : conception et analyse de corpus de contes pour la synthèse de parole expressive / Expressive speech synthesis beyond the level of the sentence : the children tale usecase : tale corpora design and analysis for expressive speech synthesis

Doukhan, David 20 September 2013 (has links)
L'objectif de la thèse est de proposer des méthodes permettant d'améliorer l'expressivité des systèmes de synthèse de la parole. Une des propositions centrales de ce travail est de définir, utiliser et mesurer l'impact de structures linguistiques opérant au delà du niveau de la phrase, par opposition aux approches opérant sur des phrases isolées de leur contexte. Le cadre de l'étude est restreint au cas de la lecture de contes pour enfants. Les contes ont la particularité d'avoir été l'objet d'un certain nombre d'études visant à en dégager une structure narrative et de faire intervenir une certain nombre de stéréotypes de personnages (héros, méchant, fée) dont le discours est souvent rapporté. Ces caractéristiques particulières sont exploitées pour modéliser les propriétés prosodiques des contes au delà du niveau de la phrase. La transmission orale des contes a souvent été associée à une pratique musicale (chants, instruments) et leur lecture reste associée à des propriétés mélodiques très riches, dont la reproduction reste un défi pour les synthétiseurs de parole modernes. Pour répondre à ces problématiques, un premier corpus de contes écrits est collecté et annoté avec des informations relatives à la structure narrative des contes, l'identification et l'attribution des citations directes, le référencement des mentions des personnages ainsi que des entités nommées et des énumérations étendues. Le corpus analysé est décrit en terme de couverture et d'accord inter-annotateurs. Il est utilisé pour modéliser des systèmes de segmentation des contes en épisode, de détection des citations directes, des actes de dialogue et des modes de communication. Un deuxième corpus de contes lus par un locuteur professionnel est présenté. La parole est alignée avec les transcriptions lexicale et phonétique, les annotations du corpus texte et des méta-informations décrivant les caractéristiques des personnages intervenant dans le conte. Les relations entre les annotations linguistiques et les propriétés prosodiques observées dans le corpus de parole sont décrites et modélisées. Finalement, un prototype de contrôle des paramètres expressifs du synthétiseur par sélection d'unités Acapela est réalisé. Le prototype génère des instructions prosodiques opérant au delà du niveau de la phrase, notamment en utilisant les informations liées à la structure du conte et à la distinction entre discours direct et discours rapporté. La validation du prototype de contrôle est réalisée dans le cadre d'une expérience perceptive, qui montre une amélioration significative de la qualité de la synthèse. / The aim of this thesis is to propose ways to improve the expressiveness of speech synthesis systems. One of the central propositions of this work is to define, use and measure the impact of linguistic structures operating beyond the sentence level, as opposed to approaches operating on sentences out of their context. The scope of the study is restricted to the case of storytelling for children. The stories have the distinction of having been the subject of a number of studies in order to highlight a narrative structure and involve a number of stereotypical characters (hero, villain, fairy) whose speech is often reported. These special features are used to model the prosodic properties tales beyond the sentence level. The oral transmission of tales was often associated with musical practice (vocals, instruments) and their reading is associated with rich melodic properties including reproduction remains a challenge for modern speech synthesizers. To address these issues, a first corpus of written tales is collected and annotated with information about the narrative structure of stories, identification and allocation of direct quotations, referencing references to characters as well as named entities and enumerations areas. The corpus analyzed is described in terms of coverage and inter-annotator agreement. It is used to model systems segmentation tales episode, detection of direct quotes, dialogue acts and modes of communication. A second corpus of stories read by a professional speaker is presented. The word is aligned with the lexical and phonetic transcriptions, annotations of the corpus text and meta-information describing the characteristics of the characters involved in the story. The relationship between linguistic annotations and prosodic properties observed in the speech corpus are described and modeled. Finally, a prototype control expressive synthesizer parameters by Acapela unit selection is made. The prototype generates prosodic operating instructions beyond the sentence level, including using the information related to the structure of the story and the distinction between direct speech and reported speech. Prototype validation control is performed through a perceptual experience, which shows a significant improvement in the quality of the synthesis.
143

Le discours rapporté dans les débats politiques télévisés : formes et fonctions des recours au discours autre : le cas des débats de l'entre-deux-tours des présidentielles françaises (1974-2012) / Reported speech in televised political debates : forms and functions of the use of other speech : the case of the debates between the two rounds of the French presidential elections (1974-2012)

Caillat, Domitille 08 December 2016 (has links)
Inscrite dans le champ de l’analyse du discours en interaction, notre thèse propose une étude des formes et des fonctions des discours rapportés (DR) dans le cadre des six débats télévisés de l’entre-deux-tours des présidentielles ayant eu lieu en France entre 1974 et 2012. Il y est question de déterminer avec précision à quoi sert le DR — dont on pourrait penser qu’il n’est pas véritablement constitutif du genre — dans ces interactions où chacun des candidats poursuit les objectifs particuliers de s’autopromouvoir et de délégitimer son adversaire.L’analyse détaillée des quelques quatre cents extraits recensés dans le corpus montre que les DR répondent, selon leur lieu d’apparition dans l’échange en cours, la nature de leur source (l’adversaire, un tiers extérieur au débat ou le locuteur lui-même) et leur teneur propositionnelle, à trois différentes visées qualifiables d’autopromotionnelle, de défensive et de polémique — visées auxquelles contribuent en outre parfois leur mode de mise en scène para- et non verbale (mouvements de la voix, mais aussi mimiques, postures, regards et gestuelles déployés par le locuteur conjointement au DR).Répondant ainsi à une intuition de départ, ce travail met à jour le fait que non seulement les discours rapportés sont mis au service des objectifs spécifiques des candidats lors des débats, mais encore qu’ils occupent, selon la nature de leur source, des fonctions différentes mais complémentaires (fonctions relatives à la dynamique des échanges et à l’élaboration d’un discours en confrontation, fonctions strictement argumentatives ou encore fonctions relatives à la finalité des débats en eux-mêmes). / Grounded in the framework of the discourse-in-interaction analysis, this work analyses the forms and functions of reported speech within the six second-round debates of the French presidential election taking place in France between 1974 and 2012. Its object is to precisely determine the purpose of reported speech (which one might think that it is not truly constitutive of the genre) within these interactions in which candidates’main aims are self-promotion and the opponent depreciation.By analysing in details the almost four hundreds extracts recorded in the corpus, our work shows that reported speeches aim, depending on their place within the exchanges, their source (the opponent, a third party or the speaker) and their propositional content, three different purposes we can consider as self-promotion, defence and argument — these purposes can be furthermore supported by some para- and non-verbal elements (voice movements, facial expression, posture, eye expression and gesture deployed at the same time).Following an initial intuition, this study reveals that not only reported speeches serve the candidates’ main goals during debates, but also, depending on their source, they assure different and complementary functions (functions serving the dynamic within the exchanges and the construction of a speech in confrontation, functions exclusively argumentative, or also functions relating to the debates global purpose).
144

Analyse et modèle génératif de l'expressivité. Application à la parole et à l'interprétation musicale

Beller, Grégory 24 June 2009 (has links) (PDF)
Cette thèse s'inscrit dans les recherches actuelles sur les émotions et les réactions émotionnelles, sur la modélisation et la transformation de la parole, ainsi que sur l'interprétation musicale. Il semble que la capacité d'exprimer, de simuler et d'identifier des émotions, des humeurs, des intentions ou des attitudes, est fondamentale dans la communication humaine. La facilité avec laquelle nous comprenons l'état d'un personnage, à partir de la seule observation du comportement des acteurs et des sons qu'ils émettent, montre que cette source d'information est essentielle et, parfois même, suffisante dans nos relations sociales. Si l'état émotionnel présente la particularité d'être idiosyncrasique, c'est-à-dire particulier à chaque individu, il n'en va pas de même de la réaction associée qui se manifeste par le geste (mouvement, posture, visage...), le son (voix, musique...), et qui, elle, est observable par autrui. Ce qui nous permet de penser qu'il est possible de transformer cette réaction dans le but de modifier la perception de l'émotion associée. <br />C'est pourquoi le paradigme d'analyse-transformation-synthèse des réactions émotionnelles est, peu à peu, introduit dans les domaines thérapeutique, commercial, scientifique et artistique. Cette thèse s'inscrit dans ces deux derniers domaines et propose plusieurs contributions. <br />D'un point de vue théorique, cette thèse propose une définition de l'expressivité, une définition de l'expressivité neutre, un nouveau mode de représentation de l'expressivité, ainsi qu'un ensemble de catégories expressives communes à la parole et à la musique. Elle situe l'expressivité parmi le recensement des niveaux d'information disponibles dans l'interprétation qui peut être vu comme un modèle de la performance artistique. Elle propose un modèle original de la parole et de ses constituants, ainsi qu'un nouveau modèle prosodique hiérarchique. <br />D'un point de vue expérimental, cette thèse fournit un protocole pour l'acquisition de données expressives interprétées. Colatéralement, elle rend disponible trois corpus pour l'observation de l'expressivité. Elle fournit une nouvelle mesure statistique du degré d'articulation ainsi que plusieurs résultats d'analyses concernant l'influence de l'expressivité sur la parole. <br />D'un point de vue technique, elle propose un algorithme de traitement du signal permettant la modification du degré d'articulation. Elle présente un système de gestion de corpus novateur qui est, d'ores et déjà, utilisé par d'autres applications du traitement automatique de la parole, nécessitant la manipulation de corpus. Elle montre l'établissement d'un réseau bayésien en tant que modèle génératif de paramètres de transformation dépendants du contexte. <br />D'un point de vue technologique, un système expérimental de transformation, de haute qualité, de l'expressivité d'une phrase neutre, en français, synthétique ou enregistrée, a été produit. <br />Enfin et surtout, d'un point de vue prospectif, cette thèse propose différentes pistes de recherche pour l'avenir, tant sur les plans théorique, expérimental, technique, que technologique. Parmi celles-ci, la confrontation des manifestations de l'expressivité dans les interprétations verbale et musicale semble être une voie prometteuse.
145

Structuration automatique de flux télévisuels

Guinaudeau, Camille 07 December 2011 (has links) (PDF)
L'augmentation du nombre de documents multimédias disponibles rend nécessaire la mise en place de méthodes de structuration automatique capables de faciliter l'accès à l'information contenue dans les documents, tout en étant suffisamment génériques pour pouvoir structurer des documents tout-venants. Dans ce cadre, nous proposons deux types de structuration, linéaire et hiérarchique, s'appuyant sur les transcriptions automatiques de la parole prononcée dans les documents. Ces transcriptions, indépendantes du type des documents considérés, sont exploitées par le biais de méthodes issues du traitement automatiques des langues (TAL). Les deux techniques de structuration, ainsi que la phase de segmentation thématique sur laquelle elles reposent, donnent lieu à plusieurs contributions originales. Tout d'abord, la méthode de segmentation thématique employée, originellement développée pour du texte écrit, est adaptée aux particularités des transcriptions automatiques de vidéos professionnelles - erreurs de transcription, faible nombre de répétitions de vocabulaire. Le critère de cohésion lexicale sur lequel elle se fonde est, en effet, sensible à ces spécificités, ce qui pénalise fortement les performances de l'algorithme. Cette adaptation est mise en place, d'une part grâce à la prise en compte, lors du calcul de la cohésion lexicale, de connaissances linguistiques et d'informations issues de la reconnaissance automatique de la parole et du signal (relations sémantiques, prosodie, mesures de confiance), et d'autre part grâce à des techniques d'interpolation de modèles de langue. À partir de cette étape de segmentation thématique, nous proposons une méthode de structuration thématique linéaire permettant de mettre en relation des segments abordant des thématiques similaires. La méthode employée, fondée sur une technique issue du domaine de la recherche d'information, est adaptée aux données audiovisuelles grâce à des indices prosodiques, qui permettent de favoriser les mots proéminents dans le discours, et des relations sémantiques. Finalement, nous proposons un travail plus exploratoire examinant différentes pistes pour adapter un algorithme de segmentation thématique linéaire à une tâche de segmentation thématique hiérarchique. Pour cela, l'algorithme de segmentation linéaire est modifié - ajustement du calcul de la cohésion lexicale, utilisation de chaines lexicales - pour prendre en compte la distribution du vocabulaire au sein du document à segmenter. Les expérimentations menées sur trois corpora composés de journaux télévisés et d'émissions de reportages, transcrits manuellement et automatiquement, montrent que les approches proposées conduisent à une amélioration des performances des méthodes de structuration développées.
146

Prosodie de la parole expressive : dimensionnalité d'énoncés méthodologiquement contrôlés authentiques et actés

Audibert, Nicolas 02 December 2008 (has links) (PDF)
Les récents progrès de la synthèse de la parole ont redéfini les enjeux majeurs de la communication personne-machine, qui s'articulent désormais autour du concept de pertinence du clone parlant à travers son expressivité. Nous défendons une hypothèse selon laquelle la dynamique des contours prosodiques serait porteuse d'information affective, en séparant les affects dont l'expression est contrôlée volontairement vs. involontairement. Pour cela a été développé E-Wiz, une plateforme dédiée à la capture de corpus multimodaux de parole expressive spontanée par des scénarios de Magicien d'Oz. 17 locuteurs francophones (dont 7 acteurs qui ont rejoué immédiatement après les affects ressentis) ont été capturés dans une tâche prétexte d'apprentissage des langues, le scénario Sound Teacher, visant l'induction d'états émotionnels de valence plutôt positive puis négative exprimés principalement sur des énoncés monosyllabiques isolés. Ils ont ensuite annoté eux-mêmes les affects exprimés. Nous avons identifié des contours de F0 distincts pour différentes expressions émotionnelles. Une évaluation perceptive en conditions audio et audiovisuelle des affects actés par un locuteur a montré que les monosyllabes étaient aussi bien reconnues que les énoncés plus longs. Deux expériences perceptives de projection dimensionnelle de stimuli expressifs sur des stimuli neutres ont montré qu'aucune dimension ne pouvait être liée directement à une classe particulière d'émotions. L'intensité et la typicalité d'expressions actées et spontanées produites par 6 locuteurs ont été mesurées, préalablement à une tâche de discrimination audio, visuelle et audiovisuelle de paires de stimuli actés vs. spontanés. Cette expérience a montré que des sujets naïfs étaient capables de discriminer les énoncés actés vs. spontanés sans différence notable entre classes d'émotion mais avec une importante variabilité interindividuelle, et sans que les différences entre intensités d'émotion perçues n'expliquent entièrement les scores de discrimination.
147

VOIX PUBLIQUES. Environnements sonores, représentations et usages d'habitation dans un quartier populaire de Naples.

Féraud, Olivier 01 February 2010 (has links) (PDF)
Cette recherche est attachée à l'étude des environnements sonores, en prenant l'exemple des Quartiers Espagnols, quartier populaire du centre de Naples. Se voulant une participation à la mise en place d'une anthropologie sonore, elle s'inscrit dans une approche pluridisciplinaire en abordant des aspects relevant de l'anthropologie sociale, la microsociologie, l'anthropologie urbaine, l'anthropologie de la communication, la sociolinguistique, l'anthropologie sensorielle et la prosodie. En observant la vie quotidienne et ses différentes « manières de faire », la mise au jour des pratiques d'habitation à l'œuvre dans la rue révèle une prévalence de la polyvalence des espaces intimes et collectifs. La rue apparaît dans la pluralité de ses usages, des usagers, de son organisation spatiale et temporelle. Devant la diversité des stratégies d'appropriation de l'espace urbain et la porosité dont l'habitat fait preuve sur un plan à la fois social et sensoriel, la dimension sonore se révèle centrale. D'une part, en tant que production sonore mettant en avant la relation à l'autre, la vocalité est au centre de la vie sociale du quartier. En confrontant cris de marchands et communications domestiques à distance, l'observation des actes de voix haute permet de dégager ce que révèlent socialement ces « voix publiques ». D'autre part, en tant qu'elles s'imposent dans l'espace urbain comme un plaisir du bruit, les sonorités des pétards et des feux d'artifice révèlent quant à elles, dans les discours attachés à leurs représentations, une volonté d'investir l'environnement sonore de la ville en même temps qu'elles questionnent des enjeux socioculturels propres à l'espace napolitain. L'analyse révèle enfin que ces deux sonorités peuvent être considérées comme constituant des environnements sonores qui, pour autant qu'ils peuvent diviser à certains égards, rassemblent les habitants qui se sentent en faire partie, et témoignent de la vie sociale qui se joue dans les Quartiers Espagnols. L'exemple d'un quartier populaire napolitain permet d'insister sur un aspect central des environnements sonores, qui est que ces derniers peuvent être vecteurs de lien social. Pointant la pertinence anthropologique de l'observation et la documentation du fait sonore, cette étude met en évidence les corrélations entre les modes d'habitation, les relations sociales et les environnements sonores.
148

Rythme des langues et acquisition du langage

Ramus, Franck 25 November 1999 (has links) (PDF)
Dans le cadre de la théorie de l'initialisation phonologique, nous avons étudié l'hypothèse selon laquelle le nourrisson est sensible dès la naissance au rythme de la parole, cette sensibilité constituant l'une des toutes premières étapes de l'acquisition du langage. Pour ce faire, nous avons effectué des mesures acoustico-phonétiques sur huit langues, montrant qu'une segmentation de la parole en consonnes/voyelles per-<br />met de déterminer certaines propriétés rythmiques des langues. Nous en avons déduit un modèle computationnel de la perception du rythme, et nous avons effectué des simulations prédisant quelles langues peuvent être distinguées sur la base de leurs propriétés rythmiques. Afin de tester ces prédictions, nous avons effectué une série d'expériences de discrimination de langues sur des sujets adultes, qui ont montré l'adéquation du modèle avec les données empiriques. Pour s'assurer que les<br />sujets n'utilisaient pas d'autres indices que le rythme, nous avons mis au point une technique basée sur la resynthèse de parole, permettant de dégrader les stimuli pour n'en préserver que les propriétés rythmiques.<br />Grâce à cette technique, nous avons pu montrer que des nouveau-nés sont capables de distinguer le néerlandais du japonais, sur la base de leurs seules différences rythmiques. Enfin, nous nous sommes demandés si cette sensibilité pour le rythme était spécique au langage, et donc à l'espèce humaine. Dans cette perspective, nous présentons quelques expériences-pilotes de discrimination de langues par des singes. Nous concluons que le nourrisson possède dès la naissance une capacité à analyser le rythme de la parole, et nous faisons de plus l'hypothèse que cette capacité peut lui être utile dans l'apprentissage de la structure des syllabes de sa langue maternelle.
149

Informatique et maîtrise de l'oral en maternelle bilingue breton-français : modèle de l'élève dans le dialogue enfant-ordinateur et ergonomie de la parole en breton.

Mermet, Michel 23 November 2006 (has links) (PDF)
Notre étude vise à construire un "modèle de l'élève bilingue", au sens large, permettant de caractériser une situation d'apprentissage qui a pour fonction la maîtrise de l'oral et pour objet le dialogue enfant-ordinateur. Nous avons analysé, à partir d'un corpus de paroles bilingues breton-français, les conditions d'apprentissage précoce d'une deuxième langue entre deux et quatre ans, auprès d'élèves d'une classe bilingue de petite section de maternelle. Nos objectifs sont de cerner le contexte d'apprentissage du breton à l'école, d'analyser la parole bilingue de l'élève et de construire des outils d'évaluation des interfaces orales. Ceci afin d'évaluer, dans le dialogue oral enfant-ordinateur, les attributs phonétiques et prosodiques (synthèse vocale en breton), la facilité d'apprentissage de l'élève et la qualité de l'apprentissage.
150

Le chunking perceptif de la parole : sur la nature du groupement temporel et son effet sur la mémoire immédiate

Gilbert, Annie 03 1900 (has links)
Dans de nombreux comportements qui reposent sur le rappel et la production de séquences, des groupements temporels émergent spontanément, créés par des délais ou des allongements. Ce « chunking » a été observé tant chez les humains que chez certains animaux et plusieurs auteurs l’attribuent à un processus général de chunking perceptif qui est conforme à la capacité de la mémoire à court terme. Cependant, aucune étude n’a établi comment ce chunking perceptif s’applique à la parole. Nous présentons une recension de la littérature qui fait ressortir certains problèmes critiques qui ont nui à la recherche sur cette question. C’est en revoyant ces problèmes qu’on propose une démonstration spécifique du chunking perceptif de la parole et de l’effet de ce processus sur la mémoire immédiate (ou mémoire de travail). Ces deux thèmes de notre thèse sont présentés séparément dans deux articles. Article 1 : The perceptual chunking of speech: a demonstration using ERPs Afin d’observer le chunking de la parole en temps réel, nous avons utilisé un paradigme de potentiels évoqués (PÉ) propice à susciter la Closure Positive Shift (CPS), une composante associée, entre autres, au traitement de marques de groupes prosodiques. Nos stimuli consistaient en des énoncés et des séries de syllabes sans sens comprenant des groupes intonatifs et des marques de groupements temporels qui pouvaient concorder, ou non, avec les marques de groupes intonatifs. Les analyses démontrent que la CPS est suscitée spécifiquement par les allongements marquant la fin des groupes temporels, indépendamment des autres variables. Notons que ces marques d’allongement, qui apparaissent universellement dans la langue parlée, créent le même type de chunking que celui qui émerge lors de l’apprentissage de séquences par des humains et des animaux. Nos résultats appuient donc l’idée que l’auditeur chunk la parole en groupes temporels et que ce chunking perceptif opère de façon similaire avec des comportements verbaux et non verbaux. Par ailleurs, les observations de l’Article 1 remettent en question des études où on associe la CPS au traitement de syntagmes intonatifs sans considérer les effets de marques temporels. Article 2 : Perceptual chunking and its effect on memory in speech processing:ERP and behavioral evidence Nous avons aussi observé comment le chunking perceptif d’énoncés en groupes temporels de différentes tailles influence la mémoire immédiate d’éléments entendus. Afin d’observer ces effets, nous avons utilisé des mesures comportementales et des PÉ, dont la composante N400 qui permettait d’évaluer la qualité de la trace mnésique d’éléments cibles étendus dans des groupes temporels. La modulation de l’amplitude relative de la N400 montre que les cibles présentées dans des groupes de 3 syllabes ont bénéficié d’une meilleure mise en mémoire immédiate que celles présentées dans des groupes plus longs. D’autres mesures comportementales et une analyse de la composante P300 ont aussi permis d’isoler l’effet de la position du groupe temporel (dans l’énoncé) sur les processus de mise en mémoire. Les études ci-dessus sont les premières à démontrer le chunking perceptif de la parole en temps réel et ses effets sur la mémoire immédiate d’éléments entendus. Dans l’ensemble, nos résultats suggèrent qu’un processus général de chunking perceptif favorise la mise en mémoire d’information séquentielle et une interprétation de la parole « chunk par chunk ». / In numerous behaviors involving the learning and production of sequences, temporal groups emerge spontaneously, created by delays or a lengthening of elements. This chunking has been observed across behaviors of both humans and animals and is taken to reflect a general process of perceptual chunking that conforms to capacity limits of short-term memory. Yet, no research has determined how perceptual chunking applies to speech. We provide a literature review that bears out critical problems, which have hampered research on this question. Consideration of these problems motivates a principled demonstration that aims to show how perceptual chunking applies to speech and the effect of this process on immediate memory (or “working memory”). These two themes are presented in separate papers in the format of journal articles. Paper 1: The perceptual chunking of speech: a demonstration using ERPs To observe perceptual chunking on line, we use event-related potentials (ERPs) and refer to the neural component of Closure Positive Shift (CPS), which is known to capture listeners’ responses to marks of prosodic groups. The speech stimuli were utterances and sequences of nonsense syllables, which contained intonation phrases marked by pitch, and both phrase-internal and phrase-final temporal groups marked by lengthening. Analyses of CPSs show that, across conditions, listeners specifically perceive speech in terms of chunks marked by lengthening. These lengthening marks, which appear universally in languages, create the same type of chunking as that which emerges in sequence learning by humans and animals. This finding supports the view that listeners chunk speech in temporal groups and that this perceptual chunking operates similarly for speech and non-verbal behaviors. Moreover, the results question reports that relate CPS to intonation phrasing without considering the effects of temporal marks. Paper 2: Perceptual chunking and its effect on memory in speech processing: ERP and behavioral evidence We examined how the perceptual chunking of utterances in terms of temporal groups of differing size influences immediate memory of heard speech. To weigh these effects, we used behavioural measures and ERPs, especially the N400 component, which served to evaluate the quality of the memory trace for target lexemes heard in the temporal groups. Variations in the amplitude of the N400 showed a better memory trace for lexemes presented in groups of 3 syllables compared to those in groups of 4 syllables. Response times along with P300 components revealed effects of position of the chunk in the utterance. This is the first study to demonstrate the perceptual chunking of speech on-line and its effects on immediate memory of heard elements. Taken together the results suggest that a general perceptual chunking enhances a buffering of sequential information and a processing of speech on a chunk-by-chunk basis.

Page generated in 0.029 seconds