Spelling suggestions: "subject:"contours prosodie"" "subject:"contours sodiques""
1 |
Étude phonostylistique de personnalités politiques hispanophones : le cas de Hugo Chávez / A phonostylistic study of Spanish-speaking politicians : the case of Hugo ChávezPérez Pabon, Carmen Patricia 11 December 2017 (has links)
Cette thèse a pour objectif de décrire les caractéristiques prosodiques du phonostyle particulier de l’ex-Président du Vénézuéla Hugo Chávez dans le phonogenre «discours public ‘spontané’» ainsi que dans trois autres phonogenres. J’analyse également le phonostyle d’autres personnalités politiques de l’Amérique hispanophone et de l’Espagne dans le même phonogenre «discours public».Dans une étude préliminaire de reconnaissance perceptive utilisant de la parole filtrée et naturelle, 12 personnalités politiques ont été décrites (d’abord en choix libre puis en choix forcé) et ensuite classées dans quatre groupes différents allant du plus ‘tribun’ ‘révolutionnaire’, ‘fort’ et ‘autoritaire’ jusqu’au plus ‘traditionnel’ ‘calme’ et ‘formel’. Chávez est classé à l’extrême des ‘tribuns’ et l’ex-Premier ministre espagnol José Zapatero à l’extrême des ‘traditionnels’.L’analyse acoustique montre que Chávez a un phonostyle très particulier, caractérisé par la répétition régulière d’un type de contour en fin de groupe intonatif (GI). Ce contour est montant sur la syllabe accentuée et descendant d’une octave sur la dernière syllabe inaccentuée du mot, qui est d’ailleurs allongée de façon significative. À l’extrémité opposée, du classement perceptif, Zapatero, a un phonostyle caractérisé par l’utilisation d’un contour montant sur la syllabe accentuée continuant la montée sur la syllabe inaccentuée suivante, en fin de GI, et par le découpage des énoncés en petits blocs. Les différentes expériences, utilisant la parole synthétique (TTS Synthesis), confirment les résultats de l’analyse acoustique et auditive.Toutes les autres personnalités politiques ont été analysées et classées dans un ‘dégradé’ allant du plus ‘tribun’ au plus ‘traditionnel’, de la même façon qu’en perception, entre les deux extrêmes, Chávez et Zapatero. Ce classement en production correspond globalement à celui effectué préalablement en perception. / The aim of this thesis is to describe the prosodic characteristics of the peculiar phonostyle used by the ex-President of Venezuela, Hugo Chávez, in the “spontaneous public speech” phonogenre, as well as in three other speaking styles. The phonostyles of other Spanish-speaking politicians from Hispanic America and Spain are also assessed in the same public speech phonogenre.In a preliminary perceptual study using both filtered and natural voices, participants were asked to describe 12 politicians first using a free choice paradigm and then forced choice. Based on the results of this perceptual study, the politicians were then classified into four different groups from the most “powerful orator”, “revolutionary”, “strong” and “authoritarian” to the most “traditional”, “quiet” and “formal”. Chávez is classed in the extreme group of “power orators” and the Spanish ex-Prime Minister, José Zapatero, is placed in the opposing traditional group.Acoustic analysis shows that Chávez has a very peculiar phonostyle, characterized by the regular repetition of a certain type of contour at the end of Intonation Phrases (IP). This contour rises on the stressed syllable and falls by one octave on the last unstressed syllable of the word, which is also lengthened in a significant way. On the opposite end of the perceptual scale, Zapatero’s phonostyle is characterized by the use of a rising contour on the stressed syllable, which continues to rise into the following unstressed syllable at the end of the IP. He also cuts utterances into small chunks. Various experiments using voice synthesis (TTS Synthesis) confirm the findings of the acoustic and perceptual analysis.The productions of the other politicians were analyzed and classified in the same ranking as in the perception study, from the most “powerful orator” to more “traditional” between the two extremes, Chávez and Zapatero. This production ranking generally corresponds to the one previously carried out in perception.
|
2 |
Génération de parole expressive dans le cas des langues à tonsMac, Dang Khoa 15 June 2012 (has links) (PDF)
De plus en plus, l'interaction entre personne et machine se rapproche du naturel afin de ressembler à l'interaction entre humains, incluant l'expressivité (en particulier les émotions et les attitudes). Dans la communication parlée, les attitudes, et plus généralement les affects sociaux, sont véhiculés principalement par la prosodie. Pour les langues tonales, la prosodie est utilisée aussi pour coder l'information sémantique dans les variations de tons. Ce travail de thèse présente une étude des affects sociaux du vietnamien, une langue à tons et une langue peu dotée, afin d'appliquer les résultats obtenus à un système de synthèse de haute qualité capable de produire la parole " expressive " pour le vietnamien. Le premier travail de cette thèse consiste en la construction du premier corpus audio-visuel des attitudes vietnamiennes, qui contient seize attitudes. Ce corpus est ensuite utilisé pour étudier la perception audio-visuelle et interculturelle des attitudes vietnamiennes. Pour cela, une série de tests perceptifs a été effectuée avec des auditeurs natifs et non-natifs (des auditeurs francophones pour les non-natifs). Les résultats de ces tests montrent que les facteurs influant sur la perception des attitudes sont l'expression de l'attitude elle-même et la modalité de présentation (audio, visuelle et audio-visuelle). Ces résultats nous ont ainsi permis de trouver des affects sociaux communs ou interculturels entre le vietnamien et le français. Puis, un autre test de perception a été réalisé sur des phrases avec tons afin d'explorer l'effet du système tonal du vietnamien sur la perception des attitudes. Les résultats montrent que les juges non-natifs peuvent traiter et séparer les indices tonals locaux et les traits saillants prosodiques de portée globale. Après une présentation de nos études sur les affects sociaux en vietnamien, nous décrivons notre modélisation de la prosodie des attitudes en vue de la synthèse de la parole expressive en vietnamien. En nous basant sur le modèle de superposition des contours fonctionnels, nous proposons une méthode pour modéliser et générer de la prosodie expressive en vietnamien. Cette méthode est ensuite appliquée pour générer de la parole expressive en vietnamien, puis évaluée par des tests de perception sur les énoncés synthétiques. Les résultats de perception valident bien la performance de notre modèle et confirment que l'approche de superposition de contours fonctionnels peut être utilisée pour modéliser une prosodie complexe comme dans le cas de la parole expressive d'une langue à tons.
|
3 |
Génération de parole expressive dans le cas des langues à tons / Generation the expressive speech in case of tonal languagesMac, Dang Khoa 15 June 2012 (has links)
De plus en plus, l'interaction entre personne et machine se rapproche du naturel afin de ressembler à l'interaction entre humains, incluant l'expressivité (en particulier les émotions et les attitudes). Dans la communication parlée, les attitudes, et plus généralement les affects sociaux, sont véhiculés principalement par la prosodie. Pour les langues tonales, la prosodie est utilisée aussi pour coder l'information sémantique dans les variations de tons. Ce travail de thèse présente une étude des affects sociaux du vietnamien, une langue à tons et une langue peu dotée, afin d'appliquer les résultats obtenus à un système de synthèse de haute qualité capable de produire la parole « expressive » pour le vietnamien. Le premier travail de cette thèse consiste en la construction du premier corpus audio-visuel des attitudes vietnamiennes, qui contient seize attitudes. Ce corpus est ensuite utilisé pour étudier la perception audio-visuelle et interculturelle des attitudes vietnamiennes. Pour cela, une série de tests perceptifs a été effectuée avec des auditeurs natifs et non-natifs (des auditeurs francophones pour les non-natifs). Les résultats de ces tests montrent que les facteurs influant sur la perception des attitudes sont l'expression de l'attitude elle-même et la modalité de présentation (audio, visuelle et audio-visuelle). Ces résultats nous ont ainsi permis de trouver des affects sociaux communs ou interculturels entre le vietnamien et le français. Puis, un autre test de perception a été réalisé sur des phrases avec tons afin d'explorer l'effet du système tonal du vietnamien sur la perception des attitudes. Les résultats montrent que les juges non-natifs peuvent traiter et séparer les indices tonals locaux et les traits saillants prosodiques de portée globale. Après une présentation de nos études sur les affects sociaux en vietnamien, nous décrivons notre modélisation de la prosodie des attitudes en vue de la synthèse de la parole expressive en vietnamien. En nous basant sur le modèle de superposition des contours fonctionnels, nous proposons une méthode pour modéliser et générer de la prosodie expressive en vietnamien. Cette méthode est ensuite appliquée pour générer de la parole expressive en vietnamien, puis évaluée par des tests de perception sur les énoncés synthétiques. Les résultats de perception valident bien la performance de notre modèle et confirment que l'approche de superposition de contours fonctionnels peut être utilisée pour modéliser une prosodie complexe comme dans le cas de la parole expressive d'une langue à tons. / Today, the human-computer interaction is reaching the naturalness and is increasingly similar to the human-human interaction, including the expressiveness (especially emotions and attitudes). In spoken communication, attitudes or social affects are mainly transferred through prosody. For tonal languages, prosody is also used to encode semantic information via tones. This thesis presents a study of social affects in Vietnamese, a tonal and under-resourced language, in order to apply the results to Vietnamese expressive speech synthesis task. The first task of this thesis concerns the construction of a first audio-visual corpus of Vietnamese attitudes which contains sixteen attitudes. This corpus is then used to study the audio-visual and intercultural perceptions of the Vietnamese attitudes. A series of perceptual tests was carried out with native and non-native listeners (French for non-native listeners). Experimental results reveal the fact that the influential factors on the perception of attitudes include the modality of presentation (audio, visual and audio-visual) and the attitudinal expression itself. These results also allow us to investigate the common specificities and cross-cultural specificities between Vietnamese and French attitudes. Another perception test was carried out using sentences with tonal variation to study the influence of Vietnamese tones on the perception of attitudes. The results show that non-native listeners can process the local prosodic cues of tones, together with the global cues of attitude patterns. After presenting our studies on Vietnamese social affects, we describe our work on attitude modelling to apply it to Vietnamese expressive speech synthesis. Based on the concept of prosodic contour superposition, a prosodic model was proposed to encode the attitudinal function of prosody for Vietnamese attitudes. This model was applied to generate the Vietnamese expressive speech and then evaluated in a perceptual experiment with synthetic utterances. The results validate the ability of applying our proposed model in generating the prosody of attitudes for a tonal language such as Vietnamese.
|
Page generated in 0.2229 seconds