Spelling suggestions: "subject:"prosodie"" "subject:"prosodies""
81 |
Large-scale acoustic and prosodic investigations of french / Analyses acoustiques et prosodiques du français à partir de grandes masses de données oralesNemoto, Rena 16 November 2011 (has links)
Cette thèse porte sur des analyses acoustiques et prosodiques du français à partir de grandes masses de données orales illustrant différents styles de parole (préparée et spontanée). Nous nous sommes intéressées aux attributs acoustiques et prosodiques qui pourraient caractériser la prononciation. En français, de nombreuses erreurs de reconnaissance automatique de la parole (RAP) sont dues à des mots fréquents homophones. Pour ces mots, la solution correcte dépend du modèle de langage. Une classification automatique (CA) a été effectuée pour discriminer deux paires homophones (‘et/est’ et ‘à/a’) par des propriétés acoustiques et prosodiques. Les résultats de la CA ont montré que le paire ‘et/est’ était plus dissociable. La CA par des attributs prosodiques et inter-segmentaux (15 attributs) s’est avérée aussi performante que celle utilisant la totalité des 62 attributs. Un test perceptif a été également effectué pour vérifier si les humains utilisaient eux aussi ces paramètres. Les résultats ont suggéré que des informations acoustiques et prosodiques pourraient être utiles pour effectuer un choix correct de mots dans des structures syntaxiquement ambigües. Ensuite, nous avons examiné des propriétés prosodiques globales aux niveaux du nom et du syntagme nominal. La comparaison entre mots lexicaux et grammaticaux a montré que la fréquence fondamentale (F0) montante et l’allongement vocalique de la dernière syllabe caractérisent les mots lexicaux, par opposition aux mots grammaticaux. Ainsi, le profil de F0 moyenne d’un syntagme nominal de longueur n pourrait être différent de celui du nom avec une valeur de F0 basse au début du syntagme. Les profils prosodiques peuvent être utiles pour localiser frontières de mots. Les résultats de ce travail pourront servir à localiser le focus et les entités-nommées par des classifieurs discriminants, et de manière plus générale à améliorer les techniques de localisation des frontières des mots pour la RAP. / This thesis focuses on acoustic and prosodic (fundamental frequency (F0), duration, intensity) analyses of French from large-scale audio corpora portraying different speaking styles: prepared and spontaneous speech. We are interested in particularities of segmental phonetics and prosody that may characterize pronunciation. In French, many errors caused by automatic speech recognition (ASR) systems arise from frequent homophone words, for which ASR systems depend on language model weights. Automatic classification (AC) was conducted to discriminate homophones by only acoustic and prosodic properties depending on their part-of-speech function or their position within prosodic words. Results from AC of two homophone pairs, et/est (and/is) and à/a (ton/has), revealed that the et/est pair was more discriminable. A selection of prosodic and inter-phoneme attributes, that is 15 attributes, performed as good results as with 62 attributes. Then corresponding perceptual tests have been conducted to verify if humans also use acoustico-prosodic parameters for the discrimination. Results suggested that acoustic and prosodic information might help in operating the correct choice in similar ambiguous syntactic structures. From the hypothesis that pronunciation variants were due to varying prosodic constraints, we examined overall prosodic properties of French on a lexical and phrase level. The comparison between lexical and grammatical words revealed F0 rise and lengthening at the end of final syllable on lexical words, while these phenomena were not observed for grammatical words. Analyses also revealed that the mean profile of a n length noun phrase could be different from that of a n length noun with a low F0 at the beginning of a noun phrase. The prosodic profiles can be helpful to locate word boundaries. Findings in this thesis will lead to localize focus and named-entity using discriminative classifiers, and to improve word boundary locations by an ASR post-processing step.
|
82 |
Facteurs de risque et de protection pour la dépression post AVC : approche en vie quotidienne / Risk and protective factors for Post-Stroke Depression : a daily life approachVillain, Marie 19 October 2016 (has links)
La Dépression Post-AVC (DPAVC) constitue une des complications psychiatriques les plus fréquentes dans les suites d’un Accident Vasculaire Cérébral (AVC) avec des conséquences majeures en termes de récupération fonctionnelle et de qualité de vie. Il est nécessaire de disposer de critères permettant une identification précoce des patients à risque afin de leur proposer des aides adaptées. L’objectif de ce travail de thèse est d’étudier certains facteurs de risque et de protection de la DPAVC avec une approche en vie quotidienne chez des patients présentant un AVC peu invalidant. Dans une première partie, nous présentons l’étude du rôle exercé par le soutien social et la routinisation sur la sévérité des symptômes dépressifs trois mois après l’AVC par la méthode « Ecological Momentary Assessment ». Dans une seconde partie, nous explorons le rôle de la voix comme marqueur précoce de la DPAVC. Nous avons mis en évidence que la perception du soutien social initial influence l’intensité des symptômes dépressifs et les activités trois mois après. D’autre part, nous avons observé une dynamique temporelle unidirectionnelle entre l’augmentation des routines et la survenue de symptômes dépressifs plus intenses. Enfin, les analyses vocales nous ont permis d’identifier des marqueurs de DPAVC avec des modifications longitudinales de la fréquence fondamentale ainsi que des marqueurs précoces (shimmer et ruptures de voisement). Au-delà des facteurs cliniques traditionnellement reconnus, ce travail a mis en évidence de façon écologique de nouveaux marqueurs de risque de DPAVC dont la détection pourrait permettre d’élaborer de nouvelles stratégies de prévention et de prise en charge / Post-stroke depression (PSD) is one of the most common psychiatric complications following stroke with detrimental consequences in terms of functional recovery and quality of life. Its identification and treatment at the earliest stages of care remains a clinical challenge. The aim of this thesis is to study risk and protective factors for PSD based on data collected in the contexts of daily life. In the first section, we present a study of the role played by social support and routinization on the severity of depressive symptoms three months after stroke by Ecological Momentary Assessment (EMA). In the second section, we examine the voice as an early marker of PSD. We observed that patient perceptions of better support quality, and not quantity, immediately following mild stroke, are associated with better behavioral and emotional outcomes three months later. In addition, we observed a unidirectional pattern of association between mood and routines, whereby the occurrence of routines was associated with a higher level of depressive symptomatology over subsequent hours. Finally, voice analysis allowed us to identify PSD markers with longitudinal changes in fundamental voice frequency and discriminant analysis demonstrated that initial voice breaks coupled with shimmer are strongly predictive of subsequent PSD. Beyond commonly-recognized clinical risk factors such as stroke severity, these ecological investigations identified new markers for PSD whose detection could lead to new strategies for prevention and care
|
83 |
Modélisation de la production des énoncés averbaux ˸ le cas des compléments différés / Modeling the production of non-sentential utterances ˸ the case of postponed complementsBotalla, Marie-Amélie 14 May 2019 (has links)
Le complément différé se présente comme une unité à la fois prosodiquement ou graphiquement autonome et syntaxiquement dépendante d’un énoncé antérieur, appelé énoncé support. Notre objectif au cours de cette thèse est de concevoir une modélisation de la production des compléments différés. Nous effectuons pour cela une étude des caractéristiques syntaxiques de 893 compléments différés, extraits de corpus écrits et oraux. Nous observons ainsi la présence d’éléments averbaux (noms, prépositions, etc.) parmi les gouverneurs des compléments différés. Cela contredit les notions antérieures, telles que l’épexégèse de Bally (1944:§75), qui n’envisageaient ces unités que sous la gouvernance d’un verbe. En outre, nous mettons en évidence les différents usages que les locuteurs font du complément différé au cours de l’interaction, et montrons ainsi sa polyvalence et son intérêt en tant qu’outil à la disposition des locuteurs. Le complément différé peut en effet servir au locuteur à ajouter une nouvelle information, mais aussi à préciser, modifier ou corriger une information apportée par l’énoncé support, à questionner son interlocuteur ou à lui répondre. De même, son autonomie prosodique ou graphique ainsi que sa dépendance syntaxique à l’énoncé support jouent un rôle dans sa réception et son interprétation, et nous montrons que produire un complément différé n’équivaut strictement ni à produire un complément non différé, ni à produire une unité syntaxiquement autonome. Nous proposons finalement une modélisation de la production des compléments différés, illustrant leur rattachement à l’énoncé support ainsi que l’implication du locuteur vis-à-vis de l’information qu’ils apportent. / The postponed complement is a prosodically or graphically independant unit which is syntactically dependent on a previous utterance, called support utterance. In this thesis, we aim to develop a modeling of the production of postponed complements. For this purpose, we conduct a study of the syntactic features of 893 postponed complements from written and oral corpora. We note the presence of non-verbal elements (nouns, prepositions, etc.) among the syntactic governors of postponed complements. This contradicts earlier notions, such as Bally's epexegesis (1944:§75), which only conceived these units under the governance of a verb. In addition, we highlight the different uses that speakers make of the postponed complement during an interaction, and we thus demonstrate its versatility and interest as a tool available to the speakers. A postponed complement can be used by the speaker to add new information, but also to specify, modify or correct the information provided by the support statement and to question or answer the interlocutor. Its prosodic or graphic autonomy and syntactic dependence on the support utterance also play a role in its reception and interpretation, and we show that producing a postponed complement is strictly equivalent neither to producing a non-postponed complement nor to producing a syntactically autonomous unit. Finally, we propose a model of the production of postponed complements, illustrating its connection to the support statement as well as the speaker's involvement towards the information provided.
|
84 |
Le chant de la prose dans l'opéra (France, Italie, Allemagne), 1659-1902 : élements de poétique, d'esthétique et d'histoire du goût / Singing Prose in Opera (France, Italy, Germany), 1659-1902 : Elements of Poetics, Aesthetics, and ReceptionGribenski, Michel 29 November 2008 (has links)
Si l’opéra sur un livret en prose ne se manifeste publiquement en Europe qu’au tournant des XIXe et XXe siècles, dans les domaines russe, puis français, enfin allemand et tchèque, des essais de chant de prose et des réflexions sur ses conditions de possibilités sont cependant intervenus, en France, dès le XVIIIe siècle. Envisagée comme forme verbale apériodique, la prose peut ainsi être considérée comme étant au fondement du genre de l’opéra. D’une part, en effet, dans la tragédie lyrique et auparavant dans l’opéra italien, des vers mêlés apériodiques sont d’emblée associés à un chant lui aussi largement apériodique, notamment dans le récitatif. Cette caractéristique formelle du récitatif est soulignée par la notion analogique péjorative de « prose musicale », élaborée dans la seconde moitié du XVIIIe siècle, en France et en Allemagne, par les partisans de la mélodie périodique italienne. D’autre part, l’ opposition entre le régime du récitatif et le régime de l’air peut être interprétée comme un conflit entre un principe dramatique linéaire de prosa oratio et un principe lyrique circulaire de versus. Sur un plan stylistique, la notion formelle de prose s’articule en outre à celle de prosaïsme, non seulement dans le drame lyrique naturaliste en prose, mais plus généralement dans le chant de type récitatif, considéré par certains théoriciens comme la prose du chant, parce qu’il est apériodique et dévolu aux matières de moindre valeur lyrique. Cette articulation entre les plans formel et stylistique s’opère notamment dans la prosodie musicale, et plus spécifiquement à travers le traitement de l’e caduc, qui fait l’objet de débats idéologiques touchant aux limites entre le naturel et le prosaïsme. Les tentatives de divers compositeurs, poètes et théoriciens pour dépasser l’antagonisme entre le vers et la prose conduisent dès lors à repenser le genre, non en termes de dichotomie formelle et stylistique, mais comme une unité organique. Celle-ci prend ainsi la forme d’un poème lyrico-dramatique, qui s’incarne dans un discours poético-musical associant chant, orchestre, et silence. Le problème du chant de la prose dans l’opéra apparaît donc comme un révélateur des enjeux génériques, esthétiques, voire idéologiques du théâtre lyrique. / Although prose opera only appeared in Europe at the turn of the nineteenth and twentieth centuries, in Russian, French, German and Czech opera, some ventures into prose singing and reflections about it did occur in France as early as the eighteenth century. Seen as an aperiodic verbal form, prose can be considered to have been an essential part of the operatic genre from the beginning. Indeed, aperiodic free mixed verse is used in French tragédie en musique, and before that in Italian opera, in association with largely non-periodic singing, especially in recitative. This formal characteristic of recitative is summed up in the metaphoric and pejorative phrase of “musical prose”, which was created in France and Germany in the second half of the eighteenth century by admirers of the Italian periodic melody. This opposition between two modes of singing, recitative-like and aria-like singing, can be seen as a conflict between two contradictory principles in opera: on the one hand, a prosa oratio principle, whose linearity represents the dramatic progressive succession ; on the other hand, a versus principle, whose periodic circle constitutes the traditional form of lyrics. On a stylistic level, prose also has to do with prosaic matters and language, not only in the naturalistic drame lyrique, but more generally in recitative singing. The latter is sometimes considered the prose of music, not only because of its form, but also because it deals with less lyrical matters than aria. This relationship between formal and stylistic levels is particularly tight in prosodic matters, especially in the treatment of the famous mute e, which provokes multiple ideological debates concerning natural, realistic, or prosaic styles of diction. Attempts to solve this problematic opposition between verse and prose logics led various musicians, librettists and theorists to go beyond formal and stylistic dichotomy and to rethink opera as an organic whole: in the form of a lyric-dramatic poem and a poetic-musical speech, where singing, orchestra, and silence are combined. The problem of prose singing in opera thus clearly reveals the generic, aesthetic, and ideological issues concerning lyric theatre.
|
85 |
ÉVALUATION QUALITATIVE DE LA PROSODIE D'APPRENANTS FRANÇAIS: APPORT DE PARAMÉTRISATION PROSODIQUESTortel, Anne 07 December 2009 (has links) (PDF)
L'absence de système d'évaluation de la prosodie de l'anglais L2 parlé par des apprenants francophones a motivé la réalisation de ce travail de thèse. Dès lors, l'analyse de facteurs rythmiques dans la production d'apprenants français, qui fait l'objet de cette recherche, a un double objectif : analyser l'influence du rythme de la langue maternelle (L1=français) sur la langue cible (L2=anglais), et d'autre part, proposer des critères évaluatifs du rythme des productions des francophones, à partir de différentes métriques rythmiques proposées dans la littérature. Ces travaux ont mené à l'élaboration d'une base de données d'anglais L1/L2 nommée ANGLISH, à partir de laquelle nous avons montré une discrimination des locuteurs natifs/non natifs s'appuyant sur la combinaison de paramètres rythmiques. Les résultats de ces travaux de recherche montrent donc qu'il est possible de distinguer la L1 de la L2, et de donner une tendance rythmique des productions des apprenants francophones.
|
86 |
Deixis prosodique multisensorielle : production et perception audiovisuelle de la focalisation contrastive en françaisDohen, Marion 18 November 2005 (has links) (PDF)
Le travail présenté dans ce mémoire est sous-tendu par trois observations majeures. D'abord, de nombreux travaux ont mis en évidence que la parole n'était pas uniquement de nature auditive mais aussi visuelle. D'autre part, la prosodie, domaine de l'intonation, du rythme et du phrasé joue un rôle crucial en parole. Enfin, la deixis ou monstration est un phénomène au coeur de la communication parlée et de son acquisition par les jeunes enfants. Or celle-ci peut, entre autre, s'exprimer uniquement avec la parole : il est possible de « montrer de la voix » par la focalisation prosodique par exemple. Ces observations et constatations permettent d'émettre l'hypothèse que la focalisation contrastive prosodique se manifesterait non seulement par la modalité auditive ,comme il a déjà été largement exploré, mais aussi par la modalité visuelle. C'est la piste que les travaux de ce mémoire visent à explorer pour le cas particulier du français. Plusieurs analyses en production de la parole ont ainsi permis, grâce aux enregistrements de six locuteurs avec deux systèmes de mesure différents et complémentaires, de mettre en évidence les stratégies de signalisation visuelle de la focalisation. Il semble que les locuteurs produisent des indices articulatoires visibles selon deux stratégies principales : la stratégie de signalisation absolue et la stratégie de signalisation différentielle. Les analyses ont également permis de montrer que d'autres gestes faciaux non articulatoires (mouvements des sourcils et de la tête) pourraient être liés à la production de la focalisation mais de façon très variable non seulement d'un locuteur à l'autre mais aussi pour un même locuteur. Par ailleurs, des analyses parallèles en perception, ont permis de montrer que les indices visuels mis en évidence en production, étaient effectivement utilisés en perception et qu'ils permettent d'extraire l'information de focalisation quand la modalité auditive est indisponible ou dégradée. Il a été mis en évidence que les indices visuels identifiés en production correspondent au moins en partie à ceux utilisés en perception audiovisuelle. Ces travaux montrent ainsi que la focalisation contrastive en français est « visible » et est « vue ». Ces résultats permettent d'esquisser un modèle cognitif de la production et de la perception audiovisuelles de la focalisation contrastive en français.
|
87 |
Contribution à l'étude des pauses silencieuses et des phénomènes dits "d'hésitation" en français oral spontané. Etude sur un corpus de récits en classe de français.Candea, Maria 01 December 2000 (has links) (PDF)
Ce travail de recherche porte sur les phénomènes dits « d'hésitation » en français oral non lu, que nous préférons appeler « marques du travail de formulation », à savoir : le euh, l'allongement final significatif, la répétition et l'autocorrection immédiate. Une importance particulière est accordée à la combinatoire de ces marques entre elles et avec la pause silencieuse. <br />L'étude montre que les pauses silencieuses subséquentes à un euh ou à un allongement marquant le travail de formulation en cours, ainsi que les pauses silencieuses insérées entre les deux termes d'une répétition, forment une classe à part : nous les avons appelées « pauses non structurantes » car elles font partie de la marque qui les précède et elles ne contribuent pas à la hiérarchisation et à la démarcation des constituants.<br />Chaque marque, étudiée séparément, est caractérisée par sa durée et celle de la pause subséquente, par ses combinaisons avec une autre marque et ses occurrences à l'intérieur de sites mixtes d'accumulation de marques, par ses contextes lexicaux et sa distribution (intono)syntaxique. Les configurations les plus fréquentes comme les plus rares sont répertoriées. L'analyse prend appui sur les études précédentes, encore rares, de ces marques en français ; elle tente de vérifier, nuancer et enrichir certaines hypothèses déjà formulées, à partir d'un corpus de 70 minutes d'enregistrement de récits non lus en classe de français.<br />A travers un test de perception ainsi qu'à travers l'analyse de l'utilisation des marques d'« hésitation » par des auteurs dramatiques et par des acteurs, l'étude contribue en outre à mieux cerner les représentations que les locuteurs ordinaires ont de ces phénomènes et à mieux connaître leur perceptibilité.
|
88 |
Expressions et micro-expressions spontanées de la face et de la voix en Interaction Homme-Machine : esquisse d'un modèle du "Feeling of Thinking".Vanpé, Anne 21 April 2011 (has links) (PDF)
Les technologies de l'interaction personne-machine se centrent de plus en plus sur l'humain. Le statut informatif des expressions présentes massivement en dehors des tours de parole, dans les micro-événements visibles ou audibles, inscrit le sujet dans une communication permanente du Feeling of Thinking (états physiologiques, mentaux, émotionnels, intentionnels et attitudinaux). Ce travail a été mené sur un corpus induit émotionnellement et restreignant l'interaction personne-machine au minima langagier. Une méthodologie empirique, sur des principes éthologiques, a d'abord été construite pour annoter les micro-gestes audibles et visibles de 6 sujets. Une analyse perceptive a ensuite mesuré la pertinence communicative de certaines icônes gestuelles. Puis a été menée une étude des occurrences des micro-gestes dans l'organisation temporelle de la tâche et des tours de parole, traçant ainsi le comportement des sujets. Enfin a été proposée une qualification impressionniste des nombreux sons vocaux non lexicaux qui ponctuent les performances (bruits de bouche, grunts, bursts, fillers, interjections).
|
89 |
Caractérisation prosodique et reconnaissance de la modalité déclarative de l'espagnol des Îles CanariesHernandez Diaz, Beatriz 09 November 2012 (has links) (PDF)
Notre recherche s'inscrit dans le projet AMPER (Atlas Multimédia Prosodique de l'Espace Roman) et elle a comme objectif principal celui d'offrir une caractérisation prosodique plus systématique de la modalité déclarative de l'espagnol parlée aux Îles Canaries. L'étude présente une double perspective : prosodique et dialectologique, car elle combine des variables strictement linguistiques (comme l'extension des syntagmes et leur combinaison accentuelle), en établissant des relations avec d'autres niveaux linguistiques comme le lexique et la syntaxe, mais aussi avec la phonétique segmentale, avec des variables sociolinguistiques (comme le sexe des informateurs, l'île d'origine, le milieu urbain ou rural et leur niveau d'études), qui nous permettent de vérifier que les informateurs constituent un groupe homogène, avec une intonation clairement représentative de la variété canarienne. Les résultats de l'analyse acoustique - vérifiés au niveau perceptif - démontrent que, effectivement, au-delà des coïncidences avec d'autres variétés, l'intonation de l'espagnol parlé aux Îles est parfaitement reconnaissable.
|
90 |
Ancrages et modèles dynamiques de la prosodie : application à la reconnaissance des émotions actées et spontanéesRingeval, Fabien 04 January 2011 (has links) (PDF)
La reconnaissance de l'état émotionnel d'un locuteur est une étape importante pour rendre la communication Homme-machine plus naturelle et conviviale. Nous étudions dans cette thèse la problématique du traitement automatique de la parole (TAP) orienté émotion sur des données actées et naturelles. L'étude des émotions spontanées a été effectuée en parallèle avec celles des troubles de la communication (TC), puisque ces troubles limitent les capacités d'interaction de l'enfant. Les techniques incluses dans les systèmes de TAP orienté émotion doivent reposer sur des paramètres robustes dans la description des corrélats de l'affect, mais aussi face aux contraintes liées au changement de locuteur et de contexte sémantique. Dans cet esprit, nos travaux ont exploité un ensemble de traitements automatiques pour effectuer la reconnaissance des émotions. Nous avons notamment identifié des points d'ancrage complémentaires de la parole (e.g., pseudo-phonèmes) pour extraire plusieurs types de paramètres (e.g., acoustique et prosodique) sur le signal. Des techniques de fusion ont aussi été employées pour estimer la con-tribution de ces approches dans la tâche de reconnaissance. De plus, un effort a été tout spécia-lement porté sur le développement de modèles non-convent-ionnels du rythme, puisque cette composante apparaît clairement comme étant sous modélisée dans les systèmes état-de-l'art. Les expériences effectuées dans cette thèse visent à démontrer la pertinence des points d'ancrage de la parole et des modèles du rythme pour identifier les paramètres corrélés aux émotions. L'étude des émotions prototypiques (i.e., actées) par les modèles non-conventionnels du rythme a, par exemple, permis de définir un continuum de valeurs représentant alors les classes d'émotions qui apparaissent selon la roue de Plutchik. Les analyses portant sur les TC ont été effectuées en étroite collaboration avec des équipes de cliniciens et de chercheurs en TAP orienté émotion. Ces travaux ont eu pour but d'employer des méthodes automatiques (i.e., identification des points d'ancrage de la parole et extraction de paramètres prosodiques) pour caractériser les particularités associées aux types de TC étu-diés, i.e., autisme, dysphasie et troubles envahissants du développement non-spécifiés (TED-NOS). Un groupe contrôle composé d'enfants à développement typique a aussi été étudié pour comparer les capacités prosodiques des sujets TC. Les résultats de cette étude sont prometteurs puisqu'ils ont montré que l'ensemble des sujets pathologiques pouvait être discriminé significa-tivement des typiques, tout comme les différents groupes de TC, selon deux types d'épreuves distinctes : (i) imitation de contours intonatifs (tâche contrainte) et (ii) production de parole affective spontanée (tâche non-contrainte). De plus, les résultats fournis par une analyse auto-matique des données ont permis de retrouver les caractéristiques cliniques des groupes de TC. Les techniques actuelles en TAP orienté émotion sont donc suffisamment matures pour s'affranchir des difficultés créées par l'étude de corpus contenant de la parole spontanée et/ou produite par des voix d'enfants. Par conséquent, la difficile mais au combien importante tâche " d'humanisation " des systèmes communicants peut être envisagée, puisque les machines peuvent avoir la capacité de percevoir de façon robuste l'affect dans des situations naturelles
|
Page generated in 0.0249 seconds