361 |
Etude, analyse et modélisation physique de la production de la parole avec applications aux troubles liés à une surdité profonde / Study, analysis and physical modeling of speech production with application to disorders related to profound hearing lossDelebecque, Louis 21 September 2015 (has links)
L’apprentissage du langage parlé nécessite un contrôle musculaire très précis des différents organes intervenant dans la production de la parole. La production de sons voisés, qui résulte de l’auto-oscillation des cordes vocales, est notamment influencée par l’ensemble du système phonatoire, du diaphragme jusqu’aux lèvres. Les travaux réalisés dans le cadre de cette thèse s’inscrivent dans un contexte de modélisation physique de la parole. Les objectifs s’articulent autour de la compréhension des phénomènes physiques gouvernant la production de sons voisés. Les études sont appliquées à des cas pour lesquels le contrôle de la production est fortement altéré, lorsque le locuteur souffre de pertes auditives importantes. Dans ce cas de figure, les interactions physiques peuvent jouer un rôle important dans l’apparition de troubles de la production. La démarche adoptée consiste alors dans un premier temps à observer les phénomènes étudiés au moyen de mesures in vivo puis à proposer des modèles théoriques mécanique, aérodynamique et acoustique permettant de les décrire. Ensuite, les modèles sont validés en comparant avec des mesures réalisées sur une maquette de l’appareil phonatoire. Finalement,des simulations numériques temporelles basées sur un modèle à deux masses pour décrire le comportement mécanique des cordes vocales, permettent de tester les modèles physiques pour des cas concrets de production. La première étude se concentre sur les sauts de fréquence fondamentale qui accompagnent les transitions involontaires entre deux mécanismes laryngés lors de la production d’une voyelle. Les travaux expérimentaux et numériques montrent qu’une transition de mécanisme laryngé est la manifestation d’une bifurcation du système laryngé et que ces bifurcations se produisent lors d’une variation de la raideur des cordes vocales, de la pression sous-glottique, de l’aire glottique initiale ou bien de la longueur des résonateurs acoustiques. Les modèles théoriques permettent de reproduire les sauts de fréquence fondamentale observés expérimentalement. Ils sont utilisés pour étudier les différentes stratégies motrices responsables de ces sauts de fréquence. La deuxième étude porte sur la production de consonnes plosives, en particulier sur les effets de la réalisation d’une occlusion du conduit vocal sur l’arrêt puis l’apparition de l’oscillation des cordes vocales. Les simulations de séquences voyelle - plosive bilabiale non voisée (/p/)-voyelle effectuées montrent que l’expansion passive de la cavité supraglottique est à l’origine du maintien de l’auto-oscillation des cordes vocales après la fermeture du conduit vocal et que l’augmentation de la longueur du conduit vocal a pour effet de réduire le délai entre le relâchement de l’occlusion et l’apparition de l’oscillation des cordes vocales. Ces résultats impliquent que l’articulation joue un rôle considérable sur le mode de voisement (voisée ou non voisée) de la consonne et sur la valeur du Voice Onset Time pour une consonne plosive non voisée. / Language learning requires specific muscle control of all organs that contribute to speech production. Voiced sounds production, which results from vocal folds self oscillation, is especially influenced by the whole phonatory apparatus, from diaphragm to lips. The general background of this thesis is the physical modeling of speech production and the objectives are motivated by a better comprehension of physical phenomena occurring in voiced sounds production. In the frame of this work, studies are focused on cases where speech production control is impaired, for example when the speaker suffers from an important hearing loss. In this situation, physical interactions can play an important role in speech production disorders emergence. The approach adopted here is first to observe the studied phenomena thanks to invivo measurements then to describe them thanks to theoretical models. Thereafter, the models are validated by comparing theoretical results with measurements performed on a replica of the phonatory apparatus. Finally, numerical simulations in the time domain, based on a two-mass model, allow to apply physical models to specific speech production occurrences.The first study deals with fundamental frequency jumps that are observed during an unvoluntary transition between two different laryngeal mechanisms in case of vowel production.Experimental and numerical results highlight that a transition between two different laryngeal mechanisms is a symptom of the laryngeal system bifurcation, and that such bifurcation occurs during a variation of the vocal folds stiffness, the subglottal pressure,the prephonatory glottal area or the acoustic resonators length. The theoretical models allow to simulate the fundamental frequency jumps that are observed experimentally. They are used to study the different motor strategies responsible for these frequency jumps.The second study deals with plosive consonants production, and in particular with the effectsof a vocal tract occlusion on voicing offset and onset. Simulations of vowel – voiceless plosive - vowel production highlight that passive expansion of the supraglottal cavity is responsible for the voicing extension after vocal tract closure, and that increase of the vocal tract length leads to a shorter delay between the vocal tract occlusion release and the voicing onset. These results highlight that the articulation plays an important role in voicing (voiced or voiceless) and in voice-onset-time value for a voiceless plosive.
|
362 |
Développement typique et atypique de la production de parole : caractéristiques segmentales et intelligibilité de la parole d’enfants porteurs d’un implant cochléaire et d’enfants normo-entendants de 5 à 11 ans / Typical and atypical development of speech production : segmental characteristics and intelligibility of 5- to 11-year-old children wearing a cochlear implant and normal-hearing childrenGrandon, Bénédicte 09 December 2016 (has links)
En 2010, plus de 200 000 personnes dans le monde en étaient équipées, dont plus de 10 000 en France (adultes et enfants). La technologie utilisée pour les premiers implants commercialisés au milieu des années 1980 a beaucoup évolué et l’implant cochléaire permet désormais à son utilisateur d’avoir accès à des caractéristiques acoustiques de plus en plus précises des sons de son environnement et notamment des sons de parole. Cependant, l’information auditive fournie par l’implant reste limitée, ce qui a pour conséquence des difficultés persistantes de production de certains sons de parole par l’utilisateur d’implant cochléaire, même après plusieurs années d’utilisation. Ces difficultés de production peuvent se traduire également par une intelligibilité moindre, et peuvent avoir des répercussions sur les relations familiales et sociales, en particulier chez l’enfant.Les études disponibles dans la littérature se concentrent sur les effets et les bénéfices à court-terme de l’implant cochléaire chez l’enfant, et il existe relativement peu d’études de production de parole chez l’enfant en âge scolaire, en particulier chez l’enfant francophone. L’objectif de ce travail est donc de proposer une évaluation des difficultés de production de plusieurs contrastes phonologiques chez l’enfant sourd, porteur d’implant cochléaire, plusieurs années après l’implantation cochléaire, et des facteurs qui influencent son intelligibilité.Dans le cadre de notre thèse, nous avons constitué un corpus de productions de parole de 13 enfants âgés de 6;6 à 10;7 ans, atteints de surdité pré- ou périlinguistique, ayant reçu un implant cochléaire entre 1;1 et 6;6 ans, et l’utilisant depuis plus d’un an et de 20 enfants normo-entendants appariés en âge chronologique (de 5;7 à 10;6 ans).Dans un premier temps, nous avons comparé les caractéristiques acoustiques des voyelles orales, des occlusives et des fricatives du français, ainsi que la réalisation de la coarticulation dans des séquences occlusive-voyelle par ces deux groupes d’enfants. Les résultats montrent une grande proximité entre les productions des enfants typiques et implantés, et certaines différences, par exemple sur les voyelles antérieures arrondies, les fricatives alvéolaires et les occlusives vélaires. Ces différences peuvent s’expliquer par les caractéristiques technologiques de l’implant et son usage par l’enfant, et révèlent également le poids des différents facteurs du développement phonologique : contraintes articulatoires, contraintes perceptives, caractéristiques de l’input langagier et de la langue maternelle.Dans un deuxième temps, nous avons élaboré une méthode d’évaluation perceptive de l’intelligibilité de la parole, que nous avons soumise à 9 auditeurs experts en parole pathologique et à 17 auditeurs naïfs, tous francophones. Notre étude perceptive d’intelligibilité met en évidence 1) une absence d’effet d’expertise sur le jugement d’intelligibilité puisque les notes données par les auditeurs experts et naïfs sont corrélées, 2) un effet de l’audition sur l’intelligibilité, puisque les enfants sourds porteurs d’implant cochléaire sont jugés moins intelligibles que les enfants normo-entendants, et 3) une meilleure intelligibilité chez les enfants implantés précocement (avant 20 mois) mais pas d’effet de la durée d’utilisation de l’implant cochléaire sur l’intelligibilité.Ce travail montre donc le bénéfice apporté par l’implant pour la communication orale, mais aussi l’existence de difficultés persistantes, qui doivent être prises en compte dans la rééducation et l’accompagnement familial, scolaire et social des enfants.Notre étude fournit en outre un ensemble de données de référence sur le développement phonologique tardif des enfants francophones, et un corpus de parole utilisable pour d’autres travaux de recherche sur le développement typique et pathologique. / As of 2010, cochlear implant has been used by over 200 000 persons (adults and children) worldwide and by 10 000 persons in France. Technology has largely improved since the first devices were put on the market in the 1980’s, and it now provides its user with more and more detailed acoustical information about the sounds of their environment in general, and about speech sounds in particular. However, perception with a cochlear implant remains limited, which leads to persisting difficulties in producing some speech sounds, even after several years of implant use. These difficulties in speech production can translate into a lower intelligibility, with effects on interactions with family and community members for its users, especially for children.A large body of studies in the literature focusses on short-term effects and gains of cochlear implant for young children and infants, but fewer studies in speech production in school-age children are available, especially in French-speaking children. The goal of this project is to assess the difficulties in the production of selected phonological contrasts in cochlear-implanted children, several years after cochlear implantation, and the factors influencing their intelligibility.For this thesis, we recorded thirteen 6;6-to-10;7 year old, pre- or perilinguistically deaf children wearing cochlear implants since they were 1;1 to 6;6 years old, with more than a year of use, and twenty normal-hearing age-matched children (chronological age ranging from 5;7 to 10;6 years).In a first experiment, we compared the acoustical characteristics of ten oral vowels, six stops and three fricatives of French. We also studied the realization of coarticulation in plosive-vowel sequences in these two groups of children.Our results show a high degree of similarity in typical and implant using children, and several differences, for example, for front rounded vowels, alveolar fricatives and velar stops. These differences can be explained by the implant’s technology and its use by the child. They also show the importance of several factors in phonological development: articulatory constraints, perceptual constraints, characteristics of language input and mother tongue.In a second experiment, we designed a method to perceptually assess the intelligibility of speech: 9 expert and 17 naïve French-speaking listeners participated in this experiment.Our perceptual assessment of intelligibility shows 1) no effect of expertise since grades given by expert and naïve listeners are correlated, 2) an effect of hearing level on intelligibility since cochlear-implanted children are less intelligible than their normal-hearing peers, and 3) a better intelligibility in early implanted children (before 20 months) but no effect of duration of implant use on intelligibility.This work emphasizes the benefits for oral communication provided by cochlear implants, but also the remaining difficulties, that need to be taken into acount for rehabilitation and support from the child’s family, school and society.Our study also provides both reference data on late stages of phonological development in French-speaking children, and a corpus of speech production which can be used for further research on typical and pathological speech development.
|
363 |
Characterization of audiovisual binding and fusion in the framework of audiovisual speech scene analysis / Caractérisation du liage et de la fusion audiovisuels dans le cadre de l'analyse de la scène audiovisuelleAttigodu Chandrashekara, Ganesh 29 February 2016 (has links)
Cette thèse porte sur l’intégration de deux concepts : l’Analyse de Scènes Auditives (ASA) et la fusion audiovisuelle (AV) en perception de parole. Nous introduisons "l’Analyse de Scènes de Parole Audio Visuelles" (AVSSA) comme une extension du modèle à deux étages caractéristique de l’ASA vers des scènes audiovisuelles et nous proposons qu'un indice de cohérence entre modalités auditive et visuelle est calculé avant la fusion AV, ce qui permet de déterminer si les entrées sensorielles doivent être cognitivement liées : c’est le « modèle à deux étages » de la fusion AV. Des expériences antérieures sur la modulation de l'effet McGurk par des contextes AV cohérents vs. incohérents présentés avant la cible McGurk ont permis de valider le modèle à deux étages. Dans ce travail de thèse, nous étudions le processus AVSSA au sein de l'architecture à deux étages dans différentes dimensions telles que l'introduction de bruit, le mélange de sources AV, la recherche de corrélats neurophysiologiques et l’évaluation sur différentes populations.Une première série d'expériences chez les jeunes adultes a permis la caractérisation du mécanisme de liage AV en introduisant du bruit et les résultats ont montré que les participants étaient en mesure d'évaluer à la fois le niveau de bruit acoustique et la cohérence AV et de contrôler la fusion AV en conséquence. Dans une deuxième série d'expériences comportementales impliquant une compétition entre sources AV, nous avons montré que l’AVSSA permet d'évaluer la cohérence entre caractéristiques visuelles et auditives dans une scène complexe, afin d'associer les composants adéquats d'une source de parole AV donné, et de fournir pour le processus de fusion une évaluation de la cohérence de la source AV extraite. Il apparaît également que la fusion dépend du focus attentionnel sur une source ou l'autre. Puis une expérience EEG a cherché à mettre en évidence un marqueur neurophysiologique du processus de liage-déliage et a montré qu’un contexte AV incohérent peut moduler l'effet de l'entrée visuelle sur la composante N1 / P2. Une dernière série d'expériences a été axée sur l’évaluation du liage AV et de sa dynamique dans une population âgée, et a fourni des résultats similaires à ceux des adultes plus jeunes mais avec une plus grande dynamique de déliage. L'ensemble des résultats a permis de mieux caractériser le processus AVSSA et a été intégré dans la proposition d'une architecture neurocognitive améliorée pour la fusion AV dans la perception de la parole. / The present doctoral work is focused on a tentative fusion between two separate concepts: Auditory Scene Analysis (ASA) and Audiovisual (AV) fusion in speech perception. We introduce “Audio Visual Speech Scene Analysis” (AVSSA) as an extension of the two-stage ASA model to- wards AV scenes, and we propose that a coherence index between the auditory and the visual input is computed prior to AV fusion, enabling to determine whether the sensory inputs should be bound together. This is the “two-stage model of AV fusion”. Previous experiments on the modulation of the McGurk effect by AV coherent vs. incoherent contexts presented before the McGurk target have provided experimental evidence supporting the two-stage model. In this doctoral work, we further evaluate the AVSSA process within the two-stage architecture in various dimensions such as introducing noise, considering multiple sources, assessing neurophysiological correlates and testing in different populations.A first set of experiments in younger adults was focused on behavioral characterization of the AV binding process by introducing noise and results showed that the participants were able to evaluate both the level of acoustic noise and AV coherence and to monitor the AV fusion accordingly. In a second set of behavioral experiments involving competing AV sources, we showed that the AVSSA process enables to evaluate the coherence between auditory and visual features within a complex scene, in order to properly associate the adequate components of a given AV speech source, and provide to the fusion process an assessment of the AV coherence of the extracted source. It also appears that the modulation of fusion depends on the attentional focus on one source or the other.Then an EEG experiment aimed to display a neurophysiological marker of the binding and un- binding process and showed that an incoherent AV context could modulate the effect of the visual input on the N1/P2 component. The last set of experiments were focused on measurement of AV binding and its dynamics in the older population, and provided similar results as in younger adults though with a higher amount of unbinding. The whole set of results enabled better characterize the AVSSA process and were embedded in the proposal of an improved neurocognitive architecture for AV fusion in speech perception.
|
364 |
Séparation de sources en ligne dans des environnements réverbérants en exploitant la localisation des sources / Online source separation in reverberant environments exploiting known speaker locationsHarris, Jack 12 October 2015 (has links)
Cette thèse porte sur les techniques de séparation de sources en aveugle en utilisant des statistiques de second ordre et statistiques d'ordresupérieur pour les environnements de réverbération. Un objectif de la thèse est la simplicité algorithmique en vue de l'implantation en lignedes algorithmes. Le principal défi des applications de séparation de sources aveugles est de s'occuper des environnements acoustiques de réverbération; une complication supplémentaire concerne les changements dans l'environnement acoustique lorsque les sources humaines se déplacent physiquement.Une nouvelle méthode dans le domaine temporel qui utilise une paire de filtres à réponse impulsionnelle finie est proposée. Cette méthode, dite les angles principaux, sur un décomposition en valeurs singulières. Une paire de filtres, jouant le rôle de formation de voie, est estimée de façon à annuler une des sources. Une étape de filtrage adaptatif estensuite utilisée pour récupérer la source restante, en exploitant la sortie de l'étage de beamforming en tant que une référence de bruit. Une approche commune de la séparation de sources aveugle est d'utiliser des méthodes fondée sur les statistiques d'ordre supérieur comme l'analyse en composantes indépendantes. Cependant, pour des mélanges convolutifs audio et vocales réalistes, la transformation dansle domaine fréquentiel pour chaque fréquence de calcul est nécessaire. Ceci introduit le problème de permutations, inhérentes à l'analyse en composantes indépendantes, pour tout les fréquences. L'analyse en vecteur indépendant résout directement cette question par la modélisation des dépendances entre les fréquences de calcul, à partir d'a priori sur les sources. Un algorithme de gradient naturel en temps réel est également proposé proposé avec un autre a priori sur les sources. Cette méthode exploite la fonction de densité de probabilité de Student, est connu pour être bien adapté pour les sources de parole, en raison de queues de distribution plus lourdes. L'algorithme final est implanté en temps réel sur un processeur numérique de signal à virgule flottante de Texas Instruments.Les sources mobiles, avec des environnements réverbérant, causent des problèmes significatifs dans les systèmes de séparation desources réalistes car les filtres de mélange deviennent variants dans le temps. Dans ce cadre, une méthode qui utilise conjointement leprincipe de la paire de filtres d'annulation et le principe de l'analyse en vecteurs indépendant. Cette approche permet de limiter les baisses de performance lorsque les sources sont mobiles. Les résultats montrent également que les temps moyen de convergence des divers paramètres sont diminués.Les méthodes en ligne qui sont introduites dans la thèse, sont testées en utilisant des réponses impulsionnelles mesurées dans des environnements de réverbération. Les résultats montrent leur robustesse et d'excellentes performances par rapport à d'autres méthodes classique, dans plusieurs situations expérimentales. / Methods for improving the real-time performance and speed of various source enhancement and separation are considered. Two themes of research are considered so far: a method which relies only on second order statistics to enhance a target source exploiting video cues. Secondly, a higher-order statistics method, independent vector analysis is implemented in real-time on a digital signal processor, where an alternative source prior has been used performance is shown to have improved.
|
365 |
Trest domácího vězení jako forma nápravy pachatele / The punishment of homeprison as a form of the offender´s rectificationFIŠEROVÁ, Petra January 2010 (has links)
Each human society creates during its existence a system of reactions against undesirable activities of persons, who break the rules of the smooth passing of a particular community and contravene the standards and values of the community. The view of these reactions {--} punishments, changes over time and also with a respect to culture of the community or the state and its approach to an individual and his rights. In the past, the forms of punishments were, and in some countries still are, mainly primitive, such as amputations of body parts. However, the civilised world, especially, in case of non-arrestable offences, tends to prefer non-custodial service, such as home detention. Home detention as a form of penalty has been used in various alternatives for many years in countries such as Italy, Germany etc. However, the Czech legal system did not allow to impose this penalty until 2010. This form of penalty should facilitate the situation in Czech crowded prisons. It might be imposed on thousands of the sentenced a year and, at the same time, it would save money of the tax payers. The thesis deals with the legislative framework, where the home detention belongs and it is also focused on the fact how the other states, where home detention has been applied for years, have adopted this form of penalty. The objective of the Probation and Media Service of the Czech Republic is also mentioned in this work. The theoretical part of the thesis is divided into two parts {--} the first part deals with the punishment in general, the other one is focused on home detention in particular.
|
366 |
Neural mechanisms of phonological processing / Mécanismes neuraux du traitement phonologiqueSun, Yue 10 December 2015 (has links)
Afin de comprendre la parole, les auditeurs ont besoin de transformer les signaux sensoriels en sens abstraits. Dans cette thèse, nous nous sommes concentrés sur les processus perceptifs liés au système des sons du langage - le traitement phonologique, et examiné les mécanismes neurobiologiques sous-jacents.Dans la première partie de la thèse, nous avons examiné l'organisation temporelle du traitement phonologique dans le cerveau humain. En utilisant des enregistrements électroencéphalographiques (EEG), nous avons étudié le décours temporel pour le traitement perceptif de règles phonologiques spécifiques à la langue maternelle des auditeurs. Les résultats montre que les connaissances des auditeurs sur les règles phonologiques complexes de leur langue maternelle sont mise en oeuvre à un stade précoce de la perception de son de la parole.Dans la deuxième partie de cette thèse, nous avons étudié l'organisation spatiale du traitement phonologique dans le cortex humain. Nous avons effectué deux études pour étudier le rôle de l'interaction sensorimotrice dans le décodage phonologique à la fois pendant la perception de la parole et la lecture. Les résultats de la première étude démontrent que le système moteur est impliqué dans la catégorisation perceptive des sons de la parole non-natifs, tantdis que ceux de la deuxième étude montrent que la réparation perceptive des séquences de lettres illégale dans la langue maternelle des auditeurs est dépendante de la disponibilité du système moteur chez les participants.L'ensemble de cette thèse fournit de nouvelles perspectives sur les aspects temporels et spatiaux de mécanismes neuronaux qui sous-tendent le traitement phonologique. / In order to understand spoken language, listeners need to transform sensory signals into abstract meanings. In this thesis, we focused on perceptual processes that deal with the sound system of spoken language – phonological processing, and examined its neurobiological underpinnings. In the first part of the thesis, we investigated the temporal organization of phonological processing in the human brain. Using electroencephalographic (EEG) recordings, we studied the time course for perceptual processing of language-specific phonological rules. Findings of this study demonstrate that listeners’ knowledge of complex phonological rules of their native language is assessed at an early stage of speech sound perception. In the second part of the thesis, we investigated the spatial organization of phonological processing in the human cortex. In particular, we conducted two studies to investigate the role of sensorimotor interaction in phonological decoding during both speech perception and reading. Results from the first study showed that the motor system is involved in the perceptual categorization of non-native speech sounds, while those from the second study demonstrated that perceptual repair of phonotactically illegal letter sequences in reader’s native language is dependent to the availability of the their motor system. Together, findings from this thesis provide new insights into temporal and spatial aspects of neural mechanisms that underlie phonological processing.
|
367 |
Modélisation bayésienne du développement conjoint de la perception, l'action et la phonologie / Bayesian modeling of the joint development of perception, action and phonologyBarnaud, Marie-Lou 19 January 2018 (has links)
A travers les tâches de perception et de production, les humains peuvent manipuler non seulement des mots et des phrases mais également des unités de plus bas niveau tels des syllabes et des phonèmes. Les études en phonétique sont principalement focalisées sur ces seconds types d'unitées. Un des objectif majeur dans ce domaine et de comprendre comment les humains acquiert et manipulent ces unités.Dans cette thèse, nous nous intéressons à cette question à travers l'utilisation de la modélisation computationnelle en réalisant des simulation informatiques à l'aide d'un modèle bayésien de la communication nommé COSMO (“Communicating Objects using Sensory-Motor Operations”). Nos études s'étendres à trois aspects.Dans une première partie, nous étudions les représentations cognitives des unités phonétiques. Il est maintenant bien établie que les unités sont caractérisées par des représentations auditives et motrices. En examinant leur rôle respectifs durant le développement, nous établissons leur complémentarité à travers ce que nous nommons la propriété <<bande étroite/bande large>>.Dans une seconde partie, nous nous intéressons à la variabilité des unités phonétiques, notamment à travers l'étude de la corrélation des idiosyncrasies en perception et en production. En comparant plusieurs conditions de développement, nous établissons qu'elles s'acquiert à travers un processus de reproduction des catégories plutôt qu'à une répétition des sons.Dans une troisième partie, nous analysons la nature des catégories phonétiques. En phonétique, il y a un débat autour du statut des syllabes vs. des phonèmes dans la communication de la parole. Dans nos simulations, nous examinons leurs acquisitions respectives à travers un apprentissage non supervisée et montrons les particularités nécessaires à la communication. / Through perception and production tasks, humans are able to manipulate not only high-level units like words or sentences but also low-level units like syllables and phonemes. Studies in phonetics mainly focus on the second type of units. One of the main goal in this field is to understand how humans acquire and manipulate these units and how they are stored in the brain. In this PhD thesis, we address this set of issues by using computer modeling, performing computer simulations with a Bayesian model of communication, named COSMO (“Communicating Objects using Sensory-Motor Operations”). Our studies extend in three ways.In a first part, we investigate the cognitive content of phonetic units. It is well established that phonetic units are characterized by both auditory and motor representations. It also seems that these representations are both used during speech processing. We question the functional role of a double representation of phonetic units in the human brain, specifically in a perception task. By examining their respective development, we show that these two representations have a complementary role during perception: the auditory representation is tuned to recognize nominal stimuli whereas the motor representation has generalization properties and can deal with stimuli typical of adverse conditions. We call this the “auditory-narrow/motor-wide” property.In a second part, we investigate the variability of phonetic units. Despite the universality of phonetic units, their characterization varies from one person to another, both in their articulatory/motor and acoustic content. This is called idiosyncrasies. In our study, we aim at understanding how they appear during speech development. We specifically compare two learning algorithms, both based on an imitation process. The first version consists in sound imitation while the second version exploits phoneme imitation. We show that idiosyncrasies appear only in the course of a phoneme imitation process. We conclude that motor learning seems rather driven by a linguistic/communication goal than motivated by the reproduction of the stimulus acoustic properties.In a third part, we investigate the nature of phonetic units. In phonetics, there is a debate about the specific status of the syllable vs phoneme in speech communication. In adult studies, a consensus is now found: both units would be stored in the brain. But, in infant studies, syllabic units seem to be primary. In our simulation study, we investigate the acquisition of both units and try to understand how our model could “discover” phonemes starting from purely syllabic representations. We show that contrary to syllables and vowels, consonants are poorly characterized in the auditory representation, because the categories overlap. This is due to the influence of one phoneme on its neighbors, the well-known “coarticulation”. However, we also show that the representation of consonants in the motor space is much more efficient, with a very low level of overlap between categories. This is in line with classical theories about motor/articulatory invariance for plosives. In consequence, phonemes, i.e. vowels and consonants, seem well displayed and likely to clearly emerge in a sensory-motor developmental approach such as ours.Through these three axes, we implemented different versions of our model. Based on data from the literature, we specifically cared about the cognitive viability of its variables and distributions and of its learning phases. In this work, modeling computation has been used in two kinds of studies: comparative and explanatory studies. In the first ones, we compared results of two models differing by one aspect and we selected the one in accordance with experimental results. In the second ones, we interpreted a phenomenon observed in literature with our model. In both cases, our simulations aim at better understanding data from the literature and provide new predictions for future studies.
|
368 |
Etude de la coordination gestes manuels/parole dans le cadre de la désignation / Study of speech/manual gestures' coordination in a designation frameworkRoustan, Benjamin 10 October 2012 (has links)
Le travail présenté dans cette thèse vise à étudier la coordination entre gestes manuels et parole lors de la production d'énoncés multimodaux. Les études menées s'intéressent plus particulièrement aux relations temporelles entre les deux modalités. Cette coordination a été étudiée plus précisément dans le cadre de la désignation qui est réalisable à la fois dans la modalité manuelle (geste de pointage) et dans la modalité parole (« montrer avec la voix », en utilisant la focalisation et/ou les démonstratifs par exemple). Les études présentées ont été menées dans un environnement contrôlé de laboratoire afin d'obtenir des mesures précises et reproductibles en minimisant les facteurs extérieurs de variations intra- et inter-participants. Les productions des locuteurs peuvent ainsi être comparées entre-elles en se focalisant sur les facteurs d'intérêt toutes choses maintenues le plus possible égales par ailleurs. Un travail particulier de mise en place des protocoles a néanmoins permis de maintenir une tâche assez naturelle afin de ne pas induire des productions trop artificielles. Les deux premières études se sont intéressées à la production conjointe de gestes manuels et de parole contenant de la focalisation. Plusieurs types de gestes ont été comparés (geste de pointage, geste de battement et geste d'appui sur un bouton) lors d'une tâche de désignation. Il a été montré que la production de focalisation attire le geste manuel quel que soit son type mais que l'attraction est plus « précise » et fine pour le pointage. Par ailleurs, l'apex du geste de pointage semble être cooccurent à une cible articulatoire plutôt qu'acoustique. La seconde étude manipule le lien de désignation le geste de pointage et la parole. Elle montre, en exhibant deux stratégies adoptées par les participants, la complexité des mécanismes mis en jeu dans cette coordination. Finalement, une troisième étude s'intéresse à la coordination dans une tâche interactive et collaborative plus naturelle. Dans cette tâche les locuteurs utilisent naturellement des gestes de pointage pour désigner à leur interlocuteur l'emplacement d'une carte à poser grâce à une phrase porteuse contenant un démonstratif. Les résultats montrent une cooccurrence de la partie du geste qui montre avec l'information qui lui est complémentaire en parole, i.e. avec le nom de l'objet à poser à l'endroit désigné par le geste de pointage, plutôt qu'avec la partie de la parole qui désigne, i.e. le démonstratif. L'effet de la perturbation de l'interaction par un bruit ambiant est également testé et il est montré que, si la parole subit un effet Lombard classique, la production de gestes est peu modifiée mis à part une adaptation de la durée de la partie du geste qui montre à l'allongement de la parole. Ce mémoire propose par ailleurs une exploration des procédés d'annotation multimodaux mis en place pour l'annotation de tâches semi-contrôlées mais applicables à des cas plus généraux. Le manuscrit se conclut par une mise en perspective des résultats pour l'amélioration de certains modèles de production conjointe gestes manuels/parole et fournit quelques pistes utilisables dans le domaine des agents conversationnels ainsi que pour la détection de pathologies. / The work synthesized in this thesis aims at studying the coordination between manual gestures and speech during multimodal utterances production. More precisely, the temporal relationship between the two modalities is considered. The coordination is studied in a designation framework since designating is possible both manually (pointing gesture) and using speech (one can "show with the voice" using focus and/or demonstratives for example). All the studies presented in this work are done in a lab setting thus allowing to get precise and reproducible measurements while minimizing potential external sources of variation (either between or within participants). Participants' productions were then compared to each other focusing on factors of interest while keeping other sources of variation as low as possible. A part of the work consisted in designing rather natural experimental protocols so as to ensure productions were not too artificial. The first two experiments studied to co-production of manual gestures and speech containing a focused part. Different types of gestures were compared (pointing gesture, beat, button-push) in a designation task. It has been shown that producing focus did temporally attract manual gesture whichever its type but that this attraction was finer and less variable for pointing gesture. Another interesting finding was that the apex of pointing gesture seems to be cooccurring with articulatory targets rather than acoustic ones. The second study manipulates the designation link between manual gestures and speech. By showing that participants can be split up into two groups using different multimodal coordination strategies, it put forward the complexity of underlying mechanisms of this coordination. The last experiment focuses on the coordination in a more natural interactive and collaborative task. In this task, participants used pointing gestures as a natural way to show where a card should be placed on a playing board. They also produced accompanying sentences containing demonstratives. Results show a co-ocurrence of the part of the gesture that shows and with the complementary information in speech (ie. the name of the object to be placed at the spot pointed at by the manual gesture) rather than with the part of speech that shows (ie. demonstrative). The influence of impairing interaction by broadcasting a surrounding noise is also an issue which is addressed. However speech production shows a classical Lombard effect, the production of manual gesture undergoes only slight changes: mainly, the part of the manual gesture that shows lasts longer and this lengthening is related to the lengthening observed in speech. The work presented in this manuscript moreover put forward a systematic way of labeling semi-constrained interactive tasks which can be generalized. The conclusion puts in perspective the results so as to improve some manual gestures/speech co-production models and indicates paths for reflection about embodied conversational agents and early detection of pathological cases.
|
369 |
L'herbier du souffleur : critique phonostylistique de la prolation dramatiqueRuffo, Sébastien January 2002 (has links)
No description available.
|
370 |
Vrylating van die gevangene : historiese ontwikkeling en penologiese perspektiefBothma, Roelf Gerhardus Petrus 09 1900 (has links)
Text in Afrikaans / Hierdie navorsing is gerig op die vrylating van die gevangene en bet ten doel om aan die
hand van 'n literatuurstudie, die Suid-Afrikaanse vrylatingstelsel binne die korrektiewe
sisteem, histories met die nodige penologiese perspektief te beskryf.
Aangesien bestaande Suid-Afrikaanse penologiese literatuur arm is aan inligting met
betrekking tot die vrylating van die gevangene en meer spesifiek die vorme van
vrylating, is verskeie bronne geidentifiseer ten einde historisiteit saam te vat en
kontemporere beleid in die verband te bespreek.
Alhoewel 1910 as vertrekpunt geneem is, is die fokus in die grootste mate geplaas op
ontwikkeling sedert 1962. Bepaalde aksies deur onder andere die Inrigtingskomitee en
Paroolraad kulmineer in die vrylating van die gevangene en om die rede bet die
navorser ook die samestelling, bevoegdhede en werksaamhede van vermelde liggame
nagevors en beskryf. / This research is aimed at the release of the prisoner and the objective is to historically
elucidate the release system within the South African correctional system on the basis
of a literature study, with the necessary penological perspective.
Considering the fact that the existing literature on penology has hardly any information
regarding the release of the prisoner and more specifically the different types of release,
various sources have been identified in order to condense the historical information and
to discuss contemporary policy in this regard.
Although 1910 was taken as the starting point, the focus has largely been placed on
development since 1962. Specific actions by, inter alia, the Institutional Committee and
the Parole Board culminate in the release of the prisoner and for this reason the
compilation, the competencies and the activities of the mentioned bodies were also
described by the researcher. / M.A. (Penologie) / Sociology
|
Page generated in 0.0494 seconds