111 |
Nouvelles méthodes multi-échelles pour l'analyse non-linéaire de la paroleKhanagha, Vahid 16 January 2013 (has links) (PDF)
Cette thèse présente une recherche exploratoire sur l'application du Formalisme Microcanonique Multiéchelles (FMM) à l'analyse de la parole. Dérivé de principes issus en physique statistique, le FMM permet une analyse géométrique précise de la dynamique non linéaire des signaux complexes. Il est fondé sur l'estimation des paramètres géométriques locaux (les exposants de singularité) qui quantifient le degré de prédictibilité à chaque point du signal. Si correctement définis est estimés, ils fournissent des informations précieuses sur la dynamique locale de signaux complexes. Nous démontrons le potentiel du FMM dans l'analyse de la parole en développant: un algorithme performant pour la segmentation phonétique, un nouveau codeur, un algorithme robuste pour la détection précise des instants de fermeture glottale, un algorithme rapide pour l'analyse par prédiction linéaire parcimonieuse et une solution efficace pour l'approximation multipulse du signal source d'excitation.
|
112 |
Perturbation de la production de la parole suite à une opération de la glande thyroïdeFauth, Camille 04 December 2012 (has links) (PDF)
L'objectif de ce travail, mené en partenariat avec le Département de Chirurgie Oncologique du Centre Paul Strauss à Strasbourg, est d'évaluer les conséquences d'une chirurgie thyroïdienne sur la voix des patients, afin de déceler les différentes perturbations qu'entraîne cette opération chirurgicale, et de mettre au jour les possibles stratégies de compensation ou de réajustements que le patient peut mettre en place, seul ou à l'aide d'une rééducation orthophonique ; il s'agit d'une étude longitudinale. L'évaluation reposait sur l'analyse de signaux acoustiques, à partir desquels une quantité importante d'indices relatifs à la qualité vocale, mais aussi aux comportements articulatoires des locuteurs, a pu être extraite. La production de voyelles soutenues a permis de conduire deux études spectrales. L'étude spatio-temporelle a été rendue possible grâce à l'analyse de logatomes, et plus précisément de séquences VCV. Nous avons mené trois expériences sur le plan acoustique. La première expérience traite des caractéristiques spectrales de la voix de patients ayant subi une thyroïdectomie et ne présentant pas d'immobilité laryngée. La deuxième étude est menée à partir des caractéristiques spectrales de la voix de locuteurs présentant une immobilité laryngée post-thyroïdectomie. Enfin, notre dernière expérience a pour objet, l'étude des caractéristiques spatio-temporelles de la voix de locuteurs qui ont subi une thyroïdectomie et présentant une immobilité laryngée. L'interprétation articulatoire, effectuée à partir des données acoustiques, révèle des perturbations aussi bien des gestes glottiques que des gestes supraglottiques, avec des stratégies de réajustements variables suivant les patients. La conception d'une " cible ", comme espace de contrôle pour la réalisation de possibles articulatoires et acoustiques perceptivement acceptables, semble particulièrement pertinente ici, dans la mesure où les locuteurs pathologiques réorganisent leurs productions selon leurs propres contraintes physiologiques et anatomiques, provoquées par leur pathologie.
|
113 |
Perturbation de la production de la parole suite à une opération de la glande thyroïde / Perturbation of speech production as a result of thyroid gland surgeryFauth, Camille 04 December 2012 (has links)
L’objectif de ce travail, mené en partenariat avec le Département de Chirurgie Oncologique du Centre Paul Strauss à Strasbourg, est d’évaluer les conséquences d’une chirurgie thyroïdienne sur la voix des patients, afin de déceler les différentes perturbations qu’entraîne cette opération chirurgicale, et de mettre au jour les possibles stratégies de compensation ou de réajustements que le patient peut mettre en place, seul ou à l’aide d’une rééducation orthophonique ; il s’agit d’une étude longitudinale. L’évaluation reposait sur l’analyse de signaux acoustiques, à partir desquels une quantité importante d’indices relatifs à la qualité vocale, mais aussi aux comportements articulatoires des locuteurs, a pu être extraite. La production de voyelles soutenues a permis de conduire deux études spectrales. L’étude spatio-temporelle a été rendue possible grâce à l’analyse de logatomes, et plus précisément de séquences VCV. Nous avons mené trois expériences sur le plan acoustique. La première expérience traite des caractéristiques spectrales de la voix de patients ayant subi une thyroïdectomie et ne présentant pas d’immobilité laryngée. La deuxième étude est menée à partir des caractéristiques spectrales de la voix de locuteurs présentant une immobilité laryngée post-thyroïdectomie. Enfin, notre dernière expérience a pour objet, l’étude des caractéristiques spatio-temporelles de la voix de locuteurs qui ont subi une thyroïdectomie et présentant une immobilité laryngée. L’interprétation articulatoire, effectuée à partir des données acoustiques, révèle des perturbations aussi bien des gestes glottiques que des gestes supraglottiques, avec des stratégies de réajustements variables suivant les patients. La conception d’une « cible », comme espace de contrôle pour la réalisation de possibles articulatoires et acoustiques perceptivement acceptables, semble particulièrement pertinente ici, dans la mesure où les locuteurs pathologiques réorganisent leurs productions selon leurs propres contraintes physiologiques et anatomiques, provoquées par leur pathologie. / The aim of this study, conducted in partnership with the Department of Surgical Oncology, Centre Paul Strauss in Strasbourg, is to assess the consequences of thyroid surgery on the voice of patients, in order to identify the various perturbations caused by this surgery, and also to reveal possible compensatory strategies or readjustments that the patient may develop, alone or with speech therapy; this is a longitudinal study. The assessment was based on the analysis of acoustic signals, from which a large amount of cues related to voice quality, but also to articulatory behaviour of speakers was extracted. Production of sustained vowels allowed carrying out two spectral studies. The spatiotemporal study was made possible through the analysis of nonsense words, and more specifically through VCV sequences. We conducted three experiments on the acoustic level. The first experiment deals with the spectral characteristics of the voice of patients who underwent thyroidectomy, with no laryngeal paralysis. The second study was conducted based on spectral characteristics of the voice of speakers with laryngeal post-thyroidectomy paralysis. Our final experiment was to study spatio-temporal characteristics of the voice of speakers who underwent thyroidectomy, with laryngeal paralysis. Articulatory interpretations, made from the acoustic data, reveal perturbations of gestures on both the glottal and supraglottal levels, with readjustment strategies varying according to patients. The concept of a "target" as a control space for execution of possible articulatory and acoustic entities, which are perceptually acceptable, seems particularly relevant in this study, since disordered speakers reorganize their productions according to their own physiological and anatomical constraints, caused by the disorder.
|
114 |
Convergence phonétique en interaction Phonetic convergence in interaction / Phonetic convergence in interactionLelong, Amélie 03 July 2012 (has links)
Le travail présenté dans cette thèse est basé sur l’étude d’un phénomène appelé convergence phonétique qui postule que deux interlocuteurs en interaction vont avoir tendance à adapter leur façon de parler à leur interlocuteur dans un but communicatif. Nous avons donc mis en place un paradigme appelé « Dominos verbaux » afin de collecter un corpus large pour caractériser ce phénomène, le but final étant de doter un agent conversationnel animé de cette capacité d’adaptation afin d’améliorer la qualité des interactions homme-machine.Nous avons mené différentes études pour étudier le phénomène entre des paires d’inconnus, d’amis de longue date, puis entre des personnes provenant de la même famille. On s’attend à ce que l’amplitude de la convergence soit liée à la distance sociale entre les deux interlocuteurs. On retrouve bien ce résultat. Nous avons ensuite étudié l’impact de la connaissance de la cible linguistique sur l’adaptation. Pour caractériser la convergence phonétique, nous avons développé deux méthodes : la première basée sur une analyse discriminante linéaire entre les coefficients MFCC de chaque locuteur, la seconde utilisant la reconnaissance de parole. La dernière méthode nous permettra par la suite d’étudier le phénomène en condition moins contrôlée.Finalement, nous avons caractérisé la convergence phonétique à l’aide d’une mesure subjective en utilisant un nouveau test de perception basé sur la détection « en ligne » d’un changement de locuteur. Le test a été réalisé à l’aide signaux extraits des interactions mais également avec des signaux obtenus avec une synthèse adaptative basé sur la modélisation HNM. Nous avons obtenus des résultats comparables démontrant ainsi la qualité de notre synthèse adaptative. / The work presented in this manuscript is based on the study of a phenomenon called phonetic convergence which postulates that two people in interaction will tend to adapt how they talk to their partner in a communicative purpose. We have developed a paradigm called “Verbal Dominoes“ to collect a large corpus to characterize this phenomenon, the ultimate goal being to fill a conversational agent of this adaptability in order to improve the quality of human-machine interactions.We have done several studies to investigate the phenomenon between pairs of unknown people, good friends, and between people coming from the same family. We expect that the amplitude of convergence is proportional to the social distance between the two speakers. We found this result. Then, we have studied the knowledge of the linguistic target impact on adaptation. To characterize the phonetic convergence, we have developed two methods: the first one is based on a linear discriminant analysis between the MFCC coefficients of each speaker and the second one used speech recognition techniques. The last method will allow us to study the phenomenon in less controlled conditions.Finally, we characterized the phonetic convergence with a subjective measurement using a new perceptual test called speaker switching. The test was performed using signals coming from real interactions but also with synthetic data obtained with the harmonic plus
|
115 |
L'apport de la voix chantée pour l'intégration phonético-phonologique d'une langue étrangère : application auprès d'italophones apprenants de FLE / Using singing-voice tasks for outcomes in phonetic and phonological correction of a foreign languageCornaz, Sandra 12 December 2014 (has links)
L’objectif du didacticien est d’élaborer une méthode performante dont le contenu et les outils d’enseignement-apprentissage améliorent les compétences phonétiques en langue étrangère. Concernant le contenu pédagogique, les travaux ont montré que les sons et les phonèmes d’une langue inconnue sont traités selon l’organisation de l’espace phonétique et phonologique de la langue maternelle. Les recherches mettent en avant l’intérêt de confronter les systèmes linguistiques afin de prédire les difficultés et les facilités auxquelles seront exposés les apprenants de langue. S’agissant des outils de transmission, les études montrent les effets bénéfiques de l’interdisciplinarité et le rôle pertinent de la musique sur le développement cognitif et des apprentissages. Notre objectif de recherche s’inscrit dans ce contexte scientifique. Notre intérêt est double. D’abord, nous avons tenté d’identifier quel paramètre, inhérent à l’émission en voix chantée et la différenciant de la voix parlée, pouvait faciliter la perception de voyelles non-natives. Ensuite, nous avons souhaité comparer les effets sur la compétence de production de voyelles non-natives de deux méthodes de corrections phonétique, l’une des deux exploitant l’outil « voix chantée ». À travers les résultats de ces études, nous avons essayé de saisir le rôle de l’italien langue maternelle sur la perception et la production du français langue cible. Nos travaux n’ont pas mis en évidence d’effet des modalités fréquence fondamentale et allongement de la durée vocalique sur la discrimination perceptive des voyelles non natives /y/ et /ø/, mais ils suggèrent un rôle du contexte prévocalique sur la perception de la voyelle non-native /y/ en contraste /u/. Nous avons trouvé un effet favorable de la méthode de correction phonétique incluant la pratique chantée sur la production du spectre sonore des voyelles fermées du français, mais pas sur l’évolution des catégories phonologiques à l’intérieur de l’espace acoustique vocalique. Les résultats de ces études soutiennent la théorie que l’enseignement-apprentissage de la phonétique a sa place en classe de langue, et suggèrent que la voix chantée serait, sous certaines conditions, un outil pertinent pour faciliter la perception et la production de voyelles non-natives. / Specialists in didactics aim to create an efficient method, whose teaching / learning content and tools improve phonetic skills in foreign languages. As for the educational content, research studies have proved that sounds and phonemes of a foreign language are processed according to the structure of the phonetic and phonological space of the native language. Other works point out that it is particularly relevant to compare linguistic systems in order to predict future difficulties and abilities language learners will be confronted with. As for transmission tools, studies have shown the beneficial effects of interdisciplinarity and the pertinent role music plays on cognitive and learning development. Our research objective falls within this scientific context. Our purpose has been two-fold. First, we tried to identify which parameter, related to the production of the singing voice whilst separate from the speaking voice, may facilitate the perception of non-native vowels. Secondly, we aimed at comparing the effects on the ability to produce non-native vowels of two corrective phonetic methods, one of which used the “singing voice” tool. Through the results of these studies, we tried to understand how Italian as a native language interacts with the perception and the production of French as a target language. Our studies have shown that vowel pitch and duration do not impact the discrimination of /y/ and /ø/, and that the consonant sharpness plays a role on the discrimination of /y/ in a CV type syllable. We found a positive effect of the method, which uses singing-voice as a tool, on the production of the sound spectrum of French closed vowels, but not on the evolution of the sounds and phonemes into the acoustic space. Our results support the theory that phonetic teaching and learning is relevant in language classes and suggest that singing-voice may be a useful tool to ease the perception and the production of non-native vowels. / L’obiettivo dell’esperto di didattica è di elaborare un metodo efficace, il cui contenuto e gli strumenti d’insegnamento-apprendimento migliorino le competenze fonetiche in lingua straniera. Riguardo al contenuto pedagogico, le nostre ricerche hanno dimostrato che i suoni e i fonemi di una lingua sconosciuta sono trattati secondo l’organizzazione dello spazio fonetico e fonologico della lingua materna. Queste ricerche evidenziano l’utilità di confrontare sistemi linguistici differenti al fine di predire le difficoltà e le agevolazioni a cui sono esposti gli studenti di lingua straniera come lingua seconda (L2). Per quanto concerne gli strumenti d’insegnamento e apprendimento, le nostre ricerche dimostrano gli effetti benefici dell’interdisciplinarità ma anche del ruolo pertinente della musica sullo sviluppo cognitivo e sul piano degli studenti. Il nostro interesse di ricerca è doppio. In primo luogo, abbiamo tentato d’identificare quale parametro, inerente alla produzione in voce cantata e che la distingue della produzione del parlato, potesse agevolare la percezione di vocali assenti dalla lingua materna. In seguito, abbiamo voluto confrontare gli effetti di due metodi di correzione fonetica, uno dei quali sfrutta lo strumento “voce cantata”, sulla competenza di produzione delle vocali del francese /y ø/ non presenti nel sistema vocalico dei locutori di italiano madrelingua. I risultati di questi studi contribuiscono ad individuare l’impatto dell’italiano madrelingua sulla produzione e sulla percezione del francese lingua d’apprendimento. I nostri lavori non hanno evvidenziato un effetto delle modalità pitch e durata d’emissione della vocale /y/ e della vocale /ø/ sulla loro discriminazione, ma suggeriscono un ruolo del contesto pre-vocalico sulla percezione della vocale /y/ in contrasto /u/. Abbiamo scoperto un effetto favorevole del metodo di correzione fonetica includendo la voce cantata sulla produzione dello spettro sonoro delle vocali chiuse del francese, ma non sull’evoluzione delle categorie fonologiche all’interno dello spazio acustico. I risultati di questi studi sostengono la teoria secondo la quale l’insegnamento-apprendimento fonetico ha pienamente ragione di essere in classe di lingua, e suggeriscono che la voce cantata sarebbe, sottommessa ad alcune condizioni, uno strumento che facilita la percezione e la produzione di vocali assenti dalla madrelingua.
|
116 |
Approche hybride pour la reconnaissance automatique de la parole en langue arabe / Hybrid approach for automatic speech recognition for the Arabic languageMasmoudi Dammak, Abir 21 September 2016 (has links)
Le développement d'un système de reconnaissance de la parole exige la disponibilité d'une grande quantité de ressources à savoir, grands corpus de texte et de parole, un dictionnaire de prononciation. Néanmoins, ces ressources ne sont pas disponibles directement pour des dialectes arabes. De ce fait, le développement d'un SRAP pour les dialectes arabes se heurte à de multiples difficultés à savoir, l’'abence de grandes quantités de ressources et l'absence d’'une orthographe standard vu que ces dialectes sont parlés et non écrit. Dans cette perspective, les travaux de cette thèse s’intègrent dans le cadre du développement d’un SRAP pour le dialecte tunisien. Une première partie des contributions consiste à développer une variante de CODA (Conventional Orthography for Arabic Dialectal) pour le dialecte tunisien. En fait, cette convention est conçue dans le but de fournir une description détaillée des directives appliquées au dialecte tunisien. Compte tenu des lignes directives de CODA, nous avons constitué notre corpus nommé TARIC : Corpus de l’interaction des chemins de fer de l’arabe tunisien dans le domaine de la SNCFT. Outre ces ressources, le dictionnaire de prononciation s’impose d’une manière indispensable pour le développement d’un SRAP. À ce propos, dans la deuxième partie des contributions, nous visons la création d’un système nommé conversion (Graphème-Phonème) G2P qui permet de générer automatiquement ce dictionnaire phonétique. Toutes ces ressources décrites avant sont utilisées pour adapter un SRAP pour le MSA du laboratoire LIUM au dialecte tunisien dans le domaine de la SNCFT. L’évaluation de notre système donné lieu WER de 22,6% sur l’ensemble de test. / The development of a speech recognition system requires the availability of a large amount of resources namely, large corpora of text and speech, a dictionary of pronunciation. Nevertheless, these resources are not available directly for Arabic dialects. As a result, the development of a SRAP for Arabic dialects is fraught with many difficulties, namely the lack of large amounts of resources and the absence of a standard spelling as these dialects are spoken and not written. In this perspective, the work of this thesis is part of the development of a SRAP for the Tunisian dialect. A first part of the contributions consists in developing a variant of CODA (Conventional Orthography for Arabic Dialectal) for the Tunisian dialect. In fact, this convention is designed to provide a detailed description of the guidelines applied to the Tunisian dialect. Given the guidelines of CODA, we have created our corpus TARIC: Corpus of the interaction of the railways of the Tunisian Arab in the field of SNCFT. In addition to these resources, the pronunciation dictionary is indispensable for the development of a peech recognition system. In this regard, in the second part of the contributions, we aim at the creation of a system called conversion(Grapheme-Phonème) G2P which allows to automatically generate this phonetic dictionary. All these resources described before are used to adapt a SRAP for the MSA of the LIUM laboratory to the Tunisian dialect in the field of SNCFT. The evaluation of our system gave rise to WER of 22.6% on the test set.
|
117 |
L'onomatopée dans le lexique de l'arabe / The onomatopoeia in the arabic lexiconAlloush, Mustafa 02 December 2016 (has links)
L’onomatopée et l’interjection qui ont été étudiées de manière approfondie dans le domaine français dès le XVIIIe siècle n’ont fait l’objet que de quelques allusions dans la théorie grammaticale arabe traditionnelle. C’est ce vide que la présente thèse se propose de combler. Il s’agit d’une étude lexicale qui s’insère dans les recherches développant la théorie des matrices et des étymons (TME). Elle comprend deux grandes parties. La première se compose de deux chapitres. Le premier est consacré aux interjections (34 cas) et le second aux onomatopées proprement dites (18 cas). Dans ces deux chapitres, on procède à la manière de Guiraud (1967, chapitre III, « Structures onomatopéiques », ex. la racine T. K.). On extrait de l’interjection ou de l’onomatopée les deux consonnes qui les composent et on les considère comme un étymon dont on suit les diverses réalisations dans le lexique, en veillant toujours à la corrélation phono-sémantique. Il ressort de cette première partie que les racines (au sens traditionnel du terme) émanant d’étymons onomatopéiques sont près de neuf cents.Comme nous avons observé la présence du trait [+strident] dans un bon nombre de ces étymons, nous avons consacré la seconde partie à l’étude d’une nouvelle matrice qui se compose des traits [+strident] et [coronal], corrélés l’invariant notionnel « son, voix, bruit » et ses conséquences ,incluant la peur, le mouvement et ses diverses caractérisations. Cette matrice se réalise dans 69 étymons qui sont disposés par ordre alphabétique. Les réalisations de chaque étymon sont disposées en trois colonnes : le radical où l’étymon se réalise, la référence dans le tableau de l’organisation de l’invariant notionnel, le sens (tel qu’il est donné dans le Kazimirski).Il ressort de cette double étude qu’un immense pan du lexique de l’arabe est motivé, pourvu que l’on situe l’analyse au niveau des traits, la corrélation s’établissant entre le bruit et la définition même du trait de stridence, les sons stridents « se caractérisant acoustiquement par une plus grande quantité de bruit que leurs correspondants non-stridents » (Chomsky et Halle, 1968, p. 166). / Although onomatopoeia and interjections in French have been studied in depth since the 18th century, they have only been alluded to in traditional Arabic grammatical theory. This thesis is intended to remedy this situation with a lexical study applying the Theory of Matrices and Etymons (TME). The thesis is divided into two major sections, the first of which comprises two chapters. The first chapter deals with 34 interjections and the second 18 onomatopoeia. The approach adopted in these first two chapters is that of Guiraud (1967, chapter III devoted to onomatopoeic structures, e.g. the T. K. root). The interjections and onomatopoeia are extracted from the consonants which compose them; these consonants are considered as an etymon the various realisations of which are pursued in the lexicon with constant attention to the phono-semantic correlation. This first part shows that there are nearly nine hundred roots (in the traditional meaning of the term) arising out of the onomatopoeic etymons. Given the presence of the [+strident] feature in a large number of these etymons, the second part of this thesis is devoted to a new matrix comprising the correlated [+strident] and [coronal] features, the notional invariant "sound, voice, noise" and its consequences including fear, movement and its various characteristics. This matrix is realised in 69 etymons ordered alphabetically. The realisations of each etymon are given in three columns: the radical in which the etymon is realised; the reference in the organisational table of the notional invariant; the meaning (as given in Kazimirski).This double study reveals that - provided that the analysis is established at the phonetic feature level - an immense area of the Arabic lexicon is motivated, the correlation between the noise and the very definition of the feature of stridence and strident sounds: "Strident sounds are marked acoustically by greater noisiness than their nonstrident counterparts" (Chomsky et Halle, 1968, p. 329).
|
118 |
De l'analysibilité des racines de l'hébreu biblique / Hebrew Roots’s AnalysabilitySibony, Jonas 18 November 2013 (has links)
Notre étude s’inscrit dans le cadre de la théorie des matrices et des étymons (TME), principalement élaborée par G. Bohas (1997, 2000), G. Bohas et M. Dat (2007) et G. Bohas et A. Saguer (2012). Ce nouvel outil propose une réorganisation du lexique des langues sémitiques non plus sur la base de phonèmes mais de traits phonétiques. Cette perspective mène à contester le caractère primitif de la notion de racine triconsonantique développée par les grammairiens arabes du Moyen-Âge. De plus, la TME permet de rendre compte d’un certain nombre de régularités observées dans le lexique, telles que les liens phonético-sémantiques existants entre certains radicaux, l’aspect mimétique de la structure du signe, la polysémie des racines trilitères, etc. Notre thèse traite dans ce cadre du vocabulaire de l’hébreu biblique et se présente en trois parties. Dans un premier temps est donnée une description complète du fonctionnement de la théorie, suit un développement du vocabulaire de sept champs notionnels contraints par un cadre phonétique stable puis nous proposons un dictionnaire présentant une réorganisation totale du lexique hébraïque ancien sur la base d’étymons bilitères. / Our study is on the matrix and etymons theory (TME), mainly elaborated by G. Bohas (1997, 2000), G. Bohas and M. Dat (2007), and G. Bohas and A. Saguer (2012). This new tool proposes a reorganization of the vocabulary of Semitic languages, no longer based on phonemes but on distinctive features. This viewpoint brings us to contest the primitive angle of the notion of triconsonantal root developed by Arab grammarians in the Middle Ages. Moreover, TME enables us to explain lots of regularities noticed in the vocabulary, such as phono-semantical links between stems, the mimetic aspect of the sign’s structure, the polysemy of the triliteral roots, etc. Our thesis deals with biblical Hebrew and is divided in three parts. The first gives a complete definition of the theory. The second applies it to the vocabulary of seven notional fields built on a stable phonetic setting. The third proposes a lexicon presenting a whole reorganization of the vocabulary of ancient Hebrew based on bilateral etymons.
|
119 |
Analyse de la parole continue en vue de la caractérisation des troubles de la voix: traitement du signal, indices acoustiques et évaluation perceptiveKacha, Abdellah 13 October 2006 (has links)
L’analyse du signal de parole offre un moyen privilégié pour l’évaluation clinique de la qualité de la voix en vue d’un diagnostique et d’une documentation quantitative des pathologies du larynx. Une analyse acoustique présente plusieurs avantages. En plus du coût peu élevé du système d’évaluation, elle est simple à mettre en œuvre, présente un caractère non invasif et documente quantitativement le degré d’enrouement perçu par le clinicien.<p>L’objectif de l’analyse du signal acoustique est d’extraire des indices pertinents permettant de déterminer les caractéristiques de la voix afin de renseigner sur l’état du larynx du locuteur. Dans ce contexte, plusieurs indices acoustiques sont utilisés pour caractériser la parole produite par des locuteurs dysphoniques. Un nombre de ces indices reflète la déviation du signal de parole voisée par rapport à la périodicité parfaite. Les causes de ces dyspériodicités sont diverses :vibrations non modales des cordes vocales, bruit de modulation comprenant les variations cycle à cycle de la durée de cycle (jitter) et de l’amplitude (shimmer) dues aux perturbations externes, bruit additif dû à une turbulence excessive, etc.<p>Les indices acoustiques des dyspériodicités vocales sont souvent obtenus à partir de fragments stationnaires de voyelles soutenues. La raison en est que les voyelles sans attaques et déclins sont faciles à analyser parce que les hypothèses de cyclicité et de stationnarité utilisées par les méthodes d’analyse sont valables pour beaucoup de locuteurs. En effet, les voyelles soutenues peuvent être supposées avec une bonne précision comme produites en maintenant invariant dans le temps les caractéristiques de la source vocale, du conduit vocal et des articulateurs et, donc, les paramètres des perturbations et du bruit sont facilement calculés pour les voyelles soutenues.<p>La plupart des cliniciens considèrent la parole continue plus informative que les voyelles soutenues. Plusieurs arguments en faveur de l’analyse de la parole continue peuvent être avancés. La vibration des cordes vocales doit commuter continuellement pour donner lieu à l’apparition ou l’extinction du voisement, le voisement doit être maintenu alors que l’impédance supra-glottique change constamment, plus particulièrement durant les obstruents, et le larynx doit descendre et monter continuellement. Le larynx fonctionne donc dans des conditions non stationnaires et très variables. La parole continue contient donc les caractéristiques dynamiques de la source de la voix et du conduit vocal tels que l’attaque et le déclin et les variations dans la fréquence fondamentale et l’amplitude. De même, il semble que les locuteurs compensent moins pour leurs problèmes de voix lors de la production de la parole continue que lorsqu’ils produisent des voyelles soutenues.<p>Les méthodes de traitement du signal de parole pour la caractérisation des troubles de la voix sont basées sur les hypothèses de stationnarité et de périodicité locales qui conduisent à des approches heuristiques permettant de détecter et d’isoler les périodes fondamentales ou les harmoniques spectrales. Comme conséquence, des erreurs d’insertion ou d’omission se produisent souvent lors de l’analyse des signaux fortement perturbés. Ces erreurs biaisent numériquement les indices acoustiques. Les mesures objectives ne sont donc fiables que lorsque l’analyse est effectuée sur des voyelles soutenues produites par des locuteurs faiblement ou modérément enroués.<p>La précision des méthodes d’analyse dans le cadre de l’estimation des dyspériodicités vocales est une caractéristique fondamentale. En effet, les perturbations cycle à cycle des durées de cycle peuvent être inférieures à 1 % alors que les perturbations cycle à cycle de l’amplitude peuvent être inférieures à 10 %. Donc, les méthodes de traitement doivent être appliquées avec précaution vis à vis de la précision de mesure pour ne pas biaiser les valeurs numériques. Le bruit de quantification par exemple peut affecter la précision d’estimation s’il n’est pas pris en considération.<p>Cette thèse se focalise sur le développement de méthodes robustes d’analyse acoustiques du signal de parole continue en vue de la caractérisation des troubles de la voix, la définition et l’évaluation d’indices acoustiques pour quantifier les dyspériodicités vocales et le développement d’une méthode d’évaluation perceptive fiable permettant de mesurer et comparer les performances des différentes méthodes d’analyse développées.<p>Les méthodes développées sont de deux types :des méthodes d’analyse par bloc qui opèrent sur des trames de courte durée du signal et des méthodes adaptatives qui permettent d’analyser le signal à chaque échantillon en tenant compte de son caractère non stationnaire.<p>Deux indices acoustiques sont utilisés pour quantifier les dyspériodicités vocales dans le signal de parole. Le premier indice, utilisé conventionnellement dans le cadre de l’évaluation objective de la qualité de la voix, est le rapport signal à dyspériodicité global. La valeur numérique de l’indice global est principalement déterminée par les segments vocaliques et donc il peut masquer certains évènements locaux, notamment dans le cas de l’analyse de la parole continue. Le second indice proposé comme alternative à l’indice global est le rapport signal à dyspériodicité segmental. Il a pour objectif de donner une plus forte pondération aux segments bruités de faibles niveaux qui sont peu pondérés dans le calcul de l’indice global.<p>La méthode d’évaluation perceptive développée est basée sur la comparaison de paires de signaux. Elle permet d’obtenir des résultats fiables même lorsque l’évaluation est réalisée par des auditeurs naïfs n’ayant pas d’expérience dans l’évaluation de la qualité de la voix et permet une grande concordance inter-juges et intra-juges. Les performances de la méthode d’évaluation perceptive basée sur la comparaison de paires de signaux sont comparées à celles de la méthode conventionnelle utilisée en milieu clinique.<p>Les performances des différentes méthodes d’analyse et des indices acoustiques sont mesurées en les testant sur des corpus comprenant des voyelles soutenues et de la parole continue. Les stimuli sont produits par des locuteurs normophoniques et dysphoniques et comprennent une large gamme de pathologies.<p> / Doctorat en sciences appliquées / info:eu-repo/semantics/nonPublished
|
120 |
Description des variétés berbères en danger du Sud-Oranais (Algérie) - Étude dialectologique, phonologique et phonétique du système consonantique / Description of endangered Berber varieties of Sud-Oranais (Algeria) - A Dialectological, phonetic and phonological study of the consonantic systemEl Idrissi, Mohamed 08 December 2017 (has links)
Il existe dans le sud ouest algérien plusieurs variétés de berbère. Certaines d'entre elles sont situées dans la région dite du Sud-Oranais et peuvent être cataloguées comme des langues en danger. Nous avons donc entrepris de décrire ces variétés avant qu'elles ne disparaissent. Cela a été mené à bien en réalisant plusieurs enquêtes de terrain. Par ailleurs, ce travail de documentation linguistique et de conservation du patrimoine culturel n'est qu'un des aspects de cette thèse. Ce travail académique est à la croisée de différents domaines disciplinaires. Nous avons eu recours aux méthodes en usage en Sciences de l'Information Géographique (SIG) et en Sciences Des Données (SDD) pour mener une étude dialectologique. Grâce aux SIG, nous avons réalisé une étude géolinguistique qui nous a permis de visualiser sur des cartes linguistiques la distribution de la variation linguistique de certaines consonnes. À partir de ces données, nous avons discuté de la réalité phonologique de ces consonnes simples et géminées. Dans le prolongement, une étude dialectométrique a été effectuée en nous basant sur des méthodes de partitions des données. Nous avons utilisé les méthodes d'Apprentissage Non Supervisé (PHA, k-moyenne, MDS, ...) et les méthodes d'Apprentissage Supervisé (CART) connues en SDD. Les résultats ont été affichés sous la forme de figures (cartes linguistiques, dendogramme, heatmap, arbre, ...) à des fins d'exploration visuelle des données. L'ensemble de ces études a été accompli par le biais d'un traitement informatique (langage R). Puis, nous avons entrepris une analyse phonétique fondée sur une étude acoustique des rhotiques alvéolaires : [ɾ], [r], [ɾˤ] et [rˤ]. Ces unités phoniques se distinguent par leur temporalité et leur réalisation articulatoire. Ainsi, les spectrogrammes nous ont permis d'examiner la distribution de ces sons. Puis, cela nous a aidé à distinguer ce qui relevait de la phonétique et de la phonologie. Ensuite, nous avons achevé cette thèse par une étude phonétique et statistique. Ces dernières ont porté sur l'obstruction réalisée par la pointe de la langue et sur la nature des vocoïdes qui accompagnent les rhotiques alvéolaires dans l'environnement d'une consonne. / There are several Berber languages in the south west of Algeria. Some of them are situated in the so-called Sud-Oranais and they can be categorized as endangered languages. So I have decided to describe them before they disappear. That’s why, I have carried out several fieldworks. But, this linguistic documentation work and cultural heritage conservation are just one of aspects of our thesis. This PhD are transdisciplinary. I have used the methods which are applied in Geographic Information Science (GIS) and in Data Science (DS) to carry out a dialectological study. A geolinguistic study has been undertaken and has enabled to visualize the expansion of the linguistic variation of certain consonants through GIS. Based on these data, I have debated the phonological reality of the simple and geminate consonants. From this research, a dialectometric study was carried out on the basis of data partitioning methods. I have used the Unsupervised Learning Methods (HAC, k-mean, MDS, ...) and the Supervised Learning Methods (CART) known in DS. A visual exploration (linguistic maps, dendogram, heatmap, tree, ...) approach is proposed in order to analyse the results which have been realized through computer processing (R language). Then, I have undertaken a phonetic analysis, which is based on an acoustic study of alveolar rhotics : [ɾ], [r], [ɾˤ] and [rˤ]. These phonic unities are distinguished by their temporality and their articulatory realization. Thus, the spectrograms enabled to examine the distribution of these sounds and to distinguish what was related to phonetic and phonology. Then, this thesis with a phonetic and statistical study has reinforced this research focused on the obstruction made by the tip of the tongue and on the nature of the vocoids which goes along with the alveolar rhotic in the area of the consonants.
|
Page generated in 0.0573 seconds