Global ETD Search

1	Analyse de la qualité vocale appliquée à la parole expressive Sturmel, Nicolas 02 March 2011 (has links) (PDF) L'analyse des signaux de parole permet de comprendre le fonctionnement de l'appareil vocal, mais aussi de décrire de nouveaux paramètres permettant de qualifier et quantifier la perception de la voix. Dans le cas de la parole expressive, l'intérêt se porte sur des variations importantes de qualité vocales et sur leurs liens avec l'expressivité et l'intention du sujet. Afin de décrire ces liens, il convient de pouvoir estimer les paramètres du modèle de production mais aussi de décomposer le signal vocal en chacune des parties qui contribuent à ce modèle. Le travail réalisé au cours de cette thèse s'axe donc autour de la segmentation et la décomposition des signaux vocaux et de l'estimation des paramètres du modèle de production vocale : Tout d'abord, la décomposition multi-échelles des signaux vocaux est abordée. En reprenant la méthode LoMA qui trace des lignes suivant les amplitudes maximum sur les réponses temporelles au banc de filtre en ondelettes, il est possible d'y détecter un certain nombre de caractéristiques du signal vocal : les instants de fermeture glottique, l'énergie associée à chaque cycle ainsi que sa distribution spectrale, le quotient ouvert du cycle glottique (par l'observation du retard de phase du premier harmonique). Cette méthode est ensuite testée sur des signaux synthétiques et réels. Puis, la décomposition harmonique + bruit des signaux vocaux est abordée. Une méthode existante (PAPD - Périodic/APériodic Décomposition) est adaptée aux variations de fréquence fondamentale par le biais de la variation dynamique de la taille de la fenêtre d'analyse et est appelée PAP-A. Cette nouvelle méthode est ensuite testée sur une base de signaux synthétiques. La sensibilité à la précision d'estimation de la fréquence fondamentale est notamment abordée. Les résultats montrent des décompositions de meilleures qualité pour PAP-A par rapport à PAPD. Ensuite, le problème de la déconvolution source/filtre est abordé. La séparation source/filtre par ZZT (zéros de la transformée en Z) est comparée aux méthodes usuelles à base de prédiction linéaire. La ZZT est utilisée pour estimer les paramètres du modèle de la source glottique via une méthode simple mais robuste qui permet une estimation conjointe de deux paramètres du débit glottique : le quotient ouvert et l'asymétrie. La méthode ainsi développée est testée et combinée à l'estimation du quotient ouvert par ondelettes. Finalement, ces trois méthodes d'estimations sont appliquées à un grand nombre de fichiers d'une base de données comportant différents styles d'élocution. Les résultats de cette analyse sont discutés afin de caractériser le lien entre style, valeur des paramètres de la production vocale et qualité vocale. On constate notamment l'émergence très nette de groupes de styles. [PHYS] Physics [INFO] Computer Science Analyse de la parole Qualité vocale Ondelettes Filtrage inverse Lpc Zzt Décomposition périodique/apériodique Jitter Shimmer Modèle LF Parole expressive Interactions source/filtre
2	Outils pour la détection et la classification<br />Application au diagnostic de défauts de surface de rail Bentoumi, Mohamed 15 October 2004 (has links) (PDF) Le travail présenté dans ce mémoire aborde les problématiques de détection et de classification pour le diagnostic de défauts. Deux approches différentes sont abordées. La première approche est l'approche de détection et classification simultanées où le problème global à K classes est scindé en sous-problèmes. Chaque sous-problème a en charge la détection d'une ou plusieurs classes de défauts et il est traité par une cellule qui enchaîne les phases de prétraitement des signaux, de choix de l'espace de représentation, de détection, puis de décision. La résolution complète du problème à K classes s'effectue par un agencement séquentiel des cellules selon un arbre de décision hiérarchique ou par une mise en parallèle des cellules avec règles de décision associées.<br />La seconde approche est l'approche de détection et classification successives. Elle consiste à traiter tout<br />d'abord les signaux issus du capteur de manière simple pour la délivrance d'un signal d'alarme indiquant la<br />présence possible d'un défaut. Dans ce cas, et dans ce cas seulement, des traitements haut niveau sont mis en<br />oeuvre dans le but d'analyser plus finement les signatures de ces défauts. Les outils pour la classification - les différents classifieurs linéaires, les classifieurs neuronaux et les machines à vecteurs de support - sont détaillés. L'accent est mis sur le réglage des marges des classifieurs linéaires, sur leurs capacités de généralisation et sur les estimateurs de cette capacité de généralisation.<br />L'ensemble de ces méthodes a été validé sur une application concernant la détection de défauts de surface de rail dans un contexte métro. Un démonstrateur temps réel et opérant en condition d'exploitation a permis de tester les solutions de l'approche détection et classification simultanées, en considérant les taux de bonne détection et de<br />fausse alarme sur 4 classes de défauts de rail. La transformée en ondelettes, le filtrage inverse et la séparation de sources par analyse en composantes indépendantes sont les outils de prétraitement qui ont été particulièrement détaillés dans ce contexte applicatif.<br />Une base de données, constituée à partir de mesures sur site labellisées, a permis de qualifier statistiquement les solutions de l'approche détection et classification successives. Une hiérarchisation des méthodes est proposée en fonction de leur capacité de généralisation, mais aussi de leur complexité et de leur aptitude à traiter le problème avec ou sans optimisation des espaces de représentation. détection filtrage inverse séparation aveugle de sources classification Ho-Kashyap réseaux de neurones courants de Foucault défauts de rail métro
3	Analyse de la qualité vocale appliquée à la parole expressive / Voice quality analysis applied to expressive speech Sturmel, Nicolas 02 March 2011 (has links) L’analyse des signaux de parole permet de comprendre le fonctionnement de l’appareil vocal, mais aussi de décrire de nouveaux paramètres permettant de qualifier et quantifier la perception de la voix. Dans le cas de la parole expressive, l'intérêt se porte sur des variations importantes de qualité vocales et sur leurs liens avec l’expressivité et l’intention du sujet. Afin de décrire ces liens, il convient de pouvoir estimer les paramètres du modèle de production mais aussi de décomposer le signal vocal en chacune des parties qui contribuent à ce modèle. Le travail réalisé au cours de cette thèse s’axe donc autour de la segmentation et la décomposition des signaux vocaux et de l’estimation des paramètres du modèle de production vocale : Tout d’abord, la décomposition multi-échelles des signaux vocaux est abordée. En reprenant la méthode LoMA qui trace des lignes suivant les amplitudes maximum sur les réponses temporelles au banc de filtre en ondelettes, il est possible d’y détecter un certain nombre de caractéristiques du signal vocal : les instants de fermeture glottique, l’énergie associée à chaque cycle ainsi que sa distribution spectrale, le quotient ouvert du cycle glottique (par l’observation du retard de phase du premier harmonique). Cette méthode est ensuite testée sur des signaux synthétiques et réels. Puis, la décomposition harmonique + bruit des signaux vocaux est abordée. Une méthode existante (PAPD - Périodic/APériodic Décomposition) est adaptée aux variations de fréquence fondamentale par le biais de la variation dynamique de la taille de la fenêtre d’analyse et est appelée PAP-A. Cette nouvelle méthode est ensuite testée sur une base de signaux synthétiques. La sensibilité à la précision d’estimation de la fréquence fondamentale est notamment abordée. Les résultats montrent des décompositions de meilleures qualité pour PAP-A par rapport à PAPD. Ensuite, le problème de la déconvolution source/filtre est abordé. La séparation source/filtre par ZZT (zéros de la transformée en Z) est comparée aux méthodes usuelles à base de prédiction linéaire. La ZZT est utilisée pour estimer les paramètres du modèle de la source glottique via une méthode simple mais robuste qui permet une estimation conjointe de deux paramètres du débit glottique : le quotient ouvert et l'asymétrie. La méthode ainsi développée est testée et combinée à l’estimation du quotient ouvert par ondelettes. Finalement, ces trois méthodes d’estimations sont appliquées à un grand nombre de fichiers d’une base de données comportant différents styles d’élocution. Les résultats de cette analyse sont discutés afin de caractériser le lien entre style, valeur des paramètres de la production vocale et qualité vocale. On constate notamment l’émergence très nette de groupes de styles. / Analysis of speech signals is a good way of understanding how the voice is produced, but it is also important as a way of describing new parameters in order to define the perception of voice quality. This study focuses on expressive speech, where voice quality varies a lot and is explicitly linked to the expressivity or intention of the speaker. In order to define those links, one has to be able to estimate a high number of parameters of the speech production model, but also be able to decompose the speech signal into each parts that contributes to this model. The work presented in this thesis addresses the segmentation of speech signals, their decomposition and the estimation of the voice production model parameters. At first, multi-scale analysis of speech signals is studied. Using the LoMA method that traces lines across scales from one maximum to the other on the time domain response of a wavelet filter bank, it is possible to detect a number of features on voiced speech, namely : the glottal closing instants, the energy associated to each glottal cycle, the open quotient (by estimating the time delay of the first harmonic). This method is then tested on both synthetic and real speech. Secondly, harmonic plus noise decomposition of speech signals is studied. An existing method (PAPD standing for Periodic/Aperiodic Decomposition) is modified to dynamically adapt the analysis window length to the fundamental frequency (F0) of the signal. The new method is then tested on synthetic speech where the sensibility to the estimation error on F0 is also discussed. Decomposition on real speech, along with their audio files, are also discussed. Results shows that this new method provides better quality of decomposition. Thirdly, the problem of source/filter deconvolution is addressed. The ZZT (Zeros of the Z Transform) method is compared to classical methods based on linear prediction. ZZT is then used for the estimation of the glottal flow parameters with a simple but robust method based on the joint estimation of both the open quotient and the asymmetry. The later method is then combined to the estimation of the open quotient using wavelet analysis. Finally, the three estimation methods developed in this thesis are used to analyze a large number of files from a database presenting different speaking styles. Results are discussed in order to characterize the link between style, model parameters and voice quality. We especially notice the neat appearance of speaking style groups Analyse de la parole Qualité vocale Ondelettes Filtrage inverse Lpc Zzt Décomposition périodique/apériodique Jitter Shimmer Modèle LF Parole expressive Interactions source/filtre Speech analysis Voice quality Wavelets Inverse filtering Lpc Zzt Periodic/aperiodic decomposition Jitter Shimmer LF model Expressive speech Source/filter interactions
4	Analyse de signaux ultrasonores, Formation d'Images de Cohérence - Application à la Microscopie Acoustique de circuits électroniques Martin, Elodie 12 September 2007 (has links) (PDF) La microscopie acoustique à balayage est une technologie largement utilisée dans l'imagerie non destructive de circuits microélectroniques. Les protocoles standards, établis pour des circuits simples, conduisent à des résultats difficilement interprétables lors de l'inspection d'assemblages petits et complexes. La limite de résolution axiale de ces dispositifs étant atteinte, une approche plus rigoureuse est proposée afin de comprendre la propagation des échos ultrasonores dans les circuits "Flip-Chip LFBGA". L'objectif de cette thèse consiste à présenter une analyse critique de signaux et images ultrasonores. La première partie de ce travail est consacrée à l'étude de la propagation des ondes planes dans des milieux feuilletés, modèle dit "direct". Dans la seconde partie, diverses méthodes de résolution du problème inverse, ou déconvolution, de signaux ultrasonores sont testées et comparées. Enfin, la troisième partie propose une nouvelle méthode, la cohérence locale temporelle, basée sur la comparaison de signaux ultrasonores réfléchis sur des circuits complexes. Microscopie acoustique Analyse non destructive Modèle direct Déconvolution Filtrage Inverse Extrapolation Spectrale Auto Régressive Degré de Cohérence Locale Traitement des Images et des Signaux

1

Page generated in 0.0688 seconds