Global ETD Search

1	Détection de motifs audio pour la séparation de sources guidée : application aux bandes-son de films / Audio motif spotting for guided source separation : application to movie soundtracks Souviraà-Labastie, Nathan 23 November 2015 (has links) Lorsque l'on manipule un signal audio, il est généralement utile d'opérer un isolement du ou des éléments sonores que l'on cherche à traiter. Cette étape est couramment appelée séparation de sources audio. Il existe de nombreuses techniques pour estimer ces sources et plus on prend en compte d'informations à leur sujet plus la séparation a des chances d'être réussie. Une façon d'incorporer des informations sur une source est l'utilisation d'un signal de référence qui va donner une première approximation de cette source. Cette thèse s'attache à explorer les aspects théoriques et appliqués de la séparation de sources audio guidée par signal de référence. La nouvelle approche proposée appelée SPOtted REference based Separation (SPORES) examine le cas particulier où les références sont obtenues automatiquement par détection de motif, c'est-à-dire par une recherche de contenu similaire. Pour qu'une telle approche soit utile, le contenu traité doit comporter une certaine redondance ou bien une large base de données doit être disponible. Heureusement, le contexte actuel nous permet bien souvent d'être dans une des deux situations et ainsi de retrouver ailleurs des motifs similaires. L'objectif premier de ce travail est de fournir un cadre théorique large qui une fois établi facilitera la mise au point efficace d'outils de traitement de contenus audio variés. Le second objectif est l'utilisation spécifique de cette approche au traitement de bandes-son de films avec par exemple comme application leur conversion en format surround 5.1 adapté aux systèmes home cinéma. / In audio signal processing, source separation consists in recovering the different audio sources that compose a given observed audio mixture. They are many techniques to estimate these sources and the more information are taken into account about them the more the separation is likely to be successful. One way to incorporate information on sources is the use of a reference signal which will give a first approximation of this source. This thesis aims to explore the theoretical and applied aspects of reference guided source separation. The proposed approach called SPOtted REference based Separation (SPORES) explore the particular case where the references are obtained automatically by motif spotting, i.e., by a search of similar content. Such an approach is useful for contents with a certain redundancy or if a large database is be available. Fortunately, the current context often puts us in one of these two situations and finding elsewhere similar motifs is possible. The primary objective of this study is to provide a broad theoretical framework that once established will facilitate the efficient development of processing tools for various audio content. The second objective is the specific use of this approach to the processing of movie soundtracks with application in 5.1 upmixing for instance. Séparation de sources audio Source separation
2	Modèles génératifs pour la classification et la séparation de sources sonores en temps-réel / Generative models for real-time audio sources classification and separation Baelde, Maxime 20 September 2019 (has links) Cette thèse s'inscrit dans le cadre de l'entreprise A-Volute, éditrice de logiciels d'amélioration d'expérience audio. Elle propose un radar qui transpose l'information sonore multi-canale en information visuelle en temps-réel. Ce radar, bien que pertinent, manque d'intelligence car il analyse uniquement le flux audio en terme d'énergie et non en termes de sources sonores distinctes. Le but de cette thèse est de développer des algorithmes de classification et de séparation de sources sonores en temps-réel. D'une part, la classification de sources sonores a pour but d'attribuer un label (par exemple voix) à un son monophonique (un label) ou polyphonique (plusieurs labels). La méthode développée utilise un attribut spécifique, le spectre de puissance normalisé, utile à la fois dans le cas monophonique et polyphonique de part sa propriété d'additivité des sources sonores. Cette méthode utilise un modèle génératif qui permet de dériver une règle de décision basée sur une estimation non paramétrique. Le passage en temps-réel est réalisé grâce à un pré-traitement des prototypes avec une classification hiérarchique ascendante. Les résultats sont encourageants sur différentes bases de données (propriétaire et de comparaison), que ce soit en terme de précision ou de temps de calcul, notamment dans le cas polyphonique. D'autre part, la séparation de sources consiste à estimer les sources en terme de signal dans un mélange. Deux approches de séparation ont été considérées dans la thèse. La première considère les signaux à retrouver comme des données manquantes et à les estimer via un schéma génératif et une modélisation probabiliste. L'autre approche consiste, à partir d'exemples sonores présent dans une base de données, à calculer des transformations optimales de plusieurs exemples dont la combinaison tends vers le mélange observé. Les deux propositions sont complémentaires, avec chacune des avantages et inconvénients (rapidité de calcul pour la première, interprétabilité du résultat pour la deuxième). Les résultats expérimentaux semblent prometteurs et nous permettent d'envisager des perspectives de recherches intéressantes pour chacune des propositions. / This thesis is part of the A-Volute company, an audio enhancement softwares editor. It offers a radar that translates multi-channel audio information into visual information in real-time. This radar, although relevant, lacks intelligence because it only analyses the audio stream in terms of energy and not in terms of separate sound sources. The purpose of this thesis is to develop algorithms for classifying and separating sound sources in real time. On the one hand, audio source classification aims to assign a label (e.g. voice) to a monophonic (one label) or polyphonic (several labels) sound. The developed method uses a specific feature, the normalized power spectrum, which is useful in both monophonic and polyphonic cases due to its additive properties of the sound sources. This method uses a generative model that allows to derive a decision rule based on a non-parametric estimation. The real-time constraint is achieved by pre-processing the prototypes with a hierarchical clustering. The results are encouraging on different databases (owned and benchmark), both in terms of accuracy and computation time, especially in the polyphonic case. On the other hand, source separation consists in estimating the sources in terms of signal in a mixture. Two approaches to this purpose were considered in this thesis. The first considers the signals to be found as missing data and estimates them through a generative process and probabilistic modelling. The other approach consists, from sound examples present in a database, in computing optimal transformations of several examples whose combination tends towards the observed mixture. The two proposals are complementary, each having advantages and drawbacks (computation time for the first, interpretability of the result for the second). The experimental results seem promising and allow us to consider interesting research perspectives for each of the proposals. Séparation de sources Modèles génératifs 519.5
3	Estimation robuste et apprentissage aveugle de modèles pour la séparation de sources sonores Arberet, Simon 17 December 2008 (has links) (PDF) La séparation de sources aveugle dans le cas sous-déterminé est un problème mal posé pour lequel on suppose que les sources sont indépendantes et parcimonieuses dans le domaine temps-fréquence. La séparation se fait alors en deux étapes : une étape d'estimation des paramètres du mélange, suivi d'une étape d'estimation des sources. Les hypothèses faites sur les sources ne sont cependant pas valides sur l'ensemble des points temps-fréquence, si bien que les approches qui traitent naïvement de l'ensemble des points de manière identiques et indépendantes, sont peu robustes pour estimer les paramètres du mélange et les sources. L'objet de cette thèse est d'exploiter la distribution locale du mélange dans les voisinages de chaque point temps-fréquence, afin de : - Détecter les régions temps-fréquence où une seule source est active et d'estimer la direction de la source dominante dans ces régions ; - Estimer la distribution des sources en chaque point temps-fréquence à l'aide de la connaissance sur les paramètres du mélange. L'approche locale que nous proposons est étayée par un algorithme de clustering appelé DEMIX, qui estime de façon robuste les paramètres du mélange dans les cas instantanés et anéchoïques. D'autre part, l'estimation locale de la distribution des sources peut être utilisée pour apprendre des MMG spectraux qui jusqu'à présent nécessitaient une étape d'apprentissage à partir d'exemples. Nous montrons que cette approche améliore l'estimation des sources de plusieurs dB en SDR. séparation de sources audio
4	Contrôle et diagnostic par un réseau de capteurs magnétiques en automobile Le Goff, Alexis 02 February 2011 (has links) (PDF) Cette thèse présente les différentes sources de champ magnétique dans un véhicule automobile à moteur thermique. Le but de ce travail est d'exploiter la mesure du champ magnétique dans une automobile afin d'extraire des données utiles pour caractériser le fonctionnement ou le dysfonctionnement des éléments du véhicule. Les expérimentations que nous avons conduites nous ont permis de mesurer, identifier, caractériser et modéliser les différentes sources de champ magnétique en automobile. Les circuits électriques, l'alternateur électrique, mais également le déplacement des pièces ferromagnétiques engendrent des champs d'induction. Toutes ces sources se mélangent sur le réseau de capteurs magnétiques installé dans le véhicule. Nous avons mis en œuvre des algorithmes de séparation de sources et de soustraction de bruit permettant de récupérer les signaux utiles pour la surveillance. L'analyse vibratoire déjà utilisée pour le diagnostic des automobiles permet d'étudier les accélérations et chocs des éléments à surveiller. L'analyse magnétique que nous présentons ici permet d'étudier d'autres caractéristiques comme le déplacement de ces pièces ou les courants électriques présents dans le système. Nous montrons que les mesures magnétiques, sont un nouvel outil de diagnostic qui peut être utilisé pour le contrôle automobile, en complément de l'analyse vibratoire. Diverses applications industrielles potentielles utilisant des capteurs à bas coût, sur le contrôle des roues, du moteur et des feux électriques sont développées. Enfin, nous ouvrons une réflexion sur la généralisation de ces résultats aux véhicules électriques en présentant les problématiques et les besoins spécifiques en particulier dans l'étude du comportement magnétique des accumulateurs électriques utilisés pour stocker l'énergie. [SPI] Engineering Sciences Séparation de sources Diagnostic Analyse vibratoire Magnétisme Automobile
5	Estimation de fréquences fondamentales multiples. Application à la séparation de signaux de parole et de musique Rosier, Julie 12 1900 (has links) (PDF) L'objet de cette thèse est l'étude du problème d'estimation de fréquences fondamentales multiples, pour des mélanges de parole et de musique dont le nombre de sources est inconnu. Dans le cadre de la parole, nous proposons une méthode itérative qui estime successivement les fréquences fondamentales. La nature «voisée/non-voisée» des mélanges est caractérisée par un modèle du type "sommes de sinusoïdes harmoniques + bruit autorégressif". L'estimation consiste à maximiser un terme de Vraisemblance pénalisée qui permet également d'estimer le nombre de sources. Dans le cadre musical, nous proposons trois nouvelles méthodes qui estiment simultanément les fréquences fondamentales. Basées sur une classification des pics spectraux du mélange, elles diffèrent par leur technique de classification. Toutes permettent d'estimer le nombre de sources. Elles permettent également de prendre en compte les recouvrements spectraux entre notes et sont ainsi applicables au traitement d'accords musicaux. Séparation de sources Analyse parole et musique
6	Sur quelques problèmes mathématiques de modélisation parcimonieuse Gribonval, Rémi 24 October 2007 (has links) (PDF) Ce document est organisé en quatre chapitres dont trois rédigés en anglais et une annexe en français. Le premier chapitre décrit mes contributions dans le domaine de la séparation de sources audio, qui constituent certainement le volet le plus appliqué de mon activité scientifique, volet auquel ont contribué significativement plusieurs doctorants et collaborateurs. Les deux chapitres suivants sont consacrés aux aspects plus mathématiques de mon travail, le premier sur les approximations non-linéaires avec des dictionnaires redondants, en collaboration étroite avec Morten Nielsen, le second sur l'analyse des performances des algorithmes de décomposition parcimonieuse, avec le concours notamment de Pierre Vandergheynst. Dans ces trois chapitres, j'ai adopté un style sans doute peu conventionnel dans la littérature scientifique : j'y ai opté pour le "je" plus que le "nous" et j'ai choisi d'agrémenter le texte de divers éléments de contexte. L'annexe, dans un style plus traditionnel, reproduit le chapitre de synthèse « Séparation de sources basée sur la parcimonie » que j'ai écrit pour l'ouvrage « Séparation de Sources » coordonné par Pierre Comon et Christian Jutten dans la collection IC2 publié par Hermès. [MATH] Mathematics séparation de sources audio parcimonie problèmes inverses traitement du signal
7	Transcription et séparation automatique de la mélodie principale dans les signaux de musique polyphoniques Durrieu, Jean-Louis 07 May 2010 (has links) (PDF) Nous proposons de traiter l'extraction de la mélodie principale, ainsi que la séparation de l'instrument jouant cette mélodie. La première tâche appartient au domaine de la recherche d'information musicale (MIR) : nous cherchons à indexer les morceaux de musique à l'aide de leur mélodie. La seconde application est la séparation aveugle de sources sonores (BASS) : extraire une piste audio pour chaque source présente dans un mélange sonore. La séparation de la mélodie principale et de l'accompagnement et l'extraction de cette mélodie sont traitées au sein d'un même cadre statistique. Le modèle pour l'instrument principal est un modèle de production source/filtre. Il suppose deux états cachés correspondant à l'état du filtre et de la source. Le modèle spectral choisi permet de prendre compte les fréquences fondamentales de l'instrument désiré et de séparer ce dernier de l'accompagnement. Deux modèles de signaux sont proposés, un modèle de mélange de gaussiennes amplifiées (GSMM) et un modèle de mélange instantané (IMM). L'accompagnement est modélisé par un modèle spectral plus général. Cinq systèmes sont proposés, trois systèmes fournissent la mélodie sous forme de séquence de fréquences fondamentales, un système fournit les notes de la mélodie et le dernier système sépare l'instrument principal de l'accompagnement. Les résultats en estimation de la mélodie et en séparation sont du niveau de l'état de l'art, comme l'ont montré nos participations aux évaluations internationales (MIREX'08, MIREX'09 et SiSEC'08). Nous avons ainsi réussi à intégrer de la connaissance musicale améliorant les résultats de travaux antérieurs sur la séparation de sources sonores. Transcription automatique de la mélodie Séparation de sources sonores musicales Factorisation en matrices non-négatives
8	Imagerie spectrale pour l'étude de structures profondes par tomographie optique diffusive de fluorescence Montcuquet, Anne-Sophie 17 December 2010 (has links) (PDF) L'imagerie optique de fluorescence permet de localiser des cibles biologiques comme des tumeurs, marquées par des fluorophores. Pour des applications au diagnostic chez l'Homme où l'épaisseur des tissus atteint plusieurs centimètres, la détection parasite de l'autofluorescence naturelle des tissus compromet la détection de la fluorescence d'intérêt et son élimination est la condition sine qua non d'une localisation correcte de la tumeur. L'objet de cette thèse a été l'étude spectrale de l'auto fluorescence des tissus et la mise au point d'une méthode de séparation de spectres aveugle permettant de supprimer sa contribution des mesures. La Factorisation en Matrices Non-négatives a été privilégiée, et de nouveaux algorithmes ont été proposés et testés sur données réelles. Nous avons démontré les performances de notre méthode dans l'amélioration de la détection des marqueurs et la reconstruction de la position de la tumeur en tomographie optique diffuse de fluorescence. Spectroscopie de fluorescence autofluorescence séparation de sources Factorisation en Matrices Non-négatives
9	Fonctions de coût pour l'estimation des filtres acoustiques dans les mélanges réverbérants / Cost functions for the estimation of acoustic filters in reverberant mixtures Benichoux, Alexis 14 October 2013 (has links) On se place dans le cadre du traitement des signaux audio multicanaux et multi-sources. À partir du mélange de plusieurs sources sonores enregistrées en milieu réverbérant, on cherche à estimer les réponses acoustiques (ou filtres de mélange) entre les sources et les microphones. Ce problème inverse ne peut être résolu qu'en prenant en compte des hypothèses sur la nature des filtres. Notre approche consiste d'une part à identifier mathématiquement les hypothèses nécessaires sur les filtres pour pouvoir les estimer et d'autre part à construire des fonctions de coût et des algorithmes permettant de les estimer effectivement. Premièrement, nous avons considéré le cas où les signaux sources sont connus. Nous avons développé une méthode d'estimation des filtres basée sur une régularisation convexe prenant en compte à la fois la nature parcimonieuse des filtres et leur enveloppe de forme exponentielle décroissante. Nous avons effectué des enregistrements en environnement réel qui ont confirmé l'efficacité de cet algorithme. Deuxièmement, nous avons considéré le cas où les signaux sources sont inconnus, mais statistiquement indépendants. Les filtres de mélange peuvent alors être estimés à une indétermination de permutation et de gain près à chaque fréquence par des techniques d'analyse en composantes indépendantes. Nous avons apporté une étude exhaustive des garanties théoriques par lesquelles l'indétermination de permutation peut être levée dans le cas où les filtres sont parcimonieux dans le domaine temporel. Troisièmement, nous avons commencé à analyser les hypothèses sous lesquelles notre algorithme d'estimation des filtres pourrait être étendu à l'estimation conjointe des signaux sources et des filtres et montré un premier résultat négatif inattendu : dans le cadre de la déconvolution parcimonieuse aveugle, pour une famille assez large de fonctions de coût régularisées, le minimum global est trivial. Des contraintes supplémentaires sur les signaux sources ou les filtres sont donc nécessaires. / This work is focused on the processing of multichannel and multisource audio signals. From an audio mixture of several audio sources recorded in a reverberant room, we wish to estimate the acoustic responses (a.k.a. mixing filters) between the sources and the microphones. To solve this inverse problem one need to take into account additional hypotheses on the nature of the acoustic responses. Our approach consists in first identifying mathematically the necessary hypotheses on the acoustic responses for their estimation and then building cost functions and algorithms to effectively estimate them. First, we considered the case where the source signals are known. We developed a method to estimate the acoustic responses based on a convex regularization which exploits both the temporal sparsity of the filters and the exponentially decaying envelope. Real-world experiments confirmed the effectiveness of this method on real data. Then, we considered the case where the sources signal are unknown, but statistically independent. The mixing filters can be estimated up to a permutation and scaling ambiguity. We brought up an exhaustive study of the theoretical conditions under which we can solve the indeterminacy, when the multichannel filters are sparse in the temporal domain. Finally, we started to analyse the hypotheses under which this algorithm could be extended to the joint estimation of the sources and the filters, and showed a first unexpected results : in the context of blind deconvolution with sparse priors, for a quite large family of regularised cost functions, the global minimum is trivial. Additional constraints on the source signals and the filters are needed. Optimisation convexe Déconvolution Réponse impulsionnelle de salle Source separation Deconvolution Convex optimisation
10	Corrélation, indépendence et modèles inverses<br />Applications au traitement des biosignaux. Vigneron, Vincent 17 December 2007 (has links) (PDF) Les activités que j'ai menées depuis une dizaine d'années relèvent essentiellement du domaine du traitement du signal, mais aussi de l'analyse de données et de l'analyse numérique. Ce document ne décrit pas de façon exhaustive tous mes travaux. Il a été rédigé autour d'une idée directrice : les relations de corrélation et de dépendance qui peuvent exister entre des signaux. J'ai choisi de faire une présentation détaillée de mes travaux qui se justifie par la fait que certains d'entre eux ne sont qu'en cours de publication et que d'autres ont été publiés avec un nombre de pages volontairement réduit par l'éditeur. Il m'est ainsi plus facile de parvenir à une présentation homogène et d'inclure en certains endroits des développements complémentaires. Le point de départ est mon intérêt certain pour la résolution de problèmes inverses. Ce paradigme apparait dans divers domaines des sciences : théorie de l'information, physique statistique, thermodynamique, traitement d'images [46], etc. Nous ne nous attacherons pas ici à faire une synthèse ou des rapprochements des diverses approches inverses. On peut trouver dans les travaux de Jaynes (professeur à l'Université de Cambridge) de nombreuses réflexions sur le sujet [104]. Nous nous intéressons par contre aux outils mathématiques qui permettent de résoudre de tels problèmes. problèmes inverses réseau de capteurs calcul ensembliste ECGf EMGd séparation de sources

Search results