Global ETD Search

1	Modélisation d'antennes et de systèmes focaux par décomposition sur une famille de faisceaux gaussiens Arias Lopez, Igor Francisco 26 June 2013 (has links) (PDF) Dans certains contextes, les méthodes classiques utilisées pour le calcul de champs rayonnés ou diffractés en présence d'obstacles de grande taille par rapport à la longueur d'onde, comme l'Optique Physique ou les méthodes de rayons, ne sont pas valides ou deviennent très lourdes en temps de calcul. La théorie des frames de Gabor fournit un cadre rigoureux permettant de décomposer une distribution de sources électromagnétiques, définie dans une ouverture équivalente plane, en une somme plus ou moins redondante de fenêtres gaussiennes. Cette décomposition peut servir de base à des algorithme de lancer de faisceaux gaussiens.Jusqu'à présent cette théorie était limitée à des décompositions dans un plan (rayonnement dans un demi-espace). L'objet de cette thèse est d'utiliser cette théorie pour décomposer des champs rayonnés ou diffractés dans toutes les directions de l'espace. Ce travail de thèse commence par une étude approfondie de l'influence des paramètres utilisés pour le calcul des coefficients de frame. La mise en oeuvre numérique permet de tester l'efficacité de techniques de troncation et de compression en termes de compromis précision/temps de calcul. Le coeur de la thèse consiste en une méthode originale de partitionnement spectral, utilisant des fonctions de partition de l'unité, qui permet d'utiliser le lancer de faisceaux gaussiens à partir de frames définis dans six plans, pour un rayonnement dans tout l'espace tridimensionnel. La formulation de la méthode est présentée. Elle est appliquée à la décomposition en faisceaux gaussiens du champ rayonné par des antennes théoriques omnidirectionnelles (réseau de dipôles et dipôle demi-onde). Une antenne réaliste sert enfin de cas test pour la mise en œuvre de la décomposition à partir de données expérimentales discrètes [INFO:INFO_OH] Computer Science/Other Frame de Gabor Lancer de faisceaux gaussiens (LFG) Partitionnement spectral Partition de l'unité Champ rayonné
2	Structuration de bases multimédia pour une exploration visuelle / Structuring multimedia bases for visual exploration Voiron, Nicolas 18 December 2015 (has links) La forte augmentation du volume de données multimédia impose la mise au point de solutions adaptées pour une exploration visuelle efficace des bases multimédia. Après avoir examiné les processus de visualisation mis en jeu, nous remarquons que ceci demande une structuration des données. L’objectif principal de cette thèse est de proposer et d’étudier ces méthodes de structuration des bases multimédia en vue de leur exploration visuelle.Nous commençons par un état de l’art détaillant les données et les mesures que nous pouvons produire en fonction de la nature des variables décrivant les données. Suit un examen des techniques de structuration par projection et classification. Nous présentons aussi en détail la technique du Clustering Spectral sur laquelle nous nous focaliserons ensuite.Notre première réalisation est une méthode originale de production et fusion de métriques par corrélation de rang. Nous testons cette première méthode sur une base multimédia issue de la vidéothèque d’un festival de films. Nous continuons ensuite par la mise au point d’une méthode de classification supervisée par corrélation que nous testons avec les données vidéos d’un challenge de la communauté multimédia. Ensuite nous nous focalisons sur les techniques du Clustering Spectral. Nous testons une technique de Clustering Spectral supervisée que nous comparons aux techniques de l’état de l’art. Et pour finir nous examinons des techniques du Clustering Spectral semi-supervisé actif. Dans ce contexte, nous proposons et validons des techniques de propagation d’annotations et des stratégies permettant d’améliorer la convergence de ces méthodes de classement. / The large increase in multimedia data volume requires the development of effective solutions for visual exploration of multimedia databases. After reviewing the visualization process involved, we emphasis the need of data structuration. The main objective of this thesis is to propose and study clustering and classification of multimedia database for their visual exploration.We begin with a state of the art detailing the data and the metrics we can produce according to the nature of the variables describing each document. Follows a review of the projection and classification techniques. We also present in detail the Spectral Clustering method.Our first contribution is an original method that produces fusion of metrics using rank correlations. We validate this method on an animation movie database coming from an international festival. Then we propose a supervised classification method based on rank correlation. This contribution is evaluated on a multimedia challenge dataset. Then we focus on Spectral Clustering methods. We test a supervised Spectral Clustering technique and compare to state of the art methods. Finally we examine active semi-supervised Spectral Clustering methods. In this context, we propose and validate constraint propagation techniques and strategies to improve the convergence of these active methods. Structuration Bases multimédia Production de métrique Corrélation de rang Partitionnement spectral Supervision Structuration Multimedia databases Metric production Rank correlations Spectral clustering Supervision 006.312
3	Modélisation d'antennes et de systèmes focaux par décomposition sur une famille de faisceaux gaussiens / Gaussian window frame analysis applied to antennas Arias Lopez, Igor Francisco 26 June 2013 (has links) Dans certains contextes, les méthodes classiques utilisées pour le calcul de champs rayonnés ou diffractés en présence d'obstacles de grande taille par rapport à la longueur d'onde, comme l'Optique Physique ou les méthodes de rayons, ne sont pas valides ou deviennent très lourdes en temps de calcul. La théorie des frames de Gabor fournit un cadre rigoureux permettant de décomposer une distribution de sources électromagnétiques, définie dans une ouverture équivalente plane, en une somme plus ou moins redondante de fenêtres gaussiennes. Cette décomposition peut servir de base à des algorithme de lancer de faisceaux gaussiens.Jusqu'à présent cette théorie était limitée à des décompositions dans un plan (rayonnement dans un demi-espace). L'objet de cette thèse est d'utiliser cette théorie pour décomposer des champs rayonnés ou diffractés dans toutes les directions de l'espace. Ce travail de thèse commence par une étude approfondie de l'influence des paramètres utilisés pour le calcul des coefficients de frame. La mise en oeuvre numérique permet de tester l'efficacité de techniques de troncation et de compression en termes de compromis précision/temps de calcul. Le coeur de la thèse consiste en une méthode originale de partitionnement spectral, utilisant des fonctions de partition de l'unité, qui permet d'utiliser le lancer de faisceaux gaussiens à partir de frames définis dans six plans, pour un rayonnement dans tout l'espace tridimensionnel. La formulation de la méthode est présentée. Elle est appliquée à la décomposition en faisceaux gaussiens du champ rayonné par des antennes théoriques omnidirectionnelles (réseau de dipôles et dipôle demi-onde). Une antenne réaliste sert enfin de cas test pour la mise en œuvre de la décomposition à partir de données expérimentales discrètes / In some contexts, conventional methods used for large problems involving radiated or diffracted field computations in the presence of obstacles, such as Physical Optics and ray based methods, become really inaccurate or prohibitively time-consuming. Gabor frame theory provides a rigorous framework for the initial decomposition of equivalent source distributions into a redundant set of Gaussian windows. Frame decomposition has been introduced as a first discretization step into Gaussian Beam Shooting (GBS) algorithms. Until now, frame decomposition has essentially been restricted to planar source distributions, radiating into one half space. The main goal of this thesis is to extend the application range of this theory to radiated or diffracted field decomposition into Gaussian beams propagating into the whole space. The thesis begins with a thorough study of influence of the parameters used for frame coefficient calculation. Numerical implementation is used to test the efficiency of truncation and compression techniques in terms of accuracy / computation time balance optimization. The core of the thesis consists of an original spectral domain partitioning method involving partition of unity functions, which allows to use Gaussian beam shooting from frames defined in six planes, for radiation into the whole three-dimensional space. The formulation of the method is presented and applied to the decomposition of fields radiated by theoretical omnidirectional antennas (dipole array and half-wave dipole) into Gaussian beams. A realistic antenna is used as a test case for the implementation of decompositions based on experimental discrete initial data Frame de Gabor Lancer de faisceaux gaussiens (LFG) Partitionnement spectral Partition de l'unité Champ rayonné Gabor frame Gaussian beam shooting (GBS) Spectral partitioning Partition of unity Radiated field
4	Steps towards end-to-end neural speaker diarization / Étapes vers un système neuronal de bout en bout pour la tâche de segmentation et de regroupement en locuteurs Yin, Ruiqing 26 September 2019 (has links) La tâche de segmentation et de regroupement en locuteurs (speaker diarization) consiste à identifier "qui parle quand" dans un flux audio sans connaissance a priori du nombre de locuteurs ou de leur temps de parole respectifs. Les systèmes de segmentation et de regroupement en locuteurs sont généralement construits en combinant quatre étapes principales. Premièrement, les régions ne contenant pas de parole telles que les silences, la musique et le bruit sont supprimées par la détection d'activité vocale (VAD). Ensuite, les régions de parole sont divisées en segments homogènes en locuteur par détection des changements de locuteurs, puis regroupées en fonction de l'identité du locuteur. Enfin, les frontières des tours de parole et leurs étiquettes sont affinées avec une étape de re-segmentation. Dans cette thèse, nous proposons d'aborder ces quatre étapes avec des approches fondées sur les réseaux de neurones. Nous formulons d’abord le problème de la segmentation initiale (détection de l’activité vocale et des changements entre locuteurs) et de la re-segmentation finale sous la forme d’un ensemble de problèmes d’étiquetage de séquence, puis nous les résolvons avec des réseaux neuronaux récurrents de type Bi-LSTM (Bidirectional Long Short-Term Memory). Au stade du regroupement des régions de parole, nous proposons d’utiliser l'algorithme de propagation d'affinité à partir de plongements neuronaux de ces tours de parole dans l'espace vectoriel des locuteurs. Des expériences sur un jeu de données télévisées montrent que le regroupement par propagation d'affinité est plus approprié que le regroupement hiérarchique agglomératif lorsqu'il est appliqué à des plongements neuronaux de locuteurs. La segmentation basée sur les réseaux récurrents et la propagation d'affinité sont également combinées et optimisées conjointement pour former une chaîne de regroupement en locuteurs. Comparé à un système dont les modules sont optimisés indépendamment, la nouvelle chaîne de traitements apporte une amélioration significative. De plus, nous proposons d’améliorer l'estimation de la matrice de similarité par des réseaux neuronaux récurrents, puis d’appliquer un partitionnement spectral à partir de cette matrice de similarité améliorée. Le système proposé atteint des performances à l'état de l'art sur la base de données de conversation téléphonique CALLHOME. Enfin, nous formulons le regroupement des tours de parole en mode séquentiel sous la forme d'une tâche supervisée d’étiquetage de séquence et abordons ce problème avec des réseaux récurrents empilés. Pour mieux comprendre le comportement du système, une analyse basée sur une architecture de codeur-décodeur est proposée. Sur des exemples synthétiques, nos systèmes apportent une amélioration significative par rapport aux méthodes de regroupement traditionnelles. / Speaker diarization is the task of determining "who speaks when" in an audio stream that usually contains an unknown amount of speech from an unknown number of speakers. Speaker diarization systems are usually built as the combination of four main stages. First, non-speech regions such as silence, music, and noise are removed by Voice Activity Detection (VAD). Next, speech regions are split into speaker-homogeneous segments by Speaker Change Detection (SCD), later grouped according to the identity of the speaker thanks to unsupervised clustering approaches. Finally, speech turn boundaries and labels are (optionally) refined with a re-segmentation stage. In this thesis, we propose to address these four stages with neural network approaches. We first formulate both the initial segmentation (voice activity detection and speaker change detection) and the final re-segmentation as a set of sequence labeling problems and then address them with Bidirectional Long Short-Term Memory (Bi-LSTM) networks. In the speech turn clustering stage, we propose to use affinity propagation on top of neural speaker embeddings. Experiments on a broadcast TV dataset show that affinity propagation clustering is more suitable than hierarchical agglomerative clustering when applied to neural speaker embeddings. The LSTM-based segmentation and affinity propagation clustering are also combined and jointly optimized to form a speaker diarization pipeline. Compared to the pipeline with independently optimized modules, the new pipeline brings a significant improvement. In addition, we propose to improve the similarity matrix by bidirectional LSTM and then apply spectral clustering on top of the improved similarity matrix. The proposed system achieves state-of-the-art performance in the CALLHOME telephone conversation dataset. Finally, we formulate sequential clustering as a supervised sequence labeling task and address it with stacked RNNs. To better understand its behavior, the analysis is based on a proposed encoder-decoder architecture. Our proposed systems bring a significant improvement compared with traditional clustering methods on toy examples. Détection des changements de locuteurs Segmentation LSTM Propagation d'affinité Partitionnement spectral Speaker diarization Speaker change detection Speech segmentation LSTM Affinity propagation Spectral clustering
5	Spectral inference methods on sparse graphs : theory and applications / Méthodes spectrales d'inférence sur des graphes parcimonieux : théorie et applications Saade, Alaa 03 October 2016 (has links) Face au déluge actuel de données principalement non structurées, les graphes ont démontré, dans une variété de domaines scientifiques, leur importance croissante comme language abstrait pour décrire des interactions complexes entre des objets complexes. L’un des principaux défis posés par l’étude de ces réseaux est l’inférence de propriétés macroscopiques à grande échelle, affectant un grand nombre d’objets ou d’agents, sur la seule base des interactions microscopiquesqu’entretiennent leurs constituants élémentaires. La physique statistique, créée précisément dans le but d’obtenir les lois macroscopiques de la thermodynamique à partir d’un modèle idéal de particules en interaction, fournit une intuition décisive dans l’étude des réseaux complexes.Dans cette thèse, nous utilisons des méthodes issues de la physique statistique des systèmes désordonnés pour mettre au point et analyser de nouveaux algorithmes d’inférence sur les graphes. Nous nous concentrons sur les méthodes spectrales, utilisant certains vecteurs propres de matrices bien choisies, et sur les graphes parcimonieux, qui contiennent une faible quantité d’information. Nous développons une théorie originale de l’inférence spectrale, fondée sur une relaxation de l’optimisation de certaines énergies libres en champ moyen. Notre approche est donc entièrement probabiliste, et diffère considérablement des motivations plus classiques fondées sur l’optimisation d’une fonction de coût. Nous illustrons l’efficacité de notre approchesur différents problèmes, dont la détection de communautés, la classification non supervisée à partir de similarités mesurées aléatoirement, et la complétion de matrices. / In an era of unprecedented deluge of (mostly unstructured) data, graphs are proving more and more useful, across the sciences, as a flexible abstraction to capture complex relationships between complex objects. One of the main challenges arising in the study of such networks is the inference of macroscopic, large-scale properties affecting a large number of objects, based solely on he microscopic interactions between their elementary constituents. Statistical physics, precisely created to recover the macroscopic laws of thermodynamics from an idealized model of interacting particles, provides significant insight to tackle such complex networks.In this dissertation, we use methods derived from the statistical physics of disordered systems to design and study new algorithms for inference on graphs. Our focus is on spectral methods, based on certain eigenvectors of carefully chosen matrices, and sparse graphs, containing only a small amount of information. We develop an original theory of spectral inference based on a relaxation of various meanfield free energy optimizations. Our approach is therefore fully probabilistic, and contrasts with more traditional motivations based on the optimization of a cost function. We illustrate the efficiency of our approach on various problems, including community detection, randomized similarity-based clustering, and matrix completion. Opérateur non retraçant Hessienne de Bethe Méthodes spectrales Détection de communautés Partitionnement spectral Complétion de matrices Modèles graphiques Inférence bayésienne Approximations de champ moyen Systèmes désordonnés Propagation des convictions Algorithmes de passage de messages Non-backtracking operator Bethe Hessian Spectral methods Community detection Spectral clustering Matrix completion Graphical models Bayesian inference Meanfield approximations Disordered systems Belief propagation Message-passing algorithms 530

1

Page generated in 0.0937 seconds