Spelling suggestions: "subject:"multivariées"" "subject:"multivariée""
1 |
Détection de ruptures pour les signaux multidimensionnels. Application à la détection d'anomalies dans les réseaux.Lung-Yut-Fong, Alexandre 06 December 2011 (has links) (PDF)
L'objectif de cette thèse est de proposer des méthodes non-paramétriques de détection rétrospective de ruptures. L'application principale de cette étude est la détection d'attaques dans les réseaux informatiques à partir de données recueillies par plusieurs sondes disséminées dans le réseau. Nous proposons dans un premier temps une méthode en trois étapes de détection décentralisée d'anomalies faisant coopérer des sondes n'ayant accès qu'à une partie du trafic réseau. Un des avantages de cette approche est la possibilité de traiter un flux massif de données, ce qui est permis par une étape de filtrage par records. Un traitement local est effectué dans chaque sonde, et une synthèse est réalisée dans un centre de fusion. La détection est effectuée à l'aide d'un test de rang qui est inspiré par le test de rang de Wilcoxon et étendu aux données censurées. Dans une seconde partie, nous proposons d'exploiter les relations de dépendance entre les données recueillies par les différents capteurs afin d'améliorer les performances de détection. Nous proposons ainsi une méthode non-paramétrique de détection d'une ou plusieurs ruptures dans un signal multidimensionnel. Cette méthode s'appuie sur un test d'homogénéité utilisant un test de rang multivarié. Nous décrivons les propriétés asymptotiques de ce test ainsi que ses performances sur divers jeux de données (bio-informatiques, économétriques ou réseau). La méthode proposée obtient de très bons résultats, en particulier lorsque la distribution des données est atypique (par exemple en présence de valeurs aberrantes).
|
2 |
Sur l'estimation de probabilités de queues multivariées / Estimating multivariate tails probabilitiesDalhoumi, Mohamed Néjib 25 September 2017 (has links)
Cette thèse présente des contributions à la modélisation multivariée des queues de distribution. Nous introduisons une nouvelle modélisation des probabilités de queue jointes d'une distribution multivariée avec des marges Pareto. Ce modèle est inspiré de celui de Wadsworth et Tawn (2013). Une nouvelle variation régulière multivariée non-standard de coefficient une fonction à deux variables est introduite, permettant de généraliser deux approches de modélisation respectivement proposées par Ramos et Ledford (2009)et Wadsworth et Tawn (2013). En nous appuyant sur cette modélisation nous proposons une nouvelle classe de modèles semi-paramétriques pour l'extrapolation multivariée selon des trajectoires couvrant tout le premier quadrant positif. Nous considérons aussi des modèles paramétriques construits grâce à une mesure non-négative satisfaisant une contrainte qui généralise celle de Ramos et Ledford (2009). Ces nouveaux modèles sont flexibles et conviennent tant pour les situations de dépendance que d'indépendance asymptotique. / This PhD thesis presents contributions to the modelling of multivariate extremevalues. We introduce a new tail model for multivariate distribution with Pareto margins. This model is inspired from the Wadsworth and Tawn (2013) one. A new non-standard multivariate regular variation with index equals to a function of two variables is thus introduced to generalize both modeling approaches proposedby Ramos and Ledford (2009) and Wadsworth and Tawn (2013), respectively. Building on this new approach we propose a new class of non-parametric models allowing multivariate extrapolation along trajectories covering the entire first positive quadrant. Similarly we consider parametric models built with a non-negative measure satisfying a constraint that generalizes the Ramos and Ledford (2009) one. These new models are flexible and valid in both situations of dependence or asymptotic independence.
|
3 |
Quantiles univariés et multivariés, approches probabilistes et statistiques : applications radar / Univariate and multivariate quantiles, probabilistic and statistical approaches : radar applicationsDecurninge, Alexis 26 January 2015 (has links)
La description et l’estimation des modèles aussi bien univariés que multivariés impliquantdes distributions à queue lourde est un enjeu applicatif majeur. Les L-moments sontdevenus des outils classiques alternatifs aux moments centraux pour décrire les comportementsen dispersion, asymétrie, kurtosis d’une distribution univariée à queue lourde. Eneffet, contrairement aux moments centraux correspondants, ils sont bien définis dès quel’espérance de la distribution d’intérêt est finie. Les L-moments peuvent être vus comme laprojection de la fonction quantile sur une famille orthogonale de polynômes, récupérant lalinéarité inhérente aux quantiles. Nous estimerons dans un premier temps les paramètresde modèles semi paramétriques définis par des contraintes sur ces L-moments par des méthodesde minimisation de divergences.Nous proposons dans un second temps une généralisation des L-moments aux distributionsmultivariées qui passe par la définition d’un quantile multivarié défini comme untransport entre la distribution uniforme sur [0; 1]d et la distribution d’intérêt. Cela nouspermet de proposer des descripteurs pour des distributions multivariées adaptés à l’étudedes queues lourdes. Nous détaillons leurs expressions dans le cadre de modèles possédantdes paramètres de rotation.Enfin, nous proposons des M-estimateurs de la matrice de dispersion des distributions complexeselliptiques. Ces dernières forment un modèle multivarié semi-paramétrique contenantnotamment des distributions à queue lourde. Des M-estimateurs spécifiques adaptésaux distributions elliptiques avec une hypothèse supplémentaire de stationnarité sont égalementproposés. Les performances et la robustesse des estimateurs sont étudiées.Les signaux radar provenant de fouillis tels les fouillis de mer ou les fouillis de sol sontsouvent modélisés par des distributions elliptiques. Nous illustrerons les performances dedétecteurs construits à partir de l’estimation de la matrice de dispersion par les méthodesproposées pour différents scénarios radar pour lesquels la robustesse de la procédure d’estimationest cruciale. / The description and the estimation of univariate and multivariate models whose underlyingdistribution is heavy-tailed is a strategic challenge. L-moments have becomeclassical tools alternative to central moments for the description of dispersion, skewnessand kurtosis of a univariate heavy-tailed distribution. Indeed, contrary to correspondingcentral moments, they are well defined since the expectation of the distribution of interestis finite. L-moments can be seen as projections of the quantile function on a family oforthogonal polynomials. First, we will estimate parameters of semi-parametric modelsdefined by constraints on L-moments through divergence methods.We will then propose a generalization of L-moments for multivariate distributions using amultivariate quantile function defined as a transport of the uniform distribution on [0; 1]dand the distribution of interest. As their univariate versions, these multivariate L-momentsare adapted for the study of heavy-tailed distributions. We explicitly give their formulationsfor models with rotational parameters.Finally, we propose M-estimators of the scatter matrix of complex elliptical distributions.The family of these distributions form a multivariate semi-parametric model especiallycontaining heavy-tailed distributions. Specific M-estimators adapted to complex ellipticaldistribution with an additional assumption of stationarity are proposed. Performancesand robustness of introduced estimators are studied.Ground and sea clutters are often modelized by complex elliptical distributions in the fieldof radar processing. We illustrate performances of detectors built from estimators of thescatter matrix through proposed methods for different radar scenarios.
|
4 |
Extrêmes multivariés et spatiaux : approches spectrales et modèles elliptiques / Multivariate and spatial extremes : spectral approaches and elliptical modelsOpitz, Thomas 30 October 2013 (has links)
Cette thèse présente des contributions à la modélisation multivariée et spatiale des valeurs extrêmes. Au travers d'une extension de la représentation par coordonnées pseudo-polaires, représentation très utilisée en théorie des valeurs extrêmes, une approche unifiée et générale pour la modélisation en valeurs extrêmes est proposée. La variable radiale de ces coordonnées est donnée par une fonction non négative et homogène dite fonction d'agrégation permettant d'agréger un vecteur dans un scalaire. La loi de la variable d'angle est caractérisée par une mesure dite angulaire ou spectrale. Nous définissons les lois radiales de Pareto et une version inversée de ces lois, toutes deux motivées dans le cadre de la variation régulière multivariée. Cette classe de modèles est assez souple et permet de modéliser les valeurs extrêmes de vecteurs aléatoires dont la variable agrégée est à décroissance de type Pareto ou Pareto inversé. Dans le cadre spatial, nous mettons l'accent sur les lois bivariées à l'instar des méthodes couramment utilisées. Des approches inférentielles originales sont développées, fondées sur un nouvel outil de représentation appelé spectrogramme. Le spectrogramme est constitué des mesures spectrales caractérisant le comportement extrémalbivarié. Enfin, la construction dite spectrale du processus limite max-stable des processus elliptiques, à savoir le processus t-extrémal, est présentée. Par ailleurs, nous énonçons des méthodesd'inférence et explorons des méthodes de simulation des processus de type max-stable et de type Pareto. L'intérêt pratique des modèles et méthodes proposés est illustré au travers d'applications à des données environnementales et financières. / This PhD thesis presents contributions to the modelling of multivariate andspatial extreme values. Using an extension of commonly used pseudo-polar representations inextreme value theory, we propose a general unifying approachto modelling of extreme value dependence. The radial variable of such coordinates is obtained from applying a nonnegative and homogeneous function, called aggregation function, allowing us to aggregate a vector into a scalar value. The distribution of the angle component is characterized by a so-called angular or spectral measure. We define radial Pareto distribution and an inverted version of thesedistributions, both motivated within the framework of multivariateregular variation. This flexible class of models allows for modelling of extreme valuesin random vectors whose aggregated variable shows tail decay of thePareto or inverted Pareto type. For the purpose of spatial extreme value analysis, we follow standard methodology in geostatistics of extremes and put the focus on bivariatedistributions. Inferentialapproaches are developed based on the notion of a spectrogram,a tool composed of thespectral measures characterizing bivariate extreme value behavior. Finally, the so-called spectral construction of the max-stable limit processobtained from elliptical processes, known as extremal-t process, ispresented. We discuss inference and explore simulation methods for the max-stableprocess and the corresponding Pareto process. The utility of the proposed models and methods is illustrated throughapplications to environmental and financial data.
|
5 |
Modélisation longitudinales de marqueur du VIHThiebaut, Rodolphe 17 December 2002 (has links) (PDF)
L'étude de l'évolution et de la valeur pronostique des marqueurs est très fréquente en<br />épidémiologie. Le taux de lymphocytes T CD4+ et la charge virale plasmatique sont des<br />marqueurs très important de l'infection par le virus de l'immunodéficience humaine (VIH).<br />La modélisation de l'évolution de ces marqueurs présente plusieurs difficultés<br />méthodologiques. D'une part, il s'agit de données répétées incomplètes c'est à dire pouvant<br />être manquantes du fait de la sortie d'étude de certains sujets et de la censure de la charge<br />virale liée à une limite de détection inférieure des techniques de mesure. D'autre part, ces<br />deux marqueurs étant corrélés, il est important de prendre en compte cette information dans le<br />modèle. Nous avons proposé des méthodes basées sur le maximum de vraisemblance pour<br />estimer les paramètres de modèles linéaires mixtes prenant en compte l'ensemble de ces<br />difficultés. Nous avons montré l'impact significatif de ces méthodes biostatistiques sur les<br />estimations et donc nous avons souligné l'importance de leur utilisation dans le cadre des<br />marqueurs du VIH. Pour promouvoir leur diffusion, nous avons présenté des possibilités<br />d'implémentation de certaines des méthodes proposées dans des logiciels statistiques<br />communs.
|
6 |
Models and estimation algorithms for nonparametric finite mixtures with conditionally independent multivariate component densities / Modèles et algorithmes d'estimation pour des mélanges finis de densités de composantes multivariées non paramétriques et conditionnellement indépendantesHoang, Vy-Thuy-Lynh 20 April 2017 (has links)
Plusieurs auteurs ont proposé récemment des modèles et des algorithmes pour l'estimation nonparamétrique de mélanges multivariés finis dont l'identifiabilité n'est pas toujours assurée. Entre les modèles considérés, l'hypothèse des coordonnées indépendantes conditionnelles à la sous-population de provenance des individus fait l'objet d'une attention croissante, en raison des développements théoriques et pratiques envisageables, particulièrement avec la multiplicité des variables qui entrent en jeu dans le framework statistique moderne. Dans ce travail, nous considérons d'abord un modèle plus général supposant l'indépendance, conditionnellement à la composante, de blocs multivariés de coordonnées au lieu de coordonnées univariées, permettant toute structure de dépendance à l'intérieur de ces blocs. Par conséquent, les fonctions de densité des blocs sont complètement multivariées et non paramétriques. Nous présentons des arguments d'identifiabilité et introduisons pour l'estimation dans ce modèle deux algorithmes méthodologiques dont les procédures de calcul ressemblent à un véritable algorithme EM mais incluent une étape additionnelle d'estimation de densité: un algorithme rapide montrant l'efficacité empirique sans justification théorique, et un algorithme lissé possédant une propriété de monotonie comme certain algorithme EM, mais plus exigeant en terme de calcul. Nous discutons également les méthodes efficaces en temps de calcul pour l'estimation et proposons quelques stratégies. Ensuite, nous considérons une extension multivariée des modèles de mélange utilisés dans le cadre de tests d'hypothèses multiples, permettant une nouvelle version multivariée de contrôle du False Discovery Rate. Nous proposons une version contrainte de notre algorithme précédent, adaptée spécialement à ce modèle. Le comportement des algorithmes de type EM que nous proposons est étudié numériquement dans plusieurs expérimentations de Monte Carlo et sur des données réelles de grande dimension et comparé avec les méthodes existantes dans la littérature. En n, les codes de nos nouveaux algorithmes sont progressivement ajoutés sous forme de nouvelles fonctions dans le package en libre accès mixtools pour le logiciel de statistique R. / Recently several authors have proposed models and estimation algorithms for finite nonparametric multivariate mixtures, whose identifiability is typically not obvious. Among the considered models, the assumption of independent coordinates conditional on the subpopulation from which each observation is drawn is subject of an increasing attention, in view of the theoretical and practical developments it allows, particularly with multiplicity of variables coming into play in the modern statistical framework. In this work we first consider a more general model assuming independence, conditional on the component, of multivariate blocks of coordinates instead of univariate coordinates, allowing for any dependence structure within these blocks. Consequently, the density functions of these blocks are completely multivariate and nonparametric. We present identifiability arguments and introduce for estimation in this model two methodological algorithms whose computational procedures resemble a true EM algorithm but include an additional density estimation step: a fast algorithm showing empirical efficiency without theoretical justification, and a smoothed algorithm possessing a monotony property as any EM algorithm does, but more computationally demanding. We also discuss computationally efficient methods for estimation and derive some strategies. Next, we consider a multivariate extension of the mixture models used in the framework of multiple hypothesis testings, allowing for a new multivariate version of the False Discovery Rate control. We propose a constrained version of our previous algorithm, specifically designed for this model. The behavior of the EM-type algorithms we propose is studied numerically through several Monte Carlo experiments and high dimensional real data, and compared with existing methods in the literature. Finally, the codes of our new algorithms are progressively implemented as new functions in the publicly-available package mixtools for the R statistical software.
|
7 |
Modélisation multivariée de champs texturaux : application à la classification d'images. / Multivariate modeling of texture space : image classification applicationSchutz, Aurélien 15 December 2014 (has links)
Le travail présenté dans cette thèse a pour objectif de proposer un algorithme de classification supervisée d’images texturées basée sur la modélisation multivariée de champs texturaux. Inspiré des algorithmes de classification dits à « Sac de Mots Visuels » (SMV), nous proposons une extension originale au cas des descripteurs paramétriques issus de la modélisation multivariée des coefficients des sous-bandes d’une décomposition en ondelettes. Différentes contributions majeures de cette thèse peuvent être mises en avant. La première concerne l’introduction d’une loi a priori intrinsèque à l’espace des descripteurs par la définition d’une loi gaussienne concentrée. Cette dernière étant caractérisée par un barycentre ¯_ et une varianceσ2, nous proposons un algorithme d’estimation de ces deux quantités. Nous proposons notamment une application au cas des modèles multivariés SIRV ( Spherically Invariant Random Vector ), en séparant le problème complexe d’estimationdu barycentre comme la résolution de deux problèmes d’estimation plus simples ( un sur la partie gaussienne et un surle multiplieur ). Afin de prendre en compte la diversité naturelle des images texturées ( contraste, orientation, . . . ), nousproposons une extension au cas des modèles de mélanges permettant ainsi de construire le dictionnaire d’apprentissage.Enfin, nous validons cet algorithme de classification sur diverses bases de données d’images texturées et montrons de bonnes performances de classification vis-à-vis d’autres algorithmes de la littérature. / The prime objective of this thesis is to propose an unsupervised classification algorithm of textured images based on multivariate stochastic models. Inspired from classification algorithm named "Bag of Words" (BoW), we propose an original extension to parametric descriptors issued from the multivariate modeling of wavelet subband coefficients. Some major contributions of this thesis can be outlined. The first one concerns the introduction of an intrinsic prior on the parameter space by defining a Gaussian concentrated distribution. This latter being characterized by a centroid ¯_ and a variance _2,we propose an estimation algorithm for those two quantities. Next, we propose an application to the multivariate SIRV (Spherically Invariant Random Vector) model, by resolving the difficult centroid estimation problem as the solution of two simpler ones (one for the Gaussian part and one for the multiplier part). To handle with the intra-class diversity of texture images (scene enlightenment, orientation . . . ), we propose an extension to mixture models allowing the construction of the training dictionary. Finally, we validate this classification algorithm on various texture image databases and show interesting classification performances compared to other state-of-the-art algorithms.
|
8 |
Structures Markoviennes cachées et modèles à corrélations conditionnelles dynamiques: extensions et applications aux corrélations d'actifs financiers.Charlot, Philippe 25 November 2010 (has links) (PDF)
L'objectif de cette thèse est d'étudier le problème de la modélisation des changements de régime dans les modèles à corrélations conditionnelles dynamiques en nous intéressant plus particulièrement à l'approche Markov-switching. A la différence de l'approche standard basée sur le modèle à chaîne de Markov caché (HMM) de base, nous utilisons des extensions du modèle HMM provenant des modèles graphiques probabilistes. Cette discipline a en effet proposé de nombreuses dérivations du modèle de base permettant de modéliser des structures complexes. Cette thèse se situe donc à l'interface de deux disciplines: l'économétrie financière et les modèles graphiques probabilistes. Le premier essai présente un modèle construit à partir d'une structure hiérarchique cachée markovienne qui permet de définir différents niveaux de granularité pour les régimes. Il peut être vu comme un cas particulier du modèle RSDC (Regime Switching for Dynamic Correlations). Basé sur le HMM hiérarchique, notre modèle permet de capter des nuances de régimes qui sont ignorées par l'approche Markov-Switching classique. La seconde contribution propose une version Markov-switching du modèle DCC construite à partir du modèle HMM factorisé. Alors que l'approche Markov-switching classique suppose que les tous les éléments de la matrice de corrélation suivent la même dynamique, notre modèle permet à tous les éléments de la matrice de corrélation d'avoir leur propre dynamique de saut. Dans la dernière contribution, nous proposons un modèle DCC construit à partir d'un arbre de décision. L'objectif de cet arbre est de relier le niveau des volatilités individuelles avec le niveau des corrélations. Pour cela, nous utilisons un arbre de décision Markovien caché, qui est une extension de HMM.
|
9 |
Empirical processes of multiple mixing data / Processus empiriques de données à mélange multipleTusche, Marco 29 November 2013 (has links)
Cette thèse étudie la convergence en loi des processus empiriques de données à mélange multiple. Son contenu correspond aux articles : Durieu et Tusche (2012), Dehling, Durieu, et Tusche (2012), et Dehiing, Durieu et Tusche (2013). Nous suivons l’approche par approximation introduite dans Dehling, Durieu, et Vo1n (2009) et Dehling and Durieu (2011), qui ont établi des théorèmes limite centraux empiriques pour des variables aléatoires dépendants à valeurs dans R ou RAd, respectivement. En développant leurs techniques, nous généralisons leurs résultats à des espaces arbitraires et à des processus empiriques indexés par des classes de fonctions. De plus, nous étudions des processus empiriques séquentiels. Nos résultats s’appliquent aux chaînes de Markov B-géométriquement ergodiques, aux modèles itératifs lipschitziens, aux systèmes dynamiques présentant un trou spectral pour l’opérateur de Perron-Frobenius associé, ou encore, aux automorphismes du tore. Nous établissons des conditions garantissant la convergence du processus empirique de tels modèles vers un processus gaussien. / The present thesis studies weak convergence of empirical processes of multiple mixing data. It is based on the articles Durieu and Tusche (2012), Dehling, Durieu, and Tusche (2012), and Dehling, Durieu, and Tusche (2013). We follow the approximating class approach introduced by Dehling, Durieu, and Voln (2009)and Dehling and Durieu (2011), who established empirical central limit theorems for dependent R- and R”d-valued random variables, respectively. Extending their technique, we generalize their results to arbitrary state spaces and to empirical processes indexed by classes of functions. Moreover we study sequential empirical processes. Our results apply to B-geometrically ergodic Markov chains, iterative Lipschitz models, dynamical systems with a spectral gap on the Perron—Frobenius operator, and ergodic toms automorphisms. We establish conditions under which the empirical process of such processes converges weakly to a Gaussian process.
|
10 |
Modélisation de la structure de dépendance d'extrêmes multivariés et spatiaux / Modelling the dependence structure of multivariate and spatial extremesBéranger, Boris 18 January 2016 (has links)
La prédiction de futurs évènements extrêmes est d’un grand intérêt dans de nombreux domaines tels que l’environnement ou la gestion des risques. Alors que la théorie des valeurs extrêmes univariées est bien connue, la complexité s’accroît lorsque l’on s’intéresse au comportement joint d’extrêmes de plusieurs variables. Un intérêt particulier est porté aux évènements de nature spatiale, définissant le cadre d’un nombre infini de dimensions. Sous l’hypothèse que ces évènements soient marginalement extrêmes, nous focalisons sur la structure de dépendance qui les lie. Dans un premier temps, nous faisons une revue des modèles paramétriques de dépendance dans le cadre multivarié et présentons différentes méthodes d’estimation. Les processus maxstables permettent l’extension au contexte spatial. Nous dérivons la loi en dimension finie du célèbre modèle de Brown- Resnick, permettant de faire de l’inférence par des méthodes de vraisemblance ou de vraisemblance composée. Nous utilisons ensuite des lois asymétriques afin de définir la représentation spectrale d’un modèle plus large : le modèle Extremal Skew-t, généralisant la plupart des modèles présents dans la littérature. Ce modèle a l’agréable propriété d’être asymétrique et non-stationnaire, deux notions présentées par les évènements environnementaux spatiaux. Ce dernier permet un large spectre de structures de dépendance. Les indicateurs de dépendance sont obtenus en utilisant la loi en dimension finie.Enfin, nous présentons une méthode d’estimation non-paramétrique par noyau pour les queues de distributions et l’appliquons à la sélection de modèles. Nous illustrons notre méthode à partir de l’exemple de modèles climatiques. / Projection of future extreme events is a major issue in a large number of areas including the environment and risk management. Although univariate extreme value theory is well understood, there is an increase in complexity when trying to understand the joint extreme behavior between two or more variables. Particular interest is given to events that are spatial by nature and which define the context of infinite dimensions. Under the assumption that events correspond marginally to univariate extremes, the main focus is then on the dependence structure that links them. First, we provide a review of parametric dependence models in the multivariate framework and illustrate different estimation strategies. The spatial extension of multivariate extremes is introduced through max-stable processes. We derive the finite-dimensional distribution of the widely used Brown-Resnick model which permits inference via full and composite likelihood methods. We then use Skew-symmetric distributions to develop a spectral representation of a wider max-stable model: the extremal Skew-t model from which most models available in the literature can be recovered. This model has the nice advantages of exhibiting skewness and nonstationarity, two properties often held by environmental spatial events. The latter enables a larger spectrum of dependence structures. Indicators of extremal dependence can be calculated using its finite-dimensional distribution. Finally, we introduce a kernel based non-parametric estimation procedure for univariate and multivariate tail density and apply it for model selection. Our method is illustrated by the example of selection of physical climate models.
|
Page generated in 0.036 seconds