Spelling suggestions: "subject:"probabilités"" "subject:"probabilitées""
251 |
Étude d'un capteur de gaz potentiométrique. Influence et rôle des espèces oxygénées de surface sur la réponse électriqueGuillet, Nicolas 17 December 2001 (has links) (PDF)
Ce travail s'inscrit dans la continuité de deux thèses présentées par E. Fascetta en 1993 et C. Pupier en 1999 qui ont été consacrées à l'étude d'un capteur de gaz potentiométrique original. Contrairement aux capteurs potentiométriques classiques, celui-ci a la particularité de disposer de deux électrodes différentes disposées dans la même atmosphère gazeuse. Ces travaux ont donné lieu à d'importants développements technologiques et ont permis de jeter les bases d'un modèle électrochimique à même de mieux interpréter l'influence de certains gaz tels que l'oxygène sur la réponse du capteur. Notre démarche a donc consisté à approfondir la compréhension des phénomènes qui sont à l'origine de la réponse électrique de ce capteur afin d'en optimiser le fonctionnement pour les différentes applications visées. La première partie de ce travail concerne la caractérisation physico-chimique des espèces qui interviennent dans la création du signal électrique et en particulier l'étude du rôle exact de l'oxygène. Pour cela, nous avons fait appel à des techniques usuellement utilisées pour l'étude des interactions gaz-solide telles que la calorimétrie et les mesures de potentiel de surface. Ensuite, nous avons étudié l'importance du choix des matériaux utilisés ainsi que l'influence de paramètres caractéristiques tels que la nature et la taille des électrodes sur la réponse électrique du capteur. Tous ces résultats ont alors été exploités pour proposer un mécanisme complet permettant d'expliciter les phénomènes qui interviennent dans l'apparition du signal électrique. Ce modèle a été confronté aux résultats expérimentaux concernant l'influence de la pression d'oxygène et de la température, puis il a été étendu à l'action combinée de la température, la pression d'oxygène et d'un gaz réducteur, le monooxyde de carbone.
|
252 |
Evaluation de la sûreté de systèmes dynamiques hybrides complexes. Application aux systèmes hydrauliquesBroy, Perrine 12 March 2014 (has links) (PDF)
Ces travaux s'intéressent à l'estimation de la fiabilité des évacuateurs de crues vannés. Le comportement fiabiliste de ces systèmes hydrauliques dépend à la fois d'événements aléatoires discrets, mais aussi de l'évolution d'une variable déterministe continue : ce sont des systèmes dynamiques hybrides. Pour ces systèmes, l'événement redouté est réalisé lorsque le niveau de la retenue atteint un seuil de sûreté. La démarche de fiabilité dynamique proposée dans cette thèse vise à prendre en compte l'information temporelle, de la modélisation à la synthèse d'indicateurs fiabilistes pour l'aide à la décision et développe deux contributions : 1) L'élaboration d'une base de connaissances dédiée à la description des évacuateurs de crues en termes de fiabilité dynamique. Chaque classe de composants est décrite par un automate stochastique hybride dont les états sont les différentes phases de son fonctionnement. 2) Le suivi de la simulation de Monte Carlo, le traitement et l'analyse des "histoires" (séquence de tous les états activés et des dates d'activation) obtenues en simulation. Cela permet de construire des indicateurs de fiabilité classique (probabilité d'occurrence de l'évènement redouté, identification des coupes équivalentes prépondérantes, ...). Des indicateurs de fiabilité dynamique basés sur la classification des histoires en fonction des dates de défaillance des composants concernés et sur l'estimation de l'importance dynamique sont aussi proposés.
|
253 |
Développement stochastique pour les processus de diffusion et applications à la valorisation d'optionsBompis, Romain 11 December 2013 (has links) (PDF)
Cette thèse est consacrée à l'approximation de l'espérance d'une fonctionnelle (pouvant dépendre de toute la trajectoire) appliquée à un processus de diffusion (pouvant être multidimensionnel). La motivation de ce travail vient des mathématiques financières où la valorisation d'options se réduit au calcul de telles espérances. La rapidité des calculs de prix et des procédures de calibration est une contrainte opérationnelle très forte et nous apportons des outils temps-réel (ou du moins plus compétitifs que les simulations de Monte Carlo dans le cas multidimensionnel) afin de combler ces besoins. Pour obtenir des formules d'approximation, on choisit un modèle proxy dans lequel les calculs analytiques sont possibles, puis nous utilisons des développements stochastiques autour de ce modèle proxy et le calcul de Malliavin afin d'approcher les quantités d'intérêt. Dans le cas où le calcul de Malliavin ne peut pas être appliqué, nous développons une méthodologie alternative combinant calcul d'Itô et arguments d'EDP. Toutes les approches (allant des EDPs à l'analyse stochastique) permettent d'obtenir des formules explicites et des estimations d'erreur précises en fonction des paramètres du modèle. Bien que le résultat final soit souvent le même, la dérivation explicite du développement peut être très différente et nous comparons les approches, tant du point de vue de la manière dont les termes correctifs sont rendus explicites que des hypothèses requises pour obtenir les estimées d'erreur. Nous considérons différentes classes de modèles et fonctionnelles lors des quatre Parties de la thèse. Dans la Partie I, nous nous concentrons sur les modèles à volatilité locale et nous obtenons des nouvelles formules d'approximation pour les prix, les sensibilités (delta) et les volatilités implicites des produits vanilles surpassant en précision les formules connues jusque-là. Nous présentons aussi des nouveaux résultats concernant la valorisation des options à départ différé. La Partie II traite de l'approximation analytique des prix vanilles dans les modèles combinant volatilité locale et stochastique (type Heston). Ce modèle est très délicat à analyser car ses moments ne sont pas tous finis et qu'il n'est pas régulier au sens de Malliavin. L'analyse d'erreur est originale et l'idée est de travailler sur une régularisation appropriée du payoff et sur un modèle habilement modifié, régulier au sens de Malliavin et à partir duquel on peut contrôler la distance par rapport au modèle initial. La Partie III porte sur la valorisation des options barrières régulières dans le cadre des modèles à volatilité locale. C'est un cas non considéré dans la littérature, difficile à cause de l'indicatrice des temps de sorties. Nous mélangeons calcul d'Itô, arguments d'EDP, propriétés de martingales et de convolutions temporelles de densités afin de décomposer l'erreur d'approximation et d'expliciter les termes correctifs. Nous obtenons des formules d'approximation explicites et très précises sous une hypothèse martingale. La Partie IV présente une nouvelle méthodologie (dénotée SAFE) pour l'approximation en loi efficace des diffusions multidimensionnelles dans un cadre assez général. Nous combinons l'utilisation d'un proxy Gaussien pour approcher la loi de la diffusion multidimensionnelle et une interpolation locale de la fonction terminale par éléments finis. Nous donnons une estimation de la complexité de notre méthodologie. Nous montrons une efficacité améliorée par rapport aux simulations de Monte Carlo dans les dimensions petites et moyennes (jusqu'à 10).
|
254 |
La chance en droit administratif. / Chance in administrative lawGiraud, Camille 21 November 2017 (has links)
La chance est une notion hétérogène en droit administratif. Les manifestations de ses différentes acceptions sont en effet nombreuses tant le hasard, les probabilités et le risque auxquels la chance renvoie sont riches d’applications concrètes. Les effets de ceux-ci sont donc également, et sans surprise, très variés, de sorte que la perméabilité du droit administratif est à leur égard teintée de singularité selon qu’ils sont respectivement considérés comme bénéfiques ou néfastes. Ainsi, les probabilités sont l’illustration de ce que la chance peut être un outil utile au juge administratif dans le prononcé de ses jugements, tandis que le hasard et le risque renvoient tous deux à la survenance d’événements ou de phénomènes imprévisibles qui cherchent à être évités. Malgré toutes les subtilités déployées par la chance en droit administratif, celle-ci se révèle néanmoins comme une notion dont l’unité apparaît au stade de l’étude de sa fonction. La chance est alors une notion fonctionnelle qui a vocation à être de plus en plus employée par le juge administratif pour améliorer l’indemnisation délivrée aux administrés, tant d’un point de vue qualitatif que quantitatif. / Chance is an heterogeneous notion in administrative law. The manifestations of its different meanings are indeed quite abundant in the sense that the coincidences, the probabilities and the risk that chance refers to are full of tangible applications. Their effects are equally, and unsurprisingly, very varied which means that the permeability of administrative law towards them is quite unique, depending on whether they are considered to be beneficial or adverse. So, probabilities illustrate how chance can be a useful tool for the administrative judge when pronouncing a judgment, whereas coincidences and risk both reflect back on the occurrence of events or unpredictable phenomenons which one would aim to avoid. Inspite of all the subtleties deployed by chance in administrative law, it nevertheless seems to be a notion, the unity of which appears to be at the study stage of its function. Chance is then a functional notion, the vocation of which is to be used more and more often by the administrative judge in order to improve the compensation awarded to citizens both from a qualitative and quantitative point of view.
|
255 |
Essays in mathematical finance and in the epistemology of finance / Essais en finance mathématique et en épistémologie de la financeDe Scheemaekere, Xavier 19 May 2011 (has links)
The goal of this thesis in finance is to combine the use of advanced mathematical methods with a return to foundational economic issues. In that perspective, I study generalized rational expectations and asset pricing in Chapter 2, and a converse comparison principle for backward stochastic differential equations with jumps in Chapter 3. Since the use of stochastic methods in finance is an interesting and complex issue in itself - if only to clarify the difference between the use of mathematical models in finance and in physics or biology - I also present a philosophical reflection on the interpretation of mathematical models in finance (Chapter 4). In Chapter 5, I conclude the thesis with an essay on the history and interpretation of mathematical probability - to be read while keeping in mind the fundamental role of mathematical probability in financial models. / Doctorat en Sciences économiques et de gestion / info:eu-repo/semantics/nonPublished
|
256 |
Univariate and multivariate symmetry: statistical inference and distributional aspects / Symétrie univariée et multivariée: inférence statistique et aspects distributionnelsLey, Christophe 26 November 2010 (has links)
This thesis deals with several statistical and probabilistic aspects of symmetry and asymmetry, both in a univariate and multivariate context, and is divided into three distinct parts.<p><p>The first part, composed of Chapters 1, 2 and 3 of the thesis, solves two conjectures associated with multivariate skew-symmetric distributions. Since the introduction in 1985 by Adelchi Azzalini of the most famous representative of that class of distributions, namely the skew-normal distribution, it is well-known that, in the vicinity of symmetry, the Fisher information matrix is singular and the profile log-likelihood function for skewness admits a stationary point whatever the sample under consideration. Since that moment, researchers have tried to determine the subclasses of skew-symmetric distributions who suffer from each of those problems, which has led to the aforementioned two conjectures. This thesis completely solves these two problems.<p><p>The second part of the thesis, namely Chapters 4 and 5, aims at applying and constructing extremely general skewing mechanisms. As such, in Chapter 4, we make use of the univariate mechanism of Ferreira and Steel (2006) to build optimal (in the Le Cam sense) tests for univariate symmetry which are very flexible. Actually, their mechanism allowing to turn a given symmetric distribution into any asymmetric distribution, the alternatives to the null hypothesis of symmetry can take any possible shape. These univariate mechanisms, besides that surjectivity property, enjoy numerous good properties, but cannot be extended to higher dimensions in a satisfactory way. For this reason, we propose in Chapter 5 different general mechanisms, sharing all the nice properties of their competitors in Ferreira and Steel (2006), but which moreover can be extended to any dimension. We formally prove that the surjectivity property holds in dimensions k>1 and we study the principal characteristics of these new multivariate mechanisms.<p><p>Finally, the third part of this thesis, composed of Chapter 6, proposes a test for multivariate central symmetry by having recourse to the concepts of statistical depth and runs. This test extends the celebrated univariate runs test of McWilliams (1990) to higher dimensions. We analyze its asymptotic behavior (especially in dimension k=2) under the null hypothesis and its invariance and robustness properties. We conclude by an overview of possible modifications of these new tests./<p><p>Cette thèse traite de différents aspects statistiques et probabilistes de symétrie et asymétrie univariées et multivariées, et est subdivisée en trois parties distinctes.<p><p>La première partie, qui comprend les chapitres 1, 2 et 3 de la thèse, est destinée à la résolution de deux conjectures associées aux lois skew-symétriques multivariées. Depuis l'introduction en 1985 par Adelchi Azzalini du plus célèbre représentant de cette classe de lois, à savoir la loi skew-normale, il est bien connu qu'en un voisinage de la situation symétrique la matrice d'information de Fisher est singulière et la fonction de vraisemblance profile pour le paramètre d'asymétrie admet un point stationnaire quel que soit l'échantillon considéré. Dès lors, des chercheurs ont essayé de déterminer les sous-classes de lois skew-symétriques qui souffrent de chacune de ces problématiques, ce qui a mené aux deux conjectures précitées. Cette thèse résoud complètement ces deux problèmes.<p><p>La deuxième partie, constituée des chapitres 4 et 5, poursuit le but d'appliquer et de proposer des méchanismes d'asymétrisation très généraux. Ainsi, au chapitre 4, nous utilisons le méchanisme univarié de Ferreira and Steel (2006) pour construire des tests de symétrie univariée optimaux (au sens de Le Cam) qui sont très flexibles. En effet, leur méchanisme permettant de transformer une loi symétrique donnée en n'importe quelle loi asymétrique, les contre-hypothèses à la symétrie peuvent prendre toute forme imaginable. Ces méchanismes univariés, outre cette propriété de surjectivité, possèdent de nombreux autres attraits, mais ne permettent pas une extension satisfaisante aux dimensions supérieures. Pour cette raison, nous proposons au chapitre 5 des méchanismes généraux alternatifs, qui partagent toutes les propriétés de leurs compétiteurs de Ferreira and Steel (2006), mais qui en plus sont généralisables à n'importe quelle dimension. Nous démontrons formellement que la surjectivité tient en dimension k > 1 et étudions les caractéristiques principales de ces nouveaux méchanismes multivariés.<p><p>Finalement, la troisième partie de cette thèse, composée du chapitre 6, propose un test de symétrie centrale multivariée en ayant recours aux concepts de profondeur statistique et de runs. Ce test étend le célèbre test de runs univarié de McWilliams (1990) aux dimensions supérieures. Nous en analysons le comportement asymptotique (surtout en dimension k = 2) sous l'hypothèse nulle et les propriétés d'invariance et de robustesse. Nous concluons par un aperçu sur des modifications possibles de ces nouveaux tests. / Doctorat en Sciences / info:eu-repo/semantics/nonPublished
|
257 |
Optimal tests for symmetryCassart, Delphine 01 June 2007 (has links)
Dans ce travail, nous proposons des procédures de test paramétriques et nonparamétrique localement et asymptotiquement optimales au sens de Hajek et Le Cam, pour trois modèles d'asymétrie. <p>La construction de modèles d'asymétrie est un sujet de recherche qui a connu un grand développement ces dernières années, et l'obtention des tests optimaux (pour trois modèles différents) est une étape essentielle en vue de leur mise en application. <p>Notre approche est fondée sur la théorie de Le Cam d'une part, pour obtenir les propriétés de normalité asymptotique, bases de la construction des tests paramétriques optimaux, et la théorie de Hajek d'autre part, qui, via un principe d'invariance permet d'obtenir les procédures non-paramétriques.<p><p>Nous considérons dans ce travail deux classes de distributions univariées asymétriques, l'une fondée sur un développement d'Edgeworth (décrit dans le Chapitre 1), et l'autre construite en utilisant un paramètre d'échelle différent pour les valeurs positives et négatives (le modèle de Fechner, décrit dans le Chapitre 2).<p>Le modèle d'asymétrie elliptique étudié dans le dernier chapitre est une généralisation multivariée du modèle du Chapitre 2.<p>Pour chacun de ces modèles, nous proposons de tester l'hypothèse de symétrie par rapport à un centre fixé, puis par rapport à un centre non spécifié.<p><p>Après avoir décrit le modèle pour lequel nous construisons les procédures optimales, nous obtenons la propriété de normalité locale asymptotique. A partir de ce résultat, nous sommes capable de construire les tests paramétriques localement et asymptotiquement optimaux. Ces tests ne sont toutefois valides que si la densité sous-jacente f est correctement spécifiée. Ils ont donc le mérite de déterminer les bornes d'efficacité paramétrique, mais sont difficilement applicables. <p>Nous adaptons donc ces tests afin de pouvoir tester les hypothèses de symétrie par rapport à un centre fixé ou non, lorsque la densité sous-jacente est considérée comme un paramètre de nuisance. <p>Les tests que nous obtenons restent localement et asymptotiquement optimaux sous f, mais restent valides sous une large classe de densités. <p><p>A partir des propriétés d'invariance du sous-modèle identifié par l'hypothèse nulle, nous obtenons les tests de rangs signés localement et asymptotiquement optimaux sous f, et valide sous une vaste classe de densité. Nous présentons en particulier, les tests fondés sur les scores normaux (ou tests de van der Waerden), qui sont optimaux sous des hypothèses Gaussiennes, tout en étant valides si cette hypothèse n'est pas vérifiée.<p>Afin de comparer les performances des tests paramétriques et non paramétriques présentés, nous calculons les efficacités asymptotiques relatives des tests non paramétriques par rapport aux tests pseudo-Gaussiens, sous une vaste classe de densités non-Gaussiennes, et nous proposons quelques simulations. / Doctorat en sciences, Orientation statistique / info:eu-repo/semantics/nonPublished
|
258 |
Réactions de fusion entre ions lourds par effet tunnel quantique : le cas des collisions entre calcium et nickel / Heavy-ion fusion reactions through quantum tunneling : collisions between calcium and nickel isotopesBourgin, Dominique 26 September 2016 (has links)
Les réactions de fusion-évaporation et de transfert de nucléons entre ions lourds à des énergies proches de la barrière de Coulomb jouent un rôle essentiel dans l’étude de la structure nucléaire et des mécanismes de réaction. Dans le cadre de cette thèse, deux expériences de fusion-évaporation et de transfert de nucléons ont été réalisées au Laboratoire National de Legnaro en Italie : 40Ca+58Ni et 40Ca+64Ni. Dans une première expérience, les sections efficaces de fusion de 40Ca+58,64Ni ont été mesurées à des énergies au-dessus et en dessous de la barrière de Coulomb et ont été interprétées à l’aide de calculs en voies couplées et Hartree-Fock dépendants du temps (TDHF). Les résultats montrent l’importance de l’excitation à un phonon octupolaire dans le noyau 40Ca et les excitations à un phonon quadripolaire dans les noyaux 58Ni et 64Ni, ainsi que l’importance des voies de transfert de nucléons dans le système riche en neutrons 40Ca+64Ni. Dans une expérience complémentaire, les probabilités de transfert de nucléons de 40Ca+58,64Ni ont été mesurées dans le même domaine d’énergie que l’expérience précédente et ont été interprétées en effectuant des calculs TDHF+BCS. Les résultats confirment l’importance des voies de transfert de nucléons dans 40Ca+64Ni. Une description conjointe des probabilités de transfert de nucléons et des sections efficaces de fusion a été réalisée pour les deux réactions étudiées en utilisant une approche en voies couplées. / Heavy-ion fusion-evaporation and nucleon transfer reactions at energies close to the Coulomb barrier play an essential role in the study of nuclear structure and reaction dynamics. In the framework of this PhD thesis, two fusion-evaporation and nucleon transfer experiments have been performed at the Laboratori Nazionali di Legnaro in Italy : 40Ca+58Ni and 40Ca+64Ni. In a first experiment, fusion cross sections for 40Ca+58,64Ni have been measured from above to below the Coulomb barrier and have been interpreted by means of coupled-channels and Time-Dependent Hartree-Fock (TDHF) calculations. The results show the importance of the one-phonon octupole excitation in the 40Ca nucleus and the one-phonon quadrupole excitations in the 58Ni and 64Ni nuclei, as well as the importance of the nucleon transfer channels in the neutron-rich system 40Ca+64Ni. In a complementary experiment, nucleon transfer probabilities for 40Ca+58,64Ni have been measured in the same energy region as the previous experiment and have been interpreted by performing TDHF+BCS calculations. The results confirm the importance of nucleon transfer channels in 40Ca+64Ni. A simultaneous description of the nucleon transfer probabilities and the fusion cross sections has been performed for both reactions, using a coupled-channels approach.
|
259 |
Modeling of complex network, application to road and cultural networks / Modeling of complex network, application to road and cultural networksJiang, Jian 12 September 2011 (has links)
De nombreux systèmes complexes provenant de phénomènes naturels ou de la société humaine peuvent être décrits comme des réseaux complexes. Dans cette thèse, sur la base de la théorie des réseaux complexes, nous allons nous pencher sur la structure topologique de ces réseaux complexes et leurs dynamiques. Nous avons créé des modèles pour étudier les influences de la structure sur la dynamique des réseaux et mis en évidence quelques propriétés particulières des systèmes complexes. Cette thèse comporte quatre parties. Dans la première partie, les propriétés empiriques (degré de distribution, coefficient d’agrégation, diamètre, longueur caractéristique de parcours) des réseaux de routes urbaines de la ville du Mans en France sont étudiées. Dans la seconde partie, nous proposons deux modèles pour étudier le mécanisme éventuel conduisant à s’écarter de la loi de puissance simple. Dans le premier modèle, la probabilité d’addition de noeuds et de liens, la création de liens est étudiée ; dans le second modèle, seule la croissance aléatoire et préférentielle de liens est ajoutée. Les résultats de la simulation de ce modèle sont comparés aux données réelles. Dans la troisième partie, les propriétés probabilistes incertaines de la loi de distribution en double puissance sont étudiées. L’optimisation du réseau et l’étude optimale du réseau sans échelle vers l’échec aléatoire sont étudiées en se servant du principe de maximisation de l’entropie. Nous avons défini l’ensemble du réseau à l’équilibre comme des ensembles stationnaires de graphes en utilisant des notions thermodynamiques telle que ”énergie”, ”température”, ” énergie libre” pour les réseaux. Dans la quatrième partie, un modèle d’union-division est mis au point pour étudier l’évolution temporelle de certains réseaux culturels ou économiques. Dans ce modèle, les noeuds représentent les cultures. Plusieurs grandeurs telles que la richesse, l’âge, identité, contenu etc. sont utilisées pour paramétrer l’évolution probable du réseau. Le modèle offre une vision à long terme sur une dynamique apparemment périodique d’ensemble de grandeurs culturelles ou économiques en interaction. / Many complex systems arising from nature and human society can be described as complex networks. In this dissertation, on the basis of complex network theory, we pay attention to the topological structure of complex network and the dynamics on it. We established models to investigate the influences of the structure on the dynamics of networks and to shed light on some peculiar properties of complex systems. This dissertation includes four parts. In the first part, the empirical properties (degree distribution, clustering coefficient, diameter, and characteristic path length) of urban road network of Le Mans city in France are studied. The degree distribution shows a double power-law which we studied in detail. In the second part, we propose two models to investigate the possible mechanisms leading to the deviation from simple power law. In the first model, probabilistic addition of nodes and links, and rewiring of links are considered; in the second one, only random and preferential link growth is included. The simulation results of the modelling are compared with the real data. In the third part,the probabilistic uncertainty behavior of double power law distribution is investigated. The network optimization and optimal design of scale free network to random failures are discussed from the viewpoint of entropy maximization. We defined equilibrium network ensemble as stationary ensembles of graphs by using some thermodynamics like notions such as ”energy”, ”temperature”, ”free energy” for network. In the forth part, an union-division model is established to investigate the time evolution of certain networks like cultural or economical networks. In this model, the nodes represent, for example, the cultures. Several quantities such as richness, age, identity, ingredient etc. are used to parameterize the probabilistic evolution of the network. The model offers a long term view on the apparently periodic dynamics of an ensemble of cultural or economic entities in interaction.
|
260 |
Méthodes non-paramétriques pour l'apprentissage et la détection de dissimilarité statistique multivariée / Nonparametric methods for learning and detecting multivariate statistical dissimilarityLhéritier, Alix 23 November 2015 (has links)
Cette thèse présente trois contributions en lien avec l'apprentissage et la détection de dissimilarité statistique multivariée, problématique d'importance primordiale pour de nombreuses méthodes d'apprentissage utilisées dans un nombre croissant de domaines. La première contribution introduit la notion de taille d'effet multivariée non-paramétrique, éclairant la nature de la dissimilarité détectée entre deux jeux de données, en deux étapes. La première consiste en une décomposition d'une mesure de dissimilarité (divergence de Jensen-Shannon) visant à la localiser dans l'espace ambiant, tandis que la seconde génère un résultat facilement interprétable en termes de grappes de points de forte discrépance et en proximité spatiale. La seconde contribution présente le premier test non-paramétrique d'homogénéité séquentiel, traitant les données issues de deux jeux une à une--au lieu de considérer ceux-ci- in extenso. Le test peut ainsi être arrêté dès qu'une évidence suffisamment forte est observée, offrant une flexibilité accrue tout en garantissant un contrôle del'erreur de type I. Sous certaines conditions, nous établissons aussi que le test a asymptotiquement une probabilité d'erreur de type II tendant vers zéro. La troisième contribution consiste en un test de détection de changement séquentiel basé sur deux fenêtres glissantes sur lesquelles un test d'homogénéité est effectué, avec des garanties sur l'erreur de type I. Notre test a une empreinte mémoire contrôlée et, contrairement à des méthodes de l'état de l'art qui ont aussi un contrôle sur l'erreur de type I, a une complexité en temps constante par observation, le rendant adapté aux flux de données. / In this thesis, we study problems related to learning and detecting multivariate statistical dissimilarity, which are of paramount importance for many statistical learning methods nowadays used in an increasingly number of fields. This thesis makes three contributions related to these problems. The first contribution introduces a notion of multivariate nonparametric effect size shedding light on the nature of the dissimilarity detected between two datasets. Our two step method first decomposes a dissimilarity measure (Jensen-Shannon divergence) aiming at localizing the dissimilarity in the data embedding space, and then proceeds by aggregating points of high discrepancy and in spatial proximity into clusters. The second contribution presents the first sequential nonparametric two-sample test. That is, instead of being given two sets of observations of fixed size, observations can be treated one at a time and, when strongly enough evidence has been found, the test can be stopped, yielding a more flexible procedure while keeping guaranteed type I error control. Additionally, under certain conditions, when the number of observations tends to infinity, the test has a vanishing probability of type II error. The third contribution consists in a sequential change detection test based on two sliding windows on which a two-sample test is performed, with type I error guarantees. Our test has controlled memory footprint and, as opposed to state-of-the-art methods that also provide type I error control, has constant time complexity per observation, which makes our test suitable for streaming data.
|
Page generated in 0.0566 seconds