• Refine Query
  • Source
  • Publication year
  • to
  • Language
  • 68
  • 44
  • 5
  • 3
  • Tagged with
  • 107
  • 107
  • 36
  • 34
  • 34
  • 25
  • 22
  • 22
  • 22
  • 18
  • 18
  • 16
  • 15
  • 14
  • 13
  • About
  • The Global ETD Search service is a free service for researchers to find electronic theses and dissertations. This service is provided by the Networked Digital Library of Theses and Dissertations.
    Our metadata is collected from universities around the world. If you manage a university/consortium/country archive and want to be added, details can be found on the NDLTD website.
11

Filtrage non linéaire par convolution de particule. Application à un procédé de dépollution biologique

Rossi, Vivien 04 December 2004 (has links) (PDF)
Cette thèse considère le problème du filtrage non linéaire, c'est à dire l'estimation au cours du temps de l'état, indirectement observé, d'un système dynamique non linéaire. Ce type de problématique concerne une large gamme de modèles relatifs à divers domaines scientifiques.<br />Une approche originale utilisant les noyaux de convolution et des simulations d'un grand nombre de variables aléatoires est développée. Le cas des modèles contenant des paramètres inconnus à estimer est aussi traité. Des propriétés théoriques de convergence sont établies pour ces nouvelles approches.<br />Afin de compléter l'étude de nos techniques, des comparaisons avec les méthodes traditionnelles, notamment avec les différents filtres particulaires, sont réalisées en simulation.<br />Puis nos nouvelles approches sont appliquées sur un problème réel, un bioréacteur de retraitement d'eaux usées. Les performances obtenues, sur données réelles, permettent d'apprécier la robustesse de la méthode par rapport aux erreurs de modèles et aux données de mauvaises qualités.
12

Estimation non-paramétrique des quantiles extrêmes conditionnels

Lekina, Alexandre 13 October 2010 (has links) (PDF)
L'objectif de ce travail est de proposer de nouveaux estimateurs de quantiles extrêmes dans le cadre conditionnel c'est-à-dire dans la situation où la variable d'intérêt Y, supposée aléatoire et réelle, est mesurée simultanément avec une covariable X. Pour ce faire, nous nous intéressons à l'étude des valeurs extrêmes d'un échantillon d'observations indépendantes dont la loi conditionnelle de Y en un point x de la covariable X est à " queue lourde ". Selon la nature de la covariable, nous considérons deux situations. Primo, lorsque la covariable est déterministe et de dimension finie ou infinie (i.e covariable fonctionnelle), nous proposons d'estimer les quantiles extrêmes par la méthode dite de la " fenêtre mobile ". La loi limite des estimateurs ainsi construits est ensuite donnée en fonction de la vitesse de convergence de l'ordre du quantile vers un. Secundo, lorsque la covariable est aléatoire et de dimension finie, nous montrons que sous certaines conditions, il est possible d'estimer les quantiles extrêmes conditionnels au moyen d'un estimateur à " noyau " de la fonction de survie conditionnelle. Ce résultat nous permet d'introduire deux versions lisses de l'estimateur de l'indice de queue conditionnel indispensable lorsque l'on veut extrapoler. Nous établissons la loi asymptotique de ces estimateurs. Par ailleurs, nous considérons le cas sans covariable (non conditionnel) lorsque la fonction de répartition est à " queue lourde ". Nous proposons et étudions un nouvel estimateur des quantiles extrêmes. Afin d'apprécier le comportement de nos nouveaux outils statistiques, des résultats sur simulation ainsi que sur des données réelles sont présentés.
13

Détection Statistique de Rupture de Modèle dans les Systèmes Dynamiques - Application à la Supervision de Procédés de Dépollution Biologique

Verdier, Ghislain 30 November 2007 (has links) (PDF)
Cette thèse considère le problème de la détection de rupture de modèle dans des systèmes dynamiques complexes. L'objectif est de mettre au point des méthodes statistiques capables de détecter le plus rapidement possible un changement de paramètre dans le modèle décrivant le système, tout en gardant un faible taux de fausses alarmes. Ce type de méthode s'applique à la détection d'anomalie ou de défaillance sur de nombreux systèmes (système de navigation, contrôle de qualité...).<br />Les méthodes développées ici prennent en compte les caractéristiques des procédés de dépollution biologique, qui constituent l'application principale de ce travail. Ainsi, la mise au point d'une procédure, de type CUSUM, construite à partir des estimations des vraisemblances conditionnelles permet de traiter, d'une part, le cas où une partie du modèle est inconnue en utilisant une approche non paramétrique pour estimer cette partie, et d'autre part, le cas fréquemment rencontré en pratique où le système est observé indirectement. Pour ce deuxième cas, des approches de type filtrage particulaire sont utilisées.<br />Des résultats d'optimalité sont établies pour les approches proposées. Ces approches sont ensuite appliquées à un problème réel, un bioréacteur de retraitement des eaux usées.
14

Inférence statistique par des transformées de Fourier pour des modèles de régression semi-paramétriques

Vimond, Myriam 12 July 2007 (has links) (PDF)
Dans cette thèse, nous étudions des modèles semi-paramétriques dits de forme invariante. Ces modèles consistent en l'observation d'un nombre fixés de fonctions de régression identiques à un opérateur de déformation paramétriques près. Ce type de modèles trouve des applications dans les problèmes d'alignement de signaux continus (images 2D, rythmes biologiques, ...) ou discrets (electroencéphalogramme, ...). Pour différents groupes de déformations, nous proposons des M-estimateurs pour les paramètres caractérisant les opérateurs associés aux fonctions de régression. Ces estimateurs minimisent ou maximisent des fonctions de contraste, construites à partir de la moyenne synchronisée des transformées de Fourier des données. De plus, pour l'un des modèles étudiés, nous prouvons l'efficacité semi-paramétrique de cet estimateur ainsi défini, et nous proposons un test d'adéquation du modèle de forme invariante construit à partir d'une des fonctions de contraste.
15

Modèles de croissance de plantes et méthodologies adaptées à leur paramétrisation pour l'analyse des phénotypes / Plant growth models and methodologies adapted to their parameterization for the analysis of phenotypes

Kang, Fenni 28 May 2013 (has links)
Les modèles de croissance de plantes cherchent à décrire la croissance de la plante en interaction avec son environnement. Idéalement, les paramètres du modèle ainsi défini doivent être stables pour une large gamme de conditions environnementales, et caractéristiques d'un génotype donné. Ils offrent ainsi des nouveaux outils d'analyse des interactions génotype X environnement et permettent d'envisager de nouvelles voies dans le processus d'amélioration génétique chez les semenciers. Malgré tout, la construction de ces modèles et leur paramétrisation restent un challenge, en particulier à cause du coût d'acquisition des données expérimentales. Dans ce contexte, le premier apport de cette thèse concerne l'étude de modèles de croissance. Pour le tournesol (Helianthus annuus L.), il s'agit du modèle SUNFLO [Lecoeur et al., 2011]. Il simule la phénologie de la plante, sa morphogenèse, sa photosynthèse, sous les contraintes de stress abiotiques. Une amélioration de ce modèle a été proposée : il s'agit du modèle SUNLAB, implémentant dans le modèle SUNFLO les fonctions d'allocation de biomasse aux organes, en utilisant les concepts sources puits du modèle GREENLAB [De Reffye et Hu, 2003]. Pour le maïs (Zea mays L.), le modèle CORNFLO, basé sur les mêmes principes que SUNFLO a également été étudié. Ces modèles permettent la différenciation entre génotypes. D'autre part, afin de paramétrer ces modèles, une méthodologie originale est conçue, adaptée au contexte de l'amélioration variétale chez les semenciers : la méthode MSPE (\multi-scenario parameter estimation") qui utilise un nombre restreint de traits expérimentaux mais dans un grand nombre de configurations environnementales pour l'estimation paramétrique par inversion de modèles. Les questions d'identifiabilité, d'analyse de sensibilité, et du choix des méthodes d'optimisation sont discutées. L'influence du nombre de scénarios sur la capacité de prévision du modèle, ainsi que sur l'erreur d'estimation est également étudiée. Enfin, il est démontré que le choix des scénarios dans des classes environnementales différentes (définies par des méthodes de classification - clustering) permet d'optimiser le processus expérimental pour la paramétrisation du modèle, en réduisant le nombre de scénarios nécessaires. / Plant growth models aim at describing the interaction between the growth of plants and their environment. Ideally, model parameters are designed to be stable for a wide range of environmental conditions, and thus to allow characterizing genotypes. They offer new tools to analyze the genotype X environment interaction and they open new perspectives in the process of genetic improvement. Nevertheless, the construction of these models and their parameterization remain a challenge, in particular because of the cost of experimental data collection. In this context, the first contribution of this thesis concerns the study of plant growth models. For sunower (Helianthus annuus L.), the model SUNFLO [Lecoeur et al., 2011] is considered. It simulates the plant phenology, morphogenesis and photosynthesis under abiotic stresses. An extension of this model is proposed: this new SUNLAB model adapts into SUNFLO a module of biomass allocation to organs, using the source-sink concepts inspired by the GREENLAB model [De Reffye and Hu, 2003]. For maize (Zea mays L.), the CORNFLO model, based on the same principles as SUNFLO, was also studied. These models helps discriminating genotypes and analyzing their performances. On the other hand, in order to parameterize these models, an original methodology is designed, adapted to the context of plant variety improvement by breeders. The MSPE methodology (\multi-scenario parameter estimation") uses a limited number of experimental traits but in a large number of environmental configurations for the parameter estimation by model inversion. Issues including identifiability, sensitivity analysis, and the choice of optimization methods are discussed. The influences of environmental scenarios amount on the model predictive ability and on estimation error are also studied. Finally, it is demonstrated that selecting scenarios in different environmental classes (obtained by data clustering methods) allows to optimize the multi-scenario parameter estimation performances, by reducing the required number of scenarios.
16

Conditional quantile estimation through optimal quantization / Estimation de quantiles conditionnels basée sur la quantification optimale

Charlier, Isabelle 17 December 2015 (has links)
Les applications les plus courantes des méthodes non paramétriques concernent l’estimation d’une fonction de régression (i.e. de l’espérance conditionnelle). Cependant, il est souvent intéressant de modéliser les quantiles conditionnels, en particulier lorsque la moyenne conditionnelle ne permet pas de représenter convenablement l’impact des covariables sur la variable dépendante. De plus, ils permettent d’obtenir des graphiques plus compréhensibles de la distribution conditionnelle de la variable dépendante que ceux obtenus avec la moyenne conditionnelle. À l’origine, la « quantification » était utilisée en ingénierie du signal et de l’information. Elle permet de discrétiser un signal continu en un nombre fini de quantifieurs. En mathématique, le problème de la quantification optimale consiste à trouver la meilleure approximation d’une distribution continue d’une variable aléatoire par une loi discrète avec un nombre fixé de quantifieurs. Initialement utilisée pour des signaux univariés, la méthode a été étendue au cadre multivarié et est devenue un outil pour résoudre certains problèmes en probabilités numériques. Le but de cette thèse est d’appliquer la quantification optimale en norme Lp à l’estimation des quantiles conditionnels. Différents cas sont abordés : covariable uni- ou multidimensionnelle, variable dépendante uni- ou multivariée. La convergence des estimateurs proposés est étudiée d’un point de vue théorique. Ces estimateurs ont été implémentés et un package R, nommé QuantifQuantile, a été développé. Leur comportement numérique est évalué sur des simulations et des données réelles. / One of the most common applications of nonparametric techniques has been the estimation of a regression function (i.e. a conditional mean). However it is often of interest to model conditional quantiles, particularly when it is felt that the conditional mean is not representative of the impact of the covariates on the dependent variable. Moreover, the quantile regression function provides a much more comprehensive picture of the conditional distribution of a dependent variable than the conditional mean function. Originally, the “quantization” was used in signal and information theories since the fifties. Quantization was devoted to the discretization of a continuous signal by a finite number of “quantizers”. In mathematics, the problem of optimal quantization is to find the best approximation of the continuous distribution of a random variable by a discrete law with a fixed number of charged points. Firstly used for a one-dimensional signal, the method has then been developed in the multi-dimensional case and extensively used as a tool to solve problems arising in numerical probability. The goal of this thesis is to study how to apply optimal quantization in Lp-norm to conditional quantile estimation. Various cases are studied: one-dimensional or multidimensional covariate, univariate or multivariate dependent variable. The convergence of the proposed estimators is studied from a theoretical point of view. The proposed estimators were implemented and a R package, called QuantifQuantile, was developed. Numerical behavior of the estimators is evaluated through simulation studies and real data applications.
17

Modélisation de la dépendance pour des statistiques d'ordre et estimation non-paramétrique. / Modelling the dependence of order statistics and nonparametric estimation.

Fischer, Richard 30 September 2016 (has links)
Dans cette thèse, on considère la modélisation de la loi jointe des statistiques d'ordre, c.à.d. des vecteurs aléatoires avec des composantes ordonnées presque sûrement. La première partie est dédiée à la modélisation probabiliste des statistiques d'ordre d'entropie maximale à marginales fixées. Les marginales étant fixées, la caractérisation de la loi jointe revient à considérer la copule associée. Dans le Chapitre 2, on présente un résultat auxiliaire sur les copules d'entropie maximale à diagonale fixée. Une condition nécessaire et suffisante est donnée pour l'existence d'une telle copule, ainsi qu'une formule explicite de sa densité et de son entropie. La solution du problème de maximisation d'entropie pour les statistiques d'ordre à marginales fixées est présentée dans le Chapitre 3. On donne des formules explicites pour sa copule et sa densité jointe. On applique le modèle obtenu pour modéliser des paramètres physiques dans le Chapitre 4.Dans la deuxième partie de la thèse, on étudie le problème d'estimation non-paramétrique des densités d'entropie maximale des statistiques d'ordre en distance de Kullback-Leibler. Le chapitre 5 décrit une méthode d'agrégation pour des densités de probabilité et des densités spectrales, basée sur une combinaison convexe de ses logarithmes, et montre des bornes optimales non-asymptotiques en déviation. Dans le Chapitre 6, on propose une méthode adaptative issue d'un modèle exponentiel log-additif pour estimer les densités considérées, et on démontre qu'elle atteint les vitesses connues minimax. L'application de cette méthode pour estimer des dimensions des défauts est présentée dans le Chapitre 7 / In this thesis we consider the modelling of the joint distribution of order statistics, i.e. random vectors with almost surely ordered components. The first part is dedicated to the probabilistic modelling of order statistics of maximal entropy with marginal constraints. Given the marginal constraints, the characterization of the joint distribution can be given by the associated copula. Chapter 2 presents an auxiliary result giving the maximum entropy copula with a fixed diagonal section. We give a necessary and sufficient condition for its existence, and derive an explicit formula for its density and entropy. Chapter 3 provides the solution for the maximum entropy problem for order statistics with marginal constraints by identifying the copula of the maximum entropy distribution. We give explicit formulas for the copula and the joint density. An application for modelling physical parameters is given in Chapter 4.In the second part of the thesis, we consider the problem of nonparametric estimation of maximum entropy densities of order statistics in Kullback-Leibler distance. Chapter 5 presents an aggregation method for probability density and spectral density estimation, based on the convex combination of the logarithms of these functions, and gives non-asymptotic bounds on the aggregation rate. In Chapter 6, we propose an adaptive estimation method based on a log-additive exponential model to estimate maximum entropy densities of order statistics which achieves the known minimax convergence rates. The method is applied to estimating flaw dimensions in Chapter 7
18

Deux problèmes d’estimation statistique pour les processus stochastiques / Two problems of statistical estimation for stochastic processes

Gasparyan, Samvel 12 December 2016 (has links)
Le travail est consacré aux questions de la statistique des processus stochastiques. Particulièrement, on considère deux problèmes d'estimation. Le premier chapitre se concentre sur le problème d'estimation non-paramétrique pour le processus de Poisson non-homogène. On estime la fonction moyenne de ce processus, donc le problème est dans le domaine d'estimation non-paramétrique. On commence par la définition de l'efficacité asymptotique dans les problèmes non-paramétriques et on procède à exploration de l'existence des estimateurs asymptotiquement efficaces. On prend en considération la classe des estimateurs à noyau. Dans la thèse il est démontré que sous les conditions sur les coefficients du noyau par rapport à une base trigonométrique, on a l'efficacité asymptotique dans le sens minimax sur les ensembles divers. Les résultats obtenus soulignent le phénomène qu'en imposant des conditions de régularité sur la fonction inconnue, on peut élargir la classe des estimateurs asymptotiquement efficaces. Pour comparer les estimateurs asymptotiquement efficaces (du premier ordre), on démontre une inégalité qui nous permet de trouver un estimateur qui est asymptotiquement efficace du second ordre. On calcule aussi la vitesse de convergence pour cet estimateur, qui dépend de la régularité de la fonction inconnue et finalement on calcule la valeur minimale de la variance asymptotique pour cet estimateur. Cette valeur joue le même rôle dans l'estimation du second ordre que la constantede Pinsker dans le problème d'estimation de la densité ou encore l'information de Fisher dans les problèmes d'estimation paramétrique.Le deuxième chapitre est dédié au problème de l’estimation de la solution d’une équation différentielle stochastique rétrograde (EDSR). On observe un processus de diffusion qui est donnée par son équation différentielle stochastique dont le coefficient de la diffusion dépend d’un paramètre inconnu. Les observations sont discrètes. Pour estimer la solution de l’EDSR on a besoin d’un estimateur-processus pour leparamètre, qui, chaque instant n’utilise que la partie des observations disponible. Dans la littérature il existe une méthode de construction, qui minimise une fonctionnelle. On ne pouvait pas utiliser cet estimateur, car le calcul serait irréalisable. Dans le travail nous avons proposé un estimateur-processus qui a la forme simple et peut être facilement calculé. Cet estimateur-processus est un estimateur asymptotiquementefficace et en utilisant cet estimateur on estime la solution de l’EDSR de manière efficace aussi. / This work is devoted to the questions of the statistics of stochastic processes. Particularly, the first chapter is devoted to a non-parametric estimation problem for an inhomogeneous Poisson process. The estimation problem is non-parametric due to the fact that we estimate the mean function. We start with the definition of the asymptotic efficiency in non-parametric estimation problems and continue with examination of the existence of asymptotically efficient estimators. We consider a class of kernel-type estimators. In the thesis we prove that under some conditions on the coefficients of the kernel with respect to a trigonometric basis we have asymptotic efficiency in minimax sense over various sets. The obtained results highlight the phenomenon that imposing regularity conditions on the unknown function, we can widen the class ofasymptotically efficient estimators. To compare these (first order) efficient estimators, we prove an inequality which allows us to find an estimator which is asymptotically efficient of second order. We calculate also the rate of convergence of this estimator, which depends on the regularity of the unknown function, and finally the minimal value of the asymptotic variance for this estimator is calculated. This value plays the same role in the second order estimation as the Pinsker constant in the density estimation problem or the Fisher information in parametric estimation problems. The second chapter is dedicated to a problem of estimation of the solution of a Backward Stochastic Differential Equation (BSDE). We observe a diffusion process which is given by its stochastic differential equation with the diffusion coefficientdepending on an unknown parameter. The observations are discrete. To estimate the solution of a BSDE, we need an estimator-process for a parameter, which, for each given time, uses only the available part of observations. In the literature there exists a method of construction, which minimizes a functional. We could not use this estimator, because the calculations would not be feasible. We propose an estimator-process which has a simple form and can be easily computed. Using this estimator we estimate the solution of a BSDE in an asymptotically efficient way.
19

Quelques propriétés asymptotiques en estimation non paramétrique de fonctionnelles de processus stationnaires en temps continu / Some asymptotic properties for nonparametric estimation of functional of stationary continuous time processes

Didi, Sultana 15 September 2014 (has links)
Les travaux de cette thèse portent sur les problèmes d’estimation non paramétrique des fonctions de densité, de régression et du mode conditionnel associés à des processus stationnaires à temps continu. La motivation essentielle est d’établir des propriétés asymptotiques tout en considérant un cadre de dépendance des données assez général qui puisse être facilement utilisé en pratique. Cette contribution se compose de quatre parties. La première partie est consacrée à l’état de l’art relatif à la problématique qui situe bien notre contribution dans la littérature. Dans le deuxième partie, nous nous intéressons à l’estimation, par la méthode du noyau, de la densité pour laquelle nous établissons des résultats de convergence presque sûre, ponctuelle et uniforme, avec des vitesses de convergence. Dans les parties suivantes, les données sont supposées stationnaires et ergodiques. Dans la troisième partie, des propriétés asymptotiques similaires sont établies pour l’estimation à noyau de la fonction de régression. Dans le même esprit, nous étudions dans la quatrième partie, l’estimation à noyau de la fonction mode conditionnel pour lequel nous établissons des propriétés de consistance avec des vitesses de convergence. L’estimateur proposé ici se positionne comme une alternative à celui de la fonction de régression dans les problèmes de prévision. / The work of this thesis focuses upon some nonparametric estimation problems. More precisely, considering kernel estimators of the density, the regression and the conditional mode functions associated to a stationary continuous-time process, we aim at establishing some asymptotic properties while taking a sufficiently general dependency framework for the data as to be easily used in practice. The present manuscript includes four parts. The first one gives the state of the art related to the field of our concern and identifies well our contribution as compared to the existing results in the literature. In the second part, we focus on the kernel density estimation. In a rather general dependency setting, where we use a martingale difference device and a technique based on a sequence of projections on -fields, we establish the almost sure pointwise and uniform consistencies with rates of our estimate. In the third part, similar asymptotic properties are established for the kernel estimator of the regression function. Here and below, the processes are assumed to be ergodic In the same spirit, we study in the fourth part, the kernel estimate of conditional mode function for which we establish consistency properties with rates of convergence. The proposed estimator may be viewed as an alternative in the prediction issues to the usual regression function.
20

Apprentissage et forêts aléatoires / Learning with random forests

Scornet, Erwan 30 November 2015 (has links)
Cette thèse est consacrée aux forêts aléatoires, une méthode d'apprentissage non paramétrique introduite par Breiman en 2001. Très répandues dans le monde des applications, les forêts aléatoires possèdent de bonnes performances et permettent de traiter efficacement de grands volumes de données. Cependant, la théorie des forêts ne permet pas d'expliquer à ce jour l'ensemble des bonnes propriétés de l'algorithme. Après avoir dressé un état de l'art des résultats théoriques existants, nous nous intéressons en premier lieu au lien entre les forêts infinies (analysées en théorie) et les forêts finies (utilisées en pratique). Nous proposons en particulier une manière de choisir le nombre d'arbres pour que les erreurs des forêts finies et infinies soient proches. D'autre part, nous étudions les forêts quantiles, un type d'algorithme proche des forêts de Breiman. Dans ce cadre, nous démontrons l'intérêt d'agréger des arbres : même si chaque arbre de la forêt quantile est inconsistant, grâce à un sous-échantillonnage adapté, la forêt quantile est consistante. Dans un deuxième temps, nous prouvons que les forêts aléatoires sont naturellement liées à des estimateurs à noyau que nous explicitons. Des bornes sur la vitesse de convergence de ces estimateurs sont également établies. Nous démontrons, dans une troisième approche, deux théorèmes sur la consistance des forêts de Breiman élaguées et complètement développées. Dans ce dernier cas, nous soulignons, comme pour les forêts quantiles, l'importance du sous-échantillonnage dans la consistance de la forêt. Enfin, nous présentons un travail indépendant portant sur l'estimation de la toxicité de certains composés chimiques. / This is devoted to a nonparametric estimation method called random forests, introduced by Breiman in 2001. Extensively used in a variety of areas, random forests exhibit good empirical performance and can handle massive data sets. However, the mathematical forces driving the algorithm remain largely unknown. After reviewing theoretical literature, we focus on the link between infinite forests (theoretically analyzed) and finite forests (used in practice) aiming at narrowing the gap between theory and practice. In particular, we propose a way to select the number of trees such that the errors of finite and infinite forests are similar. On the other hand, we study quantile forests, a type of algorithms close in spirit to Breiman's forests. In this context, we prove the benefit of trees aggregation: while each tree of quantile forest is not consistent, with a proper subsampling step, the forest is. Next, we show the connection between forests and some particular kernel estimates, which can be made explicit in some cases. We also establish upper bounds on the rate of convergence for these kernel estimates. Then we demonstrate two theorems on the consistency of both pruned and unpruned Breiman forests. We stress the importance of subsampling to demonstrate the consistency of the unpruned Breiman's forests. At last, we present the results of a Dreamchallenge whose goal was to predict the toxicity of several compounds for several patients based on their genetic profile.

Page generated in 0.4978 seconds