Return to search

Interacting stochastic systems with individual and collective reinforcement / Systèmes stochastiques en interaction avec des renforcements individuels et collectifs

L'urne de Polya est l'exemple typique de processus stochastique avec renforcement. La limite presque sûre (p.s.) en temps existe, est aléatoire et non dégénérée. L'urne de Friedman est une généralisation naturelle dont la limite (proportion asymptotique en temps) n'est plus aléatoire. De nombreux modèles aléatoires sont fondés sur des processus de renforcement comme pour la conception d'essais cliniques au design adaptatif, en économie, ou pour des algorithmes stochastiques à des fins d'optimisation ou d'estimation non paramétrique. Dans ce mémoire, inspirés par de nombreux articles récents, nous introduisons une nouvelle famille de systèmes (finis) de processus de renforcement où l'interaction se traduit par un phénomène de renforcement collectif additif, de type champ moyen. Les deux taux de renforcement (l'un spécifique à chaque composante, l'autre collectif et commun à toutes les composantes) sont possiblement différents. Nous prouvons deux types de résultats mathématiques. Différents régimes de paramètres doivent être considérés : type de la règle (brièvement, Polya/Friedman), taux du renforcement. Nous prouvons l'existence d'une limite p.s. coommune à toutes les composantes du système (synchronisation). La nature de la limite (aléatoire/déterministe) est étudiée en fonction du régime de paramètres. Nous étudions également les fluctuations en prouvant des théorèmes centraux de la limite. Les changements d'échelle varient en fonction du régime considéré. Différentes vitesses de convergence sont ainsi établies. / The Polya urn is the paradigmatic example of a reinforced stochastic process. It leads to a random (non degenerated) almost sure (a.s.) time-limit.The Friedman urn is a natural generalization whose a.s. time-limit is not random anymore. Many stochastic models for applications are based on reinforced processes, like urns with their use in adaptive design for clinical trials or economy, stochastic algorithms with their use in non parametric estimation or optimisation. In this work, in the stream of previous recent works, we introduce a new family of (finite) systems of reinforced stochastic processes, interacting through an additional collective reinforcement of mean field type. The two reinforcement rules strengths (one componentwise, one collective) are tuned through (possibly) different rates. In the case the reinforcement rates are like 1/n, these reinforcements are of Polya or Friedman type as in urn contexts and may thus lead to limits which may be random or not. We state two kind of mathematical results. Different parameter regimes needs to be considered: type of reinforcement rule (Polya/Friedman), strength of the reinforcement. We study the time-asymptotics and prove that a.s. convergence always holds. Moreover all the components share the same time-limit (synchronization). The nature of the limit (random/deterministic) according to the parameters' regime is considered. We then study fluctuations by proving central limit theorems. Scaling coefficients vary according to the regime considered. This gives insights into the different rates of convergence.

Identiferoai:union.ndltd.org:theses.fr/2019POIT2274
Date05 September 2019
CreatorsMirebrahimi, Seyedmeghdad
ContributorsPoitiers, Louis, Pierre-Yves
Source SetsDépôt national des thèses électroniques françaises
LanguageEnglish
Detected LanguageFrench
TypeElectronic Thesis or Dissertation, Text, Image, StillImage

Page generated in 0.0018 seconds