Global ETD Search

201	Approche bayésienne de l'estimation des composantes périodiques des signaux en chronobiologie / A Bayesian approach for periodic components estimation for chronobiological signals Dumitru, Mircea 25 March 2016 (has links) La toxicité et l’efficacité de plus de 30 agents anticancéreux présentent de très fortes variations en fonction du temps de dosage. Par conséquent, les biologistes qui étudient le rythme circadien ont besoin d’une méthode très précise pour estimer le vecteur de composantes périodiques (CP) de signaux chronobiologiques. En outre, dans les développements récents, non seulement la période dominante ou le vecteur de CP présentent un intérêt crucial, mais aussi leurs stabilités ou variabilités. Dans les expériences effectuées en traitement du cancer, les signaux enregistrés correspondant à différentes phases de traitement sont courts, de sept jours pour le segment de synchronisation jusqu’à deux ou trois jours pour le segment après traitement. Lorsqu’on étudie la stabilité de la période dominante nous devons considérer des signaux très court par rapport à la connaissance a priori de la période dominante, placée dans le domaine circadien. Les approches classiques fondées sur la transformée de Fourier (TF) sont inefficaces (i.e. manque de précision) compte tenu de la particularité des données (i.e. la courte longueur). Dans cette thèse, nous proposons une nouvelle méthode pour l’estimation du vecteur de CP des signaux biomédicaux, en utilisant les informations biologiques a priori et en considérant un modèle qui représente le bruit. Les signaux enregistrés dans le cadre d’expériences développées pour le traitement du cancer ont un nombre limité de périodes. Cette information a priori peut être traduite comme la parcimonie du vecteur de CP. La méthode proposée considère l’estimation de vecteur de CP comme un problème inverse enutilisant l’inférence bayésienne générale afin de déduire toutes les inconnues de notre modèle, à savoir le vecteur de CP mais aussi les hyperparamètres (i.e. les variances associées). / The toxicity and efficacy of more than 30 anticancer agents presents very high variations, depending on the dosing time. Therefore the biologists studying the circadian rhythm require a very precise method for estimating the Periodic Components (PC) vector of chronobiological signals. Moreover, in recent developments not only the dominant period or the PC vector present a crucial interest, but also their stability or variability. In cancer treatment experiments the recorded signals corresponding to different phases of treatment are short, from seven days for the synchronization segment to two or three days for the after treatment segment. When studying the stability of the dominant period we have to consider very short length signals relative to the prior knowledge of the dominant period, placed in the circadian domain. The classical approaches, based on Fourier Transform (FT) methods are inefficient (i.e. lack of precision) considering the particularities of the data (i.e. the short length). In this thesis we propose a new method for the estimation of the PC vector of biomedical signals, using the biological prior informations and considering a model that accounts for the noise. The experiments developed in the cancer treatment context are recording signals expressing a limited number of periods. This is a prior information that can be translated as the sparsity of the PC vector. The proposed method considers the PC vector estimation as an Inverse Problem (IP) using the general Bayesian inference in order to infer all the unknowns of our model, i.e. the PC vector but also the hyperparameters. Approches bayésiennes Renforcement de parcimonie Chronobiologie Modèle hiérarchique Estimation de composantes périodiques Problèmes inverses Bayesian approach Sparsity enforcing Chronobiology Hierarchical model Periodic Components vector estimation Inverse problem
202	Utilisation de la technologie mobile pour réduire l’autostimulation : validation des algorithmes décisionnels du iSTIM Préfontaine, Isabelle 05 1900 (has links) No description available. Accès noncontingent Application mobile Autisme Autostimulation iSTIM Renforcement différentiel App Autism Differential reinforcement Noncontingent access Stereotypy
203	Échantillonnage et inférence dans réseaux complexes / Sampling and inference in complex networks Kazhuthuveettil Sreedharan, Jithin 02 December 2016 (has links) L’émergence récente de grands réseaux, surtout réseaux sociaux en ligne (OSN), a révélé la difficulté de crawler le réseau complet et a déclenché le développement de nouvelles techniques distribuées. Dans cette thèse, nous concevons et analysons des algorithmes basés sur les marches aléatoires et la diffusion pour l'échantillonnage, l'estimation et l'inférence des fonctions des réseaux. La thèse commence par le problème classique de trouver les valeurs propres dominants et leurs vecteurs propres de matrices de graphe symétriques, comme la matrice Laplacienne de graphes non orientés. En utilisant le fait que le spectre est associé à une équation de type différentiel Schrödinger, nous développons des techniques évolutives à l’aide de la diffusion sur le graphe. Ensuite, nous considérons l’échantillonnage des fonctions de réseau (comme somme et moyenne) en utilisant les marches aléatoires sur le graphe. Afin d'éviter le temps «burn-in» de marche aléatoire, avec l'idée de régénération à un nœud fixe, nous développons un estimateur de la fonction de somme qui est non asymptotiquement non-biaisé et dérivons une approximation à la postérieure Bayésienne. La dernière partie de la thèse étudie l'application de la théorie des valeurs extrêmes pour faire une inférence sur les événements extrêmes à partir des échantillons stationnaires des différentes marches aléatoires pour l’échantillonnage de réseau / The recent emergence of large networks, mainly due to the rise of online social networks, brought out the difficulty to gather a complete picture of a network and it prompted the development of new distributed techniques. In this thesis, we design and analyze algorithms based on random walks and diffusion for sampling, estimation and inference of the network functions, and for approximating the spectrum of graph matrices. The thesis starts with the classical problem of finding the dominant eigenvalues and the eigenvectors of symmetric graph matrices like Laplacian of undirected graphs. Using the fact that the eigenspectrum is associated with a Schrödinger-type differential equation, we develop scalable techniques with diffusion over the graph and with gossiping algorithms. They are also adaptable to a simple algorithm based on quantum computing. Next, we consider sampling and estimation of network functions (sum and average) using random walks on graph. In order to avoid the burn-in time of random walks, with the idea of regeneration at its revisits to a fixed node, we develop an estimator for the aggregate function which is non-asymptotically unbiased and derive an approximation to its Bayesian posterior. An estimator based on reinforcement learning is also developed making use of regeneration. The final part of the thesis deals with the use of extreme value theory to make inference from the stationary samples of the random walks. Extremal events such as first hitting time of a large degree node, order statistics and mean cluster size are well captured in the parameter “extremal index”. We theoretically study and estimate extremal index of different random walk sampling techniques Échantillonnage de réseau Marches aléatoires sur le graphique Apprentissage par renforcement Théorie des valeurs extrêmes Network sampling Random walks on graph Reinforcement learning Extreme value theory
204	Représentations graphiques de fonctions et processus décisionnels Markoviens factorisés . / Graphical representations of functions and factored Markovian decision processes Magnan, Jean-Christophe 02 February 2016 (has links) En planification théorique de la décision, le cadre des Processus Décisionnels Markoviens Factorisés (Factored Markov Decision Process, FMDP) a produit des algorithmes efficaces de résolution des problèmes de décisions séquentielles dans l'incertain. L'efficacité de ces algorithmes repose sur des structures de données telles que les Arbres de Décision ou les Diagrammes de Décision Algébriques (ADDs). Ces techniques de planification sont utilisées en Apprentissage par Renforcement par l'architecture SDYNA afin de résoudre des problèmes inconnus de grandes tailles. Toutefois, l'état-de-l'art des algorithmes d'apprentissage, de programmation dynamique et d'apprentissage par renforcement utilisés par SDYNA, requière que le problème soit spécifié uniquement à l'aide de variables binaires et/ou utilise des structures améliorables en termes de compacité. Dans ce manuscrit, nous présentons nos travaux de recherche visant à élaborer et à utiliser une structure de donnée plus efficace et moins contraignante, et à l'intégrer dans une nouvelle instance de l'architecture SDYNA. Dans une première partie, nous présentons l'état-de-l'art de la modélisation de problèmes de décisions séquentielles dans l'incertain à l'aide de FMDP. Nous abordons en détail la modélisation à l'aide d'DT et d'ADDs.Puis nous présentons les ORFGs, nouvelle structure de données que nous proposons dans cette thèse pour résoudre les problèmes inhérents aux ADDs. Nous démontrons ainsi que les ORFGs s'avèrent plus efficaces que les ADDs pour modéliser les problèmes de grandes tailles. Dans une seconde partie, nous nous intéressons à la résolution des problèmes de décision dans l'incertain par Programmation Dynamique. Après avoir introduit les principaux algorithmes de résolution, nous nous attardons sur leurs variantes dans le domaine factorisé. Nous précisons les points de ces variantes factorisées qui sont améliorables. Nous décrivons alors une nouvelle version de ces algorithmes qui améliore ces aspects et utilise les ORFGs précédemment introduits. Dans une dernière partie, nous abordons l'utilisation des FMDPs en Apprentissage par Renforcement. Puis nous présentons un nouvel algorithme d'apprentissage dédié à la nouvelle structure que nous proposons. Grâce à ce nouvel algorithme, une nouvelle instance de l'architecture SDYNA est proposée, se basant sur les ORFGs ~:~l'instance SPIMDDI. Nous testons son efficacité sur quelques problèmes standards de la littérature. Enfin nous présentons quelques travaux de recherche autour de cette nouvelle instance. Nous évoquons d'abord un nouvel algorithme de gestion du compromis exploration-exploitation destiné à simplifier l'algorithme F-RMax. Puis nous détaillons une application de l'instance SPIMDDI à la gestion d'unités dans un jeu vidéo de stratégie en temps réel. / In decision theoretic planning, the factored framework (Factored Markovian Decision Process, FMDP) has produced several efficient algorithms in order to resolve large sequential decision making under uncertainty problems. The efficiency of this algorithms relies on data structures such as decision trees or algebraïc decision diagrams (ADDs). These planification technics are exploited in Reinforcement Learning by the architecture SDyna in order to resolve large and unknown problems. However, state-of-the-art learning and planning algorithms used in SDyna require the problem to be specified uniquely using binary variables and/or to use improvable data structure in term of compactness. In this book, we present our research works that seek to elaborate and to use a new data structure more efficient and less restrictive, and to integrate it in a new instance of the SDyna architecture. In a first part, we present the state-of-the-art modeling tools used in the algorithms that tackle large sequential decision making under uncertainty problems. We detail the modeling using decision trees and ADDs. Then we introduce the Ordered and Reduced Graphical Representation of Function, a new data structure that we propose in this thesis to deal with the various problems concerning the ADDs. We demonstrate that ORGRFs improve on ADDs to model large problems. In a second part, we go over the resolution of large sequential decision under uncertainty problems using Dynamic Programming. After the introduction of the main algorithms, we see in details the factored alternative. We indicate the improvable points of these factored versions. We describe our new algorithm that improve on these points and exploit the ORGRFs previously introduced. In a last part, we speak about the use of FMDPs in Reinforcement Learning. Then we introduce a new algorithm to learn the new datastrcture we propose. Thanks to this new algorithm, a new instance of the SDyna architecture is proposed, based on the ORGRFs : the SPIMDDI instance. We test its efficiency on several standard problems from the litterature. Finally, we present some works around this new instance. We detail a new algorithm for efficient exploration-exploitation compromise management, aiming to simplify F-RMax. Then we speak about an application of SPIMDDI to the managements of units in a strategic real time video game. Représentation graphique de fonction Apprentissage par renforcement Programmation dynamique Apprentissage des données Factored Markovian Decision Process Graphical function representation Reinforcement Learning 004
205	Des comportements flexibles aux comportements habituels : meta-apprentissage neuro-inspiré pour la robotique autonome / From flexible to habitual behaviors : neuro-inspired meta-learning for autonomous robots Renaudo, Erwan 06 June 2016 (has links) Dans cette thèse, nous proposons d'intégrer la notion d'habitude comportementale au sein d'une architecture de contrôle robotique, et d'étudier son interaction avec les mécanismes générant le comportement planifié. Les architectures de contrôle robotiques permettent à ce dernier d'être utilisé efficacement dans le monde réel et au robot de rester réactif aux changements dans son environnement, tout en étant capable de prendre des décisions pour accomplir des buts à long terme (Kortenkamp et Simmons, 2008). Or, ces architectures sont rarement dotées de capacités d'apprentissage leur permettant d'intégrer les expériences précédentes du robot. En neurosciences et en psychologie, l'étude des différents types d'apprentissage montre pour que ces derniers sont une capacité essentielle pour adapter le comportement des mammifères à des contextes changeants, mais également pour exploiter au mieux les contextes stables (Dickinson, 1985). Ces apprentissages sont modélisés par des algorithmes d'apprentissage par renforcement direct et indirect (Sutton et Barto, 1998), combinés pour exploiter leurs propriétés au mieux en fonction du contexte (Daw et al., 2005). Nous montrons que l'architecture proposée, qui s'inspire de ces modèles du comportement, améliore la robustesse de la performance lors d'un changement de contexte dans une tâche simulée. Si aucune des méthodes de combinaison évaluées ne se démarque des autres, elles permettent d'identifier les contraintes sur le processus de planification. Enfin, l'extension de l'étude de notre architecture à deux tâches (dont l'une sur robot réel) confirme que la combinaison permet l'amélioration de l'apprentissage du robot. / In this work, we study how the notion of behavioral habit, inspired from the study of biology, can benefit to robots. Robot control architectures allow the robot to be able to plan to reach long term goals while staying reactive to events happening in the environment (Kortenkamp et Simmons, 2008). However, these architectures are rarely provided with learning capabilities that would allow them to acquire knowledge from experience. On the other hand, learning has been shown as an essential abiilty for behavioral adaptation in mammals. It permits flexible adaptation to new contexts but also efficient behavior in known contexts (Dickinson, 1985). The learning mechanisms are modeled as model-based (planning) and model-free (habitual) reinforcement learning algorithms (Sutton et Barto, 1998) which are combined into a global model of behavior (Daw et al., 2005). We proposed a robotic control architecture that take inspiration from this model of behavior and embed the two kinds of algorithms, and studied its performance in a robotic simulated task. None of the several methods for combining the algorithm we studied gave satisfying results, however, it allowed to identify some properties required for the planning process in a robotic task. We extended our study to two other tasks (one being on a real robot) and confirmed that combining the algorithms improves learning of the robot's behavior. Robotique autonome Architecture de contrôle robotique Robotique bio-Inspirée Apprentissage par renforcement Comportement instrumental Sélection de l'action Reinforcement learning Autonomous robots Robot control architectures 629.89
206	Alert correlation towards an efficient response decision support / Corrélation d’alertes : un outil plus efficace d’aide à la décision pour répondre aux intrusions Ben Mustapha, Yosra 30 April 2015 (has links) Les SIEMs (systèmes pour la Sécurité de l’Information et la Gestion des Événements) sont les cœurs des centres opérationnels de la sécurité. Ils corrèlent un nombre important d’événements en provenance de différents capteurs (anti-virus, pare-feux, systèmes de détection d’intrusion, etc), et offrent des vues synthétiques pour la gestion des menaces ainsi que des rapports de sécurité. La gestion et l’analyse de ce grand nombre d’alertes est une tâche difficile pour l’administrateur de sécurité. La corrélation d’alertes a été conçue afin de remédier à ce problème. Des solutions de corrélation ont été développées pour obtenir une vue plus concise des alertes générées et une meilleure description de l’attaque détectée. Elles permettent de réduire considérablement le volume des alertes remontées afin de soutenir l’administrateur dans le traitement de ce grand nombre d’alertes. Malheureusement, ces techniques ne prennent pas en compte les connaissances sur le comportement de l’attaquant, les fonctionnalités de l’application et le périmètre de défense du réseau supervisé (pare-feu, serveurs mandataires, Systèmes de détection d’intrusions, etc). Dans cette thèse, nous proposons deux nouvelles approches de corrélation d’alertes. La première approche que nous appelons corrélation d’alertes basée sur les pots de miel utilise des connaissances sur les attaquants recueillies par le biais des pots de miel. La deuxième approche de corrélation est basée sur une modélisation des points d’application de politique de sécurité / Security Information and Event Management (SIEM) systems provide the security analysts with a huge amount of alerts. Managing and analyzing such tremendous number of alerts is a challenging task for the security administrator. Alert correlation has been designed in order to alleviate this problem. Current alert correlation techniques provide the security administrator with a better description of the detected attack and a more concise view of the generated alerts. That way, it usually reduces the volume of alerts in order to support the administrator in tackling the amount of generated alerts. Unfortunately, none of these techniques consider neither the knowledge about the attacker’s behavior nor the enforcement functionalities and the defense perimeter of the protected network (Firewalls, Proxies, Intrusion Detection Systems, etc). It is still challenging to first improve the knowledge about the attacker and second to identify the policy enforcement mechanisms that are capable to process generated alerts. Several authors have proposed different alert correlation methods and techniques. Although these approaches support the administrator in processing the huge number of generated alerts, they remain limited since these solutions do not provide us with more information about the attackers’ behavior and the defender’s capability in reacting to detected attacks. In this dissertation, we propose two novel alert correlation approaches. The first approach, which we call honeypot-based alert correlation, is based on the use of knowledge about attackers collected through honeypots. The second approach, which we call enforcement-based alert correlation, is based on a policy enforcement and defender capabilities’ model Corrélation d'alertes Aide à la décision Pots de miels Renforcement de politique de sécurité Systèmes de détection d'intrusions Réponses aux intrusions Alert correlation Decision support Honeypots Security policy enforcement Detection systems Responses to intrusions
207	Effects of TiB2 nanoparticles on the interfacial precipitation and mechanical properties of Al-Zn-Mg-Cu matrix composites / Effet de nanoparticules TiB2 sur la précipitation interfaciale et les propriétés mécaniques des composites à matrice de Al-Zn-Mg-Cu Ma, Yu 19 September 2019 (has links) L’influence des renforts nanoparticules de TiB2 (6 wt.%) sur la précipitation interfaciale de la phase (Zn1.5Cu0.5)Mg, la résistance à la traction et la fissuration sous chargement de fatigue (fatigue crack growth-FCG) des composites à matrice de Al-Zn-Mg-Cu ont été étudiées. Des échantillons de composites ont été obtenus par réaction in-situ pendant le moulage suivi d’un FSP (friction stir processing) et une extrusion à chaud. Seuls les échantillons moulés et extrudés ont été utilisés pour étude de FCG à cause de la limitation de la taille après FSP. Des observations au microscope électronique à balayage (SEM), avec la diffraction des électrons rétrodiffusés (SEM/EBSD) et au microscope électronique en transmission à haute résolution (HRSTEM) ont été réalisées pour caractériser la microstructure.Des échantillons présentent une structure des grains équi-axiaux et des nanoparticules de TiB2 sont distribuées de façon homogène dans la matrice. En état de solution solide, l’interface TiB2/Al est de nature semi-cohérente et très propre. En état de vieillissementou ou sur vieillissement, la précipitation interfacaile hétérogène de la phase (Zn1.5Cu0.5)Mg a été observée. La cinétique de la précipitation interfaciale a été discutée. Les interfaces entre Al/(Zn1.5Cu0.5)Mg/TiB2 sont quasi cohérentes et l’interface TiB2/Al a été renforcée grâce à la réduction de l’énergie de l’interface. Ce mécanisme de précipitation interfaciale peut expliquer l’effet de renforcement de l’interface contribuant simultanement l’augmentation de la résistance et de l’élongation des échatillons de composite.La majorité de nanoparticules TiB2 tentent de s’agglomérer le long des joints de grains dans des échantillons sans FSP. La vitesse de croissance de fissure a été augmentée à l’intérieur des grains avec un facteur d’intensité (ΔK) intermédiaire ou important à cause de l’affinement de grains. Cependant, la vitesse de croissance de fissure a été diminuée aux joints de grains avec (ΔK) faible ou intermédiaire à cause de la présence des clusters de TiB2 tandis que cette vitesse augmente avec (ΔK) important à cause de la coalescence des micropores. / The influences of TiB2 reinforcement nanoparticles (6 wt.%) on the interfacial precipitation of (Zn1.5Cu0.5)Mg phase, the associated tensile and fatigue crack growth (FCG) properties of the Al-Zn-Mg-Cu matrix composites have been studied. The composite samples were produced by in-situ reaction during casting followed by friction stir processing (FSP) and hot extrusion, while only casted and extruded samples were used for evaluating FCG due to size limit of the nugget zone after FSP. Scanning electron microscopy (SEM), electron backscatter diffraction (EBSD) and high-resolution scanning transmission electron microscopy (HRSTEM) were employed for the microstructure characterization.The as-processed composite samples contain the fine equiaxed-grain structure, where TiB2 nanoparticles are homogenously distributed. At solid-solution state, the TiB2/Al interfaces are featured by the clean and semi-coherent nature. At the peak-aged and overaged states, the interface precipitate determined as (Zn1.5Cu0.5)Mg phase was formed, and the underlying heterogeneous interfacial precipitation kinetics was discussed. The Al/(Zn1.5Cu0.5)Mg/TiB2 multi-interfaces were revealed to be almost coherent, and the TiB2/Al interfaces were thus strengthened due to the greatly reduced coherency strains. This mechanism was proposed as precipitation assisted interface strengthening, which has contributed to the simultaneously enhanced tensile strength and uniform elongation of the as-processed composite.The majority of TiB2 nanoparticles tend to aggregate along grain boundaries (GBs) in the composite samples without FSP. The FCG rate is increased inside grains at intermediate and high stress intensity factor (ΔK) ranges due to the refined grain size. However, the FCG rate at the GBs is decreased at the low and intermediate ΔK ranges by fatigue crack deflection and trapping due to the presence of TiB2 clusters, while it increases at the high ΔK range due to microvoid coalescence. Alliage d’aluminium Composite à matrice métallique Nanoparticules Précipitation interfaciale Renforcement de l’interface Fissuration sous chargement de fatigue Aluminum alloy Metal matrix composites Nanoparticles Interface precipitation Interface strengthening Fatigue crack growth
208	Allocation de ressources et association utilisateur/cellule optimisées pour les futurs réseaux denses / Optimized resource allocation and user/cell association for future dense networks Ha, Duc Thang 30 September 2019 (has links) Depuis plusieurs années, les opérateurs de téléphonie mobile sont confrontés à une croissance considérable du trafic de données mobiles. Dans un tel contexte, la technologie Cloud Radio Access Network (CRAN) qui intègre les solutions de Cloud Computing aux réseaux d’accès radio est considérée comme une nouvelle architecture pour les futures générations de réseaux 5G. L’approche CRAN permet une optimisation globale des fonctions de traitement en bande de base du signal et de la gestion des ressources radio pour l’ensemble des RRH et des utilisateurs. Parallèlement, les réseaux hétérogènes (HetNets) ont été proposés pour augmenter efficacement la capacité et la couverture du réseau 5G tout en réduisant la consommation énergétique. En combinant les avantages du Cloud avec ceux des réseaux HetNets, le concept de réseaux H-CRAN (Heterogeneous Cloud Radio Access Networks) est né et est considéré comme l’une des architectures les plus prometteuses pour répondre aux exigences des futurs systèmes. Plus particulièrement, nous abordons le problème important de l’optimisation jointe de l’association utilisateur-RRH et de la solution de beamforming sur la liaison descendante d’un système H-CRAN. Nous formulons un problème de maximisation du débit total du système sous des contraintes de mobilité et d’imperfection de CSI (Channel State Information). Notre principal défi consiste à concevoir une solution capable de maximiser le débit tout en permettant, contrairement aux autres solutions de référence, de réduire la complexité de calcul, et les coûts de signalisation et de feedback CSI dans divers environnements. Notre étude commence par proposer un algorithme Hybride, qui active périodiquement des schémas de clustering dynamiques et statiques pour aboutir à un compromis satisfaisant entre optimalité et le coût en complexité et signalisation CSI et réassociation. L’originalité de l’algorithme Hybride réside aussi dans sa prise en compte de la dimension temporelle du processus d’allocation sur plusieurs trames successives plutôt que son optimalité (ou sous-optimalité) pour la seule trame d’ordonnancement courante. De plus, nous développons une analyse des coûts de l’algorithme en fonction de plusieurs critères afin de mieux appréhender le compromis entre les nombreux paramètres impliqués. La deuxième contribution de la thèse s’intéresse au problème sous la perspective de la mobilité utilisateur. Deux variantes améliorées de l’algorithme Hybride sont proposées : ABUC (Adaptive Beamforming et User Clustering), une version adaptée à la mobilité des utilisateurs et aux variations du canal radio, et MABUC (Mobility-Aware Beamforming et User Clustering), une version améliorée qui règle dynamiquement les paramètres de feedback du CSI (périodicité et type de CSI) en fonction de la vitesse de l’utilisateur. L’algorithme MABUC offre de très bonnes performances en termes de débit cible tout en réduisant efficacement la complexité et les coûts de signalisation CSI. Dans la dernière contribution de la thèse, nous approfondissons l’étude en explorant l’optimisation automatique des paramètres d’ordonnancement du CSI. Pour ce faire, nous exploitons l’outil de l’apprentissage par renforcement afin d’optimiser les paramètres de feedback CSI en fonction du profil de mobilité individuelle des utilisateurs. Plus spécifiquement, nous proposons deux modèles d’apprentissage. Le premier modèle basé sur un algorithme de type Q-learning a permis de démontrer l’efficacité de l’approche dans un scénario à taille réduite. Le second modèle, plus scalable car basé sur une approche Deep Q-learning, a été formulé sous la forme d’un processus de type POMDP (Partially observable Markov decision process). Les résultats montrent l’efficacité des solutions qui permettent de sélectionner les paramètres de feedback les plus adaptés à chaque profil de mobilité, même dans le cas complexe où chaque utilisateur possède un profil de mobilité différent et variable dans le temps. / Recently, mobile operators have been challenged by a tremendous growth in mobile data traffic. In such a context, Cloud Radio Access Network (CRAN) has been considered as a novel architecture for future wireless networks. The radio frequency signals from geographically distributed antennas are collected by Remote Radio Heads (RRHs) and transmitted to the cloud-centralized Baseband Units (BBUs) pool through fronthaul links. This centralized architecture enables a global optimization of joint baseband signal processing and radio resource management functions for all RRHs and users. At the same time, Heterogeneous Networks (HetNets) have emerged as another core feature for 5G network to enhance the capacity/coverage while saving energy consumption. Small cells deployment helps to shorten the wireless links to end-users and thereby improving the link quality in terms of spectrum efficiency (SE) as well as energy efficiency (EE). Therefore, combining both cloud computing and HetNet advantages results in the so-called Heterogeneous-Cloud Radio Access Networks (H-CRAN) which is regarded as one of the most promising network architectures to meet 5G and beyond system requirements. In this context, we address the crucial issue of beamforming and user-to-RRH association (user clustering) in the downlink of H-CRANs. We formulate this problem as a sum-rate maximization problem under the assumption of mobility and CSI (Channel State Information) imperfectness. Our main challenge is to design a framework that can achieve sum-rate maximization while, unlike other traditional reference solutions, being able to alleviate the computational complexity, CSI feedback and reassociation signaling costs under various mobility environments. Such gain helps in reducing the control and feedback overhead and in turn improve the uplink throughput. Our study begins by proposing a simple yet effective algorithm baptized Hybrid algorithm that periodically activates dynamic and static clustering schemes to balance between the optimality of the beamforming and association solutions while being aware of practical system constraints (complexity and signaling overhead). Hybrid algorithm considers time dimension of the allocation and scheduling process rather than its optimality (or suboptimality) for the sole current scheduling frame. Moreover, we provide a cost analysis of the algorithm in terms of several parameters to better comprehend the trade-off among the numerous dimensions involved in the allocation process. The second key contribution of our thesis is to tackle the beamforming and clustering problem from a mobility perspective. Two enhanced variants of the Hybrid algorithm are proposed: ABUC (Adaptve Beamforming and User Clustering), a mobility-aware version that is fit to the distinctive features of channel variations, and MABUC (Mobility-Aware Beamforming and User Clustering), an advanced version of the algorithm that tunes dynamically the feedback scheduling parameters (CSI feedback type and periodicity) in accordance with individual user velocity. MABUC algorithm achieves a targeted sum-rate performance while supporting the complexity and CSI signaling costs to a minimum. In our last contribution, we propose to go further in the optimization of the CSI feedback scheduling parameters. To do so, we take leverage of reinforcement learning (RL) tool to optimize on-the-fly the feedback scheduling parameters according to each user mobility profile. More specifically, we propose two RL models, one based on Q-learning and a second based on Deep Q-learning algorithm formulated as a POMDP (Partially observable Markov decision process). Simulation results show the effectiveness of our proposed framework, as it enables to select the best feedback parameters tailored to each user mobility profile, even in the difficult case where each user has a different mobility profile. H-CRAN Formation de faisceau Association utilisateur à cellule CSI imparfait Mobilité Apprentissage par renforcement H-CRAN Beamforming User-to-cell association Imperfect CSI Mobility Reinforcement learning
209	Projets d'infrastructure, conflits d'usages des terres et impacts socio-économiques : Etude du projet de barrage Diamer Bhasha, au Pakistan / Infrastructural Projects, Land Use Conflicts and Socioeconomic Impacts Nexus : A Case Study of Diamer Bhasha Dam Project, Pakistan Sabir, Muazzam 22 February 2018 (has links) Les changements d’usage des terres à des fins de développement s'accompagnent toujours de conflits entre les différentes parties prenantes, en particulier dans le cadre de la construction ou de l'expansion de projets de développement dans les pays en voie de développement. C’est le cas des projets d'infrastructure comme les barrages hydrauliques et de leurs conséquences à la fois positives et négatives. Dans ces projets les conflits émergent en raison des problèmes liés aux attentes foncières, ainsi qu’aux intérêts divergents des différentes parties prenantes. En fonction de leur intensité, ils apparaissent alors sous différentes formes, avec des impacts importants sur les populations locales.La thèse traite des conflits qui surgissent entre les différents acteurs liés au projet de construction du barrage Diamer Bhasha au Pakistan, ainsi de leurs impacts socioéconomiques sur les personnes affectées. Ce projet a commencé à faire face à des oppositions concernant les acquisitions de terres et provoqué des manifestations, des actions en justice, le blocage des routes et des menaces à l’égard des promoteurs du projet.Afin d'analyser les conflits et d'évaluer les impacts socioéconomiques du projet, nous avons utilisé différentes sources de données primaires et secondaires. 61 entretiens ont ainsi été réalisés avec des experts et des parties prenantes appartenant à différents domaines.De plus, 289 articles de différents quotidiens nationaux et régionaux concernant les conflits et les impacts socioéconomiques du barrage ont été étudiés afin de vérifier et de corroborer ces informations. En outre, certains documents publiés par des organisations, publiques et privées, ont également été consultés. Les résultats révèlent différents conflits entre les personnes affectées et le Gouvernement, ainsi qu’entre différents groupes locaux d’acteurs, au sujet des compensations foncières et des droits de propriété. L’étude met en évidence les problèmes posés par le projet au niveau socio‐économiques, qui concernent en particulier un plan de réinstallation inefficace et la perte massive d'emplois. En outre, il explore les causes profondes des conflits, dues à la mauvaise planification, la mauvaise gouvernance, la mauvaise gestion, la corruption et le népotisme dans les différentes activités du projet. L’absence de participation de toutes les parties prenantes et la diffusion inexistante de l'information sur les activités du projet, sont également de très importantes sources de conflits entre les différents acteurs. Enfin, le travail présente des mesures de politiques et des recommandations pour une meilleure gouvernance, en termes de renforcement des capacités des populations locales dans différents domaines et de participation de toutes les parties prenantes à l’ensemble des composantes du projet. / Land use change for the purpose of development always comes with conflicts among different stakeholders, especially under the construction or expansion of developmental projects in developing countries. Thus, infrastructural projects like dams have both positive and negative consequences in this regard. The conflicts in such projects emerge with view of issues associated with the superposition of land expectation, as well as different stakeholders' interests. They appear in different forms, depending upon their intensity, with severe impacts on local people. The article deals with conflicts arising among different actors and their socioeconomic impacts on affected people, due to construction of Diamer Bhasha Dam project in Pakistan. This project started facing opposition from land acquisition and encouraged protestations, legal action in court, road blockage, threatening the project contractor, and violation.In order to analyze the conflicts and to assess the socioeconomic impacts of the project, we used both primary and secondary data sources. About 61 interviews with experts and stakeholders of different backgrounds were conducted.Moreover, under the secondary source about 289 articles from different national and regional dailies on conflicts and socioeconomics impacts of the Dam were studied in order to cross check the information. Further, some literature published by public and private organizations was also consulted.Preliminary results show different conflicts between affected people and Government and also among different groups of locally affected people, over land compensations and property rights. This study further highlights the socioeconomic issues of the project in the form of ineffective resettlement plan and loss of employment opportunities. It further, explores the root causes of conflicts, due to poor planning and governance, mismanagement, corruption and cronyism in different project activities. Lack of participation of all stakeholders and proper information dissemination about all project activities are also main source of conflicts among different actors. Finally, it provides policy measures and recommendations for better governance in the form of capacity building of local people in different areas and participation of all stakeholders in all project activities. Projet d'infrastructure Conflits Impacts socio-Économiques Impacts environnementaux Participation du public Renforcement des capacités Infrastructure Project Conflicts Socioeconomic Impacts Environmental impacts Public Participation Capacity Building 627.123
210	Stratégies tarifaires en assurance automobile : optimisation et expérimentation / Pricing strategies in motor insurance : optimization and experiments Bou Nader, Rami 07 December 2016 (has links) Le secteur de l'assurance automobile est confronté à plusieurs bouleversements règlementaires, financiers, comportementaux et technologiques. Afin de faire face aux défis résultant de ces changements et maintenir leur profitabilité, les assureurs doivent innover en matière de tarification. Dans ce contexte, nous développons dans cette thèse deux thématiques liées à la tarification en assurance automobile. La première thématique s'articule autour de l'optimisation des stratégies tarifaires, en souscription et au renouvellement. La deuxième thématique est orientée vers l'utilisation des expérimentations dans l'objectif de mieux appréhender les déterminants de la demande d'assurance.Tout d'abord, nous nous intéressons à l'optimisation tarifaire au renouvellement. Nous illustrons comment les modèles de demande empiriques reposant sur les données dont disposent l'assureur peuvent être utilisés afin d'optimiser sa rentabilité et la rétention de ses clients. Nous élargissons ensuite le cadre d'optimisation en tenant compte des dépendances inter-temporelles entre les décisions tarifaires actuelles et les profits générés au cours des périodes ultérieures. Ainsi, nous introduisons le cadre de Valeur Client qui permet à l'assureur d'adapter sa stratégie tarifaire en fonction des comportements des assurés au cours de leur vie client tout en tenant compte du cycle du marché. Les illustrations empiriques des deux premiers chapitres reposent sur des données naturelles observées par l'assureur.Dans la deuxième partie de la thèse, nous illustrons l'apport des expérimentions de terrain et de laboratoire à la compréhension de la demande d'assurance automobile. Une expérimentation de terrain nous permet d'affiner la mesure de l'élasticité prix des clients et de traiter le problème de tarification comme un problème de bandit contextuel. L'évaluation offline de plusieurs stratégies d'apprentissage par renforcement montre que celles appliquant une expérimentation tarifaire ciblée obtiennent de meilleures performances financières en comparaison à la stratégie myope, qui exclut toute possibilité d'expérimentation. Enfin, nous présentons les résultats d'une expérimentation de laboratoire dont l'objectif était de mesurer la valeur ajoutée des variables privées issues des modèles de décision dans le risque. En particulier, nous analysons le rôle de l'aversion au risque et la perception du risque dans l'explication des choix d'assurance automobile. La même expérimentation nous a permis d'analyser la validité externe en assurance expérimentale, c'est-à-dire la ressemblance des comportements des individus dans un contexte expérimental et dans le contexte économique réel du marché.En plus de la dualité expérimentation-optimisation dans le domaine de la tarification assurantielle, cette thèse illustre donc la dualité entre les données privées et les données publiques, ainsi que la dualité entre les modèles empiriques de demande d'assurance et les modèles théoriques. / The motor insurance sector currently confronts regulatory, financial, behavioral and technological challenges. Under these circumstances, insurers must uphold in improving their pricing strategies. Two topics related to pricing innovation are discussed in this thesis. We first take up the pricing strategy optimization for new businesses, as well as the renewals. Secondly, we highlight in the usage of experiments in leading us to a better understanding of insurance demand factors.On the first part of this thesis, we address pricing optimization at renewal, then illustrate how empirical demand models that rely on observable data could help the insurers to boost their profits and clients retention rate. We extend afterwards this framework by considering the impact of current pricing decisions on future cash-flows. Consequently, we introduce the Customer Value metric which allows insurers to reflect over the customers' behavior during their lifetime, when it comes to constructing their pricing strategy. The empirical illustrations of the first two chapters rely on natural data observed by the insurer.On the second part of this thesis, field and laboratory experiments will give us better comprehension of the motor insurance demand. Data from a field experiment refine the measure of clients' price elasticity. Offline assessment of several reinforcement learning algorithms shows how pricing experiments can achieve better performances compared with the myopic strategy which does not apply any kind of experiment. Laboratory experiments contribute to the understanding of demand models as well. In particular, we analyze the added value of risk aversion and risk perception in explaining the insurance choices. Furthermore, we examine the external validity of the experiment, i.e. the similarity between the behaviors of the customers in a lab environment versus their factual behaviors in the market.Aside from the duality between experiments and optimization, this thesis also illustrates the duality between private and public data, as well as the duality between empirical and theoretical insurance demand model. Assurance automobile Optimisation tarifaire Valeur Client Apprentissage par renforcement Assurance comportementale Validité externe Motor insurance Pricing optimization Customer Value Reinforcment learning Behavioural insurance External validity

Search results