Global ETD Search

41	Commande optimale (en Production et Stock) de Systèmes Assemble-To-Order (ATO) avec prise en compte de demandes en composants individuels Li, Zhi 03 September 2013 (has links) (PDF) Les systèmes assemble-to-order (ATO) peuvent être considérés comme une affectation de ressources multiples qui induit planification de production, satisfaction des contraintes et affectation des stocks. Les systèmes ATO représentent une stratégie de logistique populaire utilisée en gestion de fabrication. En raison de la complexité croissante des systèmes de fabrication d'aujourd'hui, le défi pour les systèmes ATO est de gérer efficacement les stocks de composants et de trouver les décisions optimales de production et d'affectation.Nous étudions un système ATO avec un produit unique qui est assemblé à partir de plusieurs composants. Le système doit répondre à une demande non seulement du produit assemblé, mais aussi des composants individuels. Nous considérons le cas avec seulement des lost sales puis le cas mixte lost sales et backorders avec des temps de production suivant des lois de type exponentiel et une demande sous forme de loi de Poisson. Nous formulons le problème comme un Processus de décision markovien (MDP), et nous considérons deux critères d'optimalité qui sont le coût actualisé et le coût moyen par période. Nous caractérisons la structure de la politique optimale et étudions l'impact des différents paramètres du système sur cette politique. Nous présentons également plusieurs heuristiques pour le cas lost sales et le cas mixte lost sales et backorders. Ces heuristiques fournissent des méthodes simples, mais efficaces pour contrôler la production et l'affectation des stocks du système ATO [SPI:OTHER] Engineering Sciences/Other Systèmes assemble-to-order Contrôle optimal Processus de décision markovien Affectation de ressources multiples Planification Production au plus juste
42	Activités d'élaboration de normes et de contenus de formations professionnelles dans le champ aéronautique : rôle de l'hétérogénéité des décideurs, du sens du travail et des dynamiques de délibérations collectives Piques, Marie 20 December 2013 (has links) (PDF) Dans le contexte actuel d'évolution et de transformation du travail, notre recherche s'attache à comprendre et à expliquer de quelle manière des acteurs professionnels (individuels et collectifs), engagés dans la définition des politiques et des pratiques de formations professionnelles aéronautiques, parviennent, collectivement, à se mettre d'accord sur des normes et des contenus de programmes de formation. Cette recherche compare des activités de délibérations collectives de deux groupes professionnels (l'un à dimension nationale et l'autre à dimension locale) qui ont en charge la définition de nouveaux programmes et normes de formations techniques qualifiantes. Les membres de ces groupes (27 et 20 sujets) représentent des entreprises, des formateurs, responsables de lycées techniques, des Ministères compétents, des figures individuelles reconnues du secteur aéronautique au plan national. Au niveau méthodologique, dans une approche exploratoire compréhensive, nous avons observé et enregistré systématiquement les réunions de ces deux groupes durant une année. Nous avons aussi analysé les discours qui en découlent ainsi qu'effectué et examiné des entretiens semi-directifs et des questionnaires que nous avons construits. Dans une perspective systémique, active et plurielle de la socialisation, le modèle de l'interstructuration du sujet et des institutions (Baubion-Broye & Hajjar, 1998) auquel nous nous référons considère que les activités du sujet sont construites et signifiées par lui, tout au long de sa vie, et en interaction avec autrui. Nos résultats montrent, notamment, que les décideurs prennent majoritairement des décisions collectives par " consensus apparent " et qu'il y a un lien entre l'expression manifeste d'alliances et le degré de consensus. Les relations interpersonnelles évoluent au cours du temps. Dynamiques de groupe Processus de décision Sens du travail
43	Optimisation de vecteurs propres de Perron et applications : du référencement de pages web à la chronothérapie Fercoq, Olivier 17 September 2012 (has links) (PDF) Les moteurs de recherche jouent un rôle essentiel sur le Web. Ils rassemblent des informations sur les pages web et pour chaque requête d'un internaute, ils donnent une liste ordonnée de pages pertinentes. Ils utilisent divers algorithmes pour classer les pages en fonction de leur contenu textuel ou de la structure d'hyperlien du Web. Ici, nous nous concentrons sur les algorithmes qui utilisent cette structure d'hyperliens, comme le PageRank, HITS, SALSA et HOTS. La notion fondamentale pour tous ces algorithmes est le graphe du web. C'est le graphe orienté qui a un noeud pour chaque page web et un arc entre les noeuds i et j si il y a un hyperlien entre les pages i et j. Le problème original considéré dans cette thèse est l'optimisation du référencement des pages d'un site web donné. Il consiste à trouver une stratégie optimale de liens qui maximise une fonction scalaire d'un classement donné sous des contraintes de design. Le PageRank, HITS et SALSA classent les pages par un vecteur de Perron, c'est-à-dire qu'ils correspondent au vecteur propre principal d'une matrice à coefficients positifs. Quand on optimise le référencement, on optimise donc une fonction scalaire du vecteur propre de Perron sur un ensemble de matrices positives irréductibles. La matrice est construite à partir du graphe du web, donc commander les hyperliens revient à commander la matrice elle-même. Nous étudions d'abord un problème général d'optimisation du PageRank avec une fonction d'utilité correspondant au revenu total du site et des contraintes de design. Ce cas est d'un intérêt particulier car pour de nombreux sites la valeur du PageRank est corrélée au chiffre d'affaires. Nous avons réduit le problème d'optimisation du PageRank à des problèmes de décision markoviens dont les ensembles d'action sont définis implicitement comme étant les points extrêmes de polytopes qui ont un oracle de séparation polynomial. Nous montrons que de tels problèmes de décision markoviens sont solubles en temps polynomial et nous donnons un algorithme qui passe à l'échelle pour la résolution effective du problème d'optimisation du PageRank sur de grandes bases de données. Ensuite, nous étudions le problème général de l'optimisation d'une fonction scalaire du vecteur propre de Perron sur un ensemble de matrices positives irréductibles. Cela couvre tous les classements par vecteur de Perron, HITS et SALSA compris. Nous montrons que la matrice des dérivées partielles de la fonction objectif a un petit rang et peut être calculée par un algorithme qui a les mêmes propriétés de convergence que la méthode de la puissance utilisée pour calculer le classement. Nous donnons un algorithme d'optimisation qui couple les itérations puissance et gradient et nous prouvons sa convergence vers un point stationnaire du problème d'optimisation. En considérant HOTS comme un vecteur de Perron non linéaire, nous montrons que l'algorithme HOTS converge géométriquement et nous résolvons l'optimisation locale de HOTS. Finalement, nous étendons le domaine d'application des méthodes d'optimisation du vecteur propre et de la valeur propre de Perron à l'optimisation de la chimiothérapie, sous l'hypothèse que les cellules se comportent différemment suivant l'heure de la journée. Nous voulons profiter de cette caractéristique pour minimiser le taux de croissance des cellules cancéreuses tout en maintenant le taux de croissance des cellules saines au dessus d'un seuil de toxicité donné. L'objectif et la contrainte peuvent s'écrire comme les valeurs propres de Floquet de modèles d'EDP structurés en âge avec des coefficients périodiques, qui sont approchés par des valeurs propres de Perron dans le problème discrétisé. Nous cherchons des stratégies d'injection de médicament localement optimales par une méthode des multiplicateurs où les minimisations sans contrainte sont faites en utilisant l'algorithme couplant les itérations puissance et gradient développé dans le cadre de l'optimisation du référencement. optimisation PageRank processus de décision markoviens dynamiques de population problèmes de grande taille
44	Structuration des processus de décision : Le cas de la transfusion sanguine française (1950-1985) Mangin, François 01 January 2004 (has links) (PDF) Ce travail est issu d'une réflexion de nature théorique sur les modes de structuration des processus de décision et d'action au sein des organisations, et d'une interrogation concrète sur les processus à l'oeuvre dans le système français de la transfusion sanguine ayant conduit aux décisions de 1983-1985 qui ont fait l'objet de diverses procédures judiciaires (<< affaires du sang contaminé"). La réflexion théorique s'inscrit au confluent de l'analyse stratégique des organisations et de l'étude des processus de décision stratégique, et s'appuie sur le concept de paradigme stratégique de l'organisation. La recherche empirique se fonde sur une analyse historique très approfondie du réseau d'établissements de transfusion sanguine depuis la fin des années 1940 et de deux institutions importantes dans son environnement: l'Association française des hémophiles et le ministère de la Santé. Elle analyse aussi de façon très détaillée l'évolution des connaissances scientifiques sur les infections transmissibles par transfusion, et notamment les hépatites puis le sida. Les résultats font apparaître le caractère particulièrement structurant des paradigmes stratégiques du réseau transfusionnel (où l'autonomie stratégique, technique et financière de chaque établissement émerge à la fois comme une valeur cardinale et comme une contrainte) et de l'Association française des hémophiles et de ses médecins conseils (qui privilégient, à partir du milieu des années 1970, des modes thérapeutiques dont les risques sont constamment minimisés, notamment auprès des hémophiles), alors que le ministère de la Santé se concentre sur les problèmes de régulation d'un système sur lequel il ne parvient pas à avoir prise. Par rapport à une approche judiciaire ayant privilégié une lecture très individualiste des responsabilités, la recherche met en évidence le poids d'un contexte structurel qui détermine largement les stratégies des acteurs, et illustre la pertinence heuristique du concept de paradigme stratégique. Paradigme stratégique Processus de décision Transfusion sanguine Hémophilie Affaire du sang contaminé
45	Optimisation des systèmes de véhicules en libre service par la tarification / Vehicle Sharing System Pricing Optimization Waserhole, Ariel 18 November 2013 (has links) Nous étudions les systèmes de véhicules en libre service en aller-simple : avec emprunt et restitution dans des lieux éventuellement différents. La publicité promeut l'image de flexibilité et d'accessibilité (tarifaire) de tels systèmes, mais en réalité il arrive qu'il n'y ait pas de véhicule disponible au départ, voire pire, pas de place à l'arrivée. Il est envisageable (et pratiqué pour Vélib' à Paris) de relocaliser les véhicules pour éviter que certaines stations soient vides ou pleines à cause des marées ou de la gravitation. Notre parti-pris est cependant de ne pas considérer de ``relocalisation physique'' (à base de tournées de camions) en raison du coût, du trafic et de la pollution occasionnées (surtout pour des systèmes de voitures, comme Autolib' à Paris). La question à laquelle nous désirons répondre dans cette thèse est la suivante : Une gestion via des tarifs incitatifs permet-elle d'améliorer significativement les performances des systèmes de véhicules en libre service ? / One way Vehicle Sharing Systems (VSS), in which users pick-up and return a vehicle in different places is a new type of transportation system that presents many advantages. However, even if advertising promotes an image of flexibility and price accessibility, in reality customers might not find a vehicle at the original station (which may be considered as an infinite price), or worse, a parking spot at destination. Since the first Bike Sharing Systems (BSS), problems of vehicles and parking spots availability have appeared crucial. We define the system performance as the number of trips sold (to be maximized). BSS performance is currently improved by vehicle relocation with trucks. Our scope is to focus on self regulating systems through pricing incentives, avoiding physical station balancing. The question we are investigating in this thesis is the following: Can a management of the incentives increases significantly the performance of the vehicle sharing systems? Véhicules en libre service Politiques tarifaires Processus de décision markovien Réseau de files d'attentes Simulation Vehicle Sharing Systems Pricing policy Markov Decision Process Queuing networks Simulation 510 004
46	Analyse des formes d’adaptation au risque dans la construction en zones inondables en région parisienne : ce pour quoi l’on décide de donner des gages et ce que l’on choisit d’ignorer / Flood risk integration in the development of urban project in the Greater Paris : logics of action and decision Moulin, Elodie 21 July 2015 (has links) Cette recherche s'inscrit dans un contexte de fortes pressions foncières en Ile-de-France, de reconversion de friches industrielles et de « revalorisation » du principe de densification urbaine, qui conduisent à l'urbanisation en zones inondables. Cette thèse propose d'examiner le processus d'urbanisation en zones inondables au regard des transformations en cours dans les modes de fabrication urbaine. Aujourd'hui, l'élaboration des grands projets d'aménagement nécessite l'intervention d'une multitude d'acteurs, la production d'une expertise importante, l'intégration des incertitudes inhérentes à des projets qui se conçoivent et se réalisent sur dix, vingt ou trente ans et la nécessaire conception d'un processus de projet évolutif. Chercheurs et acteurs de l'aménagement qualifient ces processus de « projet urbain ».Nous testons l'hypothèse selon laquelle les transformations observées dans les modes d'élaboration des projets urbains peuvent créer une opportunité dans les modes d'intégration du risque inondation. Les acteurs du projet vont-ils se saisir différemment du risque en utilisant une expertise plus riche, en convoquant des acteurs du risque autour de l'élaboration du projet ? Notre recherche s'appuie sur l'analyse de l'élaboration du projet des Ardoines à Vitry-sur-Seine et de Parc-en-Seine à Villeneuve-le-Roi, complétée par l'observation d'autres projets urbains dans la métropole parisienne mais aussi en Allemagne. L'intégration du risque est, bien souvent, dans les cas étudiés en France dans cette recherche, réfléchie au travers du Plan de Prévention du Risque d'Inondation (PPRI). Elle n'engendre qu'à la marge des pratiques et des formes urbaines englobant plusieurs facettes de la gestion du risque (prévention, protection et gestion de crise). L'application de la règle à l'échelle du projet urbain se transforme ainsi en dispositif de construction de l'ignorance (Jouzel, Dedieu, 2013) quant à une gestion du risque globale, intégrant toutes ces actions. Lors de l'application de la règle, les coalitions d'acteurs (Sabatier, Jenkins-Smith, 1993), au sens de groupe d'acteurs qui vont se retrouver en ce qui concerne l'intégration du risque autour d'une idée commune qui va faire projet, vont être amenées à produire une expertise technique. Cette expertise va être essentiellement centrée sur la mise en sécurité des biens et des personnes et la transparence hydraulique et représente la pierre angulaire pour traduire la règle en formes urbaines (pilotis, rez-de-chaussée surélevés, etc.), gages du bon respect de la règle. La construction de l'ignorance, qui se traduit par une méconnaissance des impacts des aménagements sur le fonctionnement du quartier et de la ville en temps de crise, peut être partiellement comblée par la mise en place d'un Etablissement public d'aménagement. En effet, ce dernier va regrouper en son sein l'Etat, à la fois protecteur et aménageur. Les exemples de projets urbains allemands convoqués dans cette thèse montrent quant à eux une inversion des logiques d'intégration du risque. La suppression de tout principe d'interdiction d'urbanisation en zone inondable conduit à la production de nouvelles règles tant en ce qui concerne les formes urbaines (bâtiments étanches, voiries surélevées…) que les obligations relatives à l'alerte et à la gestion de crise. Une fois le projet urbain réalisé, l'habitant en prenant possession du projet urbain va être l'ultime témoin de la segmentation de la gestion du risque inondation. En effet, en recevant l'information de son exposition, il ne fait pas le lien avec ce qu'implique cette exposition, c'est-à-dire le rôle qu'il aura à jouer en cas de crue. Plus de communication aurait pour conséquence de reposer la question des responsabilités de chacun et de signaler que, malgré les moyens de protection et les aménagements pour réduire l'aléa dans le projet urbain, le risque demeure présent / This study is developed against a background of high estate pressure in the Ile-de-France region, of brownfield conversion and of increased urban densification. All these processes are leading to the land-use in floodrisk areas. The aim of this thesis is to analyse urbanisation process in floodrisk areas, with regard to the current transformations in urban design methods. Large urban development projects require the intervention of several stakeholders and significant expertise. Uncertainties in projects that are designed over ten, twenty or thirty years and the need to develop a progressive process have to be evaluated. Researchers and land-use stakeholders qualify this process of “urban project”. Our primary hypothesis was that the changes observed in urban project designs may challenge flood risk integration methods. Will the urban project stakeholders seize upon the risk integration in a different way using a more significant expertise and make risk management stakeholders play a part? Our analysis focus on two urban projects: les Ardoines in Vitry-sur-Seine and Parc-en-Seine in Villeneuve-le-Roi. Our study also integrates observation of other urban projects in the Greater Paris and in Germany. In our case studies in France, the risk is often analysed through the flood risk prevention plan. However, this will raise only marginally practices and urban forms related to prevention, protection and crisis management. Based on this concept it has been pro-posed that the application of the rule at the urban project scale is transformed into the construction of the ignorance process (Jouzel, Dedieu, 2013) concerning a global risk management, integrating all these actions. During the rule application, the advocacy coalitions (Sabatier, Jenkins-Smith, 1993) will find a common idea mainly focusing on ensuring the safety of goods and people and the hydraulic transparency. This expertise will be the most important piece to translate the rule in urban forms (stilts, raised ground floor, etc.) as a guarantee of good compliance with the rule. Construction of ignorance results in a lack of awareness of the impacts of development projects on the district and the city during flood periods. This process is partially filled in by a public development authority, which includes the two figures of the state, both protector and developer. They have for mission to develop and densify an area of three hundred hectares. The examples of German urban projects used in this thesis show a reversal of risk integration methods. The removal of any principle of prohibition of urbanization in flood-risk areas leads to the production of new rules in regard to urban forms (sealed buildings, elevated roads ...) and also the obligations relating to the warning and management crisis. In conclusion, our study has shown that once an urban project is completed, the in-habitants will be the ultimate witnesses to the segmentation of the flood risk management. Indeed, receiving information from risk exposure, does not integrate the implications of this exposure - that is to say the role it will have to play in case of flood. More communication would lead to raise the question of responsibilities of each party and would highlight that the risk remains despite protection tools Risque inondation Projets urbains Politique publique Processus de décision Ignorance Flood risk Risk prevention plan Urban projects Public policies Decision-Making processes Ignorance
47	Jeux stochastiques sur des graphes avec des applications à l’optimisation des smart-grids / Stochastic games on graphs with applications to smart-grids optimization GONZáLEZ GóMEZ, Mauricio 29 November 2019 (has links) Au sein de la communauté scientifique, l’étude des réseaux d’énergie suscite un vif intérêt puisque ces infrastructures deviennent de plus en plus importantes dans notre monde moderne. Des outils mathématiques avancés et complexes sont nécessaires afin de bien concevoir et mettre en œuvre ces réseaux. La précision et l’optimalité sont deux caractéristiques essentielles pour leur conception. Bien que ces deux aspects soient au cœur des méthodes formelles, leur application effective reste largement inexplorée aux réseaux d’énergie. Cela motive fortement le travail développé dans cette thèse. Un accent particulier est placé sur le problème général de planification de la consommation d'énergie. Il s'agit d'un scénario dans lequel les consommateurs ont besoin d’une certaine quantité d’énergie et souhaitent que cette demande soit satisfaite dans une période spécifique (e.g., un Véhicule Électrique (VE) doit être rechargé dans une fenêtre de temps définie par son propriétaire). Par conséquent, chaque consommateur doit choisir une puissance de consommation à chaque instant (par un système informatisé), afin que l'énergie finale accumulée atteigne un niveau souhaité. La manière dont les puissances sont choisies est obtenue par l’application d’une « stratégie » qui prend en compte à chaque instant les informations pertinentes d'un consommateur afin de choisir un niveau de consommation approprié (e.g., l’énergie accumulée pour recharge le VE). Les stratégies peuvent être conçues selon une approche centralisée (dans laquelle il n'y a qu'un seul décideur qui contrôle toutes les stratégies des consommateurs) ou décentralisée (dans laquelle il y a plusieurs contrôleurs, chacun représentant un consommateur). Nous analysons ces deux scénarios dans cette thèse en utilisant des méthodes formelles, la théorie des jeux et l’optimisation. Plus précisément, nous modélisons le problème de planification de la consommation d'énergie à l'aide des processus de décision de Markov et des jeux stochastiques. Par exemple, l’environnement du système électrique, à savoir : la partie non contrôlable de la consommation totale (e.g., la consommation hors VEs), peut être représentée par un modèle stochastique. La partie contrôlable de la consommation totale peut s’adapter aux contraintes du réseau de distribution (e.g., pour ne pas dépasser la température maximale d'arrêt du transformateur électrique) et à leurs objectifs (e.g., tous les VEs soient rechargés). Cela peut être vu comme un système stochastique avec des multi-objectifs sous contraintes. Par conséquent, cette thèse concerne également une contribution aux modèles avec des objectives multicritères, ce qui permet de poursuivre plusieurs objectifs à la fois et une conception des stratégies qui sont fonctionnellement correctes et robustes aux changements de l'environnement. / Within the research community, there is a great interest in exploring many applications of energy grids since these become more and more important in our modern world. To properly design and implement these networks, advanced and complex mathematical tools are necessary. Two key features for their design are correctness and optimality. While these last two properties are in the core of formal methods, their effective application to energy networks remains largely unexploited. This constitutes one strong motivation for the work developed in this thesis. A special emphasis is made on the generic problem of scheduling power consumption. This is a scenario in which the consumers have a certain energy demand and want to have this demand fulfilled before a set deadline (e.g., an Electric Vehicle (EV) has to be recharged within a given time window set by the EV owner). Therefore, each consumer has to choose at each time the consumption power (by a computerized system) so that the final accumulated energy reaches a desired level. The way in which the power levels are chosen is according to a ``strategy’’ mapping at any time the relevant information of a consumer (e.g., the current accumulated energy for EV-charging) to a suitable power consumption level. The design of such strategies may be either centralized (in which there is a single decision-maker controlling all strategies of consumers), or decentralized (in which there are several decision-makers, each of them representing a consumer). We analyze both scenarios by exploiting ideas originating from formal methods, game theory and optimization. More specifically, the power consumption scheduling problem can be modelled using Markov decision processes and stochastic games. For instance, probabilities provide a way to model the environment of the electrical system, namely: the noncontrollable part of the total consumption (e.g., the non-EV consumption). The controllable consumption can be adapted to the constraints of the distribution network (e.g., to the maximum shutdown temperature of the electrical transformer), and to their objectives (e.g., all EVs are recharged). At first glance, this can be seen as a stochastic system with multi-constraints objectives. Therefore, the contributions of this thesis also concern the area of multi-criteria objective models, which allows one to pursue several objectives at a time such as having strategy designs functionally correct and robust against changes of the environment. Méthodes formelles Processus de décision de Markov Analyse quantitative Théorie des jeux Optimisation stochastique Smart grids Formal methods Markov decision processes Quantitative analysis Game theory Stochastic optimization Smart grids
48	Dynamic control of stochastic and fluid resource-sharing systems / Contrôle dynamique des systèmes stochastiques et fluides de partage de ressources Larrañaga, Maialen 25 September 2015 (has links) Dans cette thèse, nous étudions le contrôle dynamique des systèmes de partage de ressources qui se posent dans divers domaines : réseaux de gestion des stocks, services de santé, réseaux de communication, etc. Nous visons à allouer efficacement les ressources disponibles entre des projets concurrents, selon certains critères de performance. Ce type de problème est de nature stochastique et peut être très complexe à résoudre. Nous nous concentrons donc sur le développement de méthodes heuristiques performantes. Dans la partie I, nous nous plaçons dans le cadre des Restless Bandit Problems, qui est une classe générale de problèmes d’optimisation dynamique stochastique. Relaxer la contrainte de trajectoire dans le problème d’optimisation permet de définir une politique d’index comme heuristique pour le modèle contraint d’origine, aussi appelée politique d’index de Whittle. Nous dérivons une expression analytique pour l’index de Whittle en fonction des probabilités stationnaires de l’état dans le cas où les bandits (ou projets) suivent un processus de naissance et de mort. D’une part, cette expression nécessite la vérification de plusieurs conditions techniques, d’autre part elle ne peut être calculée explicitement que dans certains cas spécifiques. Nous prouvons ensuite, que dans le cas particulier d’une file d’attente multi-classe avec abandon, la politique d’index de Whittle est asymptotiquement optimale aussi bien pour les régimes à faible trafic comme pour ceux à fort trafic. Dans la partie II, nous dérivons des heuristiques issues de l’approximation des systèmes stochastiques de partage de ressources par des modèles fluides déterministes. Nous formulons dans un premier temps une version fluide du problème d’optimisation relaxé que nous avons introduit dans la partie I, et développons une politique d’index fluide. L’index fluide peut toujours être calculé explicitement et surmonte donc les questions techniques qui se posent lors du calcul de l’index de Whittle. Nous appliquons les politiques d’index de Whittle et de l’index fluide à plusieurs cas : les fermes de serveurs éco-conscients, l’ordonnancement opportuniste dans les systèmes sans fil, et la gestion de stockage de produits périssables. Nous montrons numériquement que ces politiques d’index sont presque optimales. Dans un second temps, nous étudions l’ordonnancement optimal de la version fluide d’une file d’attente multi-classe avec abandon. Nous obtenons le contrôle optimal du modèle fluide en présence de deux classes de clients en concurrence pour une même ressource. En nous appuyant sur ces derniers résultats, nous proposons une heuristique pour le cas général de plusieurs classes. Cette heuristique montre une performance quasi-optimale lorsqu’elle est appliquée au modèle stochastique original pour des charges de travail élevées. Enfin, dans la partie III, nous étudions les phénomènes d’abandon dans le contexte d’un problème de distribution de contenu. Nous caractérisons une politique optimale de regroupement afin que des demandes issues d’utilisateurs impatients puissent être servies efficacement en mode diffusion. / In this thesis we study the dynamic control of resource-sharing systems that arise in various domains: e.g. inventory management, healthcare and communication networks. We aim at efficiently allocating the available resources among competing projects according to a certain performance criteria. These type of problems have a stochastic nature and may be very complex to solve. We therefore focus on developing well-performing heuristics. In Part I, we consider the framework of Restless Bandit Problems, which is a general class of dynamic stochastic optimization problems. Relaxing the sample-path constraint in the optimization problem enables to define an index-based heuristic for the original constrained model, the so-called Whittle index policy. We derive a closed-form expression for the Whittle index as a function of the steady-state probabilities for the case in which bandits (projects) evolve in a birth-and-death fashion. This expression requires several technical conditions to be verified, and in addition, it can only be computed explicitly in specific cases. In the particular case of a multi-class abandonment queue, we further prove that the Whittle index policy is asymptotically optimal in the light-traffic and heavy-traffic regimes. In Part II, we derive heuristics by approximating the stochastic resource-sharing systems with deterministic fluid models. We first formulate a fluid version of the relaxed optimization problem introduced in Part I, and we develop a fluid index policy. The fluid index can always be computed explicitly and hence overcomes the technical issues that arise when calculating the Whittle index. We apply the Whittle index and the fluid index policies to several systems: e.g. power-aware server-farms, opportunistic scheduling in wireless systems, and make-to-stock problems with perishable items. We show numerically that both index policies are nearly optimal. Secondly, we study the optimal scheduling control for the fluid version of a multi-class abandonment queue. We derive the fluid optimal control when there are two classes of customers competing for a single resource. Based on the insights provided by this result we build a heuristic for the general multi-class setting. This heuristic shows near-optimal performance when applied to the original stochastic model for high workloads. In Part III, we further investigate the abandonment phenomena in the context of a content delivery problem. We characterize an optimal grouping policy so that requests, which are impatient, are efficiently transmitted in a multi-cast mode. Contrôle optimal Processus de décision markovien Restless bandit problems Abandons Relaxation lagrangienne Théorie de files d'attente Optimal control Markov decision processes Restless bandit problems Abandonments Lagrangian relaxation Queueing theory
49	Contributions to Simulation-based High-dimensional Sequential Decision Making / Contributions sur la prise de décision séquentielle basée sur des simulations dans des environnements complexes de grande dimension Hoock, Jean-Baptiste 10 April 2013 (has links) Ma thèse s'intitule « Contributions sur la prise de décision séquentielle basée sur des simulations dans des environnements complexes de grande dimension ». Le cadre de la thèse s'articule autour du jeu, de la planification et des processus de décision markovien. Un agent interagit avec son environnement en prenant successivement des décisions. L'agent part d'un état initial jusqu'à un état final dans lequel il ne peut plus prendre de décision. A chaque pas de temps, l'agent reçoit une observation de l'état de l'environnement. A partir de cette observation et de ses connaissances, il prend une décision qui modifie l'état de l'environnement. L'agent reçoit en conséquence une récompense et une nouvelle observation. Le but est de maximiser la somme des récompenses obtenues lors d'une simulation qui part d'un état initial jusqu'à un état final. La politique de l'agent est la fonction qui, à partir de l'historique des observations, retourne une décision. Nous travaillons dans un contexte où (i) le nombre d'états est immense, (ii) les récompenses apportent peu d'information, (iii) la probabilité d'atteindre rapidement un bon état final est faible et (iv) les connaissances a priori de l'environnement sont soit inexistantes soit difficilement exploitables. Les 2 applications présentées dans cette thèse répondent à ces contraintes : le jeu de Go et le simulateur 3D du projet européen MASH (Massive Sets of Heuristics). Afin de prendre une décision satisfaisante dans ce contexte, plusieurs solutions sont apportées :1. simuler en utilisant le compromis exploration/exploitation (MCTS)2. réduire la complexité du problème par des recherches locales (GoldenEye)3. construire une politique qui s'auto-améliore (RBGP)4. apprendre des connaissances a priori (CluVo+GMCTS) L'algorithme Monte-Carlo Tree Search (MCTS) est un algorithme qui a révolutionné le jeu de Go. A partir d'un modèle de l'environnement, MCTS construit itérativement un arbre des possibles de façon asymétrique en faisant des simulations de Monte-Carlo et dont le point de départ est l'observation courante de l'agent. L'agent alterne entre l'exploration du modèle en prenant de nouvelles décisions et l'exploitation des décisions qui obtiennent statistiquement une bonne récompense cumulée. Nous discutons de 2 moyens pour améliorer MCTS : la parallélisation et l'ajout de connaissances a priori. La parallélisation ne résout pas certaines faiblesses de MCTS ; notamment certains problèmes locaux restent des verrous. Nous proposons un algorithme (GoldenEye) qui se découpe en 2 parties : détection d'un problème local et ensuite sa résolution. L'algorithme de résolution réutilise des principes de MCTS et fait ses preuves sur une base classique de problèmes difficiles. L'ajout de connaissances à la main est laborieuse et ennuyeuse. Nous proposons une méthode appelée Racing-based Genetic Programming (RBGP) pour ajouter automatiquement de la connaissance. Le point fort de cet algorithme est qu'il valide rigoureusement l'ajout d'une connaissance a priori et il peut être utilisé non pas pour optimiser un algorithme mais pour construire une politique. Dans certaines applications telles que MASH, les simulations sont coûteuses en temps et il n'y a ni connaissance a priori ni modèle de l'environnement; l'algorithme Monte-Carlo Tree Search est donc inapplicable. Pour rendre MCTS applicable dans MASH, nous proposons une méthode pour apprendre des connaissances a priori (CluVo). Nous utilisons ensuite ces connaissances pour améliorer la rapidité de l'apprentissage de l'agent et aussi pour construire un modèle. A partir de ce modèle, nous utilisons une version adaptée de Monte-Carlo Tree Search (GMCTS). Cette méthode résout de difficiles problématiques MASH et donne de bons résultats dans une application dont le but est d'améliorer un tirage de lettres. / My thesis is entitled "Contributions to Simulation-based High-dimensional Sequential Decision Making". The context of the thesis is about games, planning and Markov Decision Processes. An agent interacts with its environment by successively making decisions. The agent starts from an initial state until a final state in which the agent can not make decision anymore. At each timestep, the agent receives an observation of the state of the environment. From this observation and its knowledge, the agent makes a decision which modifies the state of the environment. Then, the agent receives a reward and a new observation. The goal is to maximize the sum of rewards obtained during a simulation from an initial state to a final state. The policy of the agent is the function which, from the history of observations, returns a decision. We work in a context where (i) the number of states is huge, (ii) reward carries little information, (iii) the probability to reach quickly a good final state is weak and (iv) prior knowledge is either nonexistent or hardly exploitable. Both applications described in this thesis present these constraints : the game of Go and a 3D simulator of the european project MASH (Massive Sets of Heuristics). In order to take a satisfying decision in this context, several solutions are brought : 1. Simulating with the compromise exploration/exploitation (MCTS) 2. Reducing the complexity by local solving (GoldenEye) 3. Building a policy which improves itself (RBGP) 4. Learning prior knowledge (CluVo+GMCTS) Monte-Carlo Tree Search (MCTS) is the state of the art for the game of Go. From a model of the environment, MCTS builds incrementally and asymetrically a tree of possible futures by performing Monte-Carlo simulations. The tree starts from the current observation of the agent. The agent switches between the exploration of the model and the exploitation of decisions which statistically give a good cumulative reward. We discuss 2 ways for improving MCTS : the parallelization and the addition of prior knowledge. The parallelization does not solve some weaknesses of MCTS; in particular some local problems remain challenges. We propose an algorithm (GoldenEye) which is composed of 2 parts : detection of a local problem and then its resolution. The algorithm of resolution reuses some concepts of MCTS and it solves difficult problems of a classical database. The addition of prior knowledge by hand is laborious and boring. We propose a method called Racing-based Genetic Programming (RBGP) in order to add automatically prior knowledge. The strong point is that RBGP rigorously validates the addition of a prior knowledge and RBGP can be used for building a policy (instead of only optimizing an algorithm). In some applications such as MASH, simulations are too expensive in time and there is no prior knowledge and no model of the environment; therefore Monte-Carlo Tree Search can not be used. So that MCTS becomes usable in this context, we propose a method for learning prior knowledge (CluVo). Then we use pieces of prior knowledge for improving the rapidity of learning of the agent and for building a model, too. We use from this model an adapted version of Monte-Carlo Tree Search (GMCTS). This method solves difficult problems of MASH and gives good results in an application to a word game. Fouille d'arbres Monte-Carlo Apprentissage avec simulations Jeux Planification Processus de décision markovien MoGo MASH Monte Carlo Tree Search Learning from simulations Games Planning Markov decision process MoGo MASH
50	Exploring a bi-directional relationship between corporate social responsibility and employees' attitudes and behaviors / Exploration des relations bidirectionnelles entre responsabilité sociale de l’entreprise et attitudes et comportements des employés Farooq, Mariam 23 April 2012 (has links) Le principal objectif de cette thèse est d'examiner la relation réciproque entre la responsabilité sociale de l'entreprise (RSE) et les attitudes et les comportements des employés. Premièrement, la thèse explore les mécanismes sous-jacents alternatifs à travers lesquels la RSE affecte les employés et fait la classification des employés dans les groupes homogènes en se basant sur leur utilisation de ces différents mécanismes. Deuxièmement, elle identifie les conditions limites dans lesquelles la RSE influence de façon optimale les attitudes et les comportements des employés. Enfin, la thèse examine l'influence réciproque des employés sur la stratégie RSE de la firme et explore les pratiques des ressources humaines qui permettent à l'entreprise d'améliorer sa RSE. Afin d'atteindre ces objectifs, les trois études empiriques ont été mené dans l'Aise du Sud. Les données ont été collectées par une suite d'enquêtes avec les employés en utilisant le design de décalage dans le temps. Les résultats montrent que la RSE a un impact positif sur les attitudes et les comportements des employés à travers de multiples mécanismes. Les résultats suggèrent l'hétérogénéité parmi les employés dans leur utilisation de ces mécanismes et mettent en évidence la classification des employés en fonction de leurs orientations personnelles et valeurs culturelles individuelles afin de mieux comprendre ce phénomène. En utilisant les données de panel à trois reprises, il a été démontré également que les employés influencent la stratégie RSE. Cependant, cela dépends de leur niveau de participation dans le processus de décision et du degré de leur identification avec leur organisation / The main objective of this dissertation is to examine the reciprocal relationship between corporate social responsibility (CSR) and employees' attitudes and behaviors. Firstly, it explores the underpinning alternative mechanisms through which CSR affects employees and classifies the employees into homogenous groups on the basis of their use of these differential mechanisms. Secondly, it identifies the boundary conditions in which CSR optimally influences the employees' attitudes and behaviors. Finally, the dissertation investigates the reciprocal influence of employees on the CSR strategy of the firm and explores the human resource practices that facilitate the firm to improve its CSR. To achieve these objectives, three empirical studies were conducted in South Asia. Data were collected in a series of employee surveys with using time lag design. The results show that CSR has a positive impact on employees' attitudes and behaviors through multiple mechanisms. Findings suggest the heterogeneity among employees in their use of these mechanisms and emphasize the classification of employees depending upon their personal orientations and individual cultural values to better understand this phenomenon. Using three wave penal data, it was also found that employees influence the CSR strategy of the firm. However, it depends upon the level of their participation in decision making and extent of their identification with their organization Comportements des employés Identification Confiance Corporate social responsibility Social exchange Organizational trust Affective organizational commitment Social identity Organizational identificaiton Employees attitudes and behaviors

Search results