Spelling suggestions: "subject:"La théorie dess deux"" "subject:"La théorie dess ceux""
171 |
Voices, votes and violence : essays on select dynamics of electoral authoritarian regimesBardall, Gabrielle Simon 10 1900 (has links)
« Voix, vote et violence : Essais sur les dynamiques des régimes autoritaires électoraux » porte sur l'expression des voix généralement exclues sous des régimes autoritaires électoraux (« AE »), depuis les défis des processus institutionnalisés (en particulier les élections et la démocratie) jusqu’aux rationalisations des comportements extra-institutionnels (notamment la violence politique).
Les essais sont présentés en deux parties. Les deux essais de la partie I ont trait aux cadres analytiques d’étude des comportements des partis au pouvoir et des oppositions dans les régimes semi-autoritaires. Les trois essais de la partie II examinent un sous-domaine spécifique de ces régimes : la participation politique des femmes. Chaque chapitre propose des découvertes comme résumé ci-dessous.
Le chapitre 1 explore les défis méthodologiques dans l'étude des régimes semi-autoritaires (comme AE) en analysant de manière critique un cadre d’analyse important dans le domaine. Une réplication indépendante du modèle de classification de l'autoritarisme compétitif (« AC ») de Levistky et Way (2010) révèle des anomalies de codification dans la sélection des cas qui influent sur la théorie générale des régimes AC et qui ont des implications méthodologiques pour l'étude comparative des régimes hybrides en général.
Le chapitre 2 examine le comportement des partis de l'opposition sous des régimes AE. Je fais l'hypothèse que les objectifs électoraux et les objectifs de régime des oppositions dans les EA (les « jeux parallèles ») s’alignent dans des conditions où il existe une certitude relative concernant les résultats, mais divergent lorsque l’incertitude des résultats de régime ou des élections est plus importante, ce qui entraine quatre types de comportement identifiables. Je teste mes hypothèses sur 55 élections dans 29 États d'Afrique sub-saharienne et je démontre que les quatre types de comportement dépendent du degré de répression de l'État et du niveau de capacité organisationnelle des oppositions.
Le chapitre 3 révèle et définit la nature sexuée de la violence électorale (une caractéristique commune des régimes AE). Une base de données originale de plus de 2 000 incidents de violence électorale dans six pays, ainsi qu’un travail de terrain dans plus de cinquante pays révèlent l'existence d'importantes distinctions dans la manifestation de la violence électorale, ainsi que la présence d'un phénomène auparavant non reconnu, la violence électorale basée sur le genre (« VEBG »). Le chapitre présente les définitions, une taxonomie et la typologie des deux formes de violence.
Le chapitre 4 se penche en profondeur sur le sujet, en examinant la relation complexe entre les technologies de l'information et de la communication (TIC) et la VEBG. Les notions de la violence électorale différenciée selon le genre ainsi que la VEBG sont étendues à la violence politique en général. Je démontre que les TIC facilitent les formes sexuées de la violence politique, mais qu’elles contribuent également à résister et atténuer ces violences, grâce à certaines qualités spécifiques aux TIC.
Le dernier chapitre fournit la solution à une énigme de longue date dans l'exclusion politique dans les régimes AE (et autres) en démontrant la complémentarité des formes spécifiques de mesures temporaires spéciales (MTS) dans les systèmes électoraux fondés sur des circonscriptions uninominales (CU). Le chapitre présente une classification en cinq parties des options MTS dans les CU, y compris une interprétation originale des « seuils parallèles ». L'analyse des cinq types de MTS à travers des études de cas de pays illustre que les divergences dans l'adoption de quotas entre les systèmes électoraux sont le résultat d'un manque de connaissances plutôt que des traits intrinsèques des systèmes électoraux, comme supposé précédemment. / “Voices, Votes and Violence: Essays on Select Dynamics of Electoral Authoritarian Regimes” concerns the expression of commonly excluded voices under electoral authoritarian (EA) regimes, from the challenges of institutionalized processes (specifically, elections and voting) to rationalizations for extra-institutional behaviors (notably political violence).
The essays are presented in two parts. The first two essays in Part I concern frameworks for studying incumbent and opposition behaviors in semi-authoritarian states. The three essays in Part II examine a specific sub-field of EA regime dynamics: political participation of women. Each chapter provides findings as summarized below.
Chapter 1 explores methodological challenges in studying semi-authoritarian regimes (such as EA) by critically engaging with a leading framework of analysis in the field. An independent replication of Levistky and Way’s 2010 classification model of competitive authoritarianism (CA) reveals coding discrepancies in the authors’ case selection which impact the broader theory of CA regimes and have methodological implications for the comparative study of hybrid regimes in general.
Chapter 2 examines opposition party behavior under EA regimes. I hypothesize that EA oppositions’ electoral and regime objectives (“dual games”) align under conditions where there is relative certainty of outcomes but diverge where either regime or electoral uncertainty is greater, resulting in four identifiable behavior types. Testing the theory on 55 elections in 29 sub-Saharan African states, I demonstrate that the four behavior types are functions of the degree of state repression and the level of organizational capacity of the opposition.
Chapter 3 reveals and defines the gendered nature of electoral violence (a common feature of EA regimes). An original database of over 2000 incidents of election violence in six countries as well as fieldwork from over fifty countries reveal the existence of significant gender-differentiation in the manifestation of election violence as well as the presence of a previously unrecognized phenomenon, gender-based election violence (GBEV). The chapter introduces definitions, a taxonomy and typology of both forms of violence.
Chapter 4 delves deeper into the topic by examining the complex relationship between information and communication technologies and gendered election violence. The notions of gender-differentiated and gender-motivated violence are extended to political violence in this chapter. Information and communication technologies are found to both facilitate gendered forms of political violence as well as empower resistance and violence mitigation.
The final chapter provides the solution to a longstanding puzzle of political exclusion in EA (and other) regimes by demonstrating the complementarity of specific forms of temporary special measures (TSMs) in electoral systems based on single-member districts (SMDs). The chapter presents a five-part classification of TSM options in SMDs, including an original interpretation of “Alternate Thresholds”. Analyzing the five TSM types through country case studies, Chapter 5 illustrated that discrepancies in the adoption of quotas between electoral systems are the result a knowledge gap rather than intrinsic traits of electoral systems, as previously assumed.
|
172 |
Legal shifts : shaping expectations of intellectual property protection in an open innovation industrial environmentBruneau, Mathieu 12 1900 (has links)
Projet de recherche réalisé en 2014-2015 avec l'appui du Fonds de recherche du Québec – Société et culture. / Ce mémoire vise à évaluer les effets de variations des attentes des firmes quant à la protection conférée par les droits de propriété intellectuelle (« PI ») pour les inventions et innovations dans un milieu industriel d’innovation ouverte. D’abord, les régimes de PI aux États-Unis et au Canada sont analysés à travers des cas jurisprudentiels et législatifs et des traités internationaux afin d’illustrer de quelle façon les normes juridiques changent et démontrer les répercussions sur les attentes des firmes. Puis, les attributs du modèle de l’innovation ouverte, où les firmes gèrent à dessein leurs relations d’affaires avec une attitude d’ouverture, sont décrits et sa pertinence est appuyée à l’aide d’un modèle simple. L’accent est mis sur son traitement distinctif des échanges de connaissances et d’intrants à l’intérieur même des firmes et entre elles. Une fois ces notions établies et s’y référant à titre d’hypothèses, un modèle microéconomique des échanges de connaissances entre firmes est élaboré, avec deux variables de choix, la PI et le secret, qui captent les mécanismes de gestion technologique des firmes. Par la tension entre ces variables, les processus de prise de décisions et les interactions entre les firmes sont évalués au moyen d’une analyse statique. Pour étudier plus en détails les choix des firmes, une version à deux joueurs du modèle est examinée au moyen de la théorie des jeux. Dans toutes ces formes du modèle, l’impact des fluctuations des attentes des firmes relativement au droit de la PI est jaugé. Tel que prévu, ces effets pour une firme changent en fonction des choix de gestion de chacune des firmes. Les effets varient également eu égard à la nature des relations à travers lesquelles les échanges de connaissance ont lieu. Dans la variante à deux joueurs, la statique comparative d’un équilibre de Nash en stratégie mixte montre que la relation avec l’autre joueur imprègne les incidences des variations du droit sur les stratégies de gestion technologique. Par exemple, une hausse des attentes de protection juridique de la PI couvrant la technologie d’une firme peut étonnamment mener cette firme à moins y recourir. / The purpose of this thesis is to assess the effects of changes in firms’ expectations of intellectual property (“IP”) law protection over inventions and innovations in an industrial environment characterized by open innovation practices. To begin, a legal analysis of IP regimes in Canada and the United States is achieved through different cases of court decisions, legal amendments and international treaties in order to show how legal standards vary and to demonstrate the repercussions of legal shifts over firms’ expectations. Then, the characteristics of the open innovation management model, in which firms adopt a purposively open mindset in their business relationships, are described, and its relevance is supported using a simple model. Emphasis is laid upon open innovation’s distinguishable treatment of intra- and inter-firm flows of knowledge and inputs. Building on these insights and using them as assumptions, a microeconomic model of firms’ knowledge flow interactions is constructed, with two choice variables that capture firms’ technology management mechanisms in an open innovation industrial environment: IP and secrecy. Through the tension between these two variables, inter-firm interactions and decision-making processes are assessed with a static analysis. To study firms’ choices in greater detail, a two-firm version of the model is then examined using game theory. Throughout, the impact of fluctuations in firms’ expectations of IP law is assessed. As expected, these effects, for a focal firm, vary depending on that firm’s technology management decisions as well as other firms’. Effects also differ with respect to the nature of knowledge flows relationships that each firm undertakes. In the two-firm game theoretic version of the model, comparative statics of a mixed-strategy Nash Equilibrium show that the relationship with the other firm qualifies the consequences of legal shifts on firms’ technology management strategies. Notably, increasing expectations of IP protection for a firm’s technology might actually result in this firm relying less on IP.
|
173 |
Théorie de l’information, jeux répétés avec observation imparfaite et réseaux de communication décentralisés / Information theory, repeated games with imperfect monitoring and decentralized communications networksLe Treust, Maël 06 December 2011 (has links)
Cette thèse est consacrée à l’étude des interactions entre la théorie des jeux et la théorie de l’information, ainsi qu’à leurs applications aux réseaux de communication décentralisés. D’une part, la théorie des jeux apporte des réponses aux problèmes d’optimisation dans lesquels des agents interagissent. Dans un jeu, les joueurs choisissent des actions et obtiennent des gains appelés utilités. Les hypothèses sur l’information que possèdent les joueurs avant de jouer sont fondamentales pour déterminer l’issue d’un jeu, aussi appelée équilibre. Lorsque le même jeu est répété d’étape en étape et que les joueurs n’observent pas les actions passées parfaitement,alors les utilités d’équilibre ne sont pas connues. D’autre part, la théorie de l’information étudie les performances d’un système communicant. De nos jours, les réseaux de communication sont tellement denses qu’ils ne peuvent plus s’organiser autour d’un unique opérateur central. La théorie des jeux est appropriée pour étudier de nouvelles organisations du traitement de l’information dans lesquelles les décisions sont prises localement. Dans un premier temps, au chapitre3, nous étudions le jeu du contrôle de puissance efficace du point de vue énergétique, grâce aux résultats existants pour les jeux répétés. Les émetteurs sont considérés comme des joueurs et choisissent la puissance d’émission du signal, considérée comme leur action. L’objectif d’un joueur est de choisir une puissance optimale pour la qualité de sa propre communication. Même si les joueurs n’observent pas les actions passées de manière parfaite, nous montrons que l’observation du "ratio signal sur interférence plus bruit" est suffisante pour garantir des résultats d’équilibre optimaux pour le réseau de communication. Dans un second temps, nous utilisons les outils de la théorie de l’information pour approfondir l’étude de la circulation de l’information parmi les joueurs. Dans le chapitre 4, un encodeur envoie un signal supplémentaire aux joueurs afin qu’ils observent parfaitement les actions jouées à l’étape précédente. L’observation des joueurs devient suffisamment précise pour nous permettre de retrouver l’ensemble des utilités d’équilibre du jeu répété. Ces résultats sont à leur tour exploités afin de modéliser des réseaux de communication plus réalistes et d’y apporter des solutions nouvelles. Dans le chapitre5, nous approfondissons l’étude des utilités d’équilibre lorsque les joueurs observent les actions passées à travers un canal d’observation arbitraire. Nous démontrons un résultat d’atteignabilité pour un canal multi-utilisateurs avec états qui comporte un encodeur, deux récepteurs légitimes et un espion. Ce résultat nous permet d’étudier les corrélations entre les suites d’actions qu’un groupe de joueurs peut mettre en oeuvre à l’insu d’un joueur opposant. L’étude des canaux multiutilisateurs est un pas en avant vers la caractérisation des utilités d’équilibre dans un jeu répété avec observation imparfaite. / This thesis is devoted to the study of mutual contributions between games theory and informationtheory and their applications to decentralized communication networks. First, game theoryprovides answers to optimization problems in which agents interact. In a game, players chooseactions and obtains gains called utilities. Assumptions about the information possessed by playersbefore play is fundamental to determine the outcome a game, also called equilibrium. When thesame game is repeated from stage to stage and the players do not observe the past actions perfectly,then the equilibrium utilities are not known. On the other hand, information theory studiesthe performance of a communicating system. Nowadays, communication networks are so densethat they can not organize around a single central operator. Game theory is appropriate to explorenew organizations of communication networks in which decisions are taken locally. At first,in Chapter 3, we study the game of power control in terms of energy efficiency, thanks to theexisting results for repeated games. Transmitters are regarded as players and choose the transmissionpower of the signal, considered as their action. The objective of a player is to choose anoptimal power for the quality of its own communication. The players do not observe the pastactions perfectly, but we show that the observation of the "signal over interference plus noiseratio" is sufficient to ensure optimal equilibrium results for the communication network. In a secondstep, we use the tools of the information theory for further study of the flow of informationamong the players. In Chapter 4, an encoder sends an extra signal to the players so that theyperfectly observe the actions chosen in the previous stage-game. The observation of players issufficiently precise to characterize the set of equilibrium utilities of the repeated game. Theseresults are, in turn, used to model new communication networks and to provide more realisticsolutions. In Chapter 5, we deepen the study of equilibrium utilities when players observe thepast actions to through an arbitrary observation channel. We show a rate region is achievablefor the multi-user channel with states which includes an encoder, two legitimate receivers andan eavesdropper. This result allows us to study the correlations over the sequences of actions agroup of players can implement while keeping it secret from an opponent player. The study ofmulti-user channels is a step towards the characterization of equilibrium utilities in a repeatedgame with imperfect monitoring.
|
174 |
Généralisation des Jeux Combinatoires et Applications aux Langages LogiquesLoddo, Jean-Vincent 16 December 2002 (has links) (PDF)
La théorie des jeux a développé, à ses débuts, une vocation pour les sciences sociales et économiques, avec des applications disparates, comme par exemple le traitement de données médicales. Elle apparaît aujourd'hui comme un paradigme de concepts et de techniques très général, dont le potentiel reste encore à exploiter en informatique. Dans cette thèse nous étudions une branche particulière, la théorie des jeux combinatoires (à deux joueurs), pour en tirer bénéfice dans le domaine, très actif, des sémantiques formelles des langages de programmation. D'un jeu, nous pouvons séparer l'aspect syntaxique, inhérent aux dénouements possibles des matchs, de l'aspect sémantique, inhérent aux prévisions sur le gagnant et la quantification de son gain (en termes d'un enjeu quelconque, tel que l'argent ou le préstige). Pour modeliser la notion de gain, la structure d'évaluation choisie ne doit pas forcément être celle des booléens (gagné ou perdu), ou celle des entiers naturels ou relatifs. Il suffit qu'elle vérifie des propriétés, assez faibles, garantissant l'existence d'une sémantique même lorsque le jeu donne lieu à des matchs infinis, comme dans le cas du jeu de la bisimulation entre processus concurrents, et du jeu de la programmation logique. Dans ce travail, nous étudions la caractérisation sémantique d'un langage logique (avec ou sans contrainte) en termes de jeu à deux joueurs. Au-delà du modèle intuitif des jeux, dont la valeur pédagogique mériterait d'être approfondie, une telle interprétation permet de réutiliser un des algorithmes les plus utilisés dans la théorie des jeux combinatoire, Alpha-Bêta, comme moteur de résolution pour les langages logiques. Les résultats récents et spectaculaires obtenus par les programmes d'échecs (souvenons-nous de la défaite du champion du monde Kasparov contre le programme Deep Blue d'IBM) témoignent d'une forme d'intelligence artificielle développée dans ces programmes qui peut être transposée et exploitée dans la résolution des langages logiques. La résolution d'interrogations existentielles conjonctives dans une théorie de clauses de Horn du premier ordre est en particulier concernée. En effet, la capacité d'Alpha-Bêta à simplifier le calcul ou, en d'autres termes, sa capacité à éliminer les coups inintéressants, n'est pas intimement liée à un type de jeu ou à un type de gain particuliers, mais demande juste des propriétés algébriques qui sont satisfaites dans le jeu de la programmation logique. La correction d'Alpha-Bêta est prouvée de façon formelle pour un éventail de structures très large. Les valeurs calculées pourront être aussi bien des entiers naturels, comme dans le cas du jeu d'échecs, que des substitutions ou des contraintes, comme dans le cas des langages logiques.
|
175 |
Equilibres corrélés, jeux d'évolution et dynamique de populationsViossat, Yannick 15 December 2005 (has links) (PDF)
La thèse se compose de trois parties dont les deux premières se rattachent à la théorie des jeux et la troisième à la biologie théorique. La première partie est consacrée à l'étude des équilibres corrélés. Après avoir étudié les propriétés de la techique de réduction duale et développé ses applications, nous utilisons cette technique pour montrer que l'ensemble des jeux ayant un unique équilibre corrélé est ouvert, ce qui n'est pas vrai des équilibres de Nash, et pour caractériser la classe des jeux dont le polytope des équilibres corrélés contient un équilibre de Nash dans son intérieur relatif. Cette classe étend et généralise celle des jeux à somme nulle. Deux autres contributions sont également présentées.<br /> <br />La deuxième partie est consacrée aux jeux d'évolution, et étudie le lien entre l'issue de processus évolutifs et les concepts stratégiques statiques. Nous montrons notamment que les dynamiques d'évolution peuvent éliminer toutes les stratégies appartennant au support d'au moins un équilibre corrélé, et ce pour n'importe quelle dynamique monotone et pour des ensembles ouverts de jeux et de conditions initiales. L'élimination de toutes les stratégies dans le support des équilibres de Nash se produit sous toutes les dynamiques d'adaptation myope régulières et, sous la dynamique des réplicateurs ou la dynamique de meilleure réponse, à partir de presque toutes les conditions initiales. <br /><br />La troisième partie, co-écrite, étudie les déterminants de la séparation entre lignée germinale et lignée somatique chez les algues vertes volvocales.
|
176 |
Métadynamiques en cognition sociale. Quelle définition de meilleur est la meilleure ?Chavalarias, David 25 October 2004 (has links) (PDF)
Quels sont les principes fondateurs de l'auto-organisation des sociétés humaines ? Produits d'une évolution culturelle rapide, qui a pris le pas sur l'évolution biologique, celles-ci réclament une approche par des formalismes radicalement différents de ceux utilisés généralement dans l'étude des autres sociétés animales. Concrètement, la modélisation des rapports entre individus et collectif considère le plus souvent des agents qui peuvent être représentés sous la forme d'une hiérarchie de règles, chacune se plaçant en position méta par rapport aux règles du niveau inférieur. Celles-ci peuvent s'interpréter, selon les niveaux, comme des règles de comportement, des règles de décision, des règles de transmission culturelle ou génétique. L'émergence de régularités au niveau collectif peut alors s'interpréter comme la sélection d'une distribution particulière sur l'ensemble des règles et métarègles définissant les agents. Dès lors, le problème de l'auto-organisation dans les systèmes économiques et sociaux se reformule autour de la question suivante : « Peut-on endogénéiser les distributions des métarègles de comportement de manière à ce qu'elles soient le produit des dynamiques collectives qu'elles définissent ? ». Nous montrons dans cette thèse que la prise en compte, dans les modèles formels, de la spécificité de l'imitation humaine permet de répondre positivement à cette question, un point essentiel étant qu'une règle d'imitation peut être sa propre métarègle. Nous proposons ainsi un cadre formel pour l'étude de sociétés d'agents mimétiques auto-organisées, les jeux métamimétiques ; le concept d'équilibre correspondant est alors l'état contrefactuellement stable : aucun agent ne peut s'imaginer mieux qu'il n'est en se mettant contrefactuellement à la place de l'un de ses voisins. Nous étudions ensuite les propriétés de ces jeux en prenant comme champs d'application le problème de l'émergence de la coopération dans un dilemme de prisonnier spatialisé. Nous montrons au passage, que cette approche permet d'échapper au dilemme. Plus généralement, nous nous plaçons dans le cadre de la théorie des jeux stochastiques et nous explicitons le rôle structurant des perturbations dans ce type de système dynamique, les structures spatio-temporelles émergentes étant le produit du couplage entre la dynamique endogène des systèmes métamimétiques et la structure interne des perturbations. En rupture avec l'approche traditionnelle, ceci nous amène à interpréter l'hétérogénéité auto-organisée des systèmes sociaux humains comme une différenciation par un processus de co-évolution d'une multiplicité de critères possibles, plutôt que par un processus d'optimisation global d'un critère unique.
|
177 |
Essays in forward looking behavior in strategic interactionsMantovani, Marco 09 May 2013 (has links)
The general topic of our thesis is forward looking behavior in strategic situations. Mixing theoretical and experimental analysis, we document how strategic thinking is affected by the specific features of a dynamic interaction. The overarching result is that the information regarding decisions that are close to the current one, receive a qualitatively different consideration, with respect to distant ones. That is, the actual decisions are based on reasoning over a limited number of steps, close to actual decison node. We capture this feature of behavior both in a strategic (limited backward induction) and in a non-strategic (limited farsightedness) set up, and we identify relevant consequences on the outcome of the interaction, which powerfullly explain many observed experimental regularities.<p>In the first essay, we present a general out-of-equilibrium framework for strategic thinking in sequential games. It assumes the agents to take decisions on restricted game trees, according to their (limited) foresight level, following backward induction. Therefore we talk of limited backward induction (LBI). We test for LBI using a variant of the race game. Our design allows to identify restricted game trees and backward reasoning, thus properly disentangling LBI behavior. The results provide strong support in favor of LBI. Most players solve intermediate tasks - i.e. restricted games - without reasoning on the terminal histories. Only a small fraction of subjects play close to equilibrium, and (slow) convergence toward it appears, though only in the base game. An intermediate task keeps the subjects off the equilibrium path longer than in the base game. The results cannot be rationalized using the most popular models of strategic reasoning, let alone equilibrium analysis.<p>In the second essay, a subtle implication of the model is investigated: the sensitivity of the players’ foresight to the accessibility and completeness of the information they have, using a Centipede game. By manipulating the way in which information is provided to subjects, we show that reduced availability of information is sufficient to shift the distribution of take-nodes further from the equilibrium prediction. On the other hand, similar results are obtained in a treatment where reduced availability of information is combined with an attempt to elicit preferences for reciprocity, through the presentation of the centipede as a repeated trust game. Our results could be interpreted as cognitive limitations being more effective than preferences in determining (shifts in) behavior in our experimental centipede. Furthermore our results are at odds with the recent ones in Cox [2012], suggesting caution in generalizing their results. Reducing the availability of information may hamper backward induction or induce myopic behavior, depending on the strategic environment.<p>The third essay consists of an experimental investigation of farsighted versus myopic behavior in network formation. Pairwise stability Jackson and Wolinsky [1996] is the standard stability concept in network formation. It assumes myopic behavior of the agents in the sense that they do not forecast how others might react to their actions. Assuming that agents are perfectly farsighted, related stability concepts have been proposed. We design a simple network formation experiment to test these extreme theories, but find evidence against both of them: the subjects are consistent with an intermediate rule of behavior, which we interpret as a form of limited farsightedness. On aggregate, the selection among multiple pairwise stable networks (and the performance of farsighted stability) crucially depends on the level of farsightedness needed to sustain them, and not on efficiency or cooperative considerations. Individual behavior analysis corroborates this interpretation, and suggests, in general, a low level of farsightedness (around two steps) on the part of the agents. / Doctorat en Sciences économiques et de gestion / info:eu-repo/semantics/nonPublished
|
178 |
Agrégation de relations valuées par la méthode de Borda, en vue d'un rangement: considérations axiomatiquesMarchant, Thierry 15 October 1996 (has links)
<p align="justify">Depuis 20 à 30 ans, l'aide multicritère à la décision est apparue. L'expansion de cette nouvelle discipline s'est marquée dans la littérature essentiellement par un foisonnement de nouvelles méthodes multicritères d'aide à la décision et par des applications de celles-ci à des problèmes "réels". Pour la plupart de ces méthodes, il n'y pas ou peu de fondements théoriques. Seul le bon sens a guidé les créateurs de ces méthodes.</p><p><p align="justify">Depuis une dizaine d'années, le besoin de bases théoriques solides se fait de plus en plus sentir. C'est dans cette perspective que nous avons réalisé le présent travail. Ceci étant dit, nous n'allons pas vraiment nous occuper de méthodes multicritères à la décision dans ce travail, mais seulement de fragments de méthodes. En effet, les méthodes multicritères d'aide à la décision peuvent généralement être décomposées en trois parties (outre la définition de l'ensemble des alternatives et le choix des critères):</p><p><p align="justify"><ol><li>Modélisation des préférences: pendant cette étape, les préférences du décideur sont modélisées le long de chaque critère.<p><li>Agrégation des préférences: un modèle global de préférences est construit au départ des modèles obtenus critère par critère à la fin de la phase précédente.<p><li>Exploitation des résultats de l'agrégation: du modèle global de préférences issu de la phase 2, on déduit un choix, un rangement, une partition, selon les besoins.</ol></p><p><p align="justify">Jusqu'à présent, à cause de la difficulté du problème, peu de méthodes ont été axiomatisées de bout en bout; la plupart des travaux ne s'intéressent qu'à une ou deux des trois étapes que nous venons de décrire.</p><p><p align="justify">Nous nous sommes intéressés à une méthode bien connue: la méthode de Borda. Elle accepte comme données de départ des relations binaires. Elle intervient donc après la phase de modélisation des préférences. Le résultat de cette méthode est un rangement. Elle effectue donc les opérations correspondant aux étapes 2 et 3. Dans la suite de ce travail nous appellerons méthode de rangement toute méthode effectuant les étapes 2 et 3 pour aboutir à un rangement. Etant donné que les méthodes de rangement, celle de Borda en particulier, sont utilisées également en choix social, nous puiserons abondamment dans le vocabulaire, les outils et les résultats du choix social. Les résultats présentés seront valides en choix social, mais nous nous sommes efforcés de les rendre aussi pertinents que possible en aide multicritère à la décision.</p><p><p align="justify">Dans le chapitre II, après quelques définitions et notations, nous présentons quelques méthodes de rangement classiques, y compris la méthode de Borda, et quelques résultats majeurs de la littérature. Nous généralisons une caractérisation des méthodes de scorage due à Myerson (1995).</p><p><p align="justify">Nous nous tournons ensuite vers les relations valuées. La raison en est la suivante: elles sont utilisées depuis longtemps dans plusieurs méthodes multicritères et, depuis peu, elles le sont aussi en choix social (p.ex. Banerjec 1994) car elles permettent de modéliser plus finement les préférences des décideurs confrontés à des informations incertaines, imprécises, contradictoires, lacunaires, Nous commençons donc le chapitre III par des notations et définitions relatives aux relations valuées.</p> <p align="justify">Ensuite, nous présentons quelques méthodes de rangement opérant au départ de relations valuées. C'est-à-dire des méthodes de rangement qui agissent non pas sur des relations nettes, mais sur des relations valuées et qui fournissent comme précédemment un rangement des alternatives. N'ayant trouvé dans la littérature aucune méthode de ce type, toutes celles que nous présentons sont neuves ou des généralisations de méthodes existantes; comme par exemple, les méthodes de scorage généralisées, que nous caractérisons en généralisant encore une fois le résultat de Myerson.</p><p><p align="justify">Nous présentons enfin ce que nous appelons la méthode de Borda généralisée, qui est une des généralisations possibles de la méthode de Borda au cas valué. Nous basant sur un article de Farkas et Nitzan (1979), nous montrons que contrairement à ce qui se passait dans le cas particulier envisagé par Farkas et Nitzan (agrégation d'ordres totaux), la méthode de Borda généralisée (et sa particularisation au cas net) n'est pas toujours équivalente à la méthode proximité à l'unanimité. Cette dernière méthode classe chaque alternative en fonction de l'importance des changements qu'il faudrait faire subir à un ensemble de relations pour que l’alternative considérée gagne à l'unanimité. Nous identifions quelques cas où l'équivalence est vraie.</p><p><p align="justify">Ensuite, nous reprenons un résultat de Debord (1987). Il s'agit d'une caractérisation de la méthode de Borda en tant que méthode de choix appliquée à des préordres totaux. Nous la généralisons de deux façons au cas de la méthode de Borda en tant que méthode de rangement appliquée à des relations valuées. Lorsqu'on applique la méthode de Borda, on est amené à calculer une fonction à valeurs réelles sur l'ensemble des alternatives.</p><p><p align="justify">La valeur prise par cette fonction pour une alternative s'appelle le score de Borda de cette alternative. Ensuite, on range les alternatives par ordre décroissant de leur score de Borda. La tentation est grande - et beaucoup y succombent (peut-être avec raison) d'utiliser le score de Borda non seulement pour calculer le rangement mais aussi pour estimer si l'écart entre deux alternatives est important ou non (voir par exemple Brans 1994). Cette approche n'a, à notre connaissance, jamais été étudiée d'un point de vue théorique. Nous présentons deux caractérisations de la méthode de Borda utilisée à cette fin.</p><p><p align="justify">Dans la dernière partie du chapitre III, nous abandonnons la démarche qui visait à caractériser une méthode par un ensemble de propriétés le plus petit possible. Nous comparons 12 méthodes sur base d'une vingtaine de propriétés. Les résultats de cette partie sont résumés dans quelques tableaux.</p><p><p align="justify">Ce travail aborde donc la méthode de Borda et sa généralisation au cas valué sous différents angles. Il livre une série de résultats qui, espérons-le, devraient permettre de mieux comprendre la méthode de Borda et peut-être de l'utiliser à meilleur escient. Toutefois, quoique notre objectif ait été de présenter des résultats pertinents en aide multicritère à la décision (et nous avons fait des progrès dans ce sens), il reste du chemin à faire. Nous sommes probablement encore trop proche du choix social. Ceci constitue donc une voie de recherche intéressante, de même que l'étude d'autres méthodes de rangement et l'étude de méthodes complètes d'aide multicritère à la décision: modélisation du problème (identification du ou des décideur(s), des alternatives et des critères), modélisation des préférences, agrégation des préférences et exploitation des résultats de l'agrégation.</p><p><p> / Doctorat en sciences appliquées / info:eu-repo/semantics/nonPublished
|
179 |
Multi-player games in the era of machine learningGidel, Gauthier 07 1900 (has links)
Parmi tous les jeux de société joués par les humains au cours de l’histoire, le jeu de go était considéré comme l’un des plus difficiles à maîtriser par un programme informatique [Van Den Herik et al., 2002]; Jusqu’à ce que ce ne soit plus le cas [Silveret al., 2016]. Cette percée révolutionnaire [Müller, 2002, Van Den Herik et al., 2002] fût le fruit d’une combinaison sophistiquée de Recherche arborescente Monte-Carlo et de techniques d’apprentissage automatique pour évaluer les positions du jeu, mettant en lumière le grand potentiel de l’apprentissage automatique pour résoudre des jeux. L’apprentissage antagoniste, un cas particulier de l’optimisation multiobjective, est un outil de plus en plus utile dans l’apprentissage automatique. Par exemple, les jeux à deux joueurs et à somme nulle sont importants dans le domain des réseaux génératifs antagonistes [Goodfellow et al., 2014] ainsi que pour maîtriser des jeux comme le Go ou le Poker en s’entraînant contre lui-même [Silver et al., 2017, Brown andSandholm, 2017]. Un résultat classique de la théorie des jeux indique que les jeux convexes-concaves ont toujours un équilibre [Neumann, 1928]. Étonnamment, les praticiens en apprentissage automatique entrainent avec succès une seule paire de réseaux de neurones dont l’objectif est un problème de minimax non-convexe et non-concave alors que pour une telle fonction de gain, l’existence d’un équilibre de Nash n’est pas garantie en général. Ce travail est une tentative d'établir une solide base théorique pour l’apprentissage dans les jeux. La première contribution explore le théorème minimax pour une classe particulière de jeux non-convexes et non-concaves qui englobe les réseaux génératifs antagonistes. Cette classe correspond à un ensemble de jeux à deux joueurs et a somme nulle joués avec des réseaux de neurones. Les deuxième et troisième contributions étudient l’optimisation des problèmes minimax, et plus généralement, les inégalités variationnelles dans le cadre de l’apprentissage automatique. Bien que la méthode standard de descente de gradient ne parvienne pas à converger vers l’équilibre de Nash de jeux convexes-concaves simples, il existe des moyens d’utiliser des gradients pour obtenir des méthodes qui convergent. Nous étudierons plusieurs techniques telles que l’extrapolation, la moyenne et la quantité de mouvement à paramètre négatif. La quatrième contribution fournit une étude empirique du comportement pratique des réseaux génératifs antagonistes. Dans les deuxième et troisième contributions, nous diagnostiquons que la méthode du gradient échoue lorsque le champ de vecteur du jeu est fortement rotatif. Cependant, une telle situation peut décrire un pire des cas qui ne se produit pas dans la pratique. Nous fournissons de nouveaux outils de visualisation afin d’évaluer si nous pouvons détecter des rotations dans comportement pratique des réseaux génératifs antagonistes. / Among all the historical board games played by humans, the game of go was considered one of the most difficult to master by a computer program [Van Den Heriket al., 2002]; Until it was not [Silver et al., 2016]. This odds-breaking break-through [Müller, 2002, Van Den Herik et al., 2002] came from a sophisticated combination of Monte Carlo tree search and machine learning techniques to evaluate positions, shedding light upon the high potential of machine learning to solve games. Adversarial training, a special case of multiobjective optimization, is an increasingly useful tool in machine learning. For example, two-player zero-sum games are important for generative modeling (GANs) [Goodfellow et al., 2014] and mastering games like Go or Poker via self-play [Silver et al., 2017, Brown and Sandholm,2017]. A classic result in Game Theory states that convex-concave games always have an equilibrium [Neumann, 1928]. Surprisingly, machine learning practitioners successfully train a single pair of neural networks whose objective is a nonconvex-nonconcave minimax problem while for such a payoff function, the existence of a Nash equilibrium is not guaranteed in general. This work is an attempt to put learning in games on a firm theoretical foundation. The first contribution explores minimax theorems for a particular class of nonconvex-nonconcave games that encompasses generative adversarial networks. The proposed result is an approximate minimax theorem for two-player zero-sum games played with neural networks, including WGAN, StarCrat II, and Blotto game. Our findings rely on the fact that despite being nonconcave-nonconvex with respect to the neural networks parameters, the payoff of these games are concave-convex with respect to the actual functions (or distributions) parametrized by these neural networks. The second and third contributions study the optimization of minimax problems, and more generally, variational inequalities in the context of machine learning. While the standard gradient descent-ascent method fails to converge to the Nash equilibrium of simple convex-concave games, there exist ways to use gradients to obtain methods that converge. We investigate several techniques such as extrapolation, averaging and negative momentum. We explore these techniques experimentally by proposing a state-of-the-art (at the time of publication) optimizer for GANs called ExtraAdam. We also prove new convergence results for Extrapolation from the past, originally proposed by Popov [1980], as well as for gradient method with negative momentum. The fourth contribution provides an empirical study of the practical landscape of GANs. In the second and third contributions, we diagnose that the gradient method breaks when the game’s vector field is highly rotational. However, such a situation may describe a worst-case that does not occur in practice. We provide new visualization tools in order to exhibit rotations in practical GAN landscapes. In this contribution, we show empirically that the training of GANs exhibits significant rotations around Local Stable Stationary Points (LSSP), and we provide empirical evidence that GAN training converges to a stable stationary point, which is a saddle point for the generator loss, not a minimum, while still achieving excellent performance.
|
180 |
Wireless body-to-body sensor networks : optimization models and algorithms / Réseaux de capteurs corporels sans fils : modèles d'optimisation et algorithmesMeharouech Ali, Amira 16 December 2016 (has links)
Motivés par la demande croissante de services de santé améliorés et à distance, qui tend à augmenter notamment avec une population de plus en plus âgée, et la réduction du coût de l'utilisation des infrastructures réseaux, afin d'assurer des applications de santé temps-réel et à faible débit de données, les réseaux de capteurs médicaux sans fil (WBANs) forment encore un domaine de recherche en forte croissance, notamment avec le développement de WBANs coopératifs. Dans ce contexte, en utilisant les utilisateurs du réseau eux-mêmes en tant que relais on pourrait étendre les infrastructures réseaux existantes, tout en améliorant la capacité du réseau et optimisant l'utilisation du spectre radio. Ainsi, les opérateurs réseaux, qui planifient déjà pour l'intégration de l'internet des objets (IoT) et l'informatique en nuage (cloud), devraient aussi penser à créer un nouveau type de réseau ad hoc mobile, où les utilisateurs du réseau sont utilisés comme des stations de base ad hoc simplifiées, afin de partager l'information en temps-réel entre des personnes colocalisées portant des capteurs corporels. Ce nouveau type de réseau est appelé réseau corporel sans fil (BBN: Body-to-Body Network). Dans un BBN, un appareil radio, collecte les données des nœuds capteurs attachés ou portés par une personne, et les transmet à un appareil récepteur situé sur une autre personne du voisinage, afin d'être traitées ou retransmises à d'autres utilisateurs du BBN. le BBN peut trouver des applications dans divers domaines tels que la santé, les sports d'équipe, le militaire, les divertissements, ainsi que des expériences passionnantes des réseaux sociaux. Fonctionnant dans la bande Industrielle, Scientifique et Médicale (ISM), les liaisons de communication dans un BBN seront très sensibles aux interférences entre les différentes technologies qui partagent le spectre radio limité. Ainsi, l'interférence entre ces technologies devient une préoccupation importante pour la conception de protocoles pour l'utilisateur final du BBN. À ce jour, très peu d'études existent, qui effectuent une analyse en profondeur de ce type de scénario implicant le corps humain dans des communications radio. Le problème d'interférence dans un tel système distribué, doit être abordé avec des mécanismes distribués, tels que la théorie des jeux. Les décideurs dans le jeu sont soit les WBANs formant le BBN ou les opérateurs de réseaux qui contrôlent les dispositifs de communication inter-WBAN. Ces dispositifs doivent faire face à des ressources de transmission limitées (bande ISM) ce qui donne lieu à des conflits d'intérêts. Cette thèse vise à explorer les opportunités pour permettre des communications inter-WBANs en assurant le partage du spectre radio par le biais de deux approches. D'abord, l'atténuation des interférences mutuelles et croisées, et par la conception d'un protocole de routage spécifique BBN utilisé dans une application de contrôle de l'expansion d'une épidémie dans les zones de rassemblement de masse, tels que les aéroports. Dans un premier volet, une approche basée sur la théorie des jeux est proposée pour résoudre le problème d'interférence distribué dans les BBNs. Le jeu d'atténuation des interférences socialement conscient des intérêts de la collectivité (SIM) a une double tâche: à l'échelle WBAN, il alloue des canaux ZigBee aux capteurs corporels pour la collecte intra-WBAN des données, et à l'échelle BBN, il alloue les canaux WiFi aux appareils mobiles pour la transmission et le relais des données inter-WBANs. Deux algorithmes, BR-SIM et SORT-SIM, ont été développés pour rechercher les points d'équilibre de Nash du jeu SIM. Le premier (BR-SIM) assure les solutions de meilleure réponse (Best-response) tandis que le second (SORT-SIM) tente d'obtenir un compromis entre des solutions quasi-optimales et un temps de convergence réduit. (...) / Motivated by the rising demand for remote and improved healthcare, while decreasing the cost of using network infrastructures to ensure time and data rate-constrained applications, Wireless Body Area Networks (WBANs) still form a strongly growing research field. Besides, engineers and researchers are investigating new solutions to supplement mobile communications through developing opportunities for cooperative WBANs. In this context, using network users themselves as relays could complement and extend existing infrastructure networks, while improving network capacity and promoting radio spectrum usage. Yet, network operators, that are already planning for the Internet of Things (IoT) and cloud computing technologies integration, should also think about this new possibility of creating a new type of mobile ad hoc network, where network users themselves are used as simplified ad hoc base stations, to fulfill the desire of sharing real-time information between colocated persons carrying body sensors. This emerging type of network is called Body-to-Body Network (BBN). In a BBN, a radio device situated on one person gathers the sensor data from the sensor nodes worn by that person, and transmit them to a transceiver situated on another person in the nearby area, in order to be processed or relayed to other BBN users. BBNs can find applications in a range of areas such as healthcare, team sports, military, entertainment, as well as exciting social networking experiences. Operating in the popular Industrial, Scientific and Medical (ISM) band, the communication links in a BBN will be heavily susceptible to interference between the different radio technologies sharing the limited radio spectrum. Thus, inter-body interference become an important concern for protocol design and quality of service for the BBN end user. Yet, higher layer MAC and networking mechanisms need to be in place to overcome this interference problem. To date, very few studies, that perform in-depth analysis of this type of body-centric scenario, exist. The interference problem in such distributed system, should be tackeled with distributed mechanisms, such as Game Theory. The decision makers in the game are either the WBANs/people forming the BBN or the network operators who control the inter-WBAN communicating devices. These devices have to cope with a limited transmission resource (ISM band) that gives rise to a conflict of interests. This thesis aims at exploring the opportunities to enable inter-WBAN communications by ensuring feasible sharing of the radio spectrum through two challenging research issues. First, mutual and cross-technology interference mitigation, and second, the design of a BBN specific routing protocol applied to an epidemic control application within mass gathering areas, such as the airport, as use case in this thesis. In a first phase, a game theoretical approach is proposed to resolve the distributed interference problem in BBNs. The Socially-aware Interference Mitigation (SIM) game performs twofold: at the WBAN stage, it allocates ZigBee channels to body sensors for intra-WBAN data sensing, and at the BBN stage, it allocates WiFi channels to mobile devices for inter-WBAN data transmitting and relaying. Two algorithms, BR-SIM and SORT-SIM, were developed to search for Nash equilibra to the SIM game. The first (BR-SIM) ensures best response solutions while the second (SORT-SIM) attempts to achieve tradeoff between sub-optimal solutions and short convergence time. Then, in order to highlight the social role of BBNs, the second part of this thesis is devoted to propose an epidemic control application tailored to BBNs, in indoor environment. This application implements a geographic routing protocol, that differentiates WBANs traffic and ensures real-time quarantine strategies. (...)
|
Page generated in 0.0764 seconds