• Refine Query
  • Source
  • Publication year
  • to
  • Language
  • 88
  • 26
  • 19
  • 7
  • 5
  • 4
  • 3
  • 3
  • 2
  • 2
  • 2
  • 1
  • 1
  • 1
  • 1
  • Tagged with
  • 184
  • 50
  • 32
  • 25
  • 20
  • 16
  • 15
  • 14
  • 13
  • 13
  • 13
  • 12
  • 12
  • 12
  • 12
  • About
  • The Global ETD Search service is a free service for researchers to find electronic theses and dissertations. This service is provided by the Networked Digital Library of Theses and Dissertations.
    Our metadata is collected from universities around the world. If you manage a university/consortium/country archive and want to be added, details can be found on the NDLTD website.

Řešení koncovek ve velkých hrách s neúplnou informací jako je např. Poker / Solving Endgames in Large Imperfect-Information Games such as Poker

Ha, Karel January 2016 (has links)
Title: Solving Endgames in Large Imperfect-Information Games such as Poker Author: Bc. Karel Ha Department: Department of Applied Mathematics Supervisor: doc. Mgr. Milan Hladík, Ph.D., Department of Applied Mathematics Abstract: Endgames have a distinctive role for players. At the late stage of games, many aspects are finally clearly defined, deeming exhaustive analysis tractable. Specialised endgame handling is rewarding for games with perfect information (e.g., Chess databases pre-computed for entire classes of endings, or dividing Go board into separate independent subgames). An appealing idea would be to extend this approach to imperfect-information games such as the famous Poker: play the early parts of the game, and once the subgame becomes feasible, calculate an ending solution. However, the problem is much more complex for imperfect information. Subgames need to be generalized to account for information sets. Unfortunately, such a generalization cannot be solved straightaway, as it does not generally preserve optimality. As a consequence, we may end up with a far more exploitable strategy. There are currently three techniques to deal with this challenge: (a) disregard the problem entirely; (b) use a decomposition technique, which sadly retains only the same quality; (c) or formalize improvements of...

Micromechanical modeling of imperfect interfaces and applications

Raffa, Maria Letizia 27 November 2015 (has links)
Le rôle crucial des interfaces solides dans les problèmes de structures dans de nombreux domaines de l'Ingénierie est désormais bien connue et c'est certainement un sujet de grand intérêt scientifique. Aujourd'hui, la modélisation analytique et numérique des interfaces structurelles représentent un défi du fait desphénomènes physiques très complexes qu'il faut prendre en compte (tels que adhésion, contact non-conforme,microfissuration, frottement, contact unilatéral) autant que le besoin d'avoir des méthodes numériques qui soient capables de traiter à la fois la faible épaisseur des zones d'interface et les sauts dans les champs physiques concernés. Cette thèse vise à développer un outil analytique cohérent et général qui soit capable de dépasser les limitations des stratégies existantes et concernant la modélisation des interfaces emph{soft} et emph{hard} caractérisées par une microfissuration évolutive. Une nouvelle approche, appelée emph{Imperfect Interface Approach} (IIA), est proposée. Elle couple de manière cohérente arguments de théorie asymptotique et techniques d'homogénéisation pour les milieux microfissurés dans le cadre de la emph{Non-Interacting Approximation} (NIA). Dans le cadre de l'élasticité linéaire, l'IIA est employée avec succès pour obtenir un ensemble de modèles d'interfaces imparfaites.En généralisant la méthode de développement asymptotique à la théorie élastique des déformations finies, un modèle d'interface soft non-linéaire a été dérivé. Comme une nouvelle application, l'IIA est appliquée afin de formuler un modèle de contact non-conforme à raideurs equivalents. Simulations numériques appliquées à la maçonnerie ont été effectuées. / The crucial role of solid interfaces in structural problems in several engineering fields is well-established and they represent certainly a scientific topic of great interest. Nowadays, analytical and numerical modeling of structural interfaces are challenging tasks, due to the complex physical phenomena to take into account (such as adhesion, non-conforming contact, microcracking, friction, unilateral contact), as well as to the need of numerical methods suitable for treating small thickness of the interface zones and jumps in the physically relevant fields.Present PhD thesis aims to develop a consistent and general analytical tool able to overcome some modeling shortcomings of available modeling strategies accounting for soft and hard interfaces, and characterized by evolving microcracking. A novel approach, referred to as emph{Imperfect Interface Approach} (IIA), is proposed. It consistently couples asymptotic arguments and homogenization techniques for microcracked media in the framework of the Non-Interacting Approximation (NIA). In the context of linear elasticity, the IIA is successfully employed to derive a set of imperfect interface. By generalizing the matched asymptotic expansion method to finite strains, a nonlinear soft interface model has been derived. As a new general application, the IIA is applied to formulate a spring-type model for non-conforming contact. Finally, numerical simulations applying the soft interface models obtained in both linear and nonlinear cases to masonry structures, are carried out, showing effectiveness and soundness of the proposed formulation.

Emergence d'une complémentarité stratégique entre agriculture et biodiversité dans les territoires à haute valeur environnementale. L'exemple de la Camargue / Emergence of a strategic complementarity between farming and agriculture in area with high environmental value. The example of the camargue area

Jaeck, Mélanie 24 June 2010 (has links)
Dans cette thèse nous nous interrogeons sur l'émergence d'une complémentarité stratégique entre l'agriculture et la biodiversité dans les territoires à haute valeur environnementale. Nous étudions l'exemple de la Camargue, zone humide d'intérêt international, où l'enjeu est de concilier agriculture et protection de l'environnement. Nous réalisons d'abord une analyse du contexte camarguais, en insistant sur les rapports ambivalents entre agriculture et biodiversité . Dans la mesure où la réforme future de la PAC va venir remettre en question les conditions d'octroi de ces aides, autant que leur volume global, le développement de la riziculture camarguaise passe à terme par son association à une image de terre sauvage et naturelle. Cette complémentarité stratégique de fait peut permettre de concevoir les futures politiques publiques et de justifier le maintien des aides à la riziculture camarguaise, par sa contribution à la gestion durable de la biodiversité. Nous examinons ensuite les conditions économiques d'émergence d'une riziculture biologique, dans ce contexte particulier. Les conditions de marché, et plus précisément la présence d'une concurrence imparfaite, caractérisés par la concentration de la fourniture d'intrants (herbicides et semences) en un petit nombre de fournisseurs. Leurs stratégies d'adaptation au développement des pratiques d'agriculture biologique sont contraintes par les conditions de marché et limitées aux quantités offertes. Nous étudions à quelles conditions un équilibre stratégique existe, et excluons des équilibres extrêmes (riz biologique dominant / exclu). Nos résultats placent les stratégies d'offre variétale au c?ur de ces interactions stratégiques, c'est pourquoi nous prolongeons cette approche stratégique par l'étude des déterminants économiques de la diversité variétale dans les exploitations rizicoles camarguaises. Celle-ci confirme la place accordée aux stratégies de niche, et met en avant le rôle des opportunités de marché et des réseaux dans les choix de porte-feuille de cultivars par les agriculteurs, au-delà des contraintes structurelles de l'exploitation. Enfin, une enquête de type "choice experiments" fait apparaître l'influence des normes collectives dans les préférences des riziculteurs camarguais pour les technologies de production dont ils disposent. Les résultats de cette étude empirique montrent qu'une grande majorité des producteurs pourrait adopter des technologies sans intrants chimiques, à condition d'être accompagnés de compensations financières équivalentes à celles accordées actuellement sans condition dans le cadre de la PAC. Au-delà du cas d'étude, la thèse fournit donc des enseignements utiles pour la conception de politiques publiques capables de concilier efficacité économique et développement durable. Elle est aussi une contribution à la réflexion sur la gestion intégrée multi-acteurs de l'agriculture et de la biodiversité à l'échelle d'un territoire à haute valeur environnementale. / In this research, we assessed the emergence of a strategic complementarity between farming and biodiversity, in a landscape with a high environmental value. We rely on the Rhone river delta, wetland of international interest, and well known biodiversity's hotspot. We examine the conditions of emergence of the organic agriculture in this particular context. The market conditions, more precisely the presence of imperfect competition for input (seeds and herbicides) are putting several constraints on adaptation's strategies accessibles to firms. As a consequence, the main way to adapt is the control of input supply. We study at which conditions an interior equilibrium does exist. The study of economic factors of rice' cultivar's diversity in farms in the Camargue area confirm the role played by niche strategies, and highlight the importance of market opportunities and commercial networks in the cultivar's portfolio choices made by farmers. They are naturally playing in interaction with factors governing the costs and benefits of managing a greater cultivar's diversity. Finally, the choice experiments survey put emphasis on the influence of collective norms in farmers' preferences for production technologies. The results show that a large majority of rice producers are adopt agro-ecological technologies at a price of monetary incentives equivalent to those obtained currently from the CAP, without conditions. Thus, the future of agricultural development in the Camargue area should be associated with environmental preservation. This de facto strategic complementarity could enables stakeholders and public authorities to design future public policies and give a conditional support to a sustainable agriculture.

Raisonnement distribué dans un environnement ambiant / Distributed reasoning in ambient environnement

Jarraya, Amina 16 July 2019 (has links)
L’informatique pervasive et l’intelligence ambiante visent à créer un environnement intelligent avec des dispositifs électroniques et informatiques mis en réseau tels que les capteurs, qui s’intègrent parfaitement dans la vie quotidienne et offrent aux utilisateurs un accès transparent aux services partout et à tout moment.Pour garantir ce fonctionnement, un système doit avoir une connaissance globale sur son environnement, et en particulier sur les personnes et les dispositifs, leurs intérêts et leurs capacités, ainsi que les tâches et les activités associées. Toutes ces informations relèvent de la notion de contexte. Cela passe par la collecte des données contextuelles de l’utilisateur pour déterminer sa situation/son activité courante ; on parle alors d’identification de situations/d’activités. Pour cela, le système doit être sensible aux variations de son environnement et de son contexte, afin de détecter les situations/les activités et de s’adapter ensuite dynamiquement. Reconnaître une situation/une activité nécessite alors la mise en place de tout un processus : perception des données contextuelles, analyse de ces données collectéeset raisonnement sur celles-ci pour l’identification de situations/d’activités.Nous nous intéressons plus particulièrement aux aspects liés à la modélisation distribuée de l’environnement ambiant et à ceux liés au raisonnement distribué en présence de données imparfaites pour l’identification de situations/d’activités. Ainsi, la première contribution de la thèse concerne la partie perception. Nous avons proposé un nouveau modèle de perception permettant la collecte des données brutes issues des capteurs déployés dans l’environnement et la génération des évènements. Ensuite, la deuxième contribution se focalise sur l’observation et l’analyse de ces évènements en les segmentant et extrayant les attributs lesplus significatifs et pertinents. Enfin, les deux dernières contributions présentent deux propositions concernant le raisonnement distribué pour l’identification de situations/d’activités; l’une représente la principale contribution et l’autre représente sa version améliorée palliant certaines limites. D'un point de vue technique, toutes ces propositions ont été développées, validées et évaluées avec plusieurs outils. / Pervasive Computing and Ambient Intelligence aim to create a smart environment withnetworked electronic and computer devices such as sensors seamlessly integrating into everyday life and providing users with transparent access to services anywhere and anytime.To ensure this, a system needs to have a global knowledge of its environment, and inparticular about people and devices, their interests and their capabilities, and associated tasks and activities. All these information are related to the concept of context. This involves gathering the user contextual data to determine his/her current situation/activity; we also talk about situation/activity identification. Thus, the system must be sensitive to environment and context changes, in order to detect situations/activities and then to adapt dynamically.Recognizing a situation/an activity requires the definition of a whole process : perception of contextual data, analysis of these collected data and reasoning on them for the identification of situations/activities.We are particularly interested in aspects related to the distributed modeling of the ambient environment and to those related to distributed reasoning in the presence of imperfect data for the identification of situations/activities. Thus, the first contribution of the thesis concerns the perception part. We have proposed a new perception model that allows the gathering of raw data from sensors deployed in the environment and the generation of events.Next, the second contribution focuses on the observation and analysis of these events by segmenting them and extracting the most significant and relevant features. Finally, the last two contributions present two proposals concerning the distributed reasoning for the identification of situations/activities ; one represents the main contribution and the other represents its improved version overcoming certain limitations. From a technical point of view, all these proposals have been developed, validated and evaluated with several tools.

Interactions sur les marchés différenciés et politiques publiques : une analyse en équilibre général / Strategic interactions on differentiated markets and public policies

Elegbede, Bio Cyrinus 22 November 2017 (has links)
En économie, l'analyse de la concurrence entre les firmes est d'une importance capitale. Cette thèse examine les interactions stratégiques sur les marchés différenciés en équilibre général tout en proposant les politiques publiques à mettre en œuvre afin de réduire les distorsions dues aux comportements imparfaits des firmes. La thèse prend en compte la différenciation des produits afin d'aboutir à de nouvelles conclusions ou d'étendre celles existantes et mises en avant dans la littérature. Elle vise ainsi, principalement deux objectifs. En premier lieu, la construction d'un modèle de concurrence imparfaite sur les marchés différenciés et ceci dans un cadre d'analyse en équilibre général. En second lieu, l'évaluation des conséquences du modèle en termes de politiques économiques. Les travaux ont débuté par une revue de littérature où sont abordés successivement les mécanismes de prix dans les jeux stratégiques de marché, les concepts de différenciation des produits et les modèles de théorie des jeux traitant des interactions stratégiques en équilibre général afin de modéliser les comportements imparfaitement concurrentiels. Le chapitre 2 a ainsi conduit au concept d'équilibre Cournot-Walras symétrique sur les marchés différenciés. Pour prendre en compte la différenciation des produits, il est affecté à chaque agent économique un vecteur fini de coefficients de différenciation qui exprime la préférence de l'agent pour la diversité. A la suite du modèle de différenciation, le chapitre 3 propose des mécanismes de politiques fiscales afin de réguler les pertes dues aux comportements imparfaits des firmes. Des exemples illustrent que le modèle de différenciation admet un équilibre trivial qui est nice et les prix et les allocations de l'équilibre Cournot-Walras symétrique sur produit différencié, sous certaines conditions, convergent vers l'équilibre walrasien. / In economy, the competition analysis among firms have a significance importance because of the complexity of some elements. This thesis examines the strategic interactions on differentiated markets in general equilibrium while proposing the public policies to reduce the distortions due to the imperfect behaviors. This thesis takes into account the differentiation of products in order to obtain the new conclusions and/or to extend those existing. We thus pursues two objectives. Fisrt, the construction of a model of imperfect competition on differentiated markets in a general equilibrium framework. Second, the evaluation of the consequences of the model in terms of economic policies. At beginning, we use literature review to tackle successively price mechanisms in strategic market games, product differentiation concepts and game theory models dealing with strategic interactions in order to model imperfect behaviors. This led in chapter 2 to the symmetric Cournot-Walras equilibrium concept on differentiated markets where we assign to each economic agent a finite vector of differentiation coefficients which expresses the agent's love for diversity. Following the differentiation model, chapter 3 offers tax policy mechanisms to control losses due to perfect behavior of firms. From the analysis, it appears that some examples illustrate that the differentiation model admits a trivial equilibrium which is nice and the price and allocations of symmetrical Cournot-Walras equilibrium on differentiated product, under certain conditions, converge towards the Walrasian ones.

Robust MIMO Precoding on Real-World Measured Channels

Hedenskog, Filip January 2015 (has links)
It is well known that multi-input multi-output (MIMO) wireless communication systemsthat employ precoding techniques are capable of meeting the high expectations of modernand future wireless communication standards. In order to fully utilize these techniques, thecommunication system typically requires information of the channel, commonly referred toas channel state information (CSI). In practice, the CSI at the transmitter (CSIT) is oftennot perfect which addresses the need for robust precoding designs, that can mitigate theeffects of precoding with imperfect CSIT. By modeling the imperfect CSIT as deterministic,it can be assumed that the estimated channel, as represented by the CSIT, belongs to aconvex uncertainty set. With this approach, the problem of finding a robust precoding designcan be formulated as a convex maximin problem, where the solution optimizes the systemperformance for the worst channel that belongs to the uncertainty set. How the uncertaintyset is modeled impacts the performance of the communication system, which calls for theevaluation of several robust precoding designs. While different characteristics of the convexuncertainty sets has been evaluated for MIMO flat-fading channels represented by i.i.d. zero-mean, unit variance Gaussian elements, it is of interest to apply the theory of worst-caserobust precoding designs on real-world measured MIMO channels.More concisely, this project investigates MIMO precoding designs with deterministic im-perfect CSIT for real-world measured channels that utilizes orthogonal frequency divisionmultiplexing (OFDM) schemes. The worst-case received signal-to-noise ratio (SNR) will bepresented as a result of using MIMO precoding designs on real-world channels, and the effectof the choice of model parameters and characteristics of the chosen uncertainty set will bevisualized and discussed. Furthermore, orthogonal space-time block code (OSTBC) transmis-sion designs will be employed to measure the worst case symbol error rate (SER) as a tool toevaluate the system performance in different scenarios. The results will be compared to thatwhen the channel is composed of i.i.d. zero-mean, unit variance Gaussian elements and forthe case when the channel is based on the Kronecker model.The results indicate that a further analysis of how the Kronecker model behaves in termsof capacity is required in order to draw accurate conclusions regarding the implementation ofrobust precoding strategies when each pair of antennas are correlated. Also, it is essential todevelop a framework that offers methods on how to accurately model the uncertainty set sothat it can represent errors that originates from both quantization errors, estimation errorsand outdated estimates. / Det är välkänt att trådlösa multi-input, multi-output (MIMO) system som använder förkodar-tekniker har kapabilitet att möta de höga förväntningar som är fastställt av moderna ochframtida kommunikationsstandarder. För att utnyttja dessa förkodartekniker till fullo be-hövs information om kanalen (CSI). I praktiska kommunikationssystem är kanalinformatio-nen hos sändaren (CSIT) ofta inte perfekt vilket adresserar betydelsen av att använda robustaförkodare som kan mildra den negativa effekten som uppstår av att förkoda med CSIT som in-nehåller fel. Genom att använda en deterministisk modell för CSIT med fel kan man anta attden skattade kanalen som är representerad av CSIT tillhör en konvex osäkerhetsregion. Meddetta tillvägagångssätt kan man formulera problemet att hitta en robust förkodardesign somett konvext maximin-problem, där lösningen optimerar systemets prestanda för den värstakanalskattningen i osäkerhetsregionen. Olika modeller av osäkerhetsregioner ger upphov tillolika systemprestanda vilket betyder att olika modeller med tillhörande robusta förkodare be-höver utvärderas. Medan tidigare forskningsrapporter behandlat MIMO flat fädnings-kanalerför i.i.d. Gaussisk fördelning av elementen finns det ett intresse att applicera teorin omvärsta-fallet robust förkodning på riktiga uppmätta MIMO-kanaler.Mer koncist undersöker detta projekt designs på förkodare för riktiga uppmätta MIMO-kanaler utifrån en deterministisk modell på felaktigt CSIT, där MIMO-kanalerna utnyttjarorthogonal frequency divsion multiplexing (OFDM) scheman. Värsta-fallet signal-to-noiseratio (SNR) kommer presenteras för olika förkodar-designs och MIMO-kanaler. Hur olika valav modellparametrar och karakteristik hos osäkerhetsregionerna påverkar systemprestandankommer att diskuteras. Vidare kommer även orthogonal space-time block codes (OSTBC)användas som transmissionsscheman för att mäta symbol error rate (SER). Resultaten kom-mer att jämföras med när MIMO-kanalen består av i.i.d. Gaussisk fördelning av elementenoch för fallet när kanalen är baserad på en Kronecker-modell.Resultaten indikerar att en fortsatt analys av hur Kronecker-modellen beter sig medavseende på kapacitet är nödvändig för att dra tillförlitliga slutsatser om systemprestan-dan för förkodar-designs när antennparen är korrelerade. Det är även väsentligt att utvecklaen teori som behandlar metoder för hur man kan på ett tillförlitligt sätt modellera osäker-hetsregionen så CSIT så att kvantiseringsfel, skattningsfel och utdaterade skattningar kanrepresenteras i den.

Allocation de ressources et association utilisateur/cellule optimisées pour les futurs réseaux denses / Optimized resource allocation and user/cell association for future dense networks

Ha, Duc Thang 30 September 2019 (has links)
Depuis plusieurs années, les opérateurs de téléphonie mobile sont confrontés à une croissance considérable du trafic de données mobiles. Dans un tel contexte, la technologie Cloud Radio Access Network (CRAN) qui intègre les solutions de Cloud Computing aux réseaux d’accès radio est considérée comme une nouvelle architecture pour les futures générations de réseaux 5G. L’approche CRAN permet une optimisation globale des fonctions de traitement en bande de base du signal et de la gestion des ressources radio pour l’ensemble des RRH et des utilisateurs. Parallèlement, les réseaux hétérogènes (HetNets) ont été proposés pour augmenter efficacement la capacité et la couverture du réseau 5G tout en réduisant la consommation énergétique. En combinant les avantages du Cloud avec ceux des réseaux HetNets, le concept de réseaux H-CRAN (Heterogeneous Cloud Radio Access Networks) est né et est considéré comme l’une des architectures les plus prometteuses pour répondre aux exigences des futurs systèmes. Plus particulièrement, nous abordons le problème important de l’optimisation jointe de l’association utilisateur-RRH et de la solution de beamforming sur la liaison descendante d’un système H-CRAN. Nous formulons un problème de maximisation du débit total du système sous des contraintes de mobilité et d’imperfection de CSI (Channel State Information). Notre principal défi consiste à concevoir une solution capable de maximiser le débit tout en permettant, contrairement aux autres solutions de référence, de réduire la complexité de calcul, et les coûts de signalisation et de feedback CSI dans divers environnements. Notre étude commence par proposer un algorithme Hybride, qui active périodiquement des schémas de clustering dynamiques et statiques pour aboutir à un compromis satisfaisant entre optimalité et le coût en complexité et signalisation CSI et réassociation. L’originalité de l’algorithme Hybride réside aussi dans sa prise en compte de la dimension temporelle du processus d’allocation sur plusieurs trames successives plutôt que son optimalité (ou sous-optimalité) pour la seule trame d’ordonnancement courante. De plus, nous développons une analyse des coûts de l’algorithme en fonction de plusieurs critères afin de mieux appréhender le compromis entre les nombreux paramètres impliqués. La deuxième contribution de la thèse s’intéresse au problème sous la perspective de la mobilité utilisateur. Deux variantes améliorées de l’algorithme Hybride sont proposées : ABUC (Adaptive Beamforming et User Clustering), une version adaptée à la mobilité des utilisateurs et aux variations du canal radio, et MABUC (Mobility-Aware Beamforming et User Clustering), une version améliorée qui règle dynamiquement les paramètres de feedback du CSI (périodicité et type de CSI) en fonction de la vitesse de l’utilisateur. L’algorithme MABUC offre de très bonnes performances en termes de débit cible tout en réduisant efficacement la complexité et les coûts de signalisation CSI. Dans la dernière contribution de la thèse, nous approfondissons l’étude en explorant l’optimisation automatique des paramètres d’ordonnancement du CSI. Pour ce faire, nous exploitons l’outil de l’apprentissage par renforcement afin d’optimiser les paramètres de feedback CSI en fonction du profil de mobilité individuelle des utilisateurs. Plus spécifiquement, nous proposons deux modèles d’apprentissage. Le premier modèle basé sur un algorithme de type Q-learning a permis de démontrer l’efficacité de l’approche dans un scénario à taille réduite. Le second modèle, plus scalable car basé sur une approche Deep Q-learning, a été formulé sous la forme d’un processus de type POMDP (Partially observable Markov decision process). Les résultats montrent l’efficacité des solutions qui permettent de sélectionner les paramètres de feedback les plus adaptés à chaque profil de mobilité, même dans le cas complexe où chaque utilisateur possède un profil de mobilité différent et variable dans le temps. / Recently, mobile operators have been challenged by a tremendous growth in mobile data traffic. In such a context, Cloud Radio Access Network (CRAN) has been considered as a novel architecture for future wireless networks. The radio frequency signals from geographically distributed antennas are collected by Remote Radio Heads (RRHs) and transmitted to the cloud-centralized Baseband Units (BBUs) pool through fronthaul links. This centralized architecture enables a global optimization of joint baseband signal processing and radio resource management functions for all RRHs and users. At the same time, Heterogeneous Networks (HetNets) have emerged as another core feature for 5G network to enhance the capacity/coverage while saving energy consumption. Small cells deployment helps to shorten the wireless links to end-users and thereby improving the link quality in terms of spectrum efficiency (SE) as well as energy efficiency (EE). Therefore, combining both cloud computing and HetNet advantages results in the so-called Heterogeneous-Cloud Radio Access Networks (H-CRAN) which is regarded as one of the most promising network architectures to meet 5G and beyond system requirements. In this context, we address the crucial issue of beamforming and user-to-RRH association (user clustering) in the downlink of H-CRANs. We formulate this problem as a sum-rate maximization problem under the assumption of mobility and CSI (Channel State Information) imperfectness. Our main challenge is to design a framework that can achieve sum-rate maximization while, unlike other traditional reference solutions, being able to alleviate the computational complexity, CSI feedback and reassociation signaling costs under various mobility environments. Such gain helps in reducing the control and feedback overhead and in turn improve the uplink throughput. Our study begins by proposing a simple yet effective algorithm baptized Hybrid algorithm that periodically activates dynamic and static clustering schemes to balance between the optimality of the beamforming and association solutions while being aware of practical system constraints (complexity and signaling overhead). Hybrid algorithm considers time dimension of the allocation and scheduling process rather than its optimality (or suboptimality) for the sole current scheduling frame. Moreover, we provide a cost analysis of the algorithm in terms of several parameters to better comprehend the trade-off among the numerous dimensions involved in the allocation process. The second key contribution of our thesis is to tackle the beamforming and clustering problem from a mobility perspective. Two enhanced variants of the Hybrid algorithm are proposed: ABUC (Adaptve Beamforming and User Clustering), a mobility-aware version that is fit to the distinctive features of channel variations, and MABUC (Mobility-Aware Beamforming and User Clustering), an advanced version of the algorithm that tunes dynamically the feedback scheduling parameters (CSI feedback type and periodicity) in accordance with individual user velocity. MABUC algorithm achieves a targeted sum-rate performance while supporting the complexity and CSI signaling costs to a minimum. In our last contribution, we propose to go further in the optimization of the CSI feedback scheduling parameters. To do so, we take leverage of reinforcement learning (RL) tool to optimize on-the-fly the feedback scheduling parameters according to each user mobility profile. More specifically, we propose two RL models, one based on Q-learning and a second based on Deep Q-learning algorithm formulated as a POMDP (Partially observable Markov decision process). Simulation results show the effectiveness of our proposed framework, as it enables to select the best feedback parameters tailored to each user mobility profile, even in the difficult case where each user has a different mobility profile.

AI for an Imperfect-Information Wargame with Self-Play Reinforcement Learning / AI med självspelande förstärkningsinlärning för ett krigsspel med imperfekt information

Ryblad, Filip January 2021 (has links)
The task of training AIs for imperfect-information games has long been difficult. However, recently the algorithm ReBeL, a general framework for self-play reinforcement learning, has been shown to excel at heads-up no-limit Texas hold 'em, among other imperfect-information games. In this report the ability to adapt ReBeL to a downscaled version of the strategy wargame \say{Game of the Generals} is explored. It is shown that an implementation of ReBeL that uses no domain-specific knowledge is able to beat all benchmark bots, which indicates that ReBeL can be a useful framework when training AIs for imperfect-information wargames. / Det har länge varit en utmaning att träna AI:n för spel med imperfekt information. Nyligen har dock algoritmen ReBeL, ett generellt ramverk för självspelande förstärkningsinlärning, visat lovande prestanda i heads-up no-limit Texas hold 'em och andra spel med imperfekt information. I denna rapport undersöks ReBeLs förmåga att anpassas till en nedskalad version av spelet \say{Game of the Generals}, vilket är ett strategiskt krigsspel. Det visas att en implementation av ReBeL som inte använder någon domänspecifik kunskap klarar av att besegra alla bottar som användes vid jämförelse, vilket indikerar att ReBeL kan vara ett användbart ramverk för att träna AI:n för krigsspel med imperfekt information.

Decentralized Learning over Wireless Networks with Imperfect and Constrained Communication : To broadcast, or not to broadcast, that is the question!

Dahl, Martin January 2023 (has links)
The ever-expanding volume of data generated by network devices such as smartphones, personal computers, and sensors has significantly contributed to the remarkable advancements in artificial intelligence (AI) and machine learning (ML) algorithms. However, effectively processing and learning from this extensive data usually requires substantial computational capabilities centralized in a server. Moreover, concerns regarding data privacy arise when collecting training data from distributed network devices. To address these challenges, collaborative ML with decentralized data has emerged as a promising solution for large-scale machine learning across distributed devices, driven by the parallel computing and learning trends. Collaborative and distributed ML can be broadly classified into two types: server-based and fully decentralized, based on whether the model aggregation is coordinated by a parameter server or performed in a decentralized manner through peer-to-peer communication. In cases where communication between devices occurs over wireless links, which are inherently imperfect, unreliable, and resource-constrained, how can we design communication protocols to achieve the best learning performance? This thesis investigates decentralized learning using decentralized stochastic gradient descent, an established algorithm for decentralized ML, in a novel setting with imperfect and constrained communication. "Imperfect" implies that communication can fail and "constrained" implies that communication resources are limited. The communication across a link between two devices is modeled as a binary event with either success or failure, depending on if multiple neighbouring devices are transmitting information. To compensate for communication failures, every communication round can have multiple communication slots, which are limited and must be carefully allocated over the learning process. The quality of communication is quantified by introducing normalized throughput, describing the ratio of successful links in a communication round. To decide when devices should broadcast, both random and deterministic medium access policies have been developed with the goal of maximizing throughput, which has shown very efficient learning performance. Finally, two schemes for allocating communication slots over communication rounds have been defined and simulated: Delayed-Allocation and the Periodic-Allocation schemes, showing that it is better to allocate slots late rather than early, and neither too frequently nor infrequently which can depend on several factors and requires further study

Grid-based Pursuit Evasion Games of Imperfect Information: Theory and Higher Order Knowledge-based Strategies

Granqvist, Jacob, Haker, Jonas January 2022 (has links)
One group of games studied within game theory are grid-based pursuit evasion games of imperfect information. A pursuit evasion game is in essence a game where there exists a set of pursuers which have as their objective to capture a set of evaders. This thesis aims to develop a formalisation of this type of games as well as describing and integrating vital game theoretical concepts such as order of knowledge into this game. With the developed formalism at hand, the concept of knowledge-based strategies is then introduced, which is essential when searching for the way to play the game most efficiently. The formalisation of the game is then followed by a simulation, measuring the performance of some older and some newly developed knowledge-based strategies. The thesis concludes that the formalisation is applicable on a more general class of pursuit evasion games and enables a wider study of the game. The simulation results indicate that knowledge-based strategies of higher order do not always perform better compared to simpler strategies of lower order of knowledge. Furthermore, strategies which allow for communication between agents are found to be superior to communication-less strategies. / En typ av spel som studeras inom spelteori är rutnätsbaserade jakt-flykt-spel med ofullständig information. Ett jakt-flykt-spel går ut på att det existerar en samling jagande aktörer som försöker fånga en samling flyende aktörer. Denna uppsats söker utveckla en formalism för denna typ av spel såväl som att beskriva och integrera ett antal nyckelkoncept inom spelteori såsom kunskapsordning. Med hjälp av den utvecklade formalismen, framställs så kallade kunskapsbaserade strategier, vilka är av fundamental vikt i sökandet efter sätt att spela spelet på det effektivaste sättet. Kapitlet om formalismen följs sedan av simuleringar där några äldre och några nyare kunskapsbaserade strategier prövas. Slutsatsen dras att den nya formalismen kan vara applicerbar på en bredare samling jakt-flykt-spel än den initialt påtänkta. Vidare underlättar formalismen en generalisering till andra sätt att beskriva spel. Simulationsresultaten indikerar att kunskapsbaserade strategier av högre ordning inte alltid presterar bättre än enklare strategier av lägre ordning. Till yttermera visso visar sig kommunikationslösa strategier vara underlägsna strategier som tillåter kommunikation. / Kandidatexjobb i elektroteknik 2022, KTH, Stockholm

Page generated in 0.4788 seconds